Experimentamos os óculos de IA do Google e eles estão quase lá
Na conferência de desenvolvedores I/O do Google esta semana, tivemos a oportunidade de uma breve experiência prática com seus próximos óculos com tecnologia de IA – não os óculos somente de áudio que o Google disse que começará a ser comercializado neste outono, mas sim os óculos que oferecem uma experiência combinada de áudio e visual.
Primeiro anunciado no evento do ano passado, esses óculos Android XR oferecem uma tela na lente que coloca informações úteis à sua frente, sobrepostas ao mundo real. Isso inclui widgets que podem exibir coisas como clima, rotas a pé, detalhes de retirada do Uber, tradução ao vivo e muito mais – até mesmo widgets que você mesmo projetou usando IA.
Os óculos também serão compatíveis com telefones iOS e Android, observou a empresa, tanto no formato somente áudio quanto na futura versão de exibição.
Os óculos com tela pretendem ser o próximo passo além da primeira geração de óculos de áudio que será lançada ainda este ano. Os próprios óculos foram desenvolvidos em parceria com Warby Parker, Gentle Monster e Samsung, combinando a tecnologia do Google com a estética de design de suas marcas.
Os óculos que testamos, entretanto, ainda eram basicamente um protótipo, embora polidos o suficiente para agora serem testados externamente. Os representantes que demonstraram os óculos XR explicaram que o protótipo permitiu que o Google não se preocupasse com alguns dos detalhes cosméticos relacionados a diferentes estilos e formas, para que pudesse se concentrar em experimentar a tecnologia de exibição de forma mais livre e seus impactos na vida útil da bateria. Isso significa que esses óculos são muito diferentes de qualquer versão futura de óculos, em termos de ajuste, formato, dimensões e atenção aos detalhes. Em vez disso, é mais como poder experimentar o “interior” dos óculos, ainda em uma armação básica e confortável.
A versão de envio dos óculos será capaz de detectar quando os óculos são colocados na sua cabeça e retirados, mas os que testamos não tinham esse recurso.

Para ativar o Gemini, você deve pressionar por dois segundos no lado direito da armação dos óculos. Um sinal sonoro de inicialização soaria, informando que o Gemini está ligado e ouvindo. Na versão demo, iniciar o Gemini também iniciaria a câmera ao mesmo tempo, mas a versão de envio permitirá ao usuário configurar se deseja ligar a câmera quando o Gemini iniciar ou não.
Em um teste inicial, tocamos música através dos óculos, pedindo ao Gemini que tocasse um artista favorito. O local era muito barulhento para avaliar a qualidade do som, infelizmente, já que a música estava no volume máximo e ainda era relativamente difícil de ouvir com nitidez e detalhes. Mas a impressão inicial dessa experiência limitada foi que os óculos não seriam um ótimo substituto para fones de ouvido de alta qualidade, embora servissem se você quisesse apenas um pouco de música enquanto estivesse ao ar livre, caminhando, caminhando ou fazendo tarefas domésticas. A vantagem de não ter fones de ouvido é que você pode ouvir alguém falando com mais facilidade, em comparação com as experiências do modo de transparência em dispositivos como os AirPods da Apple.
Para desligar a música, basta tocar uma vez na lateral do quadro, no meio, como se estivesse tocando na têmpora.

No segundo teste, pressionamos o botão de captura de fotos com o dedo para tirar a foto de uma pessoa. A tela estava desligada, então a imagem foi transferida para o nosso telefone e relógio. (Mais tarde, você poderá capturar vídeo com um toque longo, mas esta opção não estava disponível para teste com o protótipo. No caso de vídeo, você veria uma visualização em miniatura do vídeo em vez de uma foto.)
Você também pode simplesmente pedir ao Gemini para tirar uma foto sem precisar pressionar o botão de foto e realizar algum tipo de manipulação de IA no resultado. Por exemplo, você pode dizer algo como “tire uma foto e transforme a pessoa em um personagem de anime”. A foto é enviada para o telefone, depois para os servidores Gemini e Nano Banana, e depois retorna em sua versão editada.
No local do Google I/O, onde o Wi-Fi estava sob forte carga, a viagem de ida e volta durou cerca de 45 segundos.

Com a exibição ativada, você verá uma tela inicial simples aparecer em seu campo de visão. A versão demo tinha alguns widgets pré-carregados que mostravam o clima e uma contagem regressiva para o evento I/O do Google. Você também pode criar iniciadores rápidos em aplicativos específicos, como Google Maps ou Tradutor, se esses estiverem entre os principais casos de uso dos óculos.
O protótipo tinha apenas uma tela sobre o olho direito, mas a plataforma pode suportar telas simples e duplas, bem como óculos somente de áudio. A imagem em si estava um pouco confusa, mas atribuímos isso às nossas lentes de contato de prescrição, que envolvem o uso de uma lente otimizada para distância de um lado e outra otimizada para visão de perto do outro. Quando fechamos um olho, a imagem ficou melhor focada, mas a experiência quase imediatamente nos deixou com algum cansaço visual acima do olho direito, e não está claro se a culpa era inteiramente da prescrição.

Uma das melhores demonstrações foi a experiência de tradução de idiomas nos óculos, que é apoiada pelo aplicativo Google Translate no telefone. Um dos manifestantes falava espanhol rapidamente, e os óculos detectavam automaticamente o idioma e exibiam o texto em inglês no display, enquanto Gemini falava inglês em nosso ouvido. Poderíamos ver viajantes do mundo comprando óculos apenas para esta experiência.
Devemos observar que o Tradutor também funcionará em óculos somente de áudio, mas sem que o texto seja exibido nos próprios óculos. Em vez disso, você poderá ver a transcrição no telefone, se necessário, além do feedback de áudio em tempo real.
Outra demonstração envolveu o uso de óculos para navegar. Embora obviamente não pudéssemos dar um passeio e sair do local para testar sua precisão, poderíamos ter uma ideia de como funcionaria. Você pode iniciar a experiência do Google Maps pedindo ao Gemini para orientá-lo até um destino – que pode até ser tão vago quanto algo como “a cafeteria mais próxima”.
O Gemini ativará o Google Maps no telefone, mas você não precisa tirar o telefone da bolsa ou do bolso para usá-lo. Após um breve atraso enquanto a experiência carrega, os óculos exibem instruções passo a passo. Quando você está ansioso, as informações da próxima curva são exibidas. Mas se precisar se orientar no espaço, você pode olhar para o chão e ver seu ponto azul em um mapa. Você também pode virar para a esquerda e para a direita para girar no espaço, da mesma forma que tentaria fazer com que o ponto azul apontasse para a direção certa em seu telefone.
Então, se você olhar para cima novamente, poderá continuar andando sem que o mapa atrapalhe.
Como a experiência está vinculada ao Google Maps no seu telefone, destinos salvos como “casa” e “trabalho” já estarão disponíveis.

Também pudemos usar brevemente os óculos para identificar uma variedade de objetos à nossa vista e fazer perguntas sobre eles. Os óculos inicialmente tiveram dificuldade para identificar a réplica de uma pintura de Monet em uma prateleira à nossa frente, mas isso porque o protótipo não habilitou a câmera automaticamente – ela teve que ser ligada novamente no aplicativo. Ainda assim, foram necessárias algumas perguntas antes de Gemini dizer que parecia um Monet, mesmo depois de nos aproximarmos para focar na assinatura de Monet no canto inferior esquerdo.
Outros testes foram mais tranquilos, pois os óculos identificaram imediatamente a planta na prateleira e responderam perguntas sobre diferentes receitas em um livro. Ainda assim, pensamos em como essas coisas poderiam ser feitas hoje com o Google Lens (ou outros modelos de IA integrados em aplicativos de chatbot), embora supomos que seja interessante poder fazê-las sem precisar puxar o telefone.
O Google diz que terá mais a compartilhar sobre seus óculos de exibição Android XR ainda este ano, quando expandir seu programa de testadores confiáveis.

Entretanto, a empresa acredita que o áudio será suficiente para as necessidades de alguns utilizadores, o que talvez seja uma forma inteligente de contornar o facto de não ter os óculos de visualização prontos, apesar da concorrência do Meta e do Snap nesta frente.
Assim como a versão com display, os óculos de áudio também fornecem acesso ao Gemini AI do Google, que você ouve em particular através dos alto-falantes da armação dos óculos. Você pode fazer coisas como ouvir música através dos óculos, pressionar um botão para tirar uma foto, fazer uma chamada ou acessar os aplicativos do telefone a partir desses óculos, como fará nas futuras versões de exibição.
Acessar outros aplicativos de terceiros não estava entre os itens que demonstramos, mas os óculos permitirão que os usuários digam ao Gemini para fazer coisas como “pegar os ingredientes desta receita e adicioná-los à minha lista de compras”.
Em outro exemplo que o Google apresentou durante a palestra do evento, os óculos podiam ver uma refeição que o usuário estava cozinhando no fogão e oferecer feedback sobre a refeição, como se a carne já estava pronta ou não.
Quando você compra por meio de links em nossos artigos, podemos ganhar uma pequena comissão. Isso não afeta nossa independência editorial.



Publicar comentário