Google Beam: uma ferramenta de videoconferência 3D de última geração

As videochamadas e as reuniões virtuais tornaram possível o trabalho à distância, ajudando as equipas a manterem-se ligadas entre países e fusos horários. Tornaram-se uma parte regular das nossas vidas e mudaram a forma como comunicamos.

No entanto, apesar da sua utilização generalizada, a tecnologia de base por detrás das videoconferências manteve-se praticamente inalterada durante anos. Graças aos recentes avanços, as plataformas de videoconferência estão a começar a mudar, com o objetivo de se tornarem mais naturais e realistas.

Curiosamente, na sua conferência anual para programadores (Google I/O 2025), a Google apresentou a sua nova ferramenta de comunicação por vídeo, conhecida como Google Beam. O Beam utiliza a inteligência artificial (IA) e a tecnologia de videoconferência 3D para ir além dos tradicionais ecrãs planos e criar uma experiência mais envolvente e presencial.

Fig. 1. O diretor executivo da Google, Sundar Pichai, apresenta o Google Beam(Fonte).

‍

De facto, o Google Beam foi concebido para dar a sensação de que a pessoa com quem está a falar está mesmo à sua frente. Ao contrário das videochamadas normais, o Google Beam recupera pistas humanas subtis, como o contacto visual e o movimento natural que muda com a perspetiva, detalhes que muitas vezes se perdem nos ecrãs planos.

Neste artigo, vamos aprofundar o que é o Google Beam, como foi desenvolvido, como funciona e as suas aplicações. Vamos começar!

Passar do Projeto Starline para o Google Beam

Antes de analisarmos mais detalhadamente o Google Beam, vamos compreender melhor o seu antecessor, o Project Starline.

Apresentado no Google I/O 2021, o Project Starline foi uma iniciativa de investigação destinada a tornar a comunicação remota mais realista, quase como se estivéssemos na mesma sala. Funcionava através da criação de imagens 3D de pessoas em tamanho real e em tempo real. Embora a tecnologia tenha atraído muita atenção, exigia configurações complexas e hardware pesado.

Fig. 2. Um olhar sobre o Projeto Starline(Fonte).

‍

Ao longo dos anos, com o avanço da tecnologia, a Google aperfeiçoou o software e optimizou o hardware. Após quatro anos de desenvolvimento, o Project Starline evoluiu para o Google Beam - uma solução mais compacta e fácil de utilizar.

O Google Beam utiliza a IA para melhorar as videochamadas, criando imagens 3D mais realistas das pessoas com quem se está a falar. Transforma o vídeo 2D normal em vistas que se ajustam a diferentes ângulos, ajudando a manter o contacto visual e facilitando a visualização das expressões faciais. Inclui também funcionalidades como a tradução em tempo real, o seguimento da cabeça e o áudio espacial.

Uma visão geral do Google Beam

O Google Beam foi desenvolvido para funcionar sem acessórios adicionais, como auscultadores de realidade aumentada (AR) ou de realidade virtual (VR). Em vez disso, vem com o seu próprio ecrã incorporado, sistema de câmara e hardware para criar imagens 3D. Isto faz com que as videochamadas sejam mais naturais, confortáveis e envolventes do que as típicas videoconferências.

Fig. 3. Um exemplo de utilização do Google Beam(Fonte).

‍

Como o Google Beam cria reuniões virtuais realistas

Agora que já falámos sobre como surgiu o Google Beam, vamos analisar mais detalhadamente o seu funcionamento.

Captura de imagens para colaboração remota imersiva

Tudo começa com a captura de informações visuais. O Beam utiliza seis câmaras de alta resolução para tirar fotografias de diferentes ângulos ao mesmo tempo.

Estas câmaras ajudam a localizar caraterísticas faciais, linguagem corporal e pequenos movimentos em tempo real. A IA desempenha um papel fundamental, optimizando as definições das câmaras e mantendo todas as transmissões de vídeo perfeitamente sincronizadas. Isto prepara o sistema para a fase seguinte: processamento de dados.

Videoconferência de imagem 2D para 3D

Em seguida, a IA é utilizada para combinar as seis transmissões de câmara 2D para gerar um modelo 3D em tempo real da pessoa em vista. Em vez de se limitar a sobrepor imagens 2D, a IA reconstrói a profundidade, as sombras e as relações espaciais para criar um gémeo digital 3D completo.

Para construir este modelo 3D, o Beam utiliza técnicas de IA e de visão por computador, como a estimativa de profundidade e o seguimento de movimentos. Estes métodos ajudam a determinar a distância a que uma pessoa está da câmara, como se move e como o seu corpo está posicionado. Com estes dados, o sistema pode mapear com exatidão as caraterísticas faciais e as partes do corpo no espaço 3D.

O modelo de IA subjacente ao Beam actualiza a representação 3D a 60 fotogramas por segundo (FPS) para manter as conversas suaves e realistas. Também faz ajustes em tempo real para refletir com precisão os movimentos da pessoa.

Fig. 4. As seis câmaras do Google Beam captam imagens de diferentes ângulos(Fonte).

‍

Sistemas de visualização do campo de luz do Google Beam

O modelo 3D é apresentado no sistema Beam do recetor utilizando um ecrã de campo luminoso. Ao contrário dos ecrãs convencionais que apresentam a mesma imagem a ambos os olhos, um ecrã de campo luminoso emite imagens ligeiramente diferentes para cada olho, simulando a forma como percebemos a profundidade na vida real. Isto cria uma experiência visual tridimensional mais realista.

Fig. 5. Troca de "high-fives" virtuais através do Google Beam(Fonte).

‍

Seguimento da cabeça em tempo real com precisão milimétrica

Uma das caraterísticas mais impressionantes do Google Beam é a sua capacidade de rastreio de IA em tempo real. O sistema utiliza o seguimento preciso da cabeça e dos olhos para seguir os movimentos até ao mais ínfimo pormenor.

Por exemplo, o motor de IA do Beam pode seguir continuamente a posição da cabeça do utilizador e fazer ajustes subtis à imagem em tempo real. Isto cria a impressão de que a pessoa no ecrã está realmente sentada à sua frente. À medida que o utilizador move a cabeça, a imagem 3D muda em conformidade, tal como numa conversa real, cara a cara.

Processamento de áudio para comunicação virtual melhorada por IA

O Beam também melhora a experiência de áudio ao utilizar som espacial que corresponde ao local onde a pessoa aparece no ecrã. Se alguém estiver no lado esquerdo do ecrã, a sua voz soará como se viesse do lado esquerdo. À medida que a pessoa muda de posição, o áudio ajusta-se com ela. Isto faz com que as conversas pareçam mais naturais e ajuda o cérebro a seguir quem está a falar sem esforço extra.

Isto funciona através da combinação de técnicas de áudio direcional com rastreio em tempo real. O Beam utiliza áudio espacial para simular a forma como percebemos naturalmente o som no mundo real (com base na direção de onde vem e como chega a cada ouvido). O sistema também segue os movimentos da cabeça do espetador e ajusta a saída de áudio em conformidade, para que o som permaneça "ligado" à pessoa no ecrã.

Aplicações do Google Beam

O Google Beam, embora ainda na sua fase inicial, mostra um potencial promissor no espaço das videoconferências. Eis algumas das suas principais aplicações:

Colaboração remota: O Google Beam pode tornar as reuniões, especialmente as discussões de liderança ou as negociações de alto risco, mais pessoais e eficazes. Ao captar factores subtis, como a linguagem corporal e o contacto visual, ajuda as pessoas a sentirem-se mais presentes, mesmo quando estão distantes.
‍
Educação: O Beam tem o potencial de tornar a aprendizagem virtual mais emocionante e acessível. Imagine um cientista a dar uma palestra ao vivo a estudantes do outro lado do mundo, e parece mesmo que estão na mesma sala.
‍
Cuidados de saúde: O feixe de luz pode tornar as consultas à distância mais pessoais. Quando os médicos e os doentes se vêem claramente e estabelecem um contacto visual natural, isso cria confiança e torna a interação mais humana.
‍
Indústrias criativas: Para pessoas em áreas criativas, como animadores, artistas e produtores, o Beam pode tornar o trabalho de equipa remoto mais fácil e natural. Quer se trate de um brainstorming de ideias ou da revisão de um projeto, a sensação é mais de estarmos juntos num estúdio do que numa videochamada.

Prós e contras do Google Beam

Eis alguns dos principais benefícios que uma inovação como o Google Beam traz para a mesa:

Não são necessários auscultadores: Ao contrário de muitas tecnologias imersivas, o Beam funciona sem necessitar de auscultadores AR ou VR. Isto torna a experiência mais confortável e evita problemas comuns como o enjoo de movimento ou a inconveniência de usar equipamento extra.
‍
Redução da fadiga do ecrã: O ecrã 3D oferece uma experiência de visualização mais natural e confortável, que pode ajudar a reduzir a fadiga ocular em comparação com o olhar fixo em ecrãs planos durante longos períodos.
‍
Tradução de idiomas em tempo real: O Beam pode incorporar tradução em tempo real com recurso a IA, facilitando a comunicação natural entre pessoas que falam línguas diferentes em reuniões internacionais ou ambientes de aprendizagem.

O Beam é um passo em frente prometedor, mas, como qualquer nova tecnologia, tem algumas limitações. Eis alguns aspectos a ter em conta:

Requisitos de hardware: O feixe requer equipamento especializado e topo de gama, como ecrãs de campo de luz e várias câmaras, o que o torna dispendioso e menos acessível para indivíduos e organizações mais pequenas.
‍
Não é portátil: O sistema Beam foi concebido para uma instalação fixa e não se destina a ser facilmente deslocado, o que limita a sua flexibilidade e utilização em ambientes móveis ou em mudança.

Principais conclusões

O Google Beam é um passo fascinante no sentido de tornar a comunicação virtual mais humana. Embora ainda esteja na sua fase inicial, tem potencial para transformar a forma como nos encontramos, ligamos e colaboramos. Ao combinar IA avançada, imagens 3D e áudio espacial, cria uma experiência remota mais realista e envolvente.

À medida que a Google continua a melhorar o hardware do Beam, a torná-lo ainda mais pequeno e, possivelmente, a levá-lo aos utilizadores comuns, traz possibilidades interessantes para o futuro da comunicação virtual. Juntamente com as novas tendências tecnológicas, como as reuniões holográficas e os avatares 3D, o Beam está a definir um novo padrão para as reuniões virtuais.

Junte-se à nossa comunidade e veja as nossas opções de licenciamento para começar a utilizar a visão computacional hoje mesmo. Consulte o nosso repositório GitHub para saber mais sobre IA. Leia as nossas páginas de soluções para obter informações sobre vários casos de utilização de IA no retalho e visão computacional na agricultura.

Explorar o Google Beam: uma ferramenta de videoconferência 3D de última geração

Passar do Projeto Starline para o Google Beam

Uma visão geral do Google Beam

Como o Google Beam cria reuniões virtuais realistas

Captura de imagens para colaboração remota imersiva

Videoconferência de imagem 2D para 3D

Sistemas de visualização do campo de luz do Google Beam

Seguimento da cabeça em tempo real com precisão milimétrica

Processamento de áudio para comunicação virtual melhorada por IA

Aplicações do Google Beam

Prós e contras do Google Beam

Principais conclusões

Ler mais nesta categoria

FastVLM: Apple apresenta o seu novo modelo de linguagem de visão rápida

Automação do fabrico através de IA de visão

Explicação da Internet das coisas industrial (IIoT)

Vamos construir juntos o futuro
da IA!

Explorar o Google Beam: uma ferramenta de videoconferência 3D de última geração

Passar do Projeto Starline para o Google Beam

Uma visão geral do Google Beam

Como o Google Beam cria reuniões virtuais realistas

Captura de imagens para colaboração remota imersiva

Videoconferência de imagem 2D para 3D

Sistemas de visualização do campo de luz do Google Beam

Seguimento da cabeça em tempo real com precisão milimétrica

Processamento de áudio para comunicação virtual melhorada por IA

Aplicações do Google Beam

Prós e contras do Google Beam

Principais conclusões

Ler mais nesta categoria

FastVLM: Apple apresenta o seu novo modelo de linguagem de visão rápida

Automação do fabrico através de IA de visão

Explicação da Internet das coisas industrial (IIoT)

Vamos construir juntos o futuro da IA!

Vamos construir juntos o futuro
da IA!