Ao clicar em “Aceitar todos os cookies”, concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Definições de cookies
Ao clicar em “Aceitar todos os cookies”, concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Saiba mais sobre o Google Beam, uma ferramenta de videoconferência 3D de última geração. Explore a forma como utiliza imagens 3D e IA para permitir reuniões virtuais realistas e envolventes.
As chamadas de vídeo e as reuniões virtuais tornaram possível o trabalho remoto, ajudando as equipes a permanecerem conectadas entre países e fusos horários. Elas se tornaram uma parte regular de nossas vidas e mudaram a forma como nos comunicamos.
No entanto, apesar do seu uso generalizado, a tecnologia central por trás da videoconferência permaneceu praticamente inalterada durante anos. Graças aos avanços recentes, as plataformas de videoconferência estão começando a mudar, com o objetivo de parecerem mais naturais e realistas.
Curiosamente, na sua conferência anual para programadoresGoogle I/O 2025), Google apresentou a sua nova ferramenta de comunicação por vídeo, conhecida como Google Beam. O Beam utiliza a inteligência artificial (IA) e a tecnologia de videoconferência 3D para ir além dos tradicionais ecrãs planos e criar uma experiência mais envolvente e presencial.
Fig. 1. O diretor executivo da Google, Sundar Pichai, apresenta Google Beam(Fonte).
De facto, Google Beam foi concebido para dar a sensação de que a pessoa com quem está a falar está mesmo à sua frente. Ao contrário das videochamadas normais, o Google Beam recupera pistas humanas subtis, como o contacto visual e o movimento natural que muda com a perspetiva, detalhes que muitas vezes se perdem nos ecrãs planos.
Neste artigo, vamos aprofundar o que é Google Beam, como foi desenvolvido, como funciona e as suas aplicações. Vamos começar!
Passar do Projeto Starline para o Google Beam
Antes de analisarmos mais detalhadamente o Google Beam, vamos compreender melhor o seu antecessor, o Project Starline.
Apresentado no Google I/O 2021, o Projeto Starline foi uma iniciativa de investigação destinada a tornar a comunicação remota mais realista, quase como se estivéssemos na mesma sala. Funcionava através da criação de imagens 3D de pessoas em tamanho real e em tempo real. Embora a tecnologia tenha atraído muita atenção, exigia configurações complexas e hardware pesado.
Fig. 2. Uma visão geral do Project Starline (Fonte).
Ao longo dos anos, com o avanço da tecnologia, Google aperfeiçoou o software e optimizou o hardware. Após quatro anos de desenvolvimento, o Project Starline evoluiu para o Google Beam - uma solução mais compacta e fácil de utilizar.
Google Beam utiliza a IA para melhorar as videochamadas, criando imagens mais realistas e em 3D das pessoas com quem está a falar. Transforma o vídeo 2D normal em vistas que se ajustam a diferentes ângulos, ajudando a manter o contacto visual e facilitando a visualização das expressões faciais. Inclui também funcionalidades como a tradução em tempo real, o seguimento da cabeça e o áudio espacial.
Uma visão geral do Google Beam
Google Beam foi desenvolvido para funcionar sem acessórios extra, como auscultadores de realidade aumentada (AR) ou de realidade virtual (VR). Em vez disso, vem com o seu próprio ecrã incorporado, sistema de câmara e hardware para criar imagens 3D. Isto faz com que as videochamadas sejam mais naturais, confortáveis e envolventes do que as típicas videoconferências.
Fig. 3. Um exemplo de utilização Google Beam(Fonte).
Como Google Beam cria reuniões virtuais realistas
Agora que já falámos sobre como surgiu Google Beam, vamos analisar mais detalhadamente o seu funcionamento.
Captura de imagem para colaboração remota imersiva
Tudo começa com a captura de informação visual. O Beam usa seis câmeras de alta resolução para tirar fotos de diferentes ângulos ao mesmo tempo.
Estas câmaras ajudam a track caraterísticas faciais, linguagem corporal e pequenos movimentos em tempo real. A IA desempenha um papel fundamental, optimizando as definições das câmaras e mantendo todas as transmissões de vídeo perfeitamente sincronizadas. Isto prepara o sistema para a fase seguinte: o processamento de dados.
Imagem 2D para videoconferência 3D
Em seguida, a IA é usada para combinar os seis feeds de câmeras 2D para gerar um modelo 3D em tempo real da pessoa em vista. Em vez de simplesmente sobrepor imagens 2D, ele reconstrói a profundidade, as sombras e as relações espaciais para criar um gêmeo digital 3D completo.
Para construir este modelo 3D, a Beam usa IA e técnicas de visão computacional como estimativa de profundidade e rastreamento de movimento. Esses métodos ajudam a determinar a distância de uma pessoa da câmera, como ela se move e como seu corpo está posicionado. Com esses dados, o sistema pode mapear características faciais e partes do corpo com precisão no espaço 3D.
O modelo de IA por trás do Beam atualiza a representação 3D a 60 quadros por segundo (FPS) para manter as conversas fluidas e realistas. Ele também faz ajustes em tempo real para refletir os movimentos da pessoa com precisão.
Fig. 4. As seis câmaras do Google Beam captam imagens de diferentes ângulos(Fonte).
Sistemas de visualização do campo de luz do Google Beam
O modelo 3D é exibido no sistema Beam do receptor usando um display de campo de luz. Ao contrário das telas convencionais que apresentam a mesma imagem para os dois olhos, um display de campo de luz emite imagens ligeiramente diferentes para cada olho, simulando a maneira como percebemos a profundidade na vida real. Isso cria uma experiência visual tridimensional mais realista.
Fig. 5. Troca de "high-fives" virtuais através do Google Beam(Fonte).
Rastreamento da cabeça em tempo real com precisão milimétrica
Uma das caraterísticas mais impressionantes do Google Beam é a sua capacidade de rastreio de IA em tempo real. O sistema utiliza o seguimento preciso da cabeça e dos olhos para seguir os movimentos até ao mais ínfimo pormenor.
Por exemplo, o motor de IA do Beam pode track continuamente a posição da cabeça do utilizador e fazer ajustes subtis à imagem em tempo real. Isto cria a impressão de que a pessoa no ecrã está realmente sentada à sua frente. À medida que o utilizador move a cabeça, a imagem 3D muda em conformidade, tal como numa conversa real, cara a cara.
Processamento de áudio para comunicação virtual aprimorada por IA
O Beam também melhora a experiência de áudio usando som espacial que corresponde ao local onde a pessoa aparece na tela. Se alguém estiver no lado esquerdo da tela, sua voz soará como se estivesse vindo da esquerda. À medida que mudam de posição, o áudio se ajusta com elas. Isso faz com que as conversas pareçam mais naturais e ajuda seu cérebro a acompanhar quem está falando sem esforço extra.
Isso funciona combinando técnicas de áudio direcional com rastreamento em tempo real. O Beam usa áudio espacial para simular como percebemos naturalmente o som no mundo real (com base na direção de onde ele vem e como ele chega a cada ouvido). O sistema também rastreia os movimentos da cabeça do espectador e ajusta a saída de áudio de acordo, para que o som permaneça “conectado” à pessoa na tela.
Aplicações do Google Beam
Google Beam, embora ainda na sua fase inicial, mostra um potencial promissor no espaço das videoconferências. Eis algumas das suas principais aplicações:
Colaboração remota: Google Beam pode tornar as reuniões, especialmente as discussões de liderança ou as negociações de alto risco, mais pessoais e eficazes. Ao captar factores subtis como a linguagem corporal e o contacto visual, ajuda as pessoas a sentirem-se mais presentes, mesmo quando estão distantes.
Educação: O Beam tem o potencial de tornar o aprendizado virtual mais interessante e acessível. Imagine um cientista dando uma palestra ao vivo para estudantes do outro lado do mundo, e parece que eles estão na mesma sala.
Saúde: O Beam poderia tornar as consultas remotas mais pessoais. Quando médicos e pacientes podem se ver claramente e fazer contato visual natural, isso constrói confiança e torna a interação mais humana.
Setores criativos: Para pessoas em áreas criativas, como animadores, artistas e produtores, o Beam pode tornar o trabalho em equipe remoto mais fácil e natural. Seja para debater ideias ou revisar um projeto, parece mais estar sentado junto em um estúdio do que em uma chamada de vídeo.
Prós e contras do Google Beam
Eis alguns dos principais benefícios que uma inovação como o Google Beam traz para a mesa:
Não são necessários headsets: Ao contrário de muitas tecnologias imersivas, o Beam funciona sem exigir headsets de AR ou VR. Isso torna a experiência mais confortável e evita problemas comuns, como enjoo ou o inconveniente de usar equipamentos extras.
Redução da fadiga ocular: O ecrã 3D oferece uma experiência de visualização mais natural e confortável, o que pode ajudar a reduzir o cansaço visual em comparação com a observação de ecrãs planos por longos períodos.
Tradução de idiomas em tempo real: O Beam pode incorporar tradução em tempo real com tecnologia de IA, tornando mais fácil para pessoas que falam idiomas diferentes se comunicarem naturalmente em reuniões internacionais ou ambientes de aprendizado.
O Beam é um passo promissor, mas como qualquer nova tecnologia, ele vem com algumas limitações. Aqui estão algumas coisas a considerar:
Requisitos de hardware: O Beam requer equipamentos especializados e de alta qualidade, como displays de campo de luz e várias câmeras, o que o torna caro e menos acessível para indivíduos e organizações menores.
Não portátil: O sistema da Beam foi projetado para instalação fixa e não foi feito para ser movido facilmente, o que limita sua flexibilidade e uso em ambientes móveis ou em mudança.
Principais conclusões
Google Beam é um passo fascinante no sentido de tornar a comunicação virtual mais humana. Embora ainda esteja na sua fase inicial, tem potencial para transformar a forma como nos encontramos, ligamos e colaboramos. Ao combinar IA avançada, imagens 3D e áudio espacial, cria uma experiência remota mais realista e envolvente.
À medida que Google continua a melhorar o hardware do Beam, a torná-lo ainda mais pequeno e, possivelmente, a levá-lo aos utilizadores comuns, traz possibilidades interessantes para o futuro da comunicação virtual. Juntamente com as novas tendências tecnológicas, como as reuniões holográficas e os avatares 3D, o Beam está a definir um novo padrão para as reuniões virtuais.