Google Beam: una herramienta de videoconferencia 3D de última generación

Del Proyecto Starline a Google Beam

Visión general de Google Beam

Cómo Google Beam crea reuniones virtuales realistas

Captura de imágenes para una colaboración inmersiva a distancia

Videoconferencia de imagen 2D a 3D

Sistemas de visualización del campo luminoso de Google Beam

Seguimiento milimétrico de la cabeza en tiempo real

Procesamiento de audio para la comunicación virtual mejorada por inteligencia artificial

Aplicaciones de Google Beam

Ventajas e inconvenientes de Google Beam

Principales conclusiones

Las videollamadas y las reuniones virtuales han hecho posible el trabajo a distancia, ayudando a los equipos a mantenerse conectados a través de países y husos horarios. Se han convertido en parte habitual de nuestras vidas y han cambiado nuestra forma de comunicarnos.

Sin embargo, a pesar de su uso generalizado, la tecnología básica de las videoconferencias ha permanecido prácticamente inalterada durante años. Gracias a los últimos avances, las plataformas de videoconferencia están empezando a cambiar, con el objetivo de parecer más naturales y realistas.

Curiosamente, en su conferencia anual de desarrolladores (Google I/O 2025), Google presentó su nueva herramienta de videocomunicación, conocida como Google Beam. Beam utiliza inteligencia artificial (IA) y tecnología de videoconferencia en 3D para ir más allá de las tradicionales pantallas planas y crear una experiencia más inmersiva y en persona.

Fig 1. Sundar Pichai, consejero delegado de Google, presenta Google Beam(fuente).

‍

De hecho, Google Beam está diseñado para que sientas que la persona con la que hablas está delante de ti. A diferencia de las videollamadas normales, devuelve sutiles señales humanas, como el contacto visual y el movimiento natural que cambia con tu perspectiva, detalles que a menudo se pierden en las pantallas planas.

En este artículo vamos a profundizar en qué es Google Beam, cómo se desarrolló, cómo funciona y sus aplicaciones. Empecemos.

Del Proyecto Starline a Google Beam

Antes de echar un vistazo más de cerca a Google Beam, conozcamos mejor a su predecesor, Project Starline.

Presentado en Google I/O 2021, Project Starline era una iniciativa de investigación cuyo objetivo era conseguir que la comunicación a distancia fuera más realista, casi como si se estuviera en la misma habitación. Funcionaba creando imágenes tridimensionales de personas en tiempo real. Aunque la tecnología atrajo mucha atención, requería configuraciones complejas y hardware pesado.

Fig. 2. Un vistazo al Proyecto Starline(Fuente).

‍

Con el paso de los años, a medida que la tecnología avanzaba, Google fue perfeccionando el software y racionalizando el hardware. Tras cuatro años de desarrollo, el proyecto Starline se ha convertido en Google Beam, una solución más compacta y fácil de usar.

Google Beam utiliza la inteligencia artificial para mejorar las videollamadas creando imágenes más realistas y tridimensionales de las personas con las que hablas. Convierte el vídeo 2D normal en vistas que se ajustan a diferentes ángulos, ayudando a mantener el contacto visual y haciendo que las expresiones faciales sean más fáciles de ver. También incluye funciones como traducción en tiempo real, seguimiento de la cabeza y audio espacial.

Visión general de Google Beam

Google Beam se ha desarrollado para funcionar sin accesorios adicionales, como cascos de realidad aumentada (RA) o realidad virtual (RV). En su lugar, incorpora su propia pantalla, sistema de cámara y hardware para crear imágenes en 3D. Esto hace que las videollamadas resulten más naturales, cómodas y atractivas que las típicas videoconferencias.

Fig. 3. Ejemplo de uso de Google Beam(Fuente).

‍

Cómo Google Beam crea reuniones virtuales realistas

Ahora que hemos hablado de cómo surgió Google Beam, veamos más de cerca cómo funciona.

Captura de imágenes para una colaboración inmersiva a distancia

Todo comienza con la captura de información visual. Beam utiliza seis cámaras de alta resolución para tomar imágenes desde distintos ángulos al mismo tiempo.

Estas cámaras ayudan a rastrear los rasgos faciales, el lenguaje corporal y los pequeños movimientos en tiempo real. La IA desempeña un papel fundamental al optimizar los ajustes de las cámaras y mantener todas las señales de vídeo perfectamente sincronizadas. Esto prepara el sistema para la siguiente fase: el procesamiento de datos.

Videoconferencia de imagen 2D a 3D

A continuación, se utiliza la IA para combinar las seis imágenes 2D de la cámara y generar un modelo 3D en tiempo real de la persona que se está viendo. En lugar de limitarse a superponer imágenes 2D, reconstruye la profundidad, las sombras y las relaciones espaciales para crear un gemelo digital en 3D.

Para construir este modelo 3D, Beam utiliza técnicas de IA y visión por ordenador como la estimación de la profundidad y el seguimiento del movimiento. Estos métodos ayudan a determinar a qué distancia se encuentra una persona de la cámara, cómo se mueve y cómo está colocado su cuerpo. Con estos datos, el sistema puede mapear con precisión los rasgos faciales y las partes del cuerpo en el espacio 3D.

El modelo de IA que hay detrás de Beam actualiza la representación 3D a 60 fotogramas por segundo (FPS ) para que las conversaciones sean fluidas y realistas. También realiza ajustes en tiempo real para reflejar con precisión los movimientos de la persona.

Fig. 4. Las seis cámaras de Google Beam captan imágenes desde distintos ángulos(Fuente).

‍

Sistemas de visualización del campo luminoso de Google Beam

El modelo 3D se muestra en el sistema Beam del receptor mediante una pantalla de campo luminoso. A diferencia de las pantallas convencionales, que presentan la misma imagen a ambos ojos, una pantalla de campo de luz emite imágenes ligeramente diferentes a cada ojo, simulando la forma en que percibimos la profundidad en la vida real. Esto crea una experiencia visual tridimensional más realista.

Fig. 5. Chocando los cinco virtualmente a través de Google Beam(Fuente).

‍

Seguimiento milimétrico de la cabeza en tiempo real

Una de las características más impresionantes de Google Beam es su capacidad de seguimiento de la IA en tiempo real. El sistema utiliza un seguimiento preciso de la cabeza y los ojos para seguir los movimientos hasta el más mínimo detalle.

Por ejemplo, el motor de inteligencia artificial de Beam puede seguir continuamente la posición de la cabeza del usuario y realizar sutiles ajustes en la imagen en tiempo real. Esto crea la impresión de que la persona en pantalla está realmente sentada frente a ti. Cuando mueves la cabeza, la imagen 3D cambia en consecuencia, como en una conversación real cara a cara.

Procesamiento de audio para la comunicación virtual mejorada por inteligencia artificial

Beam también mejora la experiencia de audio utilizando un sonido espacial que coincide con el lugar donde aparece la persona en la pantalla. Si alguien está en el lado izquierdo de la pantalla, su voz sonará como si viniera de la izquierda. A medida que la persona cambia de posición, el sonido se adapta a ella. Esto hace que las conversaciones parezcan más naturales y ayuda a tu cerebro a seguir quién está hablando sin esfuerzo adicional.

Funciona combinando técnicas de audio direccional con seguimiento en tiempo real. Beam utiliza audio espacial para simular cómo percibimos el sonido de forma natural en el mundo real (basándose en la dirección de la que procede y cómo llega a cada oído). El sistema también sigue los movimientos de la cabeza del espectador y ajusta la salida de audio en consecuencia, para que el sonido permanezca "pegado" a la persona en pantalla.

Aplicaciones de Google Beam

Google Beam, aunque aún se encuentra en sus primeras fases, muestra un potencial prometedor en el ámbito de las videoconferencias. Estas son algunas de sus principales aplicaciones:

Colaboración a distancia: Google Beam puede hacer que las reuniones, especialmente los debates sobre liderazgo o las negociaciones de alto nivel, sean más personales y eficaces. Al captar factores sutiles como el lenguaje corporal y el contacto visual, ayuda a las personas a sentirse más presentes, incluso cuando están lejos.
‍
Educación: Beam tiene el potencial de hacer que el aprendizaje virtual sea más emocionante y accesible. Imagínese a un científico dando una conferencia en directo a estudiantes al otro lado del mundo, y que realmente parezca que están en la misma sala.
‍
Sanidad: El rayo podría hacer más personales las consultas a distancia. Cuando médicos y pacientes pueden verse con claridad y establecer un contacto visual natural, se genera confianza y la interacción resulta más humana.
‍
Industrias creativas: Para las personas que trabajan en campos creativos, como animadores, artistas y productores, Beam puede hacer que el trabajo en equipo a distancia resulte más fácil y natural. Tanto si se trata de una lluvia de ideas como de revisar un proyecto, la sensación es más parecida a la de estar sentados juntos en un estudio que a la de una videollamada.

Ventajas e inconvenientes de Google Beam

Estas son algunas de las principales ventajas que aporta una innovación como Google Beam:

No se necesitan auriculares: A diferencia de muchas tecnologías inmersivas, Beam funciona sin necesidad de cascos de realidad aumentada o realidad virtual. Esto hace que la experiencia sea más cómoda y evita problemas comunes como el mareo por movimiento o la inconveniencia de llevar equipo adicional.
‍
Menor fatiga de pantalla: La pantalla 3D ofrece una experiencia visual más natural y cómoda, que puede ayudar a reducir la fatiga ocular en comparación con mirar fijamente a pantallas planas durante largos periodos.
‍
Traducción de idiomas en tiempo real: Beam puede incorporar traducción en tiempo real impulsada por IA, lo que facilita que personas que hablan idiomas diferentes se comuniquen con naturalidad en reuniones internacionales o entornos de aprendizaje.

El rayo es un paso adelante prometedor, pero, como cualquier nueva tecnología, tiene algunas limitaciones. He aquí algunos aspectos a tener en cuenta:

Requisitos de hardware: El haz de luz requiere equipos especializados de alta gama, como pantallas de campo luminoso y múltiples cámaras, lo que lo hace caro y menos accesible para particulares y pequeñas organizaciones.
‍
No es portátil: El sistema Beam está diseñado para una instalación fija y no está pensado para ser trasladado con facilidad, lo que limita su flexibilidad y uso en entornos móviles o cambiantes.

Principales conclusiones

Google Beam es un paso fascinante hacia una comunicación virtual más humana. Aunque aún está en sus primeras fases, tiene el potencial de transformar la forma en que nos reunimos, conectamos y colaboramos. Al combinar IA avanzada, imágenes 3D y audio espacial, crea una experiencia remota más realista y atractiva.

A medida que Google sigue mejorando el hardware de Beam, haciéndolo aún más pequeño y, posiblemente, llevándolo a los usuarios de a pie, ofrece posibilidades apasionantes para el futuro de la comunicación virtual. Junto con nuevas tendencias tecnológicas como las reuniones holográficas y los avatares 3D, Beam está estableciendo un nuevo estándar para las reuniones virtuales.

Únete a nuestra comunidad y echa un vistazo a nuestras opciones de licencia para empezar hoy mismo con la visión por computador. Consulte nuestro repositorio de GitHub para obtener más información sobre la IA. Lea nuestras páginas de soluciones para obtener información sobre diversos casos de uso de la IA en el comercio minorista y la visión por ordenador en la agricultura.

Google Beam: una herramienta de videoconferencia 3D de última generación

Del Proyecto Starline a Google Beam

Visión general de Google Beam

Cómo Google Beam crea reuniones virtuales realistas

Captura de imágenes para una colaboración inmersiva a distancia

Videoconferencia de imagen 2D a 3D

Sistemas de visualización del campo luminoso de Google Beam

Seguimiento milimétrico de la cabeza en tiempo real

Procesamiento de audio para la comunicación virtual mejorada por inteligencia artificial

Aplicaciones de Google Beam

Ventajas e inconvenientes de Google Beam

Principales conclusiones

Leer más en esta categoría

FastVLM: Apple presenta su nuevo modelo de lenguaje de visión rápida

Automatización de la fabricación mediante IA de visión

El Internet industrial de las cosas (IIoT) explicado

¡Construyamos juntos el futuro
de la IA!

Google Beam: una herramienta de videoconferencia 3D de última generación

Del Proyecto Starline a Google Beam

Visión general de Google Beam

Cómo Google Beam crea reuniones virtuales realistas

Captura de imágenes para una colaboración inmersiva a distancia

Videoconferencia de imagen 2D a 3D

Sistemas de visualización del campo luminoso de Google Beam

Seguimiento milimétrico de la cabeza en tiempo real

Procesamiento de audio para la comunicación virtual mejorada por inteligencia artificial

Aplicaciones de Google Beam

Ventajas e inconvenientes de Google Beam

Principales conclusiones

Leer más en esta categoría

FastVLM: Apple presenta su nuevo modelo de lenguaje de visión rápida

Automatización de la fabricación mediante IA de visión

El Internet industrial de las cosas (IIoT) explicado

¡Construyamos juntos el futuro de la IA!

¡Construyamos juntos el futuro
de la IA!