Yolo Vision Shenzhen
Shenzhen
Únete ahora

Google Beam: una herramienta de videoconferencia 3D de última generación

Conozca Google Beam, una herramienta de videoconferencia 3D de nueva generación. Explora cómo utiliza las imágenes en 3D y la IA para permitir reuniones virtuales realistas y envolventes.

Las videollamadas y las reuniones virtuales han hecho posible el trabajo a distancia, ayudando a los equipos a mantenerse conectados a través de países y zonas horarias. Se han convertido en una parte habitual de nuestras vidas y han cambiado la forma en que nos comunicamos.

Sin embargo, a pesar de su uso generalizado, la tecnología central detrás de las videoconferencias se ha mantenido prácticamente sin cambios durante años. Gracias a los avances recientes, las plataformas de videoconferencia están empezando a cambiar, con el objetivo de sentirse más naturales y realistas.

Curiosamente, en su conferencia anual de desarrolladoresGoogle I/O 2025), Google presentó su nueva herramienta de videocomunicación, conocida como Google Beam. Beam utiliza inteligencia artificial (IA) y tecnología de videoconferencia en 3D para ir más allá de las tradicionales pantallas planas y crear una experiencia más inmersiva y en persona.

Fig 1. Sundar Pichai, consejero delegado Google, presenta Google Beam(fuente).

De hecho, Google Beam está diseñado para que sientas que la persona con la que hablas está delante de ti. A diferencia de las videollamadas normales, devuelve sutiles señales humanas, como el contacto visual y el movimiento natural que cambia con tu perspectiva, detalles que a menudo se pierden en las pantallas planas.

En este artículo vamos a profundizar en qué es Google Beam, cómo se desarrolló, cómo funciona y sus aplicaciones. Empecemos.

Del Proyecto Starline a Google Beam

Antes de echar un vistazo más de cerca a Google Beam, conozcamos mejor a su predecesor, Project Starline.

Presentado en Google I/O 2021, Project Starline era una iniciativa de investigación destinada a hacer que la comunicación a distancia pareciera más real, casi como si estuvieras en la misma habitación. Funcionaba creando imágenes tridimensionales de personas en tiempo real. Aunque la tecnología atrajo mucha atención, requería configuraciones complejas y hardware pesado.

Fig. 2. Una mirada al Proyecto Starline (Fuente).

Con el paso de los años, a medida que la tecnología avanzaba, Google fue perfeccionando el software y racionalizando el hardware. Tras cuatro años de desarrollo, el proyecto Starline se ha convertido en Google Beam, una solución más compacta y fácil de usar.

Google Beam utiliza la inteligencia artificial para mejorar las videollamadas creando imágenes más realistas y tridimensionales de las personas con las que hablas. Convierte el vídeo 2D normal en vistas que se ajustan a diferentes ángulos, ayudando a mantener el contacto visual y haciendo que las expresiones faciales sean más fáciles de ver. También incluye funciones como traducción en tiempo real, seguimiento de la cabeza y audio espacial.

Visión general de Google Beam

Google Beam se ha desarrollado para funcionar sin accesorios adicionales, como cascos de realidad aumentada (RA) o realidad virtual (RV). En su lugar, incorpora su propia pantalla, sistema de cámara y hardware para crear imágenes en 3D. Esto hace que las videollamadas resulten más naturales, cómodas y atractivas que las típicas videoconferencias.

Fig. 3. Ejemplo de uso de Google Beam(Fuente).

Cómo Google Beam crea reuniones virtuales realistas

Ahora que hemos hablado de cómo surgió Google Beam, veamos más de cerca cómo funciona.

Captura de imágenes para una colaboración remota inmersiva

Todo comienza con la captura de información visual. Beam utiliza seis cámaras de alta resolución para tomar fotografías desde diferentes ángulos al mismo tiempo. 

Estas cámaras ayudan a track los rasgos faciales, el lenguaje corporal y los pequeños movimientos en tiempo real. La IA desempeña un papel fundamental al optimizar los ajustes de las cámaras y mantener todas las señales de vídeo perfectamente sincronizadas. Esto prepara el sistema para la siguiente fase: el procesamiento de datos.

Imagen 2D a videoconferencia 3D

A continuación, se utiliza la IA para combinar las seis fuentes de cámara 2D con el fin de generar un modelo 3D en tiempo real de la persona a la vista. En lugar de simplemente superponer imágenes 2D, reconstruye la profundidad, las sombras y las relaciones espaciales para crear un gemelo digital 3D completo.

Para construir este modelo 3D, Beam utiliza la IA y técnicas de visión artificial como la estimación de profundidad y el seguimiento del movimiento. Estos métodos ayudan a determinar a qué distancia está una persona de la cámara, cómo se mueve y cómo se posiciona su cuerpo. Con estos datos, el sistema puede mapear los rasgos faciales y las partes del cuerpo con precisión en el espacio 3D.

El modelo de IA detrás de Beam actualiza la representación 3D a 60 fotogramas por segundo (FPS) para que las conversaciones sean fluidas y realistas. También realiza ajustes en tiempo real para reflejar con precisión los movimientos de la persona.

Fig. 4. Las seis cámaras de Google Beam captan imágenes desde distintos ángulos(Fuente).

Sistemas de visualización del campo luminoso de Google Beam

El modelo 3D se muestra en el sistema Beam del receptor mediante una pantalla de campo de luz. A diferencia de las pantallas convencionales que presentan la misma imagen a ambos ojos, una pantalla de campo de luz emite imágenes ligeramente diferentes a cada ojo, simulando la forma en que percibimos la profundidad en la vida real. Esto crea una experiencia visual tridimensional más realista.

Fig. 5. Chocando los cinco virtualmente a través de Google Beam(Fuente).

Seguimiento de la cabeza en tiempo real con precisión milimétrica

Una de las características más impresionantes de Google Beam es su capacidad de seguimiento de la IA en tiempo real. El sistema utiliza un seguimiento preciso de la cabeza y los ojos para seguir los movimientos hasta el más mínimo detalle. 

Por ejemplo, el motor de inteligencia artificial de Beam puede track continuamente la posición de la cabeza del usuario y realizar sutiles ajustes en la imagen en tiempo real. Esto crea la impresión de que la persona en pantalla está realmente sentada frente a ti. Cuando mueves la cabeza, la imagen 3D cambia en consecuencia, como en una conversación real cara a cara.

Procesamiento de audio para la comunicación virtual mejorada por la IA

Beam también mejora la experiencia de audio mediante el uso de sonido espacial que coincide con el lugar donde aparece la persona en la pantalla. Si alguien está en el lado izquierdo de la pantalla, su voz sonará como si viniera de la izquierda. A medida que cambian de posición, el audio se ajusta con ellos. Esto hace que las conversaciones se sientan más naturales y ayuda a tu cerebro a seguir quién está hablando sin esfuerzo adicional.

Esto funciona combinando técnicas de audio direccional con seguimiento en tiempo real. Beam utiliza audio espacial para simular cómo percibimos naturalmente el sonido en el mundo real (basado en la dirección de la que proviene y cómo llega a cada oído). El sistema también rastrea los movimientos de la cabeza del espectador y ajusta la salida de audio en consecuencia, de modo que el sonido permanezca “conectado” a la persona en la pantalla. 

Aplicaciones de Google Beam

Google Beam, aunque aún se encuentra en sus primeras fases, muestra un potencial prometedor en el ámbito de las videoconferencias. Estas son algunas de sus principales aplicaciones:

  • Colaboración a distancia: Google Beam puede hacer que las reuniones, especialmente los debates sobre liderazgo o las negociaciones de alto nivel, sean más personales y eficaces. Al captar factores sutiles como el lenguaje corporal y el contacto visual, ayuda a las personas a sentirse más presentes, incluso cuando están lejos.
  • Educación: Beam tiene el potencial de hacer que el aprendizaje virtual sea más emocionante y accesible. Imagina a un científico dando una conferencia en vivo a estudiantes al otro lado del mundo, y que realmente se sienta como si estuvieran en la misma habitación. 
  • Atención Médica: Beam podría hacer que las consultas remotas se sientan más personales. Cuando los médicos y los pacientes pueden verse claramente y hacer contacto visual natural, se genera confianza y la interacción se siente más humana.
  • Industrias creativas: Para las personas en campos creativos, como animadores, artistas y productores, Beam puede hacer que el trabajo en equipo remoto se sienta más fácil y natural. Ya sea para intercambiar ideas o revisar un proyecto, se siente más como estar sentado juntos en un estudio que en una videollamada.

Ventajas e inconvenientes de Google Beam

Estas son algunas de las principales ventajas que aporta una innovación como Google Beam:

  • No se necesitan auriculares: A diferencia de muchas tecnologías inmersivas, Beam funciona sin necesidad de auriculares de RA o RV. Esto hace que la experiencia sea más cómoda y evita problemas comunes como el mareo o la incomodidad de llevar equipo adicional.
  • Fatiga visual reducida: La pantalla 3D ofrece una experiencia de visualización más natural y cómoda, lo que puede ayudar a reducir la fatiga ocular en comparación con mirar pantallas planas durante largos períodos.
  • Traducción de idiomas en tiempo real: Beam puede incorporar la traducción en tiempo real impulsada por IA, lo que facilita que las personas que hablan diferentes idiomas se comuniquen de forma natural en reuniones internacionales o entornos de aprendizaje.

Beam es un paso adelante prometedor, pero como cualquier nueva tecnología, tiene algunas limitaciones. Aquí hay algunas cosas a considerar:

  • Requisitos de hardware: Beam requiere equipos especializados de alta gama, como pantallas de campo de luz y múltiples cámaras, lo que lo hace costoso y menos accesible para particulares y organizaciones más pequeñas.
  • No portátil: El sistema de Beam está diseñado para una instalación fija y no está pensado para ser movido fácilmente, lo que limita su flexibilidad y uso en entornos móviles o cambiantes.

Conclusiones clave

Google Beam es un paso fascinante hacia una comunicación virtual más humana. Aunque aún está en sus primeras fases, tiene el potencial de transformar la forma en que nos reunimos, conectamos y colaboramos. Al combinar IA avanzada, imágenes 3D y audio espacial, crea una experiencia remota más realista y atractiva.

A medida que Google sigue mejorando el hardware de Beam, haciéndolo aún más pequeño y, posiblemente, llevándolo a los usuarios de a pie, ofrece posibilidades apasionantes para el futuro de la comunicación virtual. Junto con nuevas tendencias tecnológicas como las reuniones holográficas y los avatares 3D, Beam está estableciendo un nuevo estándar para las reuniones virtuales.

Únase a nuestra comunidad y eche un vistazo a nuestras opciones de licencia para comenzar hoy mismo con la visión artificial. Consulte nuestro repositorio de GitHub para obtener más información sobre la IA. Lea nuestras páginas de soluciones para obtener información sobre varios casos de uso de la IA en el comercio minorista y la visión artificial en la agricultura

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Comienza gratis