Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
IA de visión

Explorando Google Beam: una herramienta de videoconferencia 3D de última generación

Aprende sobre Google Beam, una herramienta de videoconferencia 3D de próxima generación. Descubre cómo utiliza la imagen 3D y la IA para permitir reuniones virtuales realistas e inmersivas.

ABAbirami Vina
4 min read
Videoconferencia 3D con Google Beam para reuniones virtuales inmersivas

Las videollamadas y las reuniones virtuales han hecho posible el trabajo remoto, ayudando a los equipos a mantenerse conectados a través de países y zonas horarias. Se han convertido en una parte habitual de nuestras vidas y han cambiado la forma en que nos comunicamos.

Sin embargo, a pesar de su uso generalizado, la tecnología principal detrás de la videoconferencia ha permanecido prácticamente inalterada durante años. Gracias a los avances recientes, las plataformas de videoconferencia están empezando a cambiar, con el objetivo de sentirse más naturales y realistas.

Curiosamente, en su conferencia anual de desarrolladores (Google I/O 2025), Google presentó su nueva herramienta de comunicación por vídeo, conocida como Google Beam. Beam utiliza inteligencia artificial (IA) y tecnología de videoconferencia 3D para ir más allá de las pantallas planas tradicionales y crear una experiencia más inmersiva y personal.

El CEO de Google, Sundar Pichai, presentando Google Beam

Fig 1. El CEO de Google, Sundar Pichai, presentando Google Beam (Fuente).

De hecho, Google Beam está diseñado para que sientas que la persona con la que hablas está justo ahí, frente a ti. A diferencia de las videollamadas normales, recupera señales humanas sutiles, como el contacto visual y el movimiento natural que cambia según tu perspectiva, detalles que a menudo se pierden en las pantallas planas.

En este artículo, profundizaremos en qué es Google Beam, cómo se desarrolló, cómo funciona y sus aplicaciones. ¡Empecemos!

Link to this sectionDe Project Starline a Google Beam#

Antes de analizar más de cerca Google Beam, entendamos mejor a su predecesor, Project Starline.

Presentado en Google I/O 2021, Project Starline fue una iniciativa de investigación destinada a hacer que la comunicación remota pareciera más realista, casi como si estuvieras en la misma habitación. Funcionaba creando imágenes 3D a tamaño real de las personas en tiempo real. Aunque la tecnología llamó mucho la atención, requería configuraciones complejas y hardware pesado.

Un vistazo al Project Starline

Fig 2. Un vistazo a Project Starline (Fuente).

A lo largo de los años, a medida que la tecnología avanzaba, Google refinó el software y simplificó el hardware. Tras cuatro años de desarrollo, Project Starline ha evolucionado hasta convertirse en Google Beam: una solución más compacta y fácil de usar.

Google Beam utiliza IA para mejorar las videollamadas creando imágenes en 3D más realistas de las personas con las que hablas. Convierte el vídeo 2D normal en vistas que se ajustan a diferentes ángulos, lo que ayuda a mantener el contacto visual y facilita la visualización de las expresiones faciales. También incluye características como traducción en tiempo real, seguimiento de cabeza y audio espacial.

Link to this sectionUna visión general de Google Beam#

Google Beam ha sido desarrollado para funcionar sin accesorios adicionales como auriculares de realidad aumentada (AR) o realidad virtual (VR). En su lugar, viene con su propia pantalla, sistema de cámara y hardware integrados para crear visuales en 3D. Esto hace que las videollamadas se sientan más naturales, cómodas y atractivas que las típicas reuniones por vídeo.

Un ejemplo del uso de Google Beam

Fig 3. Un ejemplo de uso de Google Beam (Fuente).

Link to this sectionCómo crea Google Beam reuniones virtuales realistas#

Ahora que hemos discutido cómo surgió Google Beam, echemos un vistazo más de cerca a cómo funciona.

Link to this sectionCaptura de imágenes para una colaboración remota inmersiva#

Todo comienza con la captura de información visual. Beam utiliza seis cámaras de alta resolución para tomar imágenes desde diferentes ángulos al mismo tiempo.

Estas cámaras ayudan a seguir las características faciales, el lenguaje corporal y los pequeños movimientos en tiempo real. La IA juega un papel clave al optimizar los ajustes de la cámara y mantener todas las transmisiones de vídeo perfectamente sincronizadas. Esto prepara al sistema para la siguiente etapa: el procesamiento de datos.

Link to this sectionDe vídeo 2D a videoconferencia 3D#

A continuación, se utiliza IA para combinar las seis transmisiones de cámara 2D y generar un modelo 3D en tiempo real de la persona que se está viendo. En lugar de simplemente superponer imágenes 2D, reconstruye la profundidad, las sombras y las relaciones espaciales para crear un gemelo digital 3D completo.

Para construir este modelo 3D, Beam utiliza IA y técnicas de visión artificial como la estimación de profundidad y el seguimiento de movimiento. Estos métodos ayudan a determinar a qué distancia está una persona de la cámara, cómo se mueve y cómo está posicionada su cuerpo. Con estos datos, el sistema puede mapear las características faciales y partes del cuerpo con precisión en el espacio 3D.

El modelo de IA detrás de Beam actualiza la representación 3D a 60 fotogramas por segundo (FPS) para mantener las conversaciones fluidas y realistas. También realiza ajustes en tiempo real para reflejar los movimientos de la persona con precisión.

Las seis cámaras de Google Beam capturando imágenes desde diferentes ángulos

Fig 4. Las seis cámaras de Google Beam capturan imágenes desde diferentes ángulos (Fuente).

Link to this sectionSistemas de visualización de campo de luz de Google Beam#

El modelo 3D se muestra en el sistema Beam del receptor mediante una pantalla de campo de luz. A diferencia de las pantallas convencionales que presentan la misma imagen a ambos ojos, una pantalla de campo de luz emite imágenes ligeramente diferentes a cada ojo, simulando la forma en que percibimos la profundidad en la vida real. Esto crea una experiencia visual tridimensional más realista.

Intercambiando choques de manos virtuales a través de Google Beam

Fig 5. Intercambiando choques de manos virtuales a través de Google Beam (Fuente).

Link to this sectionSeguimiento de cabeza en tiempo real con precisión milimétrica#

Una de las características más impresionantes de Google Beam es su capacidad de seguimiento por IA en tiempo real. El sistema utiliza un seguimiento preciso de cabeza y ojos para seguir los movimientos hasta el más mínimo detalle.

Por ejemplo, el motor de IA de Beam puede rastrear continuamente la posición de la cabeza del usuario y realizar ajustes sutiles en la imagen en tiempo real. Esto crea la impresión de que la persona en la pantalla está realmente sentada frente a ti. A medida que mueves la cabeza, la imagen 3D cambia en consecuencia, tal como en una conversación real cara a cara.

Link to this sectionProcesamiento de audio para comunicación virtual mejorada con IA#

Beam también mejora la experiencia de audio utilizando sonido espacial que coincide con el lugar donde aparece la persona en la pantalla. Si alguien está en el lado izquierdo de la pantalla, su voz sonará como si viniera de la izquierda. A medida que cambian de posición, el audio se ajusta con ellos. Esto hace que las conversaciones se sientan más naturales y ayuda a tu cerebro a seguir quién está hablando sin esfuerzo adicional.

Esto funciona combinando técnicas de audio direccional con seguimiento en tiempo real. Beam utiliza audio espacial para simular cómo percibimos naturalmente el sonido en el mundo real (basado en la dirección de la que proviene y cómo llega a cada oído). El sistema también rastrea los movimientos de la cabeza del espectador y ajusta la salida de audio en consecuencia, por lo que el sonido permanece “pegado” a la persona en la pantalla.

Link to this sectionAplicaciones de Google Beam#

Google Beam, aunque todavía está en sus primeras etapas, muestra un potencial prometedor en el espacio de la videoconferencia. Estas son algunas de sus aplicaciones clave:

  • Colaboración remota: Google Beam puede hacer que las reuniones, especialmente las discusiones de liderazgo o las negociaciones de alto nivel, se sientan más personales y efectivas. Al capturar factores sutiles como el lenguaje corporal y el contacto visual, ayuda a las personas a sentirse más presentes, incluso cuando están muy lejos.
  • Educación: Beam tiene el potencial de hacer que el aprendizaje virtual sea más emocionante y accesible. Imagina a un científico dando una clase en directo a estudiantes al otro lado del mundo, y que realmente parezca que están en la misma habitación.
  • Atención sanitaria: Beam podría hacer que las consultas remotas se sientan más personales. Cuando los médicos y los pacientes pueden verse claramente y mantener un contacto visual natural, se genera confianza y la interacción se siente más humana.
  • Industrias creativas: Para las personas en campos creativos, como animadores, artistas y productores, Beam puede hacer que el trabajo en equipo remoto se sienta más fácil y natural. Ya sea intercambiando ideas o revisando un proyecto, se siente más como si estuvieran sentados juntos en un estudio que en una videollamada.

Link to this sectionPros y contras de Google Beam#

Estos son algunos de los beneficios clave que aporta una innovación como Google Beam:

  • No se necesitan auriculares: A diferencia de muchas tecnologías inmersivas, Beam funciona sin necesidad de auriculares de AR o VR. Esto hace que la experiencia sea más cómoda y evita problemas comunes como el mareo o la incomodidad de llevar equipo adicional.
  • Reducción de la fatiga visual: La pantalla 3D ofrece una experiencia de visualización más natural y cómoda, lo que puede ayudar a reducir la fatiga ocular en comparación con mirar pantallas planas durante largos períodos.
  • Traducción de idiomas en tiempo real: Beam puede incorporar traducción en tiempo real impulsada por IA, lo que facilita que las personas que hablan diferentes idiomas se comuniquen de forma natural en reuniones internacionales o entornos de aprendizaje.

Beam es un paso prometedor hacia adelante, pero como cualquier tecnología nueva, tiene algunas limitaciones. Aquí hay algunas cosas a considerar:

  • Requisitos de hardware: Beam requiere equipos especializados de alta gama, como pantallas de campo de luz y múltiples cámaras, lo que lo hace caro y menos accesible para particulares y organizaciones pequeñas.
  • No es portátil: El sistema de Beam está diseñado para una instalación fija y no está pensado para ser movido fácilmente, lo que limita su flexibilidad y uso en entornos móviles o cambiantes.

Link to this sectionConclusiones clave#

Google Beam es un paso fascinante para hacer que la comunicación virtual se sienta más humana. Si bien todavía está en sus primeras etapas, tiene el potencial de transformar la forma en que nos reunimos, conectamos y colaboramos. Al combinar IA avanzada, imágenes 3D y audio espacial, crea una experiencia remota más realista y atractiva.

A medida que Google continúa mejorando el hardware de Beam, haciéndolo aún más pequeño y posiblemente llevándolo a los usuarios cotidianos, abre posibilidades emocionantes para el futuro de la comunicación virtual. Junto con nuevas tendencias tecnológicas como las reuniones holográficas y los avatares 3D, Beam está estableciendo un nuevo estándar para las reuniones virtuales.

Únete a nuestra comunidad y echa un vistazo a nuestras opciones de licencia para empezar hoy mismo con la visión artificial. Consulta nuestro repositorio de GitHub para aprender más sobre IA. Lee nuestras páginas de soluciones para obtener información sobre diversos casos de uso de IA en el comercio minorista y visión artificial en la agricultura.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático