Wenn Sie auf "Alle Cookies akzeptieren" klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Navigation auf der Website zu verbessern, die Nutzung der Website zu analysieren und unsere Marketingaktivitäten zu unterstützen. Mehr Infos
Cookie-Einstellungen
Wenn Sie auf "Alle Cookies akzeptieren" klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Navigation auf der Website zu verbessern, die Nutzung der Website zu analysieren und unsere Marketingaktivitäten zu unterstützen. Mehr Infos
Erfahren Sie mehr über Google Beam, ein 3D-Videokonferenz-Tool der nächsten Generation. Erfahren Sie, wie es 3D-Bilder und künstliche Intelligenz nutzt, um lebensechte und immersive virtuelle Meetings zu ermöglichen.
Videoanrufe und virtuelle Meetings haben die Arbeit aus der Ferne ermöglicht und helfen Teams, über Länder und Zeitzonen hinweg in Verbindung zu bleiben. Sie sind ein fester Bestandteil unseres Lebens geworden und haben die Art und Weise unserer Kommunikation verändert.
Trotz ihrer weiten Verbreitung ist die Kerntechnologie für Videokonferenzen seit Jahren weitgehend unverändert geblieben. Dank der jüngsten Fortschritte beginnen sich die Videokonferenzplattformen zu verändern und sollen sich natürlicher und lebensechter anfühlen.
Interessanterweise hat Google auf seiner jährlichen Entwicklerkonferenz (Google I/O 2025) sein neues Videokommunikationstool, Google Beam, vorgestellt. Beam nutzt künstliche Intelligenz (KI) und 3D-Videokonferenztechnologie, um über herkömmliche Flachbildschirme hinauszugehen und ein intensiveres, persönliches Erlebnis zu schaffen.
Abb. 1. Sundar Pichai, CEO von Google, bei der Einführung von Google Beam(Quelle).
Google Beam ist so konzipiert, dass es sich anfühlt, als ob die Person, mit der Sie sprechen, direkt vor Ihnen sitzt. Anders als bei normalen Videogesprächen werden subtile menschliche Signale wie Augenkontakt und natürliche Bewegungen, die sich mit der Perspektive ändern, wiedergegeben - Details, die auf Flachbildschirmen oft verloren gehen.
In diesem Artikel erfahren Sie, was Google Beam ist, wie es entwickelt wurde, wie es funktioniert und welche Anwendungen es gibt. Legen wir los!
Der Übergang von Project Starline zu Google Beam
Bevor wir uns Google Beam genauer ansehen, sollten wir seinen Vorgänger, Project Starline, besser verstehen.
Das auf der Google I/O 2021 vorgestellte Projekt Starline war eine Forschungsinitiative, die darauf abzielte, die Kommunikation aus der Ferne lebensechter zu gestalten, fast so, als ob man sich im selben Raum befände. Es funktionierte, indem es lebensgroße 3D-Bilder von Menschen in Echtzeit erstellte. Obwohl die Technologie viel Aufmerksamkeit erregte, erforderte sie komplexe Einrichtungen und schwere Hardware.
Abb. 2. Ein Blick auf das Projekt Starline(Quelle).
Im Laufe der Jahre verfeinerte Google mit der fortschreitenden Technologie die Software und optimierte die Hardware. Nach vier Jahren Entwicklungszeit hat sich Project Starline zu Google Beam entwickelt - eine kompaktere und benutzerfreundlichere Lösung.
Google Beam nutzt KI, um Videoanrufe zu verbessern, indem es realistischere, 3D-ähnliche Bilder der Gesprächspartner erstellt. Es verwandelt herkömmliche 2D-Videos in Ansichten, die sich an verschiedene Winkel anpassen, um den Augenkontakt aufrechtzuerhalten und die Mimik besser erkennen zu können. Außerdem bietet es Funktionen wie Echtzeit-Übersetzung, Kopfverfolgung und räumliches Audio.
Ein Überblick über Google Beam
Google Beam wurde entwickelt, um ohne zusätzliches Zubehör wie Augmented Reality (AR)- oder Virtual Reality (VR)-Headsets zu funktionieren. Stattdessen verfügt es über ein eigenes integriertes Display, ein Kamerasystem und Hardware zur Erstellung von 3D-Visualisierungen. Dadurch fühlen sich Videogespräche natürlicher, komfortabler und ansprechender an als typische Videokonferenzen.
Abb. 3. Ein Beispiel für die Verwendung von Google Beam(Quelle).
Wie Google Beam realistische virtuelle Meetings schafft
Nachdem wir nun besprochen haben, wie Google Beam entstanden ist, wollen wir uns die Funktionsweise genauer ansehen.
Bilderfassung für immersive Remote-Zusammenarbeit
Alles beginnt mit der Erfassung von visuellen Informationen. Beam verwendet sechs hochauflösende Kameras, um Bilder aus verschiedenen Blickwinkeln gleichzeitig aufzunehmen.
Diese Kameras helfen dabei, Gesichtszüge, Körpersprache und kleine Bewegungen in Echtzeit zu erfassen. Die KI spielt eine Schlüsselrolle, indem sie die Kameraeinstellungen optimiert und alle Videoübertragungen perfekt synchronisiert. Dies bereitet das System auf die nächste Stufe vor: die Datenverarbeitung.
2D-Bild zu 3D-Videokonferenzen
Anschließend werden die sechs 2D-Kamerabilder mithilfe von KI kombiniert, um ein Echtzeit-3D-Modell der betrachteten Person zu erstellen. Dabei werden nicht einfach 2D-Bilder übereinandergelegt, sondern Tiefe, Schatten und räumliche Beziehungen rekonstruiert, um einen vollständigen digitalen 3D-Zwilling zu erstellen.
Um dieses 3D-Modell zu erstellen, verwendet Beam KI- und Computer-Vision-Techniken wie Tiefenschätzung und Bewegungsverfolgung. Mit diesen Methoden lässt sich feststellen, wie weit eine Person von der Kamera entfernt ist, wie sie sich bewegt und wie ihr Körper positioniert ist. Mit diesen Daten kann das System Gesichtszüge und Körperteile genau im 3D-Raum abbilden.
Das KI-Modell hinter Beam aktualisiert die 3D-Darstellung mit 60 Bildern pro Sekunde (FPS), damit die Unterhaltungen flüssig und lebensecht ablaufen. Es nimmt auch Echtzeitanpassungen vor, um die Bewegungen der Person genau wiederzugeben.
Abb. 4. Die sechs Kameras von Google Beam nehmen Bilder aus verschiedenen Blickwinkeln auf(Quelle).
Die Lichtfeld-Display-Systeme von Google Beam
Das 3D-Modell wird auf dem Beam-System des Empfängers mit einer Lichtfeldanzeige dargestellt. Im Gegensatz zu herkömmlichen Bildschirmen, die für beide Augen das gleiche Bild anzeigen, gibt eine Lichtfeldanzeige für jedes Auge ein leicht unterschiedliches Bild aus und simuliert so die Art und Weise, wie wir im wirklichen Leben die Tiefe wahrnehmen. So entsteht ein realistischeres, dreidimensionales Seherlebnis.
Abb. 5. Austausch von virtuellen High-Fives über Google Beam(Quelle).
Millimetergenaue Kopfverfolgung in Echtzeit
Eine der beeindruckendsten Funktionen von Google Beam ist seine Echtzeit-KI-Tracking-Fähigkeit. Das System nutzt eine präzise Kopf- und Augenverfolgung, um Bewegungen bis ins kleinste Detail zu verfolgen.
So kann die KI-Engine von Beam beispielsweise die Kopfposition des Nutzers kontinuierlich verfolgen und das Bild in Echtzeit anpassen. So entsteht der Eindruck, dass Ihnen die Person auf dem Bildschirm wirklich gegenübersitzt. Wenn Sie Ihren Kopf bewegen, verschiebt sich das 3D-Bild entsprechend, genau wie bei einem echten Gespräch von Angesicht zu Angesicht.
Audioverarbeitung für KI-unterstützte virtuelle Kommunikation
Beam verbessert auch das Audioerlebnis durch die Verwendung von Raumklang, der sich der Position der Person auf dem Bildschirm anpasst. Wenn sich jemand auf der linken Seite des Bildschirms befindet, klingt seine Stimme, als käme sie von links. Wenn die Person die Position wechselt, passt sich der Ton an sie an. Dadurch wirken Unterhaltungen natürlicher und Ihr Gehirn kann ohne zusätzliche Anstrengung verfolgen, wer spricht.
Dies funktioniert durch die Kombination von direktionalen Audiotechniken mit Echtzeit-Tracking. Beam verwendet räumliche Audiotechniken, um zu simulieren, wie wir den Ton in der realen Welt wahrnehmen (basierend auf der Richtung, aus der er kommt und wie er jedes Ohr erreicht). Das System verfolgt auch die Kopfbewegungen des Betrachters und passt die Audioausgabe entsprechend an, sodass der Ton an der Person auf dem Bildschirm "hängen" bleibt.
Anwendungen von Google Beam
Google Beam steckt zwar noch in den Kinderschuhen, zeigt aber ein vielversprechendes Potenzial im Bereich der Videokonferenzen. Hier sind einige der wichtigsten Anwendungen:
Fernzusammenarbeit: Google Beam kann dafür sorgen, dass sich Besprechungen, insbesondere Diskussionen mit Führungskräften oder Verhandlungen mit hohem Risiko, persönlicher und effektiver anfühlen. Durch das Erfassen subtiler Faktoren wie Körpersprache und Augenkontakt fühlen sich die Teilnehmer präsenter, selbst wenn sie weit voneinander entfernt sind.
Bildung: Beam hat das Potenzial, das virtuelle Lernen spannender und zugänglicher zu machen. Stellen Sie sich vor, ein Wissenschaftler hält eine Live-Vorlesung für Studenten am anderen Ende der Welt, und es fühlt sich tatsächlich so an, als wären sie im selben Raum.
Gesundheitswesen: Beam könnte Fernkonsultationen persönlicher machen. Wenn Ärzte und Patienten einander klar sehen und natürlichen Augenkontakt herstellen können, schafft das Vertrauen und lässt die Interaktion menschlicher erscheinen.
Kreative Branchen: Für Menschen in kreativen Bereichen, wie Animatoren, Künstler und Produzenten, kann Beam die Teamarbeit aus der Ferne einfacher und natürlicher gestalten. Ob beim Brainstorming oder bei der Besprechung eines Projekts - es fühlt sich eher an, als säße man in einem Studio zusammen als bei einem Videoanruf.
Vor- und Nachteile von Google Beam
Hier sind einige der wichtigsten Vorteile, die eine Innovation wie Google Beam mit sich bringt:
Keine Headsets erforderlich: Im Gegensatz zu vielen anderen immersiven Technologien funktioniert Beam ohne AR- oder VR-Headsets. Dies macht das Erlebnis komfortabler und vermeidet häufige Probleme wie Bewegungskrankheit oder die Unannehmlichkeit, zusätzliche Ausrüstung zu tragen.
Geringere Ermüdung des Bildschirms: Das 3D-Display bietet ein natürlicheres und komfortableres Seherlebnis, das dazu beitragen kann, die Belastung der Augen im Vergleich zum langen Starren auf Flachbildschirme zu verringern.
Sprachübersetzung in Echtzeit: Beam kann eine KI-gestützte Echtzeitübersetzung integrieren, die es Menschen, die unterschiedliche Sprachen sprechen, erleichtert, in internationalen Meetings oder Lernumgebungen natürlich zu kommunizieren.
Beam ist ein vielversprechender Schritt nach vorn, aber wie jede neue Technologie hat auch diese einige Einschränkungen. Hier sind einige Dinge zu beachten:
Hardware-Anforderungen: Beam erfordert spezielle High-End-Ausrüstung, wie z. B. Lichtfeld-Displays und mehrere Kameras, was das Verfahren teuer und für Einzelpersonen und kleinere Organisationen weniger zugänglich macht.
Nicht tragbar: Das System von Beam ist für eine feste Installation konzipiert und nicht dafür gedacht, leicht bewegt zu werden, was seine Flexibilität und den Einsatz in mobilen oder wechselnden Umgebungen einschränkt.
Die wichtigsten Erkenntnisse
Google Beam ist ein faszinierender Schritt, um die virtuelle Kommunikation menschlicher zu gestalten. Es befindet sich zwar noch in der Anfangsphase, hat aber das Potenzial, die Art und Weise, wie wir uns treffen, verbinden und zusammenarbeiten, zu verändern. Durch die Kombination von fortschrittlicher künstlicher Intelligenz, 3D-Bildern und räumlichem Audio wird die Kommunikation aus der Ferne lebensechter und ansprechender.
Google arbeitet weiter daran, die Hardware von Beam zu verbessern, sie noch kleiner zu machen und sie möglicherweise auch für den normalen Nutzer zugänglich zu machen, was spannende Möglichkeiten für die Zukunft der virtuellen Kommunikation eröffnet. Zusammen mit neuen technologischen Trends wie holografischen Meetings und 3D-Avataren setzt Beam einen neuen Standard für virtuelle Meetings.