Google Genie 3 erweckt deine 3D-Welt mit KI zum Leben
Das Genie 3 KI-Weltmodell von DeepMind konvertiert Text- oder Bild-Prompts in 3D-Umgebungen. Dieser Fortschritt markiert einen weiteren Schritt in Richtung menschenähnlicher Intelligenz.

Am 5. August 2025 veröffentlichte Google DeepMind seine neueste Version des Genie-Modells, bekannt als Genie 3. Es handelt sich um ein neues KI-Modell, das die Texteingaben eines Benutzers in dynamische, interaktive Umgebungen umwandeln kann.
Diese Umgebungen oder KI-Welten ermöglichen es dem Benutzer, in Echtzeit in ihnen zu navigieren und mit ihnen zu interagieren, ähnlich wie in einem Videospiel. Benutzer können die Umgebung auch erweitern oder modifizieren, indem sie zusätzliche Texteingaben bereitstellen, was spontane Änderungen ohne Neustart der Simulation ermöglicht.
Was das neueste Genie Google-Modell besonders wirkungsvoll macht, ist, dass es zum Trainieren von KI-Agenten verwendet werden kann. Dies beinhaltet das Lehren von KI-Agenten, Entscheidungen zu treffen oder Aufgaben mithilfe von Daten und Feedback auszuführen. Durch die Verwendung einer simulierten 3D-Umgebung anstelle der realen Welt können Forscher viele Herausforderungen, Kosten und Risiken des realen Trainings vermeiden.
Google Genie 3 kann auch komplexe Szenarien simulieren, wie zum Beispiel das Testen eines autonomen Autos, das bei starkem Wetter fährt, oder eines Wingsuit-Fluges durch bergiges Gelände.
In diesem Artikel werden wir Google Genie 3 und seine Funktionen erkunden. Fangen wir an!

Abb. 1. Ein Bild aus einer Genie 3-Simulation, das einen Wingsuit-Flug zeigt. (Quelle)
Link to this sectionEine kurze Geschichte der Genie-Modelle von Google#
Bevor wir in die Genie-Modelle von Google DeepMind eintauchen, lass uns ein besseres Verständnis davon bekommen, was Weltmodelle sind.
Weltmodelle sind KI-Systeme, die Regeln der realen Welt wie Physik, Bewegung und räumliche Beziehungen aus Text-, Bild-, Video- und Bewegungs-Datensätzen lernen. Dies ermöglicht es ihnen, realistische Szenen zu erstellen und zu vorhersagen, wie sie sich entwickeln. Die Genie-Modelle sind Beispiele für solche Systeme.
Hier ist ein kurzer Einblick in die früheren Google Genie-Modelle, die den Weg für Genie 3 geebnet haben:
-
Genie 1: Genie 1, oft einfach als Google Genie bezeichnet, war das erste KI-Weltmodell von Google DeepMind, das in der Lage war, interaktive virtuelle Umgebungen zu erstellen. Benutzer konnten eine Welt mit Text, Bildern, Fotos oder sogar Skizzen beschreiben, und Genie generierte sie, wodurch sie Aktionen innerhalb der Szene steuern konnten. Es wurde entwickelt, um Videodaten über die Zeit zu verarbeiten, den nächsten Frame vorherzusagen und Benutzereingaben in Aktionen innerhalb der Welt zu übersetzen.
-
Genie 2: Aufbauend auf den Fähigkeiten von Google Genie konnte Genie 2 eine breite Palette detaillierter, interaktiver 3D-Welten erstellen. Als Weltmodell simulierte es virtuelle Umgebungen und reagierte realistisch auf Aktionen wie Springen, Schwimmen oder das Bewegen von Objekten. Trainiert auf einer riesigen Sammlung von Videos, bot es realistische Objektinteraktionen und lebensechte Charakterbewegungen.
Link to this sectionWas ist Genie 3? Googles neues KI-Modell#
Aufbauend auf früheren Genie-Modellen ist Genie 3 das neueste und fortschrittlichste der Serie. Es baut insbesondere auf Genie 2 auf, das neue virtuelle Umgebungen generieren konnte, sowie auf Veo 3, dem neuesten Videogenerierungsmodell von Google DeepMind. Veo 3 demonstriert ein tiefes Verständnis von Physik und wie Objekte in der realen Welt interagieren.
Während Veo 3 eine fest codierte Physik-Engine verwendet, bringt sich Google Genie 3 selbst bei, wie Physik funktioniert, unter Verwendung einer Methode namens selbstüberwachtes Lernen. Dies ist eine KI-Lerntechnik, bei der ein KI-Modell Muster und Beziehungen aus unbeschrifteten Daten lernt, indem es eigene Lernsignale generiert.
Die selbstüberwachte Lernfähigkeit von Google Genie 3 ist entscheidend für das Training von KI-Systemen, wie KI-Agenten oder KI-Robotern, um verschiedene Aufgaben zu bewältigen. Tatsächlich sehen Forscher bei Google DeepMind Genie 3 als einen wichtigen Schritt zur Schaffung von Artificial General Intelligence (AGI).

Abb. 2. Ein Beispiel für die Verwendung von Google Genie 3 zur Simulation der Steuerung eines Roboter-Rovers. (Quelle)
AGI ist eine theoretische Form von KI, die jede Aufgabe oder jedes Thema verstehen und lernen und dieses Wissen auf verschiedene Situationen anwenden kann, genau wie ein Mensch. Im Gegensatz zu den heutigen Modellen der künstlichen Intelligenz, die für spezifische Aufgaben gebaut sind und Schwierigkeiten haben, ihre Fähigkeiten auf neue Probleme zu übertragen, wäre AGI in der Lage, sich in einer Vielzahl von Kontexten anzupassen und zu lernen.
Link to this sectionHauptfunktionen von Google Genie 3 im Zusammenhang mit dem Aufbau einer KI-Welt#
Hier sind einige der Hauptfunktionen, die von Genie 3 unterstützt werden:
-
Text-zu-3D-Weltgenerierung: Es kann einen einfachen Text-Prompt (z. B. „ein Roboter, der die Straße entlanggeht“) in eine spielbare, 3D-ähnliche Umgebung mit grundlegenden Bewegungssteuerungen verwandeln.
-
Prompterbare Weltereignisse: Benutzer können die Umgebung dynamisch ändern, indem sie neue Befehle eingeben (z. B. Regen zur Straße hinzufügen).
-
Visuelles Gedächtnis: Genie 3 kann sich an Objekte erinnern, die in der Umgebung zurückgelassen wurden, und dich diese später wieder besuchen lassen; das Gedächtnis hält etwa eine Minute lang an.
-
Flüssige und konsistente Videoausgabe: Es kann eine Videoausgabe von 24 fps (frames per second) bei 720p-Auflösung aufrechterhalten, mit einer längeren Interaktionsdauer im Vergleich zu Genie 2.

Abb. 3. Google Genie 3 kann Ausgaben generieren, die länger halten als die von Genie 2 produzierten. (Quelle)
Link to this sectionVon Bildung bis Gaming: Anwendungen von Google DeepMinds Genie 3#
Google Genie 3 kann Lernen, Forschung und Training immersiver und ansprechender gestalten. In Klassenzimmern kann es zum Beispiel Geschichte, Wissenschaft oder Geografie zum Leben erwecken, indem es Schülern ermöglicht, alte Städte zu erkunden oder durch den Weltraum zu reisen. Ebenso bietet es Entwicklern künstlicher Intelligenz realistische virtuelle Welten, um Strategien zu üben, Herausforderungen zu bewältigen und Entscheidungsfähigkeiten zu verbessern.
Wissenschaftler können es auch verwenden, um kontrollierte Simulationen zum Testen von Ideen, zur Untersuchung von Ökosystemen oder zur Beobachtung des Verhaltens von Objekten zu erstellen. Eine weitere interessante Anwendung liegt in der Videospiel-Entwicklung. Spieleentwickler können Texteingaben in detaillierte Spielwelten umwandeln, was die Entwicklung beschleunigt und den Bedarf an großen Teams reduziert.

Abb. 4. Unterhaltsame, bunte und interaktive Spiele können mit Genie 3 entworfen werden. (Quelle)
Link to this sectionEinschränkungen von Google Genie 3 als Weltmodell#
Obwohl Google Genie 3 viele Funktionen und Vorteile bietet, ist es auch wichtig, die Nachteile zu berücksichtigen.
Hier sind einige Einschränkungen, die du beachten solltest:
-
Begrenzter Aktionsbereich: Während du viele Ereignisse in der virtuellen Welt auslösen kannst, werden nicht alle vom Agenten selbst ausgeführt. Die Aktionen, die ein Agent direkt ausführen kann, sind immer noch begrenzt.
-
Interaktion mit anderen Agenten: Das Erstellen realistischer Interaktionen zwischen mehreren unabhängigen Agenten in derselben Umgebung ist noch in Arbeit.
-
Genauigkeit in der realen Welt: Google Genie 3 kann reale Orte noch nicht mit perfekter geografischer Präzision nachbilden.
Link to this sectionWichtige Erkenntnisse#
Google Genie 3 stellt einen bedeutenden Fortschritt bei der Erstellung realistischer, interaktiver 3D-Welten mit KI dar. Es kann Ideen aus einfachen Text-Prompts zum Leben erwecken, Physik simulieren und sogar KI-Systeme in sicheren virtuellen Räumen trainieren.
Obwohl es immer noch Grenzen hat, eröffnet es viele Möglichkeiten für Forschung, Gaming und KI-Entwicklung. Es ist auch ein entscheidender Schritt in Richtung AGI-Systeme, die wie Menschen denken und lernen können.
Schau dir unser GitHub-Repository an, um mehr über KI zu erfahren. Tritt unserer aktiven Community bei und entdecke Innovationen in Bereichen wie KI im Einzelhandel und Vision-KI in der Fertigung. Um heute mit Computer Vision zu beginnen, schau dir unsere Lizenzoptionen an.






