Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024
Glossar

Neuronale Strahlungsfelder (NeRF)

Entdecken Sie die Leistungsfähigkeit von Neural Radiance Fields (NeRF) für fotorealistische 3D-Szenen, VR/AR, Robotik und Inhaltserstellung. Jetzt entdecken!

Neuronale Strahlungsfelder (Neural Radiance Fields, NeRF) sind eine leistungsstarke Deep-Learning-Technik, die verwendet wird, um beeindruckende 3D-Szenen aus einer Sammlung von 2D-Bildern zu erstellen. Im Wesentlichen lernt ein NeRF-Modell eine kontinuierliche volumetrische Darstellung einer Szene, wodurch es neue, fotorealistische Ansichten aus jedem Winkel generieren kann. Diese Methode, die in einem bahnbrechenden Paper aus dem Jahr 2020 vorgestellt wurde, hat die Erstellung von 3D-Inhalten revolutioniert, indem sie eine sehr detaillierte und realistische Ansichtssynthese ermöglicht. Der Kern von NeRF ist ein kleines neuronales Netzwerk (NN), das als "implizite" Darstellung der Szene fungiert, ein grundlegend anderer Ansatz als traditionelle 3D-Modelle wie Netze oder Voxel.

Wie funktionieren Neural Radiance Fields?

Ein NeRF lernt, eine 3D-Koordinate (einen Punkt im Raum) und eine 2D-Blickrichtung auf eine bestimmte Farbe und Dichte abzubilden. Um ein Bild von einer virtuellen Kamera zu rendern, verfolgt das Modell Strahlen vom Standpunkt der Kamera durch die Szene. Es fragt das neuronale Netzwerk an vielen Punkten entlang jedes Strahls ab, um die Farbe und Dichte an jedem Punkt vorherzusagen. Diese Werte werden dann mit einem Verfahren, das als volumetrisches Rendering bekannt ist, kombiniert, um die endgültige Farbe des Pixels im 2D-Bild zu berechnen.

Durch das Training dieses neuronalen Netzes mit einer Reihe von Eingangsbildern einer Szene aus bekannten Kamerapositionen werden die Modellgewichte optimiert, um diese Originalbilder genau zu reproduzieren. Nach dem Training kann das NeRF neue Ansichten generieren, indem es Strahlen aus neuen, nicht gesehenen Kamerapositionen rendert. Diese Technik ist Teil des breiteren Feldes der generativen KI und stützt sich auf gängige Frameworks wie PyTorch und TensorFlow für die Implementierung.

Anwendungen und Beispiele aus der Praxis

Die NeRF-Technologie bietet ein breites Spektrum an Anwendungen und schlägt die Brücke zwischen 2D-Bildern und interaktiven 3D-Erlebnissen.

  • 3D-Szenenrekonstruktion: NeRFs zeichnen sich durch die Erstellung digitaler Zwillinge von realen Umgebungen und Objekten aus. Ein prominentes Beispiel ist die "Immersive View" von Google Maps, die NeRFs verwendet, um detaillierte, interaktive 3D-Modelle von Städten zu erstellen. Dies findet Anwendung in der Stadtplanung, im virtuellen Tourismus und in der Erhaltung des kulturellen Erbes.
  • Visuelle Effekte (VFX) und Unterhaltung: Die Fähigkeit, fotorealistische Ansichten zu generieren, ist in der Filmproduktion und bei Videospielen von unschätzbarem Wert. NeRFs können verwendet werden, um realistische virtuelle Sets zu erstellen, Schauspieler zu digitalisieren und komplexe visuelle Effekte zu generieren, die mit traditionellen Methoden schwer zu erzielen sind. Unternehmen wie Luma AI entwickeln Tools, um diese Technologie zugänglicher zu machen.
  • Robotik und autonome Systeme: Für autonome Fahrzeuge und Roboter ist das Verständnis der 3D-Umgebung entscheidend für die Navigation und Interaktion. NeRFs können eine reichhaltige, detaillierte 3D-Karte aus Sensordaten bereitstellen und so die Fähigkeit eines Roboters verbessern, seine Umgebung wahrzunehmen.
  • E-Commerce und Einzelhandel: NeRF kann verwendet werden, um interaktive 3D-Modelle von Produkten zu erstellen, die es Kunden ermöglichen, Artikel online aus jedem Blickwinkel zu betrachten und so das Einkaufserlebnis zu verbessern.

Projekte wie Nerfstudio und NVIDIA's Instant-NGP (Instant NeRFs) haben es deutlich schneller und einfacher gemacht, mit NeRFs zu trainieren und zu experimentieren.

NeRF im Vergleich zu anderen Computer-Vision-Techniken

Es ist wichtig, NeRF von anderen Technologien im Bereich Computer Vision (CV) zu unterscheiden.

  • NeRF vs. Photogrammetrie: Die Photogrammetrie ist eine traditionelle Technik, die ebenfalls 3D-Modelle aus Fotos erstellt, aber typischerweise explizite Geometrie wie ein Polygonnetz ausgibt. NeRFs erstellen dagegen eine kontinuierliche, implizite Darstellung. Dadurch können NeRFs komplexe visuelle Effekte wie Transparenz, Reflexionen und feine Details effektiver erfassen als die Standard-Photogrammetrie.
  • NeRF vs. Objekterkennung: Modelle wie Ultralytics YOLO sind für Objekterkennung, Bildsegmentierung und andere analytische Aufgaben konzipiert. Sie identifizieren, was sich in einem Bild befindet, oft durch Platzieren von Bounding Boxes um Objekte. NeRF hat ein anderes Ziel: Es synthetisiert völlig neue Ansichten einer Szene aus einer Reihe von Bildern. Während beides leistungsstarke KI-Tools sind, analysiert die Objekterkennung vorhandene Bilder, während NeRF neue generiert. Sie könnten ein Objekterkennungsmodell verwenden, um Autos in einem Video zu lokalisieren, aber Sie würden NeRF verwenden, um ein 3D-Modell eines Autos zu erstellen, das Sie aus jedem Winkel betrachten können.

Im Zuge der Weiterentwicklung des Feldes werden NeRF und verwandte Methoden zu einem zentralen Element für die Erstellung der nächsten Generation von 3D- und immersiven Inhalten, wobei die Entwicklung von Plattformen wie Ultralytics HUB unterstützt wird, die die KI-Modellentwicklung erleichtern.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert