Glossaire

Champs de rayonnement neuronal (NeRF)

Découvrez la puissance des champs de rayonnement neuronaux (NeRF) pour les scènes 3D photoréalistes, la RV/AR, la robotique et la création de contenu. Explorer maintenant !

Les Neural Radiance Fields (NeRF) sont une puissante technique d'apprentissage profond utilisée pour créer des scènes 3D étonnantes à partir d'une collection d'images 2D. Essentiellement, un modèle NeRF apprend une représentation volumétrique continue d'une scène, ce qui lui permet de générer de nouvelles vues photoréalistes sous n'importe quel angle. Cette méthode, présentée dans un article novateur publié en 2020, a révolutionné la création de contenu 3D en permettant la synthèse de vues très détaillées et réalistes. Le cœur de NeRF est un petit réseau neuronal (NN) qui agit comme une représentation "implicite" de la scène, une approche fondamentalement différente des modèles 3D traditionnels tels que les maillages ou les voxels.

Comment fonctionnent les champs de rayonnement neuronal ?

Un NeRF apprend à associer une coordonnée 3D (un point dans l'espace) et une direction de vue 2D à une couleur et une densité spécifiques. Pour rendre une image à partir d'une caméra virtuelle, le modèle trace des rayons à partir du point de vue de la caméra à travers la scène. Il interroge le réseau neuronal en de nombreux points le long de chaque rayon pour prédire la couleur et la densité en chaque point. Ces valeurs sont ensuite combinées à l'aide d'un processus connu sous le nom de rendu volumétrique pour calculer la couleur finale du pixel dans l'image 2D.

En entraînant ce réseau neuronal sur un ensemble d'images d'entrée d'une scène à partir de positions de caméra connues, les poids du modèle sont optimisés pour reproduire avec précision ces images originales. Une fois entraîné, le réseau neuronal peut générer de nouvelles vues en rendant les rayons à partir de nouvelles positions de caméra. Cette technique fait partie du domaine plus large de l'IA générative et s'appuie sur des cadres populaires tels que PyTorch et TensorFlow pour la mise en œuvre.

Applications et exemples concrets

La technologie NeRF a un large éventail d'applications, comblant le fossé entre les images 2D et les expériences 3D interactives.

  • Reconstruction de scènes en 3D : Les NeRF excellent dans la création de jumeaux numériques d'environnements et d'objets du monde réel. Un exemple marquant est la "vue immersive" de Google Maps, qui utilise les NeRF pour construire des modèles 3D détaillés et interactifs des villes. Cette technique trouve des applications dans la planification urbaine, le tourisme virtuel et la préservation du patrimoine culturel.
  • Effets visuels (VFX) et divertissement : La capacité de générer des images photoréalistes est inestimable dans la réalisation de films et de jeux vidéo. Les NeRF peuvent être utilisés pour créer des décors virtuels réalistes, numériser des acteurs et générer des effets visuels complexes difficiles à réaliser avec les méthodes traditionnelles. Des entreprises comme Luma AI développent des outils pour rendre cette technologie plus accessible.
  • Robotique et systèmes autonomes : Pour les véhicules et les robots autonomes, la compréhension de l'environnement en 3D est essentielle pour la navigation et l'interaction. Les NeRF peuvent fournir une carte 3D riche et détaillée à partir des données des capteurs, améliorant ainsi la capacité d'un robot à percevoir son environnement.
  • Commerce électronique et vente au détail : Le NeRF peut être utilisé pour créer des modèles 3D interactifs de produits, ce qui permet aux clients de voir les articles sous n'importe quel angle en ligne, améliorant ainsi l'expérience d'achat.

Des projets tels que Nerfstudio et Instant-NGP (Instant NeRFs ) de NVIDIA ont permis d'accélérer et de faciliter considérablement la formation et l'expérimentation des NeRFs.

NeRF par rapport à d'autres techniques de vision par ordinateur

Il est important de distinguer NeRF des autres technologies de vision par ordinateur (VA).

  • NeRF vs. photogrammétrie : La photogrammétrie est une technique traditionnelle qui permet également de créer des modèles 3D à partir de photos, mais elle produit généralement une géométrie explicite, comme un maillage de polygones. Les NeRF, en revanche, créent une représentation continue et implicite. Cela permet aux NeRF de capturer des effets visuels complexes tels que la transparence, les reflets et les détails fins de manière plus efficace que la photogrammétrie standard.
  • NeRF vs. détection d'objets : Les modèles comme Ultralytics YOLO sont conçus pour la détection d'objets, la segmentation d'images et d'autres tâches analytiques. Ils identifient ce qui se trouve dans une image, souvent en plaçant des boîtes de délimitation autour des objets. NeRF a un objectif différent : il synthétise des vues entièrement nouvelles d'une scène à partir d' un ensemble d'images. Bien qu'il s'agisse dans les deux cas d'outils d'IA puissants, la détection d'objets analyse les images existantes, tandis que NeRF en génère de nouvelles. Vous pouvez utiliser un modèle de détection d'objets pour localiser des voitures dans une vidéo, mais vous utiliserez NeRF pour créer un modèle 3D d'une voiture que vous pourrez visualiser sous n'importe quel angle.

À mesure que le domaine évolue, le NeRF et les méthodes connexes deviennent essentiels à la création de la prochaine génération de contenus 3D et immersifs, dont le développement est soutenu par des plateformes telles que Ultralytics HUB qui facilitent l'élaboration de modèles d'IA.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers