Glossário

Campos de radiação neural (NeRF)

Descubra o poder dos Neural Radiance Fields (NeRF) para cenas 3D fotorrealistas, VR/AR, robótica e criação de conteúdos. Explore agora!

Os Neural Radiance Fields (NeRF) são uma poderosa técnica de aprendizagem profunda utilizada para criar cenas 3D impressionantes a partir de uma coleção de imagens 2D. Essencialmente, um modelo NeRF aprende uma representação volumétrica contínua de uma cena, permitindo-lhe gerar novas vistas fotorrealistas a partir de qualquer ângulo. Este método, apresentado num artigo inovador de 2020, revolucionou a criação de conteúdos 3D ao permitir a síntese de vistas altamente detalhadas e realistas. O núcleo do NeRF é uma pequena rede neural (NN) que actua como uma representação "implícita" da cena, uma abordagem fundamentalmente diferente dos modelos 3D tradicionais, como malhas ou voxels.

Como funcionam os Campos de Radiância Neural?

Um NeRF aprende a mapear uma coordenada 3D (um ponto no espaço) e uma direção de visualização 2D para uma cor e densidade específicas. Para renderizar uma imagem a partir de uma câmara virtual, o modelo traça raios a partir do ponto de vista da câmara através da cena. Consulta a rede neural em muitos pontos ao longo de cada raio para prever a cor e a densidade em cada ponto. Estes valores são depois combinados através de um processo conhecido como renderização volumétrica para calcular a cor final do pixel na imagem 2D.

Ao treinar esta rede neural num conjunto de imagens de entrada de uma cena a partir de posições de câmara conhecidas, os pesos do modelo são optimizados para reproduzir com precisão essas imagens originais. Uma vez treinada, a NeRF pode gerar novas vistas através da renderização de raios a partir de posições de câmara novas e desconhecidas. Essa técnica faz parte do campo mais amplo da IA generativa e conta com estruturas populares como PyTorch e TensorFlow para implementação.

Aplicações e exemplos do mundo real

A tecnologia NeRF tem uma vasta gama de aplicações, fazendo a ponte entre as imagens 2D e as experiências 3D interactivas.

  • Reconstrução de cenas 3D: Os NeRFs são excelentes na criação de gémeos digitais de ambientes e objectos do mundo real. Um exemplo proeminente é o "Immersive View" do Google Maps, que utiliza NeRFs para construir modelos 3D detalhados e interactivos de cidades. Isto tem aplicações no planeamento urbano, no turismo virtual e na preservação do património cultural.
  • Efeitos Visuais (VFX) e Entretenimento: A capacidade de gerar imagens fotorrealistas é inestimável na produção de filmes e jogos de vídeo. Os NeRFs podem ser utilizados para criar cenários virtuais realistas, digitalizar actores e gerar efeitos visuais complexos que são difíceis de obter com os métodos tradicionais. Empresas como a Luma AI estão a desenvolver ferramentas para tornar esta tecnologia mais acessível.
  • Robótica e sistemas autónomos: Para veículos e robôs autónomos, a compreensão do ambiente 3D é fundamental para a navegação e a interação. Os NeRFs podem fornecer um mapa 3D rico e detalhado a partir de dados de sensores, melhorando a capacidade de um robô perceber o que o rodeia.
  • Comércio eletrónico e retalho: O NeRF pode ser utilizado para criar modelos 3D interactivos de produtos, permitindo aos clientes visualizar os artigos em linha a partir de qualquer ângulo, melhorando a experiência de compra.

Projectos como o Nerfstudio e o Instant-NGP (Instant NeRFs) da NVIDIA tornaram significativamente mais rápido e fácil o treino e a experimentação com NeRFs.

NeRF vs. outras técnicas de visão computacional

É importante distinguir o NeRF de outras tecnologias de visão por computador (CV).

  • NeRF vs. Fotogrametria: A fotogrametria é uma técnica tradicional que também cria modelos 3D a partir de fotografias, mas normalmente produz geometria explícita como uma malha de polígonos. Os NeRFs, por outro lado, criam uma representação contínua e implícita. Isso permite que os NeRFs capturem efeitos visuais complexos como transparência, reflexos e detalhes finos com mais eficácia do que a fotogrametria padrão.
  • NeRF vs. Deteção de objectos: Modelos como o Ultralytics YOLO foram concebidos para a deteção de objectos, segmentação de imagens e outras tarefas analíticas. Identificam o que está numa imagem, muitas vezes colocando caixas delimitadoras à volta dos objectos. O NeRF tem um objetivo diferente: sintetiza visões totalmente novas de uma cena a partir de um conjunto de imagens. Embora ambas sejam ferramentas de IA poderosas, a deteção de objectos analisa imagens existentes, enquanto o NeRF gera novas imagens. Pode utilizar um modelo de deteção de objectos para localizar carros num vídeo, mas utilizaria o NeRF para criar um modelo 3D de um carro que pode ser visto de qualquer ângulo.

À medida que o campo evolui, o NeRF e os métodos relacionados estão a tornar-se centrais para a criação da próxima geração de conteúdos 3D e imersivos, com o desenvolvimento apoiado por plataformas como o Ultralytics HUB que facilitam o desenvolvimento de modelos de IA.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência