Yolo 비전 선전
선전
지금 참여하기
용어집

신경 방사 필드(NeRF)

실감 나는 3D 장면, VR/AR, 로봇 공학 및 콘텐츠 제작을 위한 Neural Radiance Fields(NeRF)의 강력한 기능을 경험해 보세요. 지금 바로 알아보세요!

뉴럴 래디언스 필드(NeRF)는 포토리얼한 3D를 합성하는 데 사용되는 사실적인 3D 합성하는 데 사용되는 제너레이티브 AI 장면을 합성하는 데 사용되는 획기적인 AI 기술입니다. 기존의 3D 모델링 접근 방식이 다각형이나 메시와 같은 명시적인 기하학적 구조에 의존하는 것과 달리 다각형이나 메시와 같은 구조에 의존하는 기존의 3D 모델링 접근 방식과 달리, NeRF는 신경망(NN)을 사용하여 장면의 "암시적" 표현을 생성합니다. 이를 통해 충실도가 높은 새로운 시점을 생성할 수 있습니다, 다양한 조명, 반사, 투명도 등 복잡한 시각적 현상을 정확하게 포착할 수 있습니다.

뉴럴 래디언스 필드의 작동 원리

NeRF 모델의 핵심은 연속 체적 함수로 작동합니다. 3D 공간 좌표와 보기 방향을 보기 방향을 입력으로 받고 해당 지점에 해당하는 색상과 볼륨 밀도를 출력합니다. 새로운 이미지를 렌더링하기 위해 이미지를 렌더링하기 위해 이 시스템에서는 볼류메트릭 렌더링이라는 기술을 사용합니다. 이 모델은 가상 카메라의 광선을 가상 카메라에서 각 픽셀을 통해 장면으로 광선을 투사하여 딥러닝 네트워크에 쿼리하여 광선을 따라 여러 지점에서 딥러닝 네트워크를 쿼리하여 색상과 밀도를 예측합니다. 그런 다음 이러한 값을 집계하여 최종 픽셀 색상을 계산합니다.

트레이닝 프로세스에는 렌더링된 뷰와 일치하도록 모델 가중치를 최적화하여 렌더링된 보기가 원본 입력 이미지와 일치하도록 원본 입력 이미지와 일치하도록 모델 가중치를 최적화합니다. 이는 일반적으로 다음과 같은 프레임워크를 사용하여 수행됩니다. PyTorch 또는 TensorFlow. 그 결과 매우 상세하고 탐색 가능한 3D 환경은 전적으로 표준 사진으로 구성된 표준 사진으로 구성된 학습 데이터에서 파생된 매우 상세한 3D 환경이 탄생했습니다.

실제 시나리오에서의 응용

NeRF 기술은 학술 연구를 넘어 실용적인 산업으로 빠르게 확장되어 2D 사진과 인터랙티브 3D 경험 사이의 간극을 좁히고 있습니다.

  • 3D 씬 재구성: NeRF는 실제 환경의 디지털 트윈을 만드는 데 중추적인 역할을 합니다. 예를 들어, Google 지도는 다음에서 이 기술을 활용합니다. 몰입형 보기를 통해 풍부하고 풍부하고 탐색 가능한 3D 도시 모델을 생성하여 내비게이션과 도시 계획을 개선합니다.
  • 시각 효과(VFX) 및 버추얼 프로덕션: 엔터테인먼트 업계에서 영화 제작자는 NeRF를 통해 배우나 환경을 빠르게 디지털화할 수 있습니다. 다음과 같은 회사의 도구 콘텐츠 제작자는 스마트폰으로 장면을 캡처하고 렌더링할 수 있습니다. 비디오 게임이나 가상 현실에서 사용할 수 있습니다.
  • 로봇 공학 및 자율성: 고급 로봇 시스템은 주변 환경을 더 잘 이해하기 위해 주변 환경을 더 잘 이해합니다. 센서 입력으로부터 고밀도 3D 지도를 구축함으로써, 자율 주행 차량은 복잡한 복잡한 환경을 보다 안전하게 탐색할 수 있습니다.
  • 합성 데이터 생성: NeRF는 객체에 대한 새로운 시각을 무제한으로 생성할 수 있습니다. 고품질 합성 데이터를 생성하여 다른 컴퓨터 비전(CV) 모델을 훈련하는 데 사용할 수 있습니다. 데이터를 생성할 수 있습니다.

NeRF와 관련 기술 비교

NeRF는 다른 3D 및 비전 기술과 구별하는 것이 중요한데, 이는 두 기술이 AI 생태계 내에서 서로 다른 용도로 사용되기 때문입니다. 다른 3D 및 비전 기술과 구별하는 것이 중요합니다.

  • NeRF와 사진 측량: 반면 사진 측량법도 사진으로 3D 모델을 구축하지만, 이 방법은 명시적인 지오메트리(메시)를 구축합니다. NeRF는 연속적인 볼류메트릭 표현을 생성하며, 머리카락이나 연기, 반투명과 같은 미세한 디테일을 머리카락, 연기, 반투명 재질과 같이 메시로는 캡처하기 어려운 미세한 디테일을 처리하는 데 더 효과적입니다.
  • NeRF 대 객체 감지: 다음과 같은 기술 Ultralytics YOLO11 에 초점을 맞춘 객체 감지, 즉 이미지 내에서 특정 객체를 식별하고 이미지 내에서 특정 객체를 식별하고 바운딩 박스를 사용합니다. NeRF는 뷰를 렌더링하기 위한 렌더링 프로세스입니다. 그러나 이 둘은 함께 작동할 수 있습니다. 객체 감지는 종종 관심 있는 피사체를 분리하는 데 사용됩니다. 객체 감지를 사용하는 경우가 많습니다.

비전 파이프라인에 NeRF 통합

Ultralytics 모델은 볼류메트릭 렌더링용으로 설계되지는 않았지만, NeRF의 전처리 워크플로에서 중요한 역할을 합니다. 워크플로우에서 중요한 역할을 합니다. 예를 들어, 특정 오브젝트의 깨끗한 NeRF를 생성하려면 종종 배경을 마스킹해야 합니다. 배경을 마스킹해야 하는 경우가 많습니다. 강력한 인스턴스 세분화 모델은 이러한 마스크를 자동으로 이러한 마스크를 자동으로 생성할 수 있습니다.

다음 예는 큐레이팅의 일반적인 첫 단계인 YOLO11 사용하여 객체를 detect 식별하는 방법을 보여줍니다. 3D 재구성을 위한 데이터 세트입니다:

from ultralytics import YOLO

# Load the official YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference to detect objects in an image
results = model("path/to/image.jpg")

# Show results to verify detection accuracy before downstream processing
results[0].show()

이 분야의 빠른 진화는 다음과 같은 오픈 소스 라이브러리의 지원을 받고 있습니다. 트레이닝 워크플로를 간소화하는 Nerfstudio, 트레이닝 시간을 대폭 단축하는 NVIDIA 훈련 시간을 획기적으로 줄여주는 인스턴트-NGP. 이러한 툴은 연구자와 개발자 모두 강력한 3D 재구성을 이용할 수 있습니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기