실감 나는 3D 장면, VR/AR, 로봇 공학 및 콘텐츠 제작을 위한 Neural Radiance Fields(NeRF)의 강력한 기능을 경험해 보세요. 지금 바로 알아보세요!
뉴럴 래디언스 필드(NeRF)는 포토리얼한 3D를 합성하는 데 사용되는 사실적인 3D 합성하는 데 사용되는 제너레이티브 AI 장면을 합성하는 데 사용되는 획기적인 AI 기술입니다. 기존의 3D 모델링 접근 방식이 다각형이나 메시와 같은 명시적인 기하학적 구조에 의존하는 것과 달리 다각형이나 메시와 같은 구조에 의존하는 기존의 3D 모델링 접근 방식과 달리, NeRF는 신경망(NN)을 사용하여 장면의 "암시적" 표현을 생성합니다. 이를 통해 충실도가 높은 새로운 시점을 생성할 수 있습니다, 다양한 조명, 반사, 투명도 등 복잡한 시각적 현상을 정확하게 포착할 수 있습니다.
NeRF 모델의 핵심은 연속 체적 함수로 작동합니다. 3D 공간 좌표와 보기 방향을 보기 방향을 입력으로 받고 해당 지점에 해당하는 색상과 볼륨 밀도를 출력합니다. 새로운 이미지를 렌더링하기 위해 이미지를 렌더링하기 위해 이 시스템에서는 볼류메트릭 렌더링이라는 기술을 사용합니다. 이 모델은 가상 카메라의 광선을 가상 카메라에서 각 픽셀을 통해 장면으로 광선을 투사하여 딥러닝 네트워크에 쿼리하여 광선을 따라 여러 지점에서 딥러닝 네트워크를 쿼리하여 색상과 밀도를 예측합니다. 그런 다음 이러한 값을 집계하여 최종 픽셀 색상을 계산합니다.
트레이닝 프로세스에는 렌더링된 뷰와 일치하도록 모델 가중치를 최적화하여 렌더링된 보기가 원본 입력 이미지와 일치하도록 원본 입력 이미지와 일치하도록 모델 가중치를 최적화합니다. 이는 일반적으로 다음과 같은 프레임워크를 사용하여 수행됩니다. PyTorch 또는 TensorFlow. 그 결과 매우 상세하고 탐색 가능한 3D 환경은 전적으로 표준 사진으로 구성된 표준 사진으로 구성된 학습 데이터에서 파생된 매우 상세한 3D 환경이 탄생했습니다.
NeRF 기술은 학술 연구를 넘어 실용적인 산업으로 빠르게 확장되어 2D 사진과 인터랙티브 3D 경험 사이의 간극을 좁히고 있습니다.
NeRF는 다른 3D 및 비전 기술과 구별하는 것이 중요한데, 이는 두 기술이 AI 생태계 내에서 서로 다른 용도로 사용되기 때문입니다. 다른 3D 및 비전 기술과 구별하는 것이 중요합니다.
Ultralytics 모델은 볼류메트릭 렌더링용으로 설계되지는 않았지만, NeRF의 전처리 워크플로에서 중요한 역할을 합니다. 워크플로우에서 중요한 역할을 합니다. 예를 들어, 특정 오브젝트의 깨끗한 NeRF를 생성하려면 종종 배경을 마스킹해야 합니다. 배경을 마스킹해야 하는 경우가 많습니다. 강력한 인스턴스 세분화 모델은 이러한 마스크를 자동으로 이러한 마스크를 자동으로 생성할 수 있습니다.
다음 예는 큐레이팅의 일반적인 첫 단계인 YOLO11 사용하여 객체를 detect 식별하는 방법을 보여줍니다. 3D 재구성을 위한 데이터 세트입니다:
from ultralytics import YOLO
# Load the official YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference to detect objects in an image
results = model("path/to/image.jpg")
# Show results to verify detection accuracy before downstream processing
results[0].show()
이 분야의 빠른 진화는 다음과 같은 오픈 소스 라이브러리의 지원을 받고 있습니다. 트레이닝 워크플로를 간소화하는 Nerfstudio, 트레이닝 시간을 대폭 단축하는 NVIDIA 훈련 시간을 획기적으로 줄여주는 인스턴트-NGP. 이러한 툴은 연구자와 개발자 모두 강력한 3D 재구성을 이용할 수 있습니다.