Fotogerçekçi 3D sahneler, VR/AR, robotik ve içerik oluşturma için Neural Radiance Fields'in (NeRF) gücünü keşfedin. Şimdi keşfedin!
Nöral Işıltı Alanları (NeRF), sağlık alanında çığır açan bir ilerlemeyi temsil etmektedir. fotogerçekçi 3D sentezlemek için kullanılan üretken yapay zeka 2D görüntü koleksiyonundan sahneler. Açık geometrik özelliklere dayanan geleneksel 3B modelleme yaklaşımlarının aksine poligonlar veya kafesler gibi yapılar, NeRF'ler bir oluşturmak için sinir ağı (NN) Bir sahnenin "örtük" temsili. Bu, yüksek doğrulukla yeni bakış açılarının oluşturulmasına olanak tanır, Değişken aydınlatma, yansımalar ve şeffaflık gibi karmaşık görsel fenomenleri doğru bir şekilde yakalamak.
Bir NeRF modeli özünde sürekli bir hacimsel fonksiyon olarak işlev görür. Bir 3D uzamsal koordinat ve bir yönünü girdi olarak alır ve o nokta için karşılık gelen renk ve hacim yoğunluğunu çıktı olarak verir. Yeni bir işlemek için görüntü olarak adlandırılan bir teknik kullanır. hacimsel işleme. Model, ışınları sanal kamerayı her bir piksel üzerinden sahneye yönlendirerek boyunca birden fazla noktada derin öğrenme ağı renk ve yoğunluğu tahmin etmek için ışın. Bu değerler daha sonra nihai piksel rengini hesaplamak için toplanır.
Eğitim süreci aşağıdakilerin optimize edilmesini içerir model ağırlıkları, böylece işlenen görünümler orijinal girdi görüntüleri. Bu genellikle aşağıdaki gibi çerçeveler kullanılarak gerçekleştirilir PyTorch veya TensorFlow. Sonuç, son derece ayrıntılı, gezilebilir bir 3 boyutlu ortam tamamen Standart fotoğraflardan oluşan eğitim verileri.
NeRF teknolojisi, akademik araştırmaların ötesine geçerek pratik endüstrilere doğru hızla genişlemiş ve 2D fotoğrafçılık ve etkileşimli 3D deneyimler.
NeRF'yi diğer 3D ve görüntü tekniklerinden ayırmak önemlidir, çünkü bunlar farklı amaçlara hizmet etmektedir. Yapay zeka ekosistemi.
Ultralytics modelleri hacimsel işleme için tasarlanmamış olsa da, ön işlemede çok önemli bir rol oynarlar NeRF'ler için iş akışları. Örneğin, belirli bir nesnenin temiz bir NeRF'sini oluşturmak için genellikle arka plan. Sağlam bir örnek segmentasyon modeli otomatik olarak bu maskeleri üretir.
Aşağıdaki örnek, bir nesneyi detect etmek ve tanımlamak için YOLO11 'in nasıl kullanılacağını göstermektedir; bu, küratörlükte yaygın bir ilk adımdır 3D yeniden yapılandırma için bir veri kümesi:
from ultralytics import YOLO
# Load the official YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference to detect objects in an image
results = model("path/to/image.jpg")
# Show results to verify detection accuracy before downstream processing
results[0].show()
Bu alanın hızlı gelişimi, aşağıdaki gibi açık kaynaklı kütüphaneler tarafından desteklenmektedir Eğitim iş akışını basitleştiren Nerfstudio ve NVIDIA'nın Eğitim sürelerini büyük ölçüde azaltan Instant-NGP. Bu araçlar güçlü 3D rekonstrüksiyonu hem araştırmacılar hem de geliştiriciler için erişilebilir hale getirir.

.webp)