Derinlik tahmininin bilgisayar görüşüne nasıl 3D perspektif kattığını öğrenin. Ultralytics modellerini kullanarak monoküler derinlik ve stereo görüş gibi teknikleri keşfedin.
Derinlik tahmini, nesnelerin kameradan uzaklığını belirleyen ve 2D görüntülere etkili bir şekilde üçüncü bir boyut ekleyen bilgisayar görüşünde kritik bir işlemdir. Görüntüdeki her pikselin ne kadar uzakta olduğunu hesaplayarak, bu teknik, piksel yoğunluğunun mesafeye karşılık geldiği bir temsil olan derinlik haritası oluşturur . Bu özellik, insan binoküler görüşünü taklit ederek makinelerin uzamsal ilişkileri ve geometriyi algılamasını sağlar. Otonom sistemlerin güvenli bir şekilde gezinmesini, çevresini anlamasını ve fiziksel nesnelerle etkileşime girmesini sağlayan temel bir teknolojidir.
Derinlik tahminini elde etmenin, donanım tabanlı çözümlerden yapay zeka kullanan tamamen yazılım tabanlı yaklaşımlara kadar çeşitli yolları vardır.
Mesafeyi ölçme yeteneği, birçok sektörde dönüştürücü bir etkiye sahiptir ve uzamsal farkındalık gerektiren uygulamaları destekler. farkındalık.
Özel derinlik modelleri mevcut olsa da, basit senaryolarda mesafe için bir gösterge olarak nesne algılama sınırlayıcı kutularını kullanarak uzamsal ilişkileri sıklıkla çıkarabilirsiniz
(daha büyük kutular genellikle daha yakın nesneleri ifade eder). Model yükleme yöntemi aşağıda açıklanmıştır
: ultralytics detect için kullanılan paket, birçok derinlik algılama boru hattının ilk adımıdır.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("path/to/image.jpg")
# Process results
for result in results:
# Get bounding boxes (xyxy format)
boxes = result.boxes.xyxy
# Iterate through detections
for box in boxes:
print(f"Detected object at: {box}")
Derinlik tahminini ilgili terimlerden ayırmak önemlidir. Nesne algılama, bir nesnenin 2D uzayda ne olduğunu ve nerede olduğunu (sınırlayıcı kutu kullanarak) belirlerken, derinlik tahmini nesnenin ne kadar uzakta olduğunu (Z ekseni) belirler. Benzer şekilde, anlamsal segmentasyon pikselleri kategorilere (örneğin yol, gökyüzü, araba) ayırırken, derinlik tahmini aynı piksellere bir mesafe değeri atar.
Üretken yapay zeka alanındaki son gelişmeler, 2D ve 3D görme arasındaki boşluğu doldurmaktadır. Neural Radiance Fields (NeRF) gibi teknikler, altta yatan derinlik ilkelerine büyük ölçüde dayanarak, birden fazla 2D görüntüyü kullanarak karmaşık 3D sahneleri yeniden oluşturur. Ayrıca, model optimizasyon teknikleri geliştikçe, kenar yapay zeka cihazlarında yüksek doğrulukta derinlik tahmini yapmak mümkün hale geliyor. Bu, Ultralytics gibi platformların sağladığı verimli model eğitimi ve dağıtımı sayesinde, drone veya akıllı gözlük gibi küçük donanımlarda gerçek zamanlı uzamsal hesaplama yapılmasını mümkün kılıyor.