Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Derinlik Tahmini

Derinlik tahmininin bilgisayar görüşüne nasıl 3D perspektif kattığını öğrenin. Ultralytics modellerini kullanarak monoküler derinlik ve stereo görüş gibi teknikleri keşfedin.

Derinlik tahmini, nesnelerin kameradan uzaklığını belirleyen ve 2D görüntülere etkili bir şekilde üçüncü bir boyut ekleyen bilgisayar görüşünde kritik bir işlemdir. Görüntüdeki her pikselin ne kadar uzakta olduğunu hesaplayarak, bu teknik, piksel yoğunluğunun mesafeye karşılık geldiği bir temsil olan derinlik haritası oluşturur . Bu özellik, insan binoküler görüşünü taklit ederek makinelerin uzamsal ilişkileri ve geometriyi algılamasını sağlar. Otonom sistemlerin güvenli bir şekilde gezinmesini, çevresini anlamasını ve fiziksel nesnelerle etkileşime girmesini sağlayan temel bir teknolojidir.

Temel Mekanizmalar ve Teknikler

Derinlik tahminini elde etmenin, donanım tabanlı çözümlerden yapay zeka kullanan tamamen yazılım tabanlı yaklaşımlara kadar çeşitli yolları vardır.

  • Stereo Görüş Sistemleri: İnsan gözlerine benzer şekilde, stereo görüş yan yana yerleştirilmiş iki kamera kullanır. Algoritmalar, sol ve sağ görüntüler arasındaki küçük farklılıkları veya eşitsizlikleri analiz ederek mesafeyi üçgenle hesaplar. Bu, her iki karede aynı noktaları tanımlamak için büyük ölçüde doğru özellikeşleştirmesine bağlıdır.
  • Monoküler Derinlik Tahmini: Bu gelişmiş yöntem, tek bir görüntüden derinliği tahmin eder. Tek bir 2D fotoğrafta doğal derinlik verisi bulunmadığından, derin öğrenme modelleri, perspektif, nesne boyutu ve örtülme gibi görsel ipuçlarını tanımak için geniş veri kümeleri üzerinde eğitilir. Evrişimli sinir ağları (CNN) gibi modern mimariler, bu görevde mükemmeldir ve standart kameralardan 3D yapı elde etmeyi mümkün kılar.
  • LiDAR ve Uçuş Süresi (ToF): LiDAR (Işık Algılama ve Mesafe Ölçümü) ve Uçuş Süresi kameraları gibi aktif sensörler ışık darbeleri yayar ve bunların geri dönmesi için geçen süreyi ölçer. Bu yöntemler son derece hassas nokta bulutları oluşturur ve genellikle makine öğrenimi modellerini eğitmek için yer gerçeği verilerini toplamak amacıyla kullanılır.

Gerçek Dünya Uygulamaları

Mesafeyi ölçme yeteneği, birçok sektörde dönüştürücü bir etkiye sahiptir ve uzamsal farkındalık gerektiren uygulamaları destekler. farkındalık.

  • Otonom Sürüş: Otonom araçlar, detect , diğer araçlarla olan mesafeyi ölçmek ve karmaşık yol ağlarında güvenli bir şekilde seyretmek için derinlik tahminine dayanır. Yaya ve bisikletlileri tanımak için 3D nesne algılama sürecinin ayrılmaz bir parçasıdır. Otonom araçlar, detect , diğer araçlarla olan mesafeyi ölçmek ve karmaşık yol ağlarında güvenli bir şekilde seyretmek için derinlik tahminine dayanır. Yaya ve bisikletlileri tanımak için 3D nesne algılama sürecinin ayrılmaz bir parçasıdır.
  • Robotik ve Otomasyon: Robotlar, yol planlama ve nesne manipülasyonu gibi görevler için derinlik algısını kullanır. Örneğin, bir depo robotu, bir paketi rafla çarpışmadan almak için rafın tam olarak ne kadar uzakta olduğunu bilmelidir.
  • Artırılmış Gerçeklik (AR): Sanal nesneleri gerçek dünya sahnesine inandırıcı bir şekilde yerleştirmek için AR cihazları çevrenin 3D geometrisini anlamalıdır. Derinlik tahmini, sanal karakterlerin gerçek mobilyaların arkasına saklanabilmesini sağlar ve bu kavram, oklüzyon işleme olarak bilinir.

Kod Örneği: Monoküler Derinlik Tahmini

Özel derinlik modelleri mevcut olsa da, basit senaryolarda mesafe için bir gösterge olarak nesne algılama sınırlayıcı kutularını kullanarak uzamsal ilişkileri sıklıkla çıkarabilirsiniz (daha büyük kutular genellikle daha yakın nesneleri ifade eder). Model yükleme yöntemi aşağıda açıklanmıştır : ultralytics detect için kullanılan paket, birçok derinlik algılama boru hattının ilk adımıdır.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Process results
for result in results:
    # Get bounding boxes (xyxy format)
    boxes = result.boxes.xyxy

    # Iterate through detections
    for box in boxes:
        print(f"Detected object at: {box}")

Diğer Bilgisayar Görme Kavramlarıyla İlişkisi

Derinlik tahminini ilgili terimlerden ayırmak önemlidir. Nesne algılama, bir nesnenin 2D uzayda ne olduğunu ve nerede olduğunu (sınırlayıcı kutu kullanarak) belirlerken, derinlik tahmini nesnenin ne kadar uzakta olduğunu (Z ekseni) belirler. Benzer şekilde, anlamsal segmentasyon pikselleri kategorilere (örneğin yol, gökyüzü, araba) ayırırken, derinlik tahmini aynı piksellere bir mesafe değeri atar.

Uzamsal Yapay Zeka Alanındaki Gelişmeler

Üretken yapay zeka alanındaki son gelişmeler, 2D ve 3D görme arasındaki boşluğu doldurmaktadır. Neural Radiance Fields (NeRF) gibi teknikler, altta yatan derinlik ilkelerine büyük ölçüde dayanarak, birden fazla 2D görüntüyü kullanarak karmaşık 3D sahneleri yeniden oluşturur. Ayrıca, model optimizasyon teknikleri geliştikçe, kenar yapay zeka cihazlarında yüksek doğrulukta derinlik tahmini yapmak mümkün hale geliyor. Bu, Ultralytics gibi platformların sağladığı verimli model eğitimi ve dağıtımı sayesinde, drone veya akıllı gözlük gibi küçük donanımlarda gerçek zamanlı uzamsal hesaplama yapılmasını mümkün kılıyor.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın