Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Derinlik Tahmini

Derinlik tahmininin robotik, AR/VR ve 3D algıyı güçlendirmek için görüntülerden (stereo, ToF, LiDAR ve monoküler derin öğrenme) nasıl derinlik haritaları oluşturduğunu keşfedin.

Derinlik tahmini, temel bir görevdir belirlenmesini içeren bilgisayarla görme (CV) Bir sahnedeki nesnelerin kameraya göre uzaklığı. Bir görüntüdeki her piksel için derinlik değerini hesaplayarak, Bu işlem, standart iki boyutlu verileri genellikle derinlik haritası olarak adlandırılan zengin bir 3D temsile dönüştürür. Bu yetenek, makinelerin uzamsal ilişkileri algılayarak ortamlarda gezinmelerini sağlamak için gereklidir, nesneleri manipüle edebilir ve insan görsel sisteminin yaptığı gibi dünyanın geometrisini anlayabilir.

Derinlik Tahmin Mekanizmaları

Derinliğin tahmin edilmesi, donanım yoğun aktif algılamadan aşağıdaki yöntemlere kadar çeşitli yöntemlerle gerçekleştirilebilir yazılım odaklı derin öğrenme (DL) yaklaşımları.

  • Stereo Görüş: İnsan binoküler görüşünden esinlenilmiştir, stereo görüş sistemleri iki kamera kullanır biraz ayrı konumlandırılmıştır. Eşitsizliği analiz ederek - bir nesnenin yatay konumunda iki nesne arasındaki fark sol ve sağ görüntüler-algoritmalar mesafeyi matematiksel olarak üçgenleştirebilir. Bu yöntem büyük ölçüde güvenilirliğe dayanır çerçeveler arasında özellik eşleştirme.
  • Monoküler Derinlik Tahmini: Bu teknik, derinliği tek bir 2B görüntüden tahmin eder, bu da zorlu bir çünkü tek bir görüntü açık derinlik bilgisinden yoksundur. Modern Evrişimsel Sinir Ağları (CNN'ler) nesne boyutu, perspektif ve oklüzyon gibi monoküler ipuçlarını tanımak için büyük veri kümeleri üzerinde eğitilir. Monoküler derinlik tahminine yönelik araştırmalar önemli ölçüde ilerlemiştir, standart kameraların 3D yapıları çıkarmasına izin verir.
  • Aktif Sensörler (LiDAR ve ToF): Pasif kamera sistemlerinin aksine, aktif sensörler sinyalleri mesafe ölçümü. LiDAR (Light Detection and Ranging) lazer darbeleri kullanır hassas 3B nokta bulutları oluşturmak için Uçuş Süresi (ToF) kameraları ışığın sensöre geri dönmesi için geçen süreyi ölçer. Bu teknolojiler yüksek doğrulukta yer gerçeği sağlar eğitmek için sıklıkla kullanılan veriler makine öğrenimi (ML) modelleri.

Gerçek Dünya Uygulamaları

Üçüncü boyutu algılama yeteneği, çeşitli sektörlerde kritik işlevselliğin kilidini açar.

Otonom Sistemler ve Robotik

Otonom araçlar alanında, derinlik tahmini, güvenlik ve navigasyon için hayati önem taşır. Sürücüsüz araçlar engelleri detect etmek için kamera verilerini LiDAR ile birleştirir, diğer araçlara olan mesafeyi tahmin edebilir ve yolun gerçek zamanlı bir haritasını oluşturabilir. Benzer şekilde, içinde robotik, derinlik algısı otomatik kolların öğelerin konumunu ve şeklini doğru bir şekilde değerlendirerek "alma ve yerleştirme" işlemlerini gerçekleştirme üretim otomasyonu iş akışları.

Artırılmış Gerçeklik (AR)

İçin artırılmış gerçeklik deneyimlerin sürükleyici olması için sanal nesnelerin fiziksel dünyayla gerçekçi bir şekilde etkileşime girmesi gerekir. Derinlik tahmini mobil cihazların bir odanın geometrisini anlamasını sağlayarak sanal mobilya veya karakterlerin yerleştirilmesine olanak tanır veya gerçek dünyadaki nesnelerin arkasına gizlenerek (oklüzyon) kullanıcı deneyimini büyük ölçüde iyileştirir.

Python Örneği: YOLO11 ile Mesafe Yaklaşımı

Özel derinlik modelleri mevcut olsa da, geliştiriciler genellikle 2D nesne algılama kalibrasyon verilerinin yanı sıra yaklaşık mesafe. Bu ultralytics kütüphanesi, çözüm modülü aracılığıyla bunu basitleştirerek kullanıcıların Sınırlayıcı kutu konumlarına göre izlenen nesnelerin mesafesini tahmin eder.

Aşağıdaki kodda nasıl kullanılacağı gösterilmektedir YOLO11 nesneleri track ve yaklaşık değerlerini hesaplamak için kameradan uzaklık.

import cv2
from ultralytics import YOLO, solutions

# Load the YOLO11 model for object detection
model = YOLO("yolo11n.pt")

# Initialize the DistanceCalculation solution
# This estimates distance based on bounding box centroids
dist_obj = solutions.DistanceCalculation(names=model.names, view_img=True)

# Open a video file or camera stream
cap = cv2.VideoCapture("path/to/video.mp4")

while cap.isOpened():
    success, im0 = cap.read()
    if not success:
        break

    # Track objects and calculate distance
    tracks = model.track(im0, persist=True, show=False)
    im0 = dist_obj.start_process(im0, tracks)

    # Display result (or save/process further)
    cv2.imshow("Distance Estimation", im0)
    if cv2.waitKey(1) == ord("q"):
        break

cap.release()
cv2.destroyAllWindows()

Derinlik Tahmini ve İlgili Kavramlar

Derinlik tahminini yapay zeka ekosistemindeki benzer terimlerden ayırmak önemlidir:

  • 3D Nesne Algılama: Bir yandan derinlik tahmini her piksele bir uzaklık değeri atarken, 3B nesne algılama belirli nesneleri tanımlamaya odaklanır. nesneleri ve 3B sınırlayıcı kutu (küboid) yerleştirme etraflarında. 3D algılama size "arabanın nerede olduğunu ve boyutunu" söylerken, derinlik tahmini Yol ve arka plan da dahil olmak üzere tüm sahnenin geometrisi.
  • Mesafe Hesaplama: Bu genellikle iki belirli nokta arasındaki veya kameradan farklı bir nesneye kadar olan doğrusal boşluğun ölçülmesi anlamına gelir (genellikle 2D sezgisel yöntemler kullanılarak), yukarıdaki kod örneğinde gösterildiği gibi. Derinlik tahmini yoğun, piksel bazında bir tahmindir görünümün eksiksiz bir topografik haritasını oluşturan görev.
  • Optik Akış: Bu ölçüm nesnelerin kareler arasındaki görünür hareketi. Optik akış ise derinlik (hareketten yapı) çıkarmak için kullanılabilir, Birincil çıktısı statik bir mesafe haritası değil, bir hareket vektör alanıdır.

Mekansal Yapay Zekanın Geliştirilmesi

Üretken Yapay Zeka alanındaki son gelişmeler ve temel modeller 2D ve 3D arasındaki boşluğu daha da kapatıyor. Gibi teknikler Sinirsel Parlaklık Alanları (NeRF) yeniden yapılandırmak için seyrek 2D görüntüler kullanır temel derinlik ilkelerine dayanan karmaşık 3B sahneler. As model optimizasyonu gelişir, son derece hassas derinlik tahmini, yeni nesil akıllı dronlara güç veren uç cihazlarda uygulanabilir hale geliyor, hizmet robotları ve uzamsal bilgi işlem cihazları.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın