Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Derinlik Tahmini

Derinlik tahmininin robotik, AR/VR ve 3D algıyı güçlendirmek için görüntülerden (stereo, ToF, LiDAR ve monoküler derin öğrenme) nasıl derinlik haritaları oluşturduğunu keşfedin.

Derinlik tahmini, temel bir görevdir belirlenmesini içeren bilgisayarla görme (CV) Bir sahnedeki nesnelerin kameraya göre uzaklığı. Bir görüntüdeki her piksel için derinlik değerini hesaplayarak, Bu işlem, standart iki boyutlu verileri genellikle derinlik haritası olarak adlandırılan zengin bir 3D temsile dönüştürür. Bu yetenek, makinelerin uzamsal ilişkileri algılayarak ortamlarda gezinmelerini sağlamak için gereklidir, nesneleri manipüle edebilir ve insan görsel sisteminin yaptığı gibi dünyanın geometrisini anlayabilir.

Derinlik Tahmin Mekanizmaları

Derinliğin tahmin edilmesi, donanım yoğun aktif algılamadan aşağıdaki yöntemlere kadar çeşitli yöntemlerle gerçekleştirilebilir yazılım odaklı derin öğrenme (DL) yaklaşımları.

  • Stereo Vision: İnsanların binoküler görüşünden esinlenerek, stereo vision sistemleri birbirinden hafifçe ayrılmış iki kamera kullanır. Algoritmalar, sol ve sağ görüntüler arasında bir nesnenin yatay konumundaki fark olan eşitsizliği analiz ederek mesafeyi matematiksel olarak üçgenleme yoluyla hesaplayabilir. Bu yöntem, kareler arasında güvenilir özellik eşleştirmesine büyük ölçüde dayanır.
  • Monoküler Derinlik Tahmini: Bu teknik, derinliği tek bir 2B görüntüden tahmin eder, bu da zorlu bir çünkü tek bir görüntü açık derinlik bilgisinden yoksundur. Modern Evrişimsel Sinir Ağları (CNN'ler) nesne boyutu, perspektif ve oklüzyon gibi monoküler ipuçlarını tanımak için büyük veri kümeleri üzerinde eğitilir. Monoküler derinlik tahminine yönelik araştırmalar önemli ölçüde ilerlemiştir, standart kameraların 3D yapıları çıkarmasına izin verir.
  • Aktif Sensörler (LiDAR ve ToF): Pasif kamera sistemlerinden farklı olarak, aktif sensörler mesafeyi ölçmek için sinyaller yayar. LiDAR (Işık Algılama ve Mesafe Ölçümü), lazer darbeleri kullanarak LiDAR (Işık Algılama ve Mesafe Ölçümü), lazer darbeleri kullanarak hassas 3D nokta bulutları oluştururken, Uçuş Süresi (ToF) kameraları ışığın sensöre geri dönmesi için geçen süreyi ölçer. Bu teknolojiler, genellikle makine öğrenimi (ML) modellerini eğitmek için kullanılan yüksek doğruluklu yer gerçeği verileri sağlar. .

Gerçek Dünya Uygulamaları

Üçüncü boyutu algılama yeteneği, çeşitli sektörlerde kritik işlevselliğin kilidini açar.

Otonom Sistemler ve Robotik

Otonom araçlar alanında, derinlik tahmini, güvenlik ve navigasyon için hayati önem taşır. Sürücüsüz araçlar engelleri detect etmek için kamera verilerini LiDAR ile birleştirir, diğer araçlara olan mesafeyi tahmin edebilir ve yolun gerçek zamanlı bir haritasını oluşturabilir. Benzer şekilde, içinde robotik, derinlik algısı otomatik kolların öğelerin konumunu ve şeklini doğru bir şekilde değerlendirerek "alma ve yerleştirme" işlemlerini gerçekleştirme üretim otomasyonu iş akışları.

Artırılmış Gerçeklik (AR)

Artırılmış gerçeklik deneyimlerinin sürükleyici olması için sanal nesnelerin fiziksel dünyayla gerçekçi bir şekilde etkileşime girmesi gerekir. Derinlik tahmini, mobil cihazların bir odanın geometrisini anlamasını sağlar ve sanal mobilyaların veya karakterlerin zemine yerleştirilmesine veya gerçek dünyadaki nesnelerin arkasına gizlenmesine (örtülme) olanak tanıyarak kullanıcı deneyimini büyük ölçüde iyileştirir.

Python Örneği: YOLO11 ile Mesafe Yaklaşımı

Özel derinlik modelleri mevcut olsa da, geliştiriciler genellikle 2D nesne algılama kalibrasyon verilerinin yanı sıra yaklaşık mesafe. Bu ultralytics kütüphanesi, çözüm modülü aracılığıyla bunu basitleştirerek kullanıcıların Sınırlayıcı kutu konumlarına göre izlenen nesnelerin mesafesini tahmin eder.

Aşağıdaki kodda nasıl kullanılacağı gösterilmektedir YOLO11 nesneleri track ve yaklaşık değerlerini hesaplamak için kameradan uzaklık.

import cv2
from ultralytics import YOLO, solutions

# Load the YOLO11 model for object detection
model = YOLO("yolo11n.pt")

# Initialize the DistanceCalculation solution
# This estimates distance based on bounding box centroids
dist_obj = solutions.DistanceCalculation(names=model.names, view_img=True)

# Open a video file or camera stream
cap = cv2.VideoCapture("path/to/video.mp4")

while cap.isOpened():
    success, im0 = cap.read()
    if not success:
        break

    # Track objects and calculate distance
    tracks = model.track(im0, persist=True, show=False)
    im0 = dist_obj.start_process(im0, tracks)

    # Display result (or save/process further)
    cv2.imshow("Distance Estimation", im0)
    if cv2.waitKey(1) == ord("q"):
        break

cap.release()
cv2.destroyAllWindows()

Derinlik Tahmini ve İlgili Kavramlar

Derinlik tahminini yapay zeka ekosistemindeki benzer terimlerden ayırmak önemlidir:

  • 3D Nesne Algılama: Bir yandan derinlik tahmini her piksele bir uzaklık değeri atarken, 3B nesne algılama belirli nesneleri tanımlamaya odaklanır. nesneleri ve 3B sınırlayıcı kutu (küboid) yerleştirme etraflarında. 3D algılama size "arabanın nerede olduğunu ve boyutunu" söylerken, derinlik tahmini Yol ve arka plan da dahil olmak üzere tüm sahnenin geometrisi.
  • Mesafe Hesaplama: Bu genellikle iki belirli nokta arasındaki veya kameradan farklı bir nesneye kadar olan doğrusal boşluğun ölçülmesi anlamına gelir (genellikle 2D sezgisel yöntemler kullanılarak), yukarıdaki kod örneğinde gösterildiği gibi. Derinlik tahmini yoğun, piksel bazında bir tahmindir görünümün eksiksiz bir topografik haritasını oluşturan görev.
  • Optik Akış: Bu ölçüm nesnelerin kareler arasındaki görünür hareketi. Optik akış ise derinlik (hareketten yapı) çıkarmak için kullanılabilir, Birincil çıktısı statik bir mesafe haritası değil, bir hareket vektör alanıdır.

Mekansal Yapay Zekanın Geliştirilmesi

Üretken AI ve temel modellerdeki son gelişmeler, 2D ve 3D arasındaki uçurumu daha da kapatıyor. Neural Radiance Fields (NeRF) gibi teknikler, altta yatan derinlik ilkelerine büyük ölçüde dayanarak, seyrek 2D görüntüleri kullanarak karmaşık 3D sahneleri yeniden oluşturur. Model optimizasyonu geliştikçe, yüksek doğrulukta derinlik tahmini, kenar yapay zeka cihazlarında mümkün hale gelerek, yeni nesil akıllı dronları, hizmet robotlarını ve uzamsal bilgi işlem cihazlarını güçlendiriyor.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın