YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

Derinlik Tahmini

Derinlik tahmininin robotik, AR/VR ve 3D algıyı güçlendirmek için görüntülerden (stereo, ToF, LiDAR ve monoküler derin öğrenme) nasıl derinlik haritaları oluşturduğunu keşfedin.

Derinlik tahmini, bir sahnedeki çeşitli nesnelerin bir kameranın bakış açısından uzaklığını hesaplamayı içeren bilgisayarla görmede temel bir görevdir. Yalnızca yükseklik ve genişliği yakalayan standart 2D görüntülerin aksine, derinlik tahmini üçüncü bir boyut ekleyerek bir sistemin dünyayı 3D olarak algılamasını sağlar. Bu işlem, esasen her pikselin değerinin kameradan uzaklığına karşılık geldiği bir görüntü olan bir derinlik haritası oluşturur. Bu özellik, makinelerin uzamsal ilişkileri anlamasını ve insan görüşüne benzer şekilde çevreleriyle daha anlamlı bir şekilde etkileşime girmesini sağlamak için temeldir.

Derinlik Tahmini Nasıl Çalışır?

Derinlik tahmini elde etmek için, özel donanım kullanan geleneksel yöntemlerden derin öğrenmeye dayalı modern yaklaşımlara kadar çeşitli teknikler vardır.

  • Stereo Görüş: Bu yöntem, birbirinden kısa bir mesafeye yerleştirilmiş iki kamera kullanarak insanın binoküler görüşünü taklit eder. İki görüntü arasındaki küçük farkları (eşitsizlik) analiz ederek, sahnedeki noktalara olan mesafeyi üçgenlemek mümkündür. Bu, derinlik bilgisini yakalamak için klasik ve güvenilir bir yaklaşımdır.
  • Uçuş Süresi (ToF) Kameraları: Bu özel sensörler bir ışık sinyali (genellikle kızılötesi) yayar ve ışığın bir nesneden sekip sensöre geri dönmesi için geçen süreyi ölçer. ToF kameralar gerçek zamanlı olarak son derece hassas derinlik haritaları oluşturabilir.
  • LiDAR (Işık Algılama ve Uzaklık Ölçümü): Genellikle otonom araçlarda kullanılan LiDAR, lazer darbeleri yayarak ve çevrenin ayrıntılı bir 3D nokta bulutunu oluşturmak için geri dönüş sürelerini ölçerek çalışır. LiDAR teknolojisi hassas derinlik verileri sağlayarak güvenli navigasyon için çok değerli hale getirir.
  • Monoküler Derinlik Tahmini: Yapay zekadaki önemli bir ilerleme, tek bir 2D görüntüden derinlik tahminini içerir. Derin öğrenme modelleri, özellikle de konvolüsyonel sinir ağları (CNN'ler), insan beyninin yaptığı gibi dokulardan, gölgelendirmeden ve nesne boyutlarından derinlik ipuçları çıkarmak için geniş veri kümeleri üzerinde eğitilir.

Derinlik Tahmini Uygulamaları

Derinliği algılama yeteneği, uzamsal farkındalık gerektiren çok çeşitli uygulamalar için çok önemlidir.

Robotikte derinlik tahmini, navigasyon ve manipülasyon için kritik öneme sahiptir. Bir montaj hattındaki endüstriyel bir robot, nesneleri doğru bir şekilde kavramak ve hareket ettirmek için derinlik verilerini kullanır ve üretim otomasyonunda verimliliği artırır. Benzer şekilde, mobil bir robot engellerden kaçınmak ve depo gibi dinamik bir ortamda yolunu planlamak için bir derinlik haritası kullanır. Bu 3B algı, fiziksel dünya ile hassas ve güvenli etkileşime olanak tanır.

Artırılmış Gerçeklik (AR) ve Sanal Gerçeklik (VR), sürükleyici deneyimler yaratmak için büyük ölçüde derinlik tahminine dayanır. Akıllı telefondaki bir AR uygulamasının sanal bir mobilya parçasını gerçek bir odaya yerleştirebilmesi için öncelikle odanın geometrisini anlaması gerekir. Sistem, ayrıntılı bir derinlik haritası oluşturarak sanal nesnenin gerçek dünyadaki nesnelerle gerçekçi bir şekilde örtüşmesini ve etkileşime girmesini sağlayabilir, böylece illüzyonu kusursuz ve inandırıcı hale getirebilir.

Derinlik Tahmini ve İlgili Kavramlar

Derinlik tahminini bilgisayarla görmede kulağa benzer gelen terimlerden ayırmak önemlidir.

  • Mesafe Hesaplama: Birbiriyle ilişkili olsa da, bilgisayarla görmede mesafe hesaplaması genellikle 2B görüntü düzleminde (yani piksel cinsinden) iki nesne arasındaki mesafenin ölçülmesi anlamına gelir. Buna karşılık, derinlik tahmini, 3D uzaydaki nesnelerin kameranın kendisine olan uzaklığını ölçer. Basit bir kalibre edilmiş mesafe bazı görevler için yeterli olabilirken, derinlik tahmini daha ayrıntılı uzamsal bilgi sağlar.
  • 3B Nesne Algılama: Derinlik tahmini, 3D nesne algılama için önemli bir olanaktır. 2D nesne algılama düz bir görüntüdeki nesnenin etrafına bir sınırlayıcı kutu çizerken, 3D nesne algılama nesnenin etrafına bir 3D küboid yerleştirerek üç boyutlu uzaydaki konumunu, boyutunu ve yönünü tanımlar. Bu gelişmiş algılama ancak doğru derinlik bilgisi ile mümkündür.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı