YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

Panoptik Segmentasyon

Panoptik segmentasyonun, yapay zeka uygulamalarında hassas piksel düzeyinde sahne anlayışı için semantik ve örnek segmentasyonunu nasıl birleştirdiğini keşfedin.

Panoptik segmentasyon, tüm bir sahnenin kapsamlı, piksel düzeyinde anlaşılmasını sağlayan gelişmiş bir bilgisayarlı görü (CV) görevidir. İki ayrı görevi birleştirir: semantik segmentasyon ve örnek segmentasyonu. Amaç, bir görüntüdeki her piksele hem bir sınıf etiketi (araba, kişi veya gökyüzü gibi) hem de farklı nesneler için benzersiz bir örnek kimliği atamaktır. Bu, her iki segmentasyon yönteminin tek başına başarabileceğinden daha bütünsel ve ayrıntılı bir çıktı oluşturarak, makinelerin görsel ortamları insan görüşüne daha yakın bir ayrıntı düzeyinde algılamasını sağlar. Terim, FAIR'den araştırmacılar tarafından hazırlanan çığır açan 2018 tarihli "Panoptik Segmentasyon" makalesinde tanıtıldı.

Panoptik ve Diğer Segmentasyon Türleri Karşılaştırması

Panoramik bölütlemeyi tam olarak anlamak için, onu oluşturan parçalarla karşılaştırmak faydalı olacaktır:

  • Semantik Bölütleme (Semantic Segmentation): Bu teknik, bir görüntüdeki her pikseli belirli bir kategoriye sınıflandırır. Örneğin, arabalara ait tüm pikselleri "araba" ve yolun tüm piksellerini "yol" olarak etiketler. Ancak, aynı nesne sınıfının farklı örnekleri arasında ayrım yapmaz. Yan yana duran iki ayrı araba, aynı "araba" piksel haritasının parçası olacaktır.
  • Örnek Bölütleme (Instance Segmentation): Bu yöntem, genellikle "şeyler" olarak adlandırılan (örneğin, arabalar, yayalar, hayvanlar) bireysel nesneleri algılar ve bölümlere ayırır. Algılanan her nesne örneğine benzersiz bir maske atar, örneğin: car_1, car_2, ve pedestrian_1. Ancak, örnek segmentasyonu tipik olarak amorf arka plan bölgelerini veya belirgin bir şekli veya sayısı olmayan "şeyleri" (örneğin, gökyüzü, yol, çimen, duvarlar) göz ardı eder.
  • Panoptik Segmentasyon: Bu, hem semantik hem de örnek segmentasyonunun güçlü yönlerini birleştirir. Görüntüdeki her bir pikseli bölümlere ayırır ve hem "şeyler" hem de "eşyalar" için bir sınıf etiketi sağlar. En önemlisi, her "şeye" benzersiz bir örnek kimliği atayarak eksiksiz ve birleşik bir sahne yorumu sağlar. Örneğin, bir panoptik model yalnızca gökyüzünü ve yolu etiketlemekle kalmaz, aynı zamanda tanımlar ve sınırlandırır car_1, car_2, ve pedestrian_1 ayrı varlıklar olarak. Bu kapsamlı yaklaşım, gelişmiş YZ uygulamaları.

Panoptik Bölütlemenin Uygulamaları

Panoptik segmentasyonun sunduğu ayrıntılı sahne anlayışı, çeşitli alanlarda paha biçilmezdir:

  • Otonom Araçlar: Sürücüsüz otomobiller, güvenli navigasyon için çevrelerini tam olarak anlamayı gerektirir. Panoramik segmentasyon, yol ve kaldırımlar gibi amorf yüzeyleri ("şeyler") tanımlamalarına ve aynı zamanda bireysel otomobilleri, yayaları ve bisikletlileri ("nesneler"), örtüştüklerinde bile ayırt etmelerini sağlar. Waymo gibi şirketlerin sistemlerinde gösterilen bu ayrıntılı algılama, güvenli yol planlaması ve karar verme için kritik öneme sahiptir. Ultralytics'in otomotiv çözümlerinde yapay zeka'ya nasıl katkıda bulunduğunu görün.
  • Tıbbi Görüntü Analizi: MR veya BT taramaları gibi tıbbi taramaları analiz ederken, panoptik segmentasyon çeşitli doku türlerini ("şeyler") ayırt edebilirken, aynı zamanda tümörler veya bireysel hücreler ("nesneler") gibi yapıların belirli örneklerini de tanımlayabilir. Bu, daha doğru teşhisleri destekler, cerrahi planlamaya yardımcı olur ve hastalığın ilerlemesini izlemeye yardımcı olur. Tümör tespiti için YOLO11 kullanımı gibi ilgili görevler hakkında bilgi edinebilirsiniz.
  • Robotik: Robotların çevreleriyle etkili bir şekilde etkileşim kurabilmeleri için hem genel düzeni (duvarlar, zeminler) hem de manipüle edebilecekleri belirli nesneleri (aletler, parçalar) anlamaları gerekir. Panoptik segmentasyon, bu birleşik görünümü sağlayarak, depolar ve fabrikalar gibi karmaşık ortamlarda navigasyonu ve insan-robot etkileşimini geliştirir. Yapay zekanın robotikteki rolü hakkında daha fazla bilgi edinin.
  • Artırılmış Gerçeklik (AR): AR uygulamaları, sanal nesneleri gerçek dünyayla sorunsuz bir şekilde harmanlamak için panoptik segmentasyonu kullanır. Hem arka plan yüzeylerinin hem de ön plan nesnelerinin konumunu anlayarak, AR sistemleri sanal içeriği gerçekçi bir şekilde yerleştirebilir ve tıkanmaları doğru bir şekilde işleyebilir. Bu, AR teknolojisinde büyük gelişmelere yol açmıştır.
  • Uydu Görüntü Analizi: Bu teknik, ormanlar veya su kütleleri ("şeyler") gibi geniş alan türleri ile binalar veya araçlar ("nesneler") gibi bireysel yapılar arasında ayrım yaparak ayrıntılı arazi örtüsü haritalaması için kullanılır. USGS gibi devlet kurumları, bu verileri çevresel izleme ve şehir planlaması için kullanır.

Modeller ve Uygulama

Panoptik segmentasyon modelleri tipik olarak PyTorch gibi derin öğrenme çerçeveleri kullanılarak oluşturulur ve COCO-Panoptic ve Cityscapes gibi büyük ölçekli veri kümeleri üzerinde eğitilir. YOLO11 gibi Ultralytics modelleri, temel yapı taşları olan nesne tespiti ve örnek segmentasyonu gibi temel görevlerde son teknoloji performansı sunarken, panoptik segmentasyon entegre sahne anlamanın bir sonraki seviyesini temsil eder. Google AI ve Meta AI gibi kurumlardaki araştırmalar devam ettikçe, bu kapsamlı modellerin yetenekleri sürekli olarak gelişmekte ve daha karmaşık ve bilinçli yapay zeka sistemlerinin önünü açmaktadır. Ultralytics HUB gibi platformları kullanarak ilgili görevler için modelleri yönetebilir ve eğitebilirsiniz.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı