Sözlük

Panoptik Segmentasyon

Panoptik segmentasyonun, yapay zeka uygulamalarında piksel düzeyinde hassas sahne anlayışı için semantik ve örnek segmentasyonu nasıl birleştirdiğini keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Panoptik segmentasyon, her piksele hem bir sınıf etiketi hem de benzersiz bir örnek kimliği atayarak bir görüntünün eksiksiz ve tutarlı bir şekilde anlaşılmasını sağlamayı amaçlayan gelişmiş bir bilgisayarla görme görevidir. İki ana segmentasyon paradigmasını etkili bir şekilde birleştirir: her pikseli bir kategori ile etiketleyen semantik segmentasyon ('araba', 'yol', 'gökyüzü' gibi) ve bireysel nesne örneklerini tanımlayan ve tanımlayan örnek segmentasyonu('araba 1', 'araba 2' gibi). Amaç, aynı sınıftaki farklı nesneleri birbirinden ayıran ve aynı zamanda sayılabilir "şeylere" (ör. arabalar, yayalar, bisikletler) karşı genellikle "şeyler" (ör. yol, gökyüzü, bitki örtüsü) olarak adlandırılan şekilsiz arka plan bölgelerini tanımlayan sahnenin kapsamlı, piksel düzeyinde bir haritasını oluşturmaktır. Bu bütünsel yaklaşım, tek başına semantik veya örnek segmentasyonundan daha zengin sahne bağlamı sağlar.

Panoptik Segmentasyon Nasıl Çalışır?

Panoptik segmentasyon algoritmaları, her pikselin anlamsal bir etiket ve sayılabilir bir nesneye ("şey") aitse benzersiz bir örnek kimliği aldığı tek bir çıktı haritası üretmek için bir görüntüyü işler. Arka plan bölgelerine ("şeyler") ait pikseller aynı anlamsal etiketi paylaşır ancak genellikle benzersiz örnek kimliklerine sahip değildir (veya her bir şey kategorisi için tek bir kimlik paylaşır). Modern yaklaşımlar genellikle derin öğrenmeden, özellikle de Evrişimsel Sinir Ağları (CNN'ler) veya Transformatörlere dayalı mimarilerden yararlanır. Bazı yöntemler anlamsal ve örnek segmentasyonu için ayrı ağ dalları kullanır ve ardından sonuçları birleştirirken, diğerleri orijinal "Panoptic Segmentation" makalesinde tanıtıldığı gibi panoptik görev için özel olarak tasarlanmış uçtan uca modeller kullanır. Bu modellerin eğitilmesi için COCO Panoptic veri kümesi veya Cityscapes veri kümesi gibi ayrıntılı panoptik açıklamalara sahip veri kümeleri gerekir. Performans genellikle segmentasyon kalitesi ve tanıma kalitesini birleştiren Panoptik Kalite (PQ) metriği kullanılarak ölçülür.

Panoptik Segmentasyon ve İlgili Görevler

Panoptik segmentasyon ve ilgili bilgisayarla görme görevleri arasındaki farkları anlamak çok önemlidir:

  • Anlamsal Segmentasyon: Her piksele bir sınıf etiketi (örneğin, 'araba', 'kişi', 'yol') atar. Kategorileri tanımlar ancak aynı kategorinin farklı örnekleri arasında ayrım yapmaz. Örneğin, çıktı maskesinde tüm arabalar aynı renkte olabilir.
  • Örnek Segmentasyonu: Tek tek nesne örneklerini tespit eder ve bölümlere ayırır (örneğin, 'araba 1', 'araba 2', 'kişi 1'). Sayılabilir "şeylere" odaklanır ve tipik olarak gökyüzü veya yol gibi şekilsiz arka plan "şeylerini" görmezden gelir veya bunları tek bir arka plan sınıfı olarak ele alır. Ultralytics YOLO modelleri sağlam örnek segmentasyonu özellikleri sağlar. Örnek segmentasyonu ve semantik segmentasyon hakkındaki bu kılavuzda daha fazla bilgi edinebilirsiniz.
  • Nesne Algılama: Sınırlayıcı kutular kullanarak nesnelerin varlığını ve konumunu belirler ve sınıf etiketleri atar. Piksel düzeyinde maskeler sağlamaz veya arka plan bölgelerini segmentlere ayırmaz. YOLOv10 gibi birçok son teknoloji nesne algılama modeli ve YOLO11YOLO11 ve YOLOv10 gibi karşılaştırma için kullanılabilir.

Panoptik segmentasyon, semantik ve örnek segmentasyonun güçlü yönlerini benzersiz bir şekilde birleştirerek tüm pikselleri sınıf etiketli arka plan bölgelerine veya farklı nesne örneklerine ayıran birleşik bir çıktı sağlar.

Panoptik Segmentasyon Uygulamaları

Panoptik segmentasyonun sunduğu kapsamlı sahne anlayışı, çeşitli alanlarda değerlidir:

  • Otonom Araçlar: Kendi kendine giden arabalar çevrelerini tam olarak anlamayı gerektirir. Panoptik segmentasyon, nesneler üst üste bindiğinde bile yolu, kaldırımları, binaları ("şeyler") aynı anda tanımlamalarını ve tek tek arabaları, yayaları, bisikletlileri ("şeyler") ayırt etmelerini sağlar. Bu ayrıntılı algılama, güvenli navigasyon ve karar verme için kritik öneme sahiptir. Ultralytics 'in otomotiv çözümlerinde yapay zekaya nasıl katkıda bulunduğunu görün.
  • Tıbbi Görüntü Analizi: MRI veya CT taramaları gibi tıbbi taramaları analiz ederken, panoptik segmentasyon çeşitli doku tiplerini ("şeyler") ayırt edebilir ve aynı zamanda tümörler, lezyonlar veya tek tek hücreler ("şeyler") gibi yapıların belirli örneklerini tanımlayıp segmentlere ayırabilir. Bu da teşhis, tedavi planlaması ve hastalık ilerlemesinin izlenmesine yardımcı olur. Tümör tespiti için YOLO11 kullanımı hakkında bilgi edinin.
  • Robotik: Karmaşık ortamlarda çalışan robotlar hem düzeni (duvarlar, zeminler - "şeyler") hem de etkileşime girebilecekleri tek tek nesneleri (aletler, parçalar, insanlar - "şeyler") anlamaktan yararlanır. Bu, navigasyon, manipülasyon ve insan-robot etkileşimine yardımcı olur. Robotikte yapay zekayı keşfedin.
  • Artırılmış Gerçeklik (AR): AR uygulamaları, sanal nesneleri gerçek dünya sahnesine gerçekçi bir şekilde yerleştirmek için panoptik segmentasyonu kullanabilir ve hem arka plan yüzeyleri hem de ön plan nesneleriyle oklüzyonları ve etkileşimleri doğru bir şekilde ele alabilir. AR teknolojisindeki gelişmelere bakın.
  • Uydu Görüntü Analizi: Ormanlar veya su kütleleri ("şeyler") gibi geniş alan türleri ile binalar veya araçlar ("şeyler") gibi bireysel yapılar arasında ayrım yaparak ayrıntılı arazi örtüsü haritalaması için kullanılır. Uydu görüntüsü analiz teknikleri hakkında bilgi edinin.

YOLO11 gibi Ultralytics modelleri, nesne algılama ve örnek segmentasyonu gibi görevlerde son teknoloji ürünü performans sunarken, panoptik segmentasyon, giderek daha karmaşık hale gelen yapay zeka uygulamaları için çok önemli olan entegre sahne anlayışının bir sonraki seviyesini temsil eder. Ultralytics HUB gibi platformları kullanarak ilgili görevler için modelleri yönetebilir ve eğitebilirsiniz.

Tümünü okuyun