Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Panoptik Segmentasyon

Panoptik segmentasyonun, yapay zeka uygulamalarında hassas piksel düzeyinde sahne anlayışı için semantik ve örnek segmentasyonunu nasıl birleştirdiğini keşfedin.

Panoptik segmentasyon birleşik bir birleştiren bilgisayarla görme (CV) görevi iki farklı yaklaşımın yetenekleri - anlamsalsegmentasyon ve örnek segmentasyonusağlamak için Bir görüntünün piksel düzeyinde kapsamlı bir şekilde anlaşılması. Diğer yöntemler yalnızca nesneleri tanımlamaya odaklanabilirken Bölgeleri kategorize eden panoptik segmentasyon, görsel bir sahnedeki her piksele benzersiz bir etiket atar. Bu süreç "şeyler" -gökyüzü, yol veya çimen gibi şekilsiz arka plan bölgeleri- ve "şeyler"-insanlar, arabalar ve hayvanlar gibi sayılabilir nesneler. Bu teknikler arasında köprü kurarak, yapay zeka (AI) sistemleri insan görüşünün ayrıntılı algısını taklit ederek çevrelerinin bütünsel bir görünümünü elde eder.

Segmentasyon Teknikleri Arasındaki Fark

Panoptik segmentasyonun değerini tam olarak kavramak için, onu ilgili segmentasyonlardan ayırmak faydalı olacaktır görüntü bölütleme görevleri:

  • Anlamsal Segmentasyon: Bu yöntem her piksele bir sınıf etiketi atar ancak aynı kategorideki birden fazla nesneyi tek bir nesne olarak ele alır. varlık. Örneğin, bir insan kalabalığı ayırt edilmeksizin birleşik bir "kişi" bölgesi olarak etiketlenir bireysel üyeler.
  • Örnek Segmentasyonu: Bu teknik yalnızca farklı sayılabilir nesneleri ("şeyler") tanımlamaya ve tasvir etmeye odaklanır. Aşağıdakiler için kesin bir sınırlayıcı kutu ve maske oluşturur her bir "araba" veya "yaya" ancak tipik olarak arka plan öğelerini göz ardı eder.
  • Panoptik Segmentasyon: Bu yaklaşım ikisini birleştirerek hiçbir pikselin sınıflandırılmadan kalmamasını sağlar. Bu ön planın benzersiz kimliklerini korurken arka plan ("şeyler") için bağlam sağlar nesneler ("şeyler"). Bu kavram, şu yazarın dönüm noktası niteliğindeki makalesinde resmileştirilmiştir FAIR (Meta AI), toplam sahne için titiz bir standart oluşturuyor ayrıştırma.

Panoptik Modeller Nasıl Çalışır?

Modern panoptik mimariler tipik olarak güçlü derin öğrenme (DL) çerçeveleri. Genellikle bir paylaşılan özellik çıkarıcı veya backbonegibi Evrişimsel Sinir Ağı (CNN) veya bir Görüntü Dönüştürücüsü (ViT). Şebeke daha sonra iki özel başlığa ayrılır: biri anlamsal analiz ve diğeri örnek tanımlama için. Gelişmiş algoritmaları, çakışan tahminler gibi çatışmaları çözmek için bu çıktıları birleştirerek uyumlu bir panoptik Harita.

Bu modellerin eğitimi kapsamlı bir eğitim gerektirir. açıklamalı veri kümeleri. Popüler kıyaslamalar arasında COCO Veri Kümesi, çeşitli günlük nesneler sunmaktadır, ve kentsel sokak sahneleri konusunda uzmanlaşmış Cityscapes'in temel otomotiv araştırmaları için.

Gerçek Dünya Uygulamaları

Panoptik segmentasyonun sunduğu granüler ayrıntılar, aşağıdakilere dayanan sektörleri dönüştürüyor gezinmek ve etkileşimde bulunmak için makine öğrenimi (ML) fiziksel dünya ile.

  • Otonom Araçlar: Waymo gibi şirketlerin sürücüsüz araçları ve Tesla toplam sahne anlayışına bağlıdır. Panoptik modeller aracın Sürülebilir yüzeyleri (anlamsal "şeyler") tanımlarken aynı zamanda tek tek bireylerin yörüngesini takip etmek yayalar ve diğer araçlar (örneğin "şeyler").
  • Tıbbi Görüntü Analizi: Sağlık hizmetlerinde hassasiyet kritik önem taşır. Analiz MRI taramaları genellikle genel doku tipleri ile spesifik anomaliler arasında ayrım yapmayı gerektirir. Panoptik segmentasyon yardımcı olur Radyologlar, tek tek tümör hücrelerini sayarken ve ölçerken arka plandaki organları belirleyerek doğru tümör tespiti.
  • Robotik ve Tarım: Tarımda Robotlar Yapılandırılmamış ortamlar bu teknolojiyi manipülasyon ve navigasyon için kullanır. İçinde hassas tarım, otomatik hasat makineleri Ürünlere zarar vermeden toplamak için mahsul sıralarını (arka plan) tek tek olgun meyvelerden (örnekler) ayırt etmek bitki.

YOLO ile Örnek Segmentasyonu

Tam panoptik mimariler hesaplama açısından yoğun olabilirken, "şeyler" bileşeni - tanımlama farklı nesne örnekleri- tarafından verimli bir şekilde ele alınır Ultralytics YOLO11. YOLO11 en son teknolojiyi sunar gerçek zamanlı çıkarım, onu mükemmel bir Hız ve doğruluk gerektiren uygulamalar için seçim.

Aşağıdakiler Python örneğinde nasıl kullanılacağı gösterilmektedir. ultralytics panoptik anlayışın önemli bir yapı taşı olan örnek segmentasyonunu gerçekleştirmek için paket:

from ultralytics import YOLO

# Load a pretrained YOLO11 instance segmentation model
model = YOLO("yolo11n-seg.pt")

# Run inference to detect and segment individual objects ('things')
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting image with segmentation masks
results[0].show()

Karmaşık boru hatları oluşturan geliştiriciler için PyTorch ve kütüphaneler gibi OpenCV bu segmentasyon haritalarının daha fazla işlenmesine olanak tanır. Hakkında daha fazla bilgi edinebilirsiniz Belirli bir projeye uyacak özel segmentasyon modellerinin eğitimi Ultralytics belgelerindeki ihtiyaçlar.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın