Örnek Segmentasyonu: Hızlı Bir Kılavuz

Bilgisayarlı görü uygulamaları, trafik kameralarının yol koşullarını izlemesinden mağazalardaki self-checkout sistemlerine kadar günlük hayatımızda giderek daha yaygın hale geliyor. Makinelerin görsel verileri insanlar gibi anlamasını sağlayarak, Vision AI çeşitli sektörlerde etki yaratıyor.

Bu uygulamaların çoğu, görüntülerdeki temel nesnelerin etrafına sınırlayıcı kutular yerleştiren bir bilgisayarlı görme görevi olan nesne algılamaya dayanır. Bu yaklaşım genellikle iyi işe yarasa da, bazı görüntü analizi çözümlerinin daha da yüksek hassasiyete ihtiyacı vardır.

Örneğin, tıbbi görüntüleme, sadece bir tümörü tespit etmekten daha fazlasını gerektirir - tam şeklini belirtmek çok önemlidir. Benzer şekilde, robotikte makinelerin doğru bir şekilde kavramak için bir nesnenin tam hatlarını tanıması gerekir. Bu zorlukların üstesinden gelmek için, örnek segmentasyonu daha kesin bir çözüm sunar.

Örnek segmentasyonu, nesneleri tespit etmenin yeterli olmadığı kullanım durumlarını desteklemek için tasarlanmış bir bilgisayarla görme görevidir - piksel düzeyinde doğruluk sağlar. Bilgisayarla görme modelleri gibi Ultralytics YOLO11 görüntülere ve videolara kolayca örnek segmentasyonu uygulamak için kullanılabilir.

__wf_reserved_inherit — Şekil 1. Örnek segmentasyonu için YOLO11 kullanımına örnek.

‍

Bu kılavuzda, örnek segmentasyonunun nasıl çalıştığını, uygulamalarını ve Ultralytics YOLO11 'in belirli segmentasyon görevleri için nasıl özel olarak eğitilebileceğini açıklayacağız.

Örnek segmentasyonu nedir?

Diyelim ki yan yana duran insanların bir grup fotoğrafı var. Nesne tespiti, her kişinin etrafına kutular çizmeye yardımcı olabilir, ancak bu size onların tam şeklini söylemez.

Örnek segmentasyonu ise, her bir kişinin etrafını dikkatlice çizmeye benzer, böylece üst üste gelseler bile tüm hatlarını görebilirsiniz. Sadece bir şeyin nerede olduğunu bir kutu ile işaretlemek yerine, her nesnenin tam şeklini piksel düzeyinde tanımlar, bu da karmaşık görüntüleri anlamayı kolaylaştırır.

Sonuç, bir nesnenin şeklini dolduran, hangi piksellerin ona ait olduğunu tam olarak belirleyen ayrıntılı bir maskedir. Bu hassasiyet düzeyi, nesnelerin tam şeklini ve sınırlarını anlamanın önemli olduğu birçok gerçek dünya uygulamasında faydalıdır.

‍

Örnek bölütleme - semantik bölütleme karşılaştırması

Örnek segmentasyonunu (instance segmentation) incelerken, semantik segmentasyon kavramıyla karşılaşabilirsiniz.

Her iki teknik de bilgisayarların görüntüleri piksel düzeyinde anlamasına yardımcı olur, ancak farklı amaçlara hizmet ederler. Semantik segmentasyon, her pikseli kategorisine göre etiketler ve aynı türdeki tüm nesneleri bir araya getirir. Örneğin, birden fazla araba içeren bir görüntüde, semantik segmentasyon bunların hepsini tek tek araçlar arasında ayrım yapmadan "araba" olarak işaretler.

Öte yandan, örnek segmentasyonu her nesneyi ayrı ayrı tanımlayarak bir adım daha ileri gider. Her bir örneğe benzersiz etiketler atar ve şekillerinin etrafında hassas maskeler oluşturur. Yani aynı görüntüde, örnek segmentasyonu her şeyi sadece "araba" olarak etiketlemekle kalmaz, aynı zamanda her bir arabayı ayrı ayrı tanır ve ana hatlarını çizer.

İkisi arasındaki temel fark, semantik segmentasyonun nesneleri kategoriye göre gruplandırması, örnek segmentasyonunun ise her nesneyi net sınırları olan benzersiz bir varlık olarak ayırt etmesidir. Hangi görevin kullanılacağını seçmek, belirli uygulamaya bağlıdır; bir görüntüde ne olduğunu bilmek yeterli mi, yoksa tek tek nesneler arasında ayrım yapmak önemli mi?

‍

Popüler örnek segmentasyon modelleri

Günümüzde Vision AI topluluğunun kullanımına sunulmuş çeşitli örnek segmentasyon modelleri bulunmaktadır. Bazıları daha hızlı, bazıları daha doğru ve bazıları ise daha kolay kullanılabilir.

Bu seçenekler yararlı olsa da, belirli bir görev için hangisinin kullanılacağı sorusuna yol açabilir? Seçenekler arasında Ultralytics YOLO modelleri, hız ve doğruluğa odaklandıkları için oldukça popülerdir.

Ayrıca, bu modeller yıllar içinde önemli ölçüde gelişmiştir. Örneğin, Ultralytics YOLOv5PyTorch gibi çerçeveler kullanılarak basitleştirilmiş dağıtım, gelişmiş Vision AI'yı derin teknik uzmanlık gerektirmeden daha geniş bir kitle için erişilebilir hale getirir.

Bu başarının üzerine inşa ediyoruz, Ultralytics YOLOv8 örnek segmentasyonu, poz tahmini ve görüntü sınıflandırması gibi bilgisayarla görme görevleri için gelişmiş destek sundu.

Şimdi, YOLO11 performansı yeni bir seviyeye taşıyor. COCO veri kümesinde YOLOv8m'den %22 daha az parametre ile daha yüksek bir ortalama ortalama hassasiyetmAP) elde eder, yani daha az kaynak kullanırken nesneleri daha hassas bir şekilde tanıyabilir.

‍

Basitçe söylemek gerekirse, YOLO11 verimlilikten ödün vermeden son teknoloji ürünü doğruluk sunar ve bu da onu sahada oyunun kurallarını değiştiren bir ürün haline getirir.

Örnek segmentasyonunun nasıl çalıştığını anlama

Şimdi, örnek segmentasyonunun tipik olarak nasıl çalıştığını inceleyelim. Daha eski bilgisayarla görme modelleri iki adımlı bir yaklaşım kullanır.

İlk olarak, etraflarına sınırlayıcı kutular çizerek nesneleri detect ederler. Ardından, her nesnenin tam şeklini belirlemek için piksel düzeyinde bir maske oluştururlar. İyi bilinen bir örnek, bir maske tahmin adımı ekleyerek nesne algılama modelleri üzerine inşa edilen Mask R-CNN'dir. Bu yöntem etkili olmakla birlikte, görüntüyü birden fazla aşamada işlediği için yavaş olabilir ve gerçek zamanlı uygulamaları daha zor hale getirir.

Bu arada, YOLO11 gibi modeller görüntüleri tek seferde işleyerek nesne sınırlayıcı kutularını ve örnek segmentasyon maskelerini aynı anda tahmin eder. Bu kolaylaştırılmış yaklaşım, yüksek doğruluğu korurken çok daha hızlı olmasını sağlar. Sonuç olarak, hem hızın hem de hassasiyetin çok önemli olduğu otonom sürüş, video analizi ve robotik gibi gerçek zamanlı uygulamalar için özellikle kullanışlıdır.

Örnek segmentasyonu için özel eğitim YOLO11

YOLO11 kutudan önceden eğitilmiş bir model olarak çıkmaktadır. Örnek segmentasyonu için günlük nesneleri kapsayan COCO veri kümesi üzerinde eğitilmiştir. Bununla birlikte, Ultralytics Python paketi, benzersiz nesnelerin segmente edilmesi gereken özel uygulamalar için gerekli olan özel eğitimi destekler.

Özel eğitim veya bir modele ince ayar yapmak neden önemlidir? Özel eğitim, önceden eğitilmiş modellerde zaten yerleşik olan bilgiden yararlanarak transfer öğrenimini kullanır. Sıfırdan başlamak yerine, mevcut bir modeli daha küçük veri kümeleri ve daha az bilgi işlem kaynağı kullanarak yeni görevlere uyarlar ve tüm bunları yüksek doğruluğu koruyarak yapar.

YOLO11 nasıl özel olarak eğitilir

İşte örnek segmentasyonu için YOLO11 'in ince ayarının yapılmasında yer alan adımlara daha yakından bir bakış:

Veri hazırlama: Özel uygulamanıza göre görüntüleri toplayın ve açıklama ekleyin. Ultralytics birden fazla görüntü veri kümesi için destek sağlar, ancak görüntüleri ve ek açıklamaları gerekli YOLO biçiminde hazırlayarak kendi veri kümenizi kullanarak da eğitebilirsiniz.
‍
Önceden eğitilmiş bir model kullanma: Sıfırdan başlamak yerine, önceden eğitilmiş bir Ultralytics YOLO11 modeli kullanın.
‍
Model eğitimi: Batch boyutu (iterasyon başına işlenen resimler), resim boyutu (hedef giriş çözünürlüğü) ve epoch sayısı (toplam eğitim döngüsü) gibi hayati eğitim ayarlarını ayarlayın ve modeli eğitin.
‍
Performans değerlendirmesi: Model eğitimi tamamlandıktan sonra, mAP gibi performans ölçümlerini kullanarak modelin doğruluğunu test edebilirsiniz. Ultralytics Python paketi ayrıca model değerlendirmesi için yerleşik işlevler sağlar.

YOLO11 tarafından etkinleştirilen örnek segmentasyon uygulamaları

Örnek bölütleme, makinelerin nesneleri daha doğru bir şekilde görmesine ve anlamasına yardımcı olarak gerçek dünya zorluklarını çözmek için kullanılabilir. Otomasyonu geliştirmekten çevreyi korumaya kadar birçok alanda önemli bir rol oynar. Nerelerde etkili olduğuna dair bazı örneklere göz atalım.

YOLO11 kullanarak şantiye güvenliği ve izleme

Örnek bölütleme, şantiyelerde güvenlik ve verimliliğin sağlanmasında kritik bir rol oynayabilir. Örneğin, ağır makineleri izlemek için kullanılabilir.

YOLO11 , vinçler, ekskavatörler ve buldozerler gibi farklı ekipman türlerini doğru bir şekilde segment ayırmak ve tanımlamak ve konumlarını gerçek zamanlı olarak track için ince ayar yapılabilir. Bu, saha yöneticilerinin makinelerin kesinlikle belirlenmiş alanlar içinde çalıştığından ve işçilerin bulunduğu veya tehlikelerin mevcut olduğu bölgelere tecavüz etmediğinden emin olmalarını sağlar.

Ayrıca, bu tür çözümlerin gerçek zamanlı uyarı sistemleriyle entegre edilmesi, hızlı düzeltici eylemlerin alınmasını sağlar. Bunun ötesinde, toplanan içgörüler, saha yerleşimini ve iş akışını optimize etmeye yardımcı olarak riskleri daha da azaltır ve üretkenliği artırır.

‍

Segmentasyon ve YOLO11 ile hayvan izleme

Hayvan davranışlarını izleme, araştırmacıların, çiftçilerin ve doğa korumacılarının farklı ortamlardaki hayvanlarla daha iyi ilgilenmelerine yardımcı olur. Örnek segmentasyonu, çiftliklerdeki, hayvanat bahçelerindeki ve doğal yaşam alanlarındaki bireysel hayvanları tanımlayarak ve bölümlere ayırarak bu sistemlerde faydalı bir rol oynar. Sınırlayıcı kutular kullanan geleneksel nesne tespitinden farklı olarak, örnek segmentasyonu, hayvanlar birbirine yakın olduğunda özellikle yararlı olan her hayvanın piksel düzeyinde bir tanımını sağlar.

Ayrıntılı segmentasyon, hareketlerin ve davranışların daha doğru bir şekilde izlenmesini kolaylaştırır. Örtüşen veya birbirine yakın kümelenmiş hayvanlar belirgin bir şekilde tanınabilir ve etkileşimlerin, sağlık değerlendirmelerinin ve aktivite modellerinin daha kesin bir analizini sağlar. Genel olarak, hayvan davranışına ilişkin daha derin içgörüler, hayvan bakımı ve yönetim uygulamalarını geliştirir.

‍

Spor analitiği ve oyuncu takibinde YOLO11

Hassas oyuncu ve etkinlik takibi, spor analizinin büyük bir parçasıdır. Geleneksel izleme yöntemleri manuel etiketlemeye dayanır ve bu da ayrıntılı etkileşimleri yakalayamayabilir. Bilgisayarlı görü, her bir oyuncu, top ve önemli olay gibi ayrıntıları piksel düzeyinde segment ayırarak ayrıntılı içgörüler elde etmek için kullanılabilir.

Örneğin, örnek segmentasyonu, her bir oyuncuyu ve nesneyi net bir şekilde ayırarak fauller veya topsuz olaylar gibi olayların detect yardımcı olabilir. YOLO11 gibi modellerin sağladığı bu granüler izleme, analistlere hareket modellerini, uzamsal konumlandırmayı ve etkileşimleri yüksek doğrulukla incelemeleri için daha net bilgiler sunar. Bu içgörülerin önemli bir faydası, takımların stratejilerini iyileştirmelerine ve genel performansı artırmalarına yardımcı olmalarıdır.

Örnek segmentasyonunun (instance segmentation) artıları ve eksileri

İşte örnek segmentasyonun çeşitli sektörlere sağlayabileceği temel faydalardan bazıları:

Geliştirilmiş otomasyon: Kalite kontrolü ve güvenlik izlemesi gibi görevleri otomatikleştirerek, örnek segmentasyonu manuel müdahale ihtiyacını azaltır ve insan hatasını en aza indirir.
‍
Daha iyi sahne anlama: Her nesneyi doğru bir şekilde ana hatlarıyla belirterek, örnek segmentasyonu karmaşık sahnelerin daha derinlemesine anlaşılmasına katkıda bulunur ve daha bilinçli karar vermeyi destekler.
‍
Verimli işlem sonrası: Piksel düzeyindeki çıktı, arka plan kaldırma, nesne sayma ve mekansal analiz gibi görevleri basitleştirerek ek işlem adımlarına olan ihtiyacı azaltır.

Bu faydalar örnek segmentasyonunun farklı kullanım durumlarını nasıl etkilediğini vurgularken, uygulanmasında yer alan zorlukları da dikkate almak önemlidir.

İşte örnek segmentasyonun temel sınırlamalarından bazıları:

Şeffaflıkla ilgili zorluklar: Cam ve su gibi şeffaf veya yansıtıcı nesneleri bölümlere ayırmak zordur ve bu da yanlış sınırlara yol açar.
‍
Bakım maliyeti: Modellerin doğru ve alakalı kalması için, çevresel koşullar ve veri kümeleri değiştikçe sürekli güncellemeler ve ince ayarlar yapmak gerekir.
‍
Yüksek etiketleme çabası: Örnek segmentasyon modellerini eğitmek, ayrıntılı piksel düzeyinde etiketleme gerektirir, bu da veri hazırlığında harcanan zamanı ve maliyeti önemli ölçüde artırır.

Önemli çıkarımlar

Örnek bölütleme, üst üste gelseler bile, tek tek nesneleri hassas bir şekilde ayırt etmeyi mümkün kılar. Nesne sınırlarını piksel düzeyinde yakalayarak, nesne algılama gibi geleneksel bilgisayarla görme görevlerine kıyasla görsel verilerin daha derinlemesine anlaşılmasını sağlar.

Bilgisayarlı görü alanındaki son gelişmeler, örnek segmentasyonunu daha hızlı ve kullanımı daha kolay hale getirmiştir. Özellikle Ultralytics YOLO11 gibi bilgisayarlı görü modelleri, süreci basitleştirerek minimum kurulumla gerçek zamanlı segmentasyon sağlar ve çeşitli endüstriler ve uygulamalar için daha erişilebilir hale getirir.

Yapay zekaya meraklı mısınız? Keşfetmeye devam etmek için GitHub depomuzu ziyaret edin ve topluluğumuzla bağlantı kurun. Çözüm sayfalarımızda kendi kendine giden arabalarda yapay zeka ve tarımda Vizyon AI gibi yenilikler hakkında bilgi edinin. Lisanslama seçeneklerimize göz atın ve bir bilgisayarlı görü projesine başlayın!

Örnek segmentasyonu nedir? Hızlı bir rehber

Örnek segmentasyonu nedir?

Örnek bölütleme - semantik bölütleme karşılaştırması

Popüler örnek segmentasyon modelleri

Örnek segmentasyonunun nasıl çalıştığını anlama

Örnek segmentasyonu için özel eğitim YOLO11

YOLO11 nasıl özel olarak eğitilir

YOLO11 tarafından etkinleştirilen örnek segmentasyon uygulamaları

YOLO11 kullanarak şantiye güvenliği ve izleme

Segmentasyon ve YOLO11 ile hayvan izleme

Spor analitiği ve oyuncu takibinde YOLO11

Örnek segmentasyonunun (instance segmentation) artıları ve eksileri

Önemli çıkarımlar

Bu kategoride daha fazla okuyun

Monoküler derinlik tahmini nedir? Genel bakış

Görüntü işleme nedir? Kısa bir giriş

Şablon eşleştirme nedir? Hızlı kılavuz

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Örnek segmentasyonu nedir? Hızlı bir rehber

Örnek segmentasyonu nedir?

Örnek bölütleme - semantik bölütleme karşılaştırması

Popüler örnek segmentasyon modelleri

Örnek segmentasyonunun nasıl çalıştığını anlama

Örnek segmentasyonu için özel eğitim YOLO11

YOLO11 nasıl özel olarak eğitilir

YOLO11 tarafından etkinleştirilen örnek segmentasyon uygulamaları

YOLO11 kullanarak şantiye güvenliği ve izleme

Segmentasyon ve YOLO11 ile hayvan izleme

Spor analitiği ve oyuncu takibinde YOLO11

Örnek segmentasyonunun (instance segmentation) artıları ve eksileri

Önemli çıkarımlar

Bu kategoride daha fazla okuyun

Monoküler derinlik tahmini nedir? Genel bakış

Görüntü işleme nedir? Kısa bir giriş

Şablon eşleştirme nedir? Hızlı kılavuz

Gelin, yapay zekanın geleceğini birlikte inşa edelim!

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!