Nesne algılama için Maksimum Olmayan Bastırmayı (NMS) keşfedin. Sonuçları nasıl iyileştirdiğini, doğruluğu nasıl artırdığını ve YOLO gibi yapay zeka uygulamalarına nasıl güç verdiğini öğrenin.
Maksimum Olmayan Bastırma (NMS), bilgisayarla görmede (CV), özellikle de nesne algılama işlem hatlarında yaygın olarak kullanılan önemli bir son işlem tekniğidir. Ana rolü, genellikle aynı nesne örneği için birden fazla, örtüşen sınırlayıcı kutu tanımlayan algılama modelleri tarafından üretilen ham çıktıyı rafine etmektir. Bu gereksiz kutuları akıllıca filtreleyen NMS, bir görüntü veya video karesindeki her bir farklı nesnenin tek bir optimum sınırlayıcı kutu ile temsil edilmesini sağlar. Bu, nihai algılama sonuçlarının netliğini ve doğruluğunu önemli ölçüde artırarak sonraki görevler için daha kullanışlı hale getirir.
Çeşitli nesne algılama modelleri, örneğin Ultralytics YOLO versiyonları, tipik olarak bir görüntüyü tarar ve tespit edilen nesnelerin etrafında çok sayıda potansiyel sınırlayıcı kutu önerir. Önerilen her kutu, modelin kutunun bir nesne içerdiğine ve belirli bir sınıfa ait olduğuna dair kesinliğini gösteren bir güven puanı ile birlikte gelir. NMS, bu önerileri güven puanlarına ve uzamsal örtüşmelerine göre sistematik olarak azaltarak çalışır.
Süreç genel olarak şu adımları takip eder:
Bu, yalnızca en güvenli, örtüşmeyen kutuların kalmasını sağlar ve birçok bilgisayarla görme eğitiminde görselleştirildiği gibi çok daha temiz ve daha yorumlanabilir bir çıktı sağlar.
Daha geniş Yapay Zeka (AI) ve Makine Öğrenimi (ML) alanlarında, NMS güvenilir nesne algılama performansı elde etmek için temeldir. NMS olmadan, aşağıdaki gibi bir dedektörün çıkışı YOLO11 tek nesneler için birden fazla kutu ile karmaşık hale gelecektir. Bu fazlalık, nesneleri sayma(nesne sayma kılavuzu), nesne izleme veya robotikte karmaşık sahne anlama gibi sonraki uygulamalarda hatalara yol açabilir.
Bu gereksiz tespitleri ortadan kaldırarak (genellikle yanlış pozitiflere katkıda bulunur), NMS modelin tahminlerinin hassasiyetini önemli ölçüde artırır. Bu iyileştirme, yüksek güvenilirlik ve doğruluk gerektiren uygulamalar için kritik öneme sahiptir. NMS'nin etkisi, YOLO Performans Ölçütleri kılavuzunda ayrıntılı olarak açıklandığı üzere, genellikle NMS uygulandıktan sonra hesaplanan Ortalama Ortalama Kesinlik (mAP) gibi değerlendirme ölçütlerine yansıtılır.
NMS, çok sayıda pratik yapay zeka uygulamasını mümkün kılan bir köşe taşı teknolojisidir:
NMS, özellikle bir nesne algılama modeli ilk aday sınırlayıcı kutu kümesini oluşturduktan sonra uygulanan bir işlem sonrası adımdır. Çapa tabanlı dedektörler ile çapasız dedektörler arasındaki fark gibi algılama mimarisinin kendisiyle karıştırılmamalıdır. Bu mimariler potansiyel kutuların nasıl önerildiğini tanımlarken, NMS bu önerileri iyileştirir.
İlginç bir şekilde, NMS ile ilişkili hesaplama maliyeti ve potansiyel darboğazlar, NMS içermeyen nesne dedektörlerine yönelik araştırmaları teşvik etmiştir. YOLOv10 gibi modeller eğitim sırasında (tutarlı ikili atamalar gibi) mekanizmaları entegre ederek gereksiz kutuları tahmin etmekten doğal olarak kaçınır, çıkarım gecikmesini azaltmayı ve gerçekten uçtan uca tespit sağlamayı amaçlar(YOLOv10 NMS'siz yaklaşım). Bu, aşağıdaki gibi geleneksel yaklaşımlarla tezat oluşturmaktadır Ultralytics YOLOv8 veya YOLOv5NMS'nin çıkarım işlem hattının standart ve temel bir parçası olmaya devam ettiği. YOLOv10 ve YOLOv8 gibi teknik karşılaştırmaları belgelerimizde inceleyebilirsiniz. Soft-NMS(Soft-NMS üzerine makale) gibi varyantlar, örtüşen kutuların puanlarını tamamen ortadan kaldırmak yerine azaltan alternatif yaklaşımlar sunar.
NMS, Ultralytics ekosistemine sorunsuz bir şekilde entegre edilmiştir. Ultralytics YOLO modelleri NMS'yi otomatik olarak tahmin (predict
) ve doğrulama (val
) modları, kullanıcıların varsayılan olarak temiz ve doğru algılama çıktıları almasını sağlar. NMS davranışını kontrol eden parametreler (IoU eşiği ve güven eşiği gibi) genellikle özel uygulama ihtiyaçları için ayarlanabilir.
Ultralytics HUB gibi platformlar bu ayrıntıları daha da soyutlaştırarak kullanıcıların modelleri eğitmesine(bulut eğitim kılavuzu) ve NMS'nin optimize edilmiş boru hattının bir parçası olarak otomatik olarak ele alındığı yerlerde bunları dağıtmasına olanak tanır. Bu entegrasyon, kullanıcıların MLOps konusundaki derin teknik uzmanlıklarından bağımsız olarak, çeşitli bilgisayarla görme görevleri için son teknoloji ürünü nesne algılama sonuçlarından yararlanabilmelerini sağlar. Ultralytics çerçevesindeki özel uygulama ayrıntıları Ultralytics yardımcı programları referansında keşfedilebilir. Daha fazla tanım için ana Ultralytics Sözlüğü'ne göz atın.