Veri kalitesi, artırma, eğitim stratejileri, değerlendirme ve dağıtımla ilgili pratik ipuçlarıyla küçük nesneler mAP model mAP nasıl iyileştirebileceğinizi öğrenin.
Veri kalitesi, artırma, eğitim stratejileri, değerlendirme ve dağıtımla ilgili pratik ipuçlarıyla küçük nesneler mAP model mAP nasıl iyileştirebileceğinizi öğrenin.
Yapay zeka (AI), makine öğrenimi ve bilgisayar görüşünün kullanımı yaygınlaşmaya devam ederken, nesne algılama sistemleri akıllı trafik kameralarından insansız hava araçlarına ve perakende analiz araçlarına kadar her yerde kullanılmaktadır. Genellikle bu sistemlerin, kameraya yakın büyük bir kamyon veya uzaktaki küçük bir yaya gibi her boyuttaki detect beklenir.
Genellikle, büyük ve açıkça görülebilen nesneleri tespit etmek daha kolaydır. Buna karşılık, küçük nesneleri tespit etmek daha zordur.
Bir nesne görüntünün sadece çok küçük bir bölümünü kapladığında, işlenecek görsel bilgi çok azdır. Trafik görüntüsünde uzaktaki bir yaya veya havadan çekilmiş bir fotoğrafta görünen küçük bir araç sadece birkaç piksel içerebilir, ancak bu pikseller çok önemli bilgiler taşıyabilir.
Ultralytics YOLO gibi bilgisayar görme modelleri, nesneleri tanımak için görsel kalıplara dayanır ve bu kalıplar sınırlı veya belirsiz olduğunda performans düşer. İşleme sırasında önemli ayrıntılar kaybolabilir ve bu da tahminleri yerelleştirme hatalarına daha duyarlı hale getirir. Sınırlayıcı kutudaki küçük bir kayma bile doğru bir algılamayı yanlış bir algılamaya dönüştürebilir.
Bu fark, model performansına baktığımızda net bir şekilde ortaya çıkıyor. Çoğu algılama ve segmentasyon modeli orta ve büyük nesneleri iyi işlerken, küçük nesneler genellikle genel doğruluğu düşürür.
Derin öğrenme performansı genellikle ortalama hassasiyet( mAP) kullanılarak ölçülür. Bu metrik, algılamaların ne kadar doğru olduğunu ve tahmin edilen kutuların gerçek nesnelerle ne kadar iyi uyum sağladığını yansıtır.
Farklı güven düzeyleri ve Birleşim Üzerinde Kesişim IoU eşikleri IoU tahmin edilen sınırlayıcı kutunun gerçek kutuyla ne kadar örtüştüğünü ölçen bir metrik IoU arasında, tahmin edilen nesnelerin kaç tanesinin doğru olduğunu gösteren hassasiyet ile gerçek nesnelerin kaç tanesinin başarıyla algılandığını gösteren geri çağırma oranını birleştirir.
Daha önce, küçük nesne algılama ve bunun bilgisayar görme modelleri için neden bu kadar zor bir sorun olduğunu incelemiştik. Bu makalede, bu temeli temel alarak, küçük nesneler söz konusu mAP nasıl iyileştirebileceğimize odaklanacağız. Hadi başlayalım!
Nesne algılayıcıları içeren uygulamalarda, küçük bir nesne, insan gözüne ne kadar küçük göründüğü ile değil, görüntüde ne kadar yer kapladığı ile tanımlanır. Görüntünün sadece çok küçük bir bölümünü kaplıyorsa, çok az görsel bilgi içerir ve bu da bilgisayar görme algoritmasının detect zorlaştırır.

Çalışılacak piksel sayısı azaldıkça, kenarlar, şekiller ve dokular gibi önemli ayrıntılar belirsiz hale gelebilir veya kolayca kaybolabilir. Görüntü model tarafından işlenirken, yararlı desenleri vurgulamak için yeniden boyutlandırılır ve basitleştirilir.
Bu, modelin genel sahneyi anlamasına yardımcı olurken, ince ayrıntıları daha da azaltabilir. Küçük nesneler için, bu ayrıntılar genellikle doğru algılama için çok önemlidir.
Bu zorluklar, değerlendirme ölçütlerine bakıldığında daha da belirgin hale geliyor. Küçük nesneler, yerelleştirme hatalarına özellikle duyarlıdır. Hafifçe yanlış hizalanmış bir sınırlayıcı kutu bile, gerekli Intersection over Union ( IoU) eşiğinin altına düşebilir.
Bu durumda, makul görünen bir tahmin yanlış olarak değerlendirilebilir. Bu durum hem hassasiyeti hem de geri çağırmayı düşürür ve sonuçta ortalama hassasiyeti ( mAP) azaltır.
Bu faktörler birbiriyle yakından bağlantılı olduğundan, performansı iyileştirmek için genellikle tüm sistemi göz önünde bulundurmak gerekir. Bu, küçük görsel ayrıntıların daha iyi korunması ve yorumlanması için görüntü çözünürlüğü, özellik çıkarma, model tasarımı ve değerlendirme ayarlarını dikkatlice dengelemek anlamına gelir.
Küçük nesne algılama söz konusu olduğunda, veri setinin kalitesi genellikle performansta en büyük farkı yaratır. Küçük nesneler görüntünün sadece çok küçük bir bölümünü kaplar, bu da modelin öğrenmesi için çok az görsel bilgi olduğu anlamına gelir. Bu nedenle, eğitim verileri özellikle önem kazanır. Veri seti yeterince net ve temsil edici örnekler içermiyorsa, nesne algılama modeli tutarlı kalıpları tanımakta zorluk çeker.
Küçük nesne algılama için uygun veri kümeleri genellikle yüksek çözünürlüklü görüntüler, sık görülen küçük hedefler ve tutarlı görsel koşullar içerir. COCO gibi genel veri kümeleri yararlı başlangıç noktaları olsa da, genellikle belirli gerçek dünya kullanım durumlarının ölçeği, yoğunluğu veya bağlamıyla eşleşmez. Bu gibi durumlarda, model performansını iyileştirmek için alana özgü eğitim verilerinin toplanması gerekir.
Anotasyon kalitesi de kritik bir rol oynar. Anotasyonlar, modelin tahmin etmeyi öğrendiği doğru nesne etiketlerini ve sınırlayıcı kutu konumlarını belirleyerek temel gerçeği oluşturur.
Küçük nesneler için sınırlayıcı kutular dikkatli ve tutarlı bir şekilde çizilmelidir. Kutuların yerleştirilmesindeki en ufak farklılıklar bile yerelleştirme doğruluğunu önemli ölçüde etkileyebilir, çünkü küçük nesneler piksel düzeyindeki kaymalara karşı oldukça hassastır.
Yetersiz veya tutarsız açıklamalar mAP önemli ölçüde azaltabilir. Nesneler yanlış etiketlenirse, model yanlış kalıpları öğrenir ve bu da yanlış pozitif sonuçları artırabilir.
Nesneler görüntüde görünse de gerçekte mevcut değilse, doğru algılamalar değerlendirme sırasında yanlış pozitif olarak sayılabilir. Her iki durum da genel performansı düşürür.
İlginç bir şekilde, son araştırmalar, küçük nesneler için ortalama hassasiyetin standart karşılaştırmalarda genellikle %20 ile %40 arasında kaldığını ve bunun daha büyük nesnelere kıyasla önemli ölçüde daha düşük olduğunu göstermektedir. Bu fark, genel algılama doğruluğunda veri kümesi tasarımı ve açıklama tutarlılığının önemini vurgulamaktadır.
Veri setinin kalitesi ve açıklama tutarlılığının önemini daha iyi anladıktan sonra, nesne algılama modelinin mevcut verilerden nasıl daha etkili bir şekilde öğrenebileceğini inceleyelim. Ek görüntüleri toplamak zor veya pahalı olsa bile, mevcut verileri daha iyi kullanarak performansı artırmanın yolları vardır.
En pratik yaklaşımlardan biri veri artırmadır. Küçük nesnelerin algılanmasında özellikle önemli bir role sahiptir, çünkü küçük nesneler modelin öğrenmesi için daha az görsel ipucu sağlar. Eğitim sırasında kontrollü varyasyonlar ekleyerek, artırma yeni veri toplama gerektirmeden modelin daha iyi genelleme yapmasına yardımcı olur.
Etkili veri artırma, küçük nesnelerin net bir şekilde görünür kalmasına odaklanır. Kontrollü yeniden boyutlandırma, hafif kırpma ve görüntü döşeme gibi teknikler, küçük nesnelerin şeklini ve görünümünü korurken daha fazla öne çıkmasını sağlayabilir. Amaç, modelin küçük nesneleri gerçek durumlarda nasıl göründüklerini değiştirmeden, daha sık ve biraz farklı koşullar altında görmesine yardımcı olmaktır.
Ancak, büyütme işlemi dikkatli bir şekilde uygulanmalıdır. Bazı dönüşümler, küçük nesnelerin görünürlüğünü azaltabilir veya gerçek verilerde meydana gelmesi olası olmayan şekillerde görünümlerini değiştirebilir. Bu durumda, model nesnelerin sınırlarını doğru bir şekilde öğrenmekte zorlanabilir.
Giderek daha popüler hale gelen bir başka ilginç veri artırma türü, sentetik eğitim verileri oluşturmak için üretken yapay zeka kullanımıdır. Artık ekipler, manuel olarak toplanan ve etiketlenen görüntülere güvenmek yerine, belirli ortamları, nesne boyutlarını, aydınlatma koşullarını ve arka plan varyasyonlarını simüle eden gerçekçi sahneler oluşturabilirler.

Bu yaklaşım, gerçek dünyadaki örneklerin tutarlı bir şekilde yakalanmasının zor olabileceği küçük nesne algılama için özellikle yararlıdır. Ölçek, yoğunluk ve yerleştirme gibi sentetik görüntülerde küçük nesnelerin nasıl görüneceğini kontrol ederek, modelleri daha geniş bir eğitim senaryosu yelpazesine maruz bırakmak mümkündür.
Gerçek verilerle dikkatli bir şekilde birleştirildiğinde, sentetik artırma modelin sağlamlığını artırabilir, veri toplama maliyetlerini azaltabilir ve daha hedefli performans iyileştirmelerini destekleyebilir.
Veri setinin kalitesi ve açıklama tutarlılığının yanı sıra, model eğitimi seçimleri de küçük nesne algılama performansını büyük ölçüde etkiler.
İşte dikkate alınması gereken bazı temel eğitim stratejileri:
Küçük nesne görevleri için genel nesne algılama modelini kullanabilirsiniz, ancak küçük nesne algılamayı iyileştirmek için özel olarak tasarlanmış model mimarileri de mevcuttur. Örneğin, Ultralytics YOLOv8 modelinin ince uzamsal ayrıntıları korumak için optimize edilmiş P2 model varyantları bulunmaktadır.
YOLOv8 , ağda ilerledikçe görüntüleri kademeli olarak küçülterek çoklu ölçeklerde YOLOv8 . Bu, modelin genel sahneyi anlamasına yardımcı olur, ancak aynı zamanda ince ayrıntıları da azaltır.
Bir nesne zaten çok küçükse, bu işlem sırasında önemli görsel bilgiler kaybolabilir. Ultralytics YOLOv8 in P2 varyantı, özellik piramidinde 2 adım kullanarak bu sorunuYOLOv8 .
Özellik piramidi, farklı boyutlardaki detect için görüntüyü birden fazla iç çözünürlükte analiz eden modelin bir parçasıdır. 2'lik bir adımla, görüntü bu aşamada daha kademeli olarak küçültülür ve böylece orijinal piksel düzeyindeki ayrıntıların daha fazlası korunabilir.
Daha fazla uzamsal ayrıntı korunduğu için, küçük nesneler ağ içinde daha görünür bir yapıya sahip olur. Bu, modelin yalnızca birkaç piksel kaplayan detect yerelleştirmesini ve detect kolaylaştırır, bu da küçük nesnelerin mAP iyileştirmeye yardımcı olabilir.
Ortalama hassasiyet, modelin genel performansını özetlerken, modelin farklı boyutlardaki nesneleri ne kadar iyi işlediğini her zaman göstermez. Küçük nesneler için performans, genellikle sınıflandırma yerine yerelleştirme doğruluğu tarafından sınırlandırılır, yani sınırlayıcı kutunun hafif kaymaları sonuçları önemli ölçüde etkileyebilir.
Diğer bir deyişle, model nesnenin sınıfını doğru bir şekilde tanımlayabilir, ancak tahmin edilen sınırlayıcı kutu hafifçe yanlış hizalanmışsa, algılama yine de yanlış kabul edilebilir. Küçük nesneler yalnızca az sayıda pikseli kapladığından, kutunun yerleştirilmesinde küçük bir kayma bile tahmin edilen kutu ile gerçek değer arasındaki örtüşmeyi önemli ölçüde azaltabilir. Sonuç olarak, nesne doğru bir şekilde tanımlanmış olsa bile değerlendirme puanları düşebilir.

Daha bilgilendirici bir yaklaşım, performansı nesne boyutuna göre değerlendirmektir. En yaygın olarak kullanılan karşılaştırma ölçütleri, küçük, orta ve büyük nesneler için ortalama hassasiyeti ayrı ayrı bildirir.
Bu boyuta özgü döküm, modelin hangi alanlarda iyi performans gösterdiğini ve hangi alanlarda zorlandığını daha net bir şekilde ortaya koymaktadır. Uygulamada, küçük nesne AP genellikle genel mAP gerisinde kalır ve toplu metriklerde açıkça görülmeyen yerelleştirme zorluklarını ortaya çıkarır.
Kontrollü test ortamlarından gerçek dünya uygulamalarına geçildiğinde model performansı genellikle değişir. Görüntü çözünürlüğü, işlem hızı ve mevcut donanım gibi faktörler, küçük nesnelerin algılanmasını doğrudan etkileyen ödünleşimlere yol açar.
Örneğin, giriş çözünürlüğünü artırmak küçük nesnelerin mAP iyileştirebilir mAP küçük hedefler daha fazla piksel kaplar ve daha fazla ayrıntı içerir. Ancak, daha yüksek çözünürlük aynı zamanda bellek kullanımını ve işlem süresini de artırır. Bu da çıkarımları yavaşlatabilir ve işletim maliyetlerini artırabilir.

Donanım seçimleri, bu ödünleşimleri yönetmede önemli bir rol oynar. Daha güçlü GPU'lar daha büyük modeller ve daha hızlı işleme imkanı sağlar, ancak dağıtım ortamları, özellikle uç cihazlar, genellikle sınırlı hesaplama ve bellek kaynaklarına sahiptir.
Gerçek zamanlı uygulamalar başka bir kısıtlama daha getirir: düşük gecikme süresini korumak için model boyutunun veya giriş çözünürlüğünün azaltılması gerekebilir ve bu da küçük nesnelerin geri çağrılmasını olumsuz etkileyebilir. Sonuç olarak, dağıtım kararları, algılama performansını donanım sınırlamaları, hız gereksinimleri ve genel maliyet ile dengelemek gerektirir.
Küçük nesnelerin algılanmasını iyileştirmek, özellikle gerçek dünya ortamlarında çalışırken pratik ve yapılandırılmış bir yaklaşım gerektirir. Aşağıda, akılda tutulması gereken ana adımların bir özeti yer almaktadır:
Küçük nesneler mAP iyileştirmek, rastgele ayarlamalar yerine yapılandırılmış, veriye dayalı bir yaklaşım gerektirir. Gerçek iyileştirmeler, iyi veriler, tutarlı açıklamalar, dikkatli eğitim ve doğru değerlendirme yöntemlerinin bir araya getirilmesiyle elde edilir. Gerçek dünya projelerinde, istikrarlı testler ve küçük, ölçülebilir değişiklikler, zaman içinde daha iyi ve daha güvenilir küçük nesne algılamasına yol açar.
Büyüyen topluluğumuza katılın ve uygulamalı AI kaynakları için GitHub depomuzu keşfedin. Bugün görsel AI ile geliştirme yapmak için lisans seçeneklerimizi inceleyin. Çözüm sayfalarımızı ziyaret ederek tarımda AI'nın çiftçiliği nasıl dönüştürdüğünü ve robotikte görsel AI'nın geleceği nasıl şekillendirdiğini öğrenin.