Nesne Algılamada Ortalama Ortalama Hassasiyeti (mAP) anlayın. Anlamını, hesaplanmasını ve mAP'nin model performansını değerlendirmek için neden önemli olduğunu öğrenin.

Nesne Algılamada Ortalama Ortalama Hassasiyeti (mAP) anlayın. Anlamını, hesaplanmasını ve mAP'nin model performansını değerlendirmek için neden önemli olduğunu öğrenin.
Yapay zekanın benimsenmesi hızla artıyor ve yapay zeka, sürücüsüz otomobillerden raftaki ürünleri tanımlayabilen perakende sistemlerine kadar çeşitli yeniliklere entegre ediliyor. Bu teknolojiler, makinelerin görsel verileri analiz etmesini sağlayan bir yapay zeka (AI) dalı olan bilgisayarla görmeye dayanıyor.
Bilgisayarla görme sistemlerinin ve algoritmalarının doğruluğunu ölçmek için kullanılan önemli bir değerlendirme ölçütü ortalama ortalama hassasiyettir (mAP). mAP metriği, bir Görme Yapay Zeka modelinin tahmininin gerçek dünya sonuçlarıyla ne kadar yakından eşleştiğini gösterir.
Yaygın bir bilgisayarla görme görevi, bir modelin bir görüntüdeki birden fazla nesneyi tanımladığı ve etraflarına sınırlayıcı kutular çizdiği nesne algılamadır. mAP, nesne algılama modellerinin performansını değerlendirmek için kullanılan standart bir metriktir ve Ultralytics YOLO11 gibi derin öğrenme modellerini karşılaştırmak için yaygın olarak kullanılmaktadır.
Bu makalede, ortalama hassasiyetin nasıl hesaplandığını ve nesne algılama modellerini eğiten veya değerlendiren herkes için neden önemli olduğunu göreceğiz. Hadi başlayalım!
Ortalama ortalama hassasiyet, bir görüntüdeki farklı nesneleri tespit etmek ve tanımlamak gibi görsel bilgi erişimiyle ilgili görevler söz konusu olduğunda bir derin öğrenme modelinin ne kadar doğru olduğunu gösteren bir puandır. Örneğin, bir köpek, bir kedi ve bir araba içeren bir fotoğrafı analiz eden bir nesne alg ılama modeli düşünün. Güvenilir bir model, her bir nesneyi tanıyarak ve etrafına sınırlayıcı kutular ve etiketler çizerek, nerede olduğunu ve ne olduğunu vurgulayarak nesne algılama işlemini gerçekleştirebilir.
mAP, modelin bu görevi birçok görüntüde ve farklı nesne türlerinde ne kadar iyi gerçekleştirdiğini gösterir. Modelin her bir nesneyi ve görüntü içindeki konumunu doğru bir şekilde tanımlayıp tanımlamadığını kontrol eder. Skor 0 ile 1 arasında değişir; burada bir, modelin her şeyi mükemmel bir şekilde bulduğu ve sıfır ise hiçbir nesneyi tespit edemediği anlamına gelir.
Makine öğreniminde ortalama ortalama hassasiyetin arkasındaki kavramları keşfetmeden önce, iki temel terimi daha iyi anlayalım: temel gerçek ve tahminler.
Temel gerçek, nesnelerin ve görüntüdeki konumlarının açıklama olarak bilinen bir süreçle insanlar tarafından dikkatlice etiketlendiği doğru referans verilerini ifade eder. Bu arada tahminler, YZ modellerinin bir görüntüyü analiz ettikten sonra verdiği sonuçlardır. YZ modelinin tahminlerini temel gerçekle karşılaştırarak, modelin doğru sonuçları elde etmeye ne kadar yaklaştığını ölçebiliriz.
Karışıklık matrisi genellikle bir nesne algılama modelinin ne kadar hassas olduğunu anlamak için kullanılır. Modelin tahminlerinin gerçek doğru cevaplarla (zemin gerçeği) nasıl eşleştiğini gösteren bir tablodur. Bu tablodan dört temel bileşenin veya sonucun bir dökümünü elde edebiliriz: doğru pozitifler, yanlış pozitifler, yanlış negatifler ve doğru negatifler.
İşte bu bileşenler karışıklık matrisinde neyi temsil etmektedir:
Gerçek negatifler nesne tespitinde yaygın olarak kullanılmaz, çünkü genellikle bir görüntüdeki birçok boş bölgeyi görmezden geliriz. Ancak, modelin görüntüye bir etiket atadığı görüntü sınıflandırma gibi diğer bilgisayarla görme görevlerinde çok önemlidir. Örneğin, görev bir görüntünün kedi içerip içermediğini tespit etmekse ve model, görüntüde kedi olmadığında "kedi yok" ifadesini doğru bir şekilde tanımlarsa, bu gerçek bir negatiftir.
Nesne algılama modellerinin değerlendirilmesinde bir diğer önemli ölçüt de Birlik Üzerinden Kesişimdir (IoU). Bu tür Vision AI modelleri için, bir görüntüde bir nesnenin varlığını tespit etmek yeterli değildir; aynı zamanda sınırlayıcı kutular çizmek için nesnenin görüntüde nerede olduğunu da bulması gerekir.
IoU metriği, modelin öngördüğü kutunun gerçek, doğru kutuyla (zemin gerçeği) ne kadar yakından eşleştiğini ölçer. Skor 0 ile 1 arasındadır; burada 1 mükemmel eşleşme, 0 ise hiç örtüşme olmadığı anlamına gelir.
Örneğin, daha yüksek bir IoU (0,80 veya 0,85 gibi), tahmin edilen kutunun yer-gerçek kutusuyla yakın bir eşleşme olduğu anlamına gelir ve doğru konumlandırmayı gösterir. Daha düşük bir IoU (0,30 veya 0,25 gibi) modelin nesnenin yerini doğru bir şekilde tespit edemediği anlamına gelir.
Bir tespitin başarılı olup olmadığını belirlemek için farklı eşikler kullanırız. Yaygın bir IoU eşiği 0,5'tir, yani tahmin edilen bir kutunun gerçek bir pozitif olarak sayılması için zemin-gerçek kutusuyla en az %50 örtüşmesi gerekir. Bu eşiğin altındaki herhangi bir örtüşme yanlış pozitif olarak kabul edilir.
Şimdiye kadar, nesne algılama modellerinin performansını anlamak için bazı temel değerlendirme metriklerini inceledik. Buna dayanarak, en önemli metriklerden ikisi kesinlik ve geri çağırmadır. Bunlar bize modelin tespitlerinin ne kadar doğru olduğuna dair net bir resim verir. Şimdi bunların ne olduğuna bir göz atalım.
Kesinlik değerleri bize modelin tahminlerinin kaç tanesinin gerçekten doğru olduğunu söyler. Şu soruya cevap verir: Modelin tespit ettiğini iddia ettiği tüm nesnelerden kaç tanesi gerçekten oradaydı?
Öte yandan hatırlama değerleri, modelin görüntüde bulunan tüm gerçek nesneleri ne kadar iyi bulduğunu ölçer. Şu soruya cevap verir: Mevcut tüm gerçek nesnelerden kaç tanesini model doğru tespit etti?
Kesinlik ve geri çağırma birlikte bize bir modelin ne kadar iyi performans gösterdiğine dair daha net bir resim verir. Örneğin, bir model bir görüntüdeki 10 arabayı tahmin ederse ve bunlardan 9'u gerçekten arabaysa, %90'lık bir kesinliğe (olumlu bir tahmin) sahiptir.
Bu iki değerlendirme ölçütü genellikle bir ödünleşim içerir: bir model yalnızca tamamen emin olduğu tahminlerde bulunarak yüksek bir hassasiyet değerine ulaşabilir, ancak bu birçok nesneyi kaçırmasına neden olabilir, bu da geri çağırma seviyesini düşürür. Bu arada, bir sınırlayıcı kutuyu neredeyse her yerde tahmin ederek çok yüksek geri çağırma değerine de ulaşabilir, ancak bu hassasiyeti azaltacaktır.
Hassasiyet ve geri çağırma, bir modelin bireysel tahminlerde nasıl performans gösterdiğini anlamamıza yardımcı olurken, Ortalama hassasiyet (AP) daha geniş bir görünüm sağlayabilir. Daha fazla nesneyi tespit etmeye çalıştıkça modelin hassasiyetinin nasıl değiştiğini gösterir ve performansını tek bir sayı olarak özetler.
Ortalama hassasiyet puanını hesaplamak için, öncelikle her nesne türü için hassasiyet-hatırlama eğrisi (veya PR eğrisi) adı verilen birleşik grafik benzeri bir metrik oluşturabiliriz. Bu eğri, model daha fazla tahmin yaptıkça ne olduğunu gösterir.
Modelin yalnızca en kolay veya en belirgin nesneleri tespit ederek başladığı bir senaryo düşünün. Bu aşamada, tahminlerin çoğu doğru olduğu için hassasiyet yüksektir, ancak birçok nesne hala gözden kaçtığı için geri çağırma düşüktür. Model daha zor veya daha nadir olanlar da dahil olmak üzere daha fazla nesne tespit etmeye çalıştıkça, genellikle daha fazla hata ortaya çıkar. Bu da geri çağırma artarken hassasiyetin düşmesine neden olur.
Ortalama hassasiyet, eğrinin altındaki alandır (PR eğrisinin AUC'si). Daha büyük bir alan, modelin daha fazla nesne tespit etse bile tahminlerini doğru tutmada daha iyi olduğu anlamına gelir. AP her sınıf etiketi için ayrı ayrı hesaplanır.
Örneğin, arabaları, bisikletleri ve yayaları tespit edebilen bir modelde, AP değerlerini bu üç kategorinin her biri için ayrı ayrı hesaplayabiliriz. Bu, modelin hangi nesneleri tespit etmede iyi olduğunu ve nerede hala iyileştirmeye ihtiyaç duyabileceğini görmemize yardımcı olur.
Her nesne sınıfı için ortalama hassasiyeti hesapladıktan sonra, modelin tüm sınıflardaki genel performansını yansıtan tek bir puana ihtiyacımız vardır. Bu, ortalama ortalama hassasiyet formülü kullanılarak elde edilebilir. Her kategori için AP puanlarının ortalamasını alır.
Örneğin, YOLO11 gibi bir bilgisayarla görme modelinin otomobiller için 0,827, motosikletler için 0,679, kamyonlar için 0,355, otobüsler için 0,863 ve bisikletler için 0,982 AP elde ettiğini varsayalım. mAP formülünü kullanarak bu sayıları toplayabilir ve aşağıdaki gibi toplam sınıf sayısına bölebiliriz:
mAP = (0,827 + 0,679 + 0,355 + 0,863 + 0,982) ÷ 5 = 0,7432 ≈ 0,743
0,743'lük mAP puanı, modelin tüm nesne sınıflarında ne kadar iyi performans gösterdiğini değerlendirmek için basit bir çözüm sağlar. 1'e yakın bir değer, modelin çoğu kategori için doğru olduğu anlamına gelirken, daha düşük bir değer bazılarında zorlandığını gösterir.
Artık AP ve mAP'nin nasıl hesaplandığını ve bileşenlerinin neler olduğunu daha iyi anladığımıza göre, bilgisayarla görmedeki önemlerine genel bir bakış:
Daha sonra, mAP gibi temel metriklerin gerçek dünya bilgisayarla görme kullanım durumları oluştururken nasıl yardımcı olabileceğini inceleyelim.
Sürücüsüz otomobiller söz konusu olduğunda, yayaları, yol işaretlerini, bisikletlileri ve şerit işaretlerini tanımlamak için nesne algılama çok önemlidir. Örneğin, bir çocuk aniden karşıdan karşıya koşarsa, aracın nesneyi (çocuğu) algılamak, nerede olduğunu bulmak, hareketini izlemek ve gerekli eylemi gerçekleştirmek (frene basmak) için saniyeleri vardır.
YOLO11 gibi modeller, bu tür yüksek riskli senaryolarda gerçek zamanlı nesne tespiti için tasarlanmıştır. Bu durumlarda, mAP kritik bir güvenlik ölçütü haline gelir.
Yüksek bir mAP puanı, sistemin çocuğu hızlı bir şekilde algılamasını, tam olarak konumlandırmasını ve minimum gecikmeyle frenlemeyi tetiklemesini sağlar. Düşük bir mAP, çocuğun başka bir küçük nesneyle karıştırılması gibi gözden kaçan tespitler veya tehlikeli yanlış sınıflandırmalar anlamına gelebilir.
Benzer şekilde, perakende sektöründe nesne algılama modelleri stok izleme ve ödeme süreçleri gibi görevleri otomatikleştirmek için kullanılabilir. Bir müşteri self-checkout sırasında bir ürünü taradığında, algılamadaki bir hata hayal kırıklığına neden olabilir.
Yüksek bir mAP puanı, modelin benzer ürünler arasında doğru bir ayrım yapmasını ve ürünler sıkıca paketlendiğinde bile hassas sınırlama kutuları çizmesini sağlar. Düşük bir mAP puanı karışıklıklara yol açabilir. Örneğin, model bir portakal suyu şişesini görsel olarak benzer bir elma suyu şişesiyle karıştırırsa, bu durum yanlış faturalandırmaya ve hatalı envanter raporlarına neden olabilir.
YOLO11 gibi modellerle entegre perakende sistemleri ürünleri gerçek zamanlı olarak algılayabilir, envanterle karşılaştırabilir ve arka uç sistemlerini anında güncelleyebilir. Hızlı tempolu perakende ortamlarında mAP, operasyonların doğru ve güvenilir olmasında çok önemli bir rol oynar.
Sağlık hizmetlerinde teşhis doğruluğunu artırmak, tıbbi görüntülemede hassas tespitle başlar. YOLO11 gibi modeller radyologların bu tıbbi taramalardan tümörleri, kırıkları veya diğer anomalileri tespit etmesine yardımcı olabilir. Burada, ortalama ortalama hassasiyet, bir modelin klinik güvenilirliğini değerlendirmek için önemli bir ölçüttür.
Yüksek bir mAP, modelin hem yüksek geri çağırma (en gerçek sorunları belirleme) hem de yüksek hassasiyet (yanlış alarmlardan kaçınma) elde ettiğini gösterir ki bu klinik karar verme sürecinde çok önemlidir. Ayrıca, sağlık hizmetlerinde IoU eşiği, son derece doğru tespit sağlamak için genellikle çok yüksek (0,85 veya 0,90) olarak ayarlanır.
Ancak, düşük bir mAP skoru endişelere yol açabilir. Diyelim ki bir model bir tümörü gözden kaçırdı; bu durum teşhisi geciktirebilir veya yanlış tedaviye yol açabilir.
Nesne algılama modellerini değerlendirmek için ortalama ortalama hassasiyet kullanmanın temel avantajları şunlardır:
mAP metriğini kullanmanın çeşitli faydaları olsa da, dikkate alınması gereken bazı sınırlamalar vardır. İşte dikkate alınması gereken birkaç faktör:
Ortalama ortalama hassasiyetin sadece teknik bir puan olmadığını, aynı zamanda bir modelin potansiyel gerçek dünya performansının bir yansıması olduğunu gördük. İster otonom bir araç sisteminde isterse bir perakende kasasında olsun, yüksek bir mAP puanı, bir modelin performansının ve uygulamaya hazırlığının güvenilir bir göstergesi olarak hizmet eder.
mAP önemli ve etkili bir metrik olmakla birlikte, çok yönlü bir değerlendirme stratejisinin parçası olarak görülmelidir. Sağlık hizmetleri ve otonom sürüş gibi kritik uygulamalar için yalnızca mAP'ye güvenmek yeterli değildir.
Çıkarım hızı (modelin tahminleri ne kadar hızlı yaptığı), model boyutu (uç cihazlarda dağıtımı etkileme) ve nitel hata analizi (modelin yaptığı hata türlerini anlama) gibi ek faktörler de sistemin güvenli, verimli ve amacına gerçekten uygun olmasını sağlamak için dikkate alınmalıdır.
Bilgisayarla görme hakkında daha fazla bilgi edinmek için büyüyen topluluğumuza ve GitHub depomuza katılın. Tarımda yapay görme ve lojistikte yapay zeka uygulamaları hakkında bilgi edinmek için çözüm sayfalarımızı keşfedin. Kendi bilgisayarla görme modelinizi bugün kullanmaya başlamak için lisanslama seçeneklerimize göz atın!