Sözlük

Doğruluk

Makine öğreniminde doğruluğun önemini, hesaplanmasını, dengesiz veri kümeleriyle ilgili sınırlamaları ve model performansını iyileştirmenin yollarını keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Doğruluk, Makine Öğrenimi (ML) modellerinin performansını değerlendirmek için kullanılan en temel ve sezgisel ölçütlerden biridir, özellikle Yapay Zeka (AI) ve Bilgisayarla Görme (CV) içindeki sınıflandırma görevlerinde. Toplam tahmin sayısı içinde YZ modeli tarafından yapılan doğru tahminlerin oranını temsil eder. Anlaşılması ve hesaplanması kolay olsa da, yalnızca doğruluğa güvenmek, özellikle belirli veri kümeleri veya belirli problem gereksinimleri ile uğraşırken bazen yanıltıcı olabilir.

Doğruluk Nasıl Hesaplanır?

Doğruluk, doğru tahminlerin sayısının (hem gerçek pozitifler hem de gerçek negatifler) yapılan toplam tahmin sayısına bölünmesiyle hesaplanır. Örneğin, bir model 100 görüntüden 90'ını doğru bir şekilde tanımlarsa, doğruluğu %90'dır. Bu basitlik, model performansını değerlendirmek için popüler bir başlangıç noktası olmasını sağlar.

Yapay Zeka ve Makine Öğrenimindeki Önemi

Doğruluk, bir modelin genel olarak ne sıklıkla doğru olduğuna dair basit bir ölçü sağlar. Model geliştirme ve model eğitiminin ilk aşamalarında genel bir performans hissi elde etmek için yaygın olarak kullanılır. Yüksek doğruluk genellikle birçok uygulama için birincil hedeftir ve modelin yeni, görülmemiş verilere iyi genelleme yaptığını gösterir. Aşağıdakiler gibi birçok son teknoloji model Ultralytics YOLONesne algılama için, hız gibi diğer faktörleri dengelerken yüksek doğruluk için çabalayın. YOLO11 ve YOLOv8 gibi genellikle doğruluk kıyaslamalarını vurgulayan karşılaştırmaları görebilirsiniz.

Doğruluk Sınırlamaları

Sezgiselliğine rağmen, doğruluğun önemli sınırlamaları vardır:

  • Dengesiz Veri Kümeleri: Doğruluk, bir sınıfın diğerlerinden önemli ölçüde fazla olduğu dengesiz verilerle uğraşırken zayıf bir performans göstergesi olabilir. Örneğin, nadir görülen bir hastalığın tespitinde (örneğin, %1 prevalans), her zaman "hastalık yok" tahmininde bulunan bir model %99 doğruluğa ulaşır, ancak gerçek vakaları tespit edemez ve işe yaramaz hale gelir. Bu durum, potansiyel veri seti yanlılığını dikkate almanın önemini vurgulamaktadır.
  • Hata Türlerini Görmezden Gelme: Doğruluk tüm hataları eşit olarak ele alır. Ancak, birçok gerçek dünya senaryosunda, farklı hataların maliyeti değişir. Örneğin, kötü huylu bir tümörü iyi huylu olarak yanlış sınıflandırmak (yanlış negatif), iyi huylu bir tümörü kötü huylu olarak sınıflandırmaktan (yanlış pozitif) genellikle çok daha kritiktir.
  • Doğruluk Paradoksu: Bazı durumlarda, standart tanıma göre daha az doğru olan bir model aslında pratikte daha faydalı olabilir. Bu durum Doğruluk Paradoksu olarak bilinir.

Doğruluğu Diğer Ölçütlerden Ayırt Etme

Doğruluğun sınırlamaları nedeniyle, özellikle dengesiz verilerde veya değişen hata maliyetlerinde, diğer ölçütler genellikle tercih edilir veya onunla birlikte kullanılır:

  • Hassasiyet: Gerçekten doğru olan pozitif tanımlamaların oranını ölçer. Yanlış pozitiflerin maliyeti yüksek olduğunda yüksek hassasiyet çok önemlidir (örneğin, önemli e-postaları spam olarak işaretleyen spam filtreleri).
  • Geri Çağırma (Hassasiyet): Doğru tespit edilen gerçek pozitiflerin oranını ölçer. Yanlış negatiflerin maliyeti yüksek olduğunda (örneğin, bir tanının atlanması) yüksek geri çağırma hayati önem taşır.
  • F1-Skor: Hassasiyet ve Geri Çağırma'nın harmonik ortalaması, ikisi arasında bir denge sağlar. Hem yanlış pozitifler hem de yanlış negatifler önemli olduğunda kullanışlıdır.
  • Ortalama Ortalama Hassasiyet (mAP): Nesne algılamada farklı geri çağırma seviyelerinde hem sınıflandırma doğruluğunu hem de yerelleştirme doğruluğunu (IoU) dikkate alan ortak bir metrik.
  • Karışıklık Matrisi: Bir sınıflandırma algoritmasının performansını görselleştiren, doğru pozitifleri, doğru negatifleri, yanlış pozitifleri ve yanlış negatifleri gösteren, hassasiyet, geri çağırma ve doğruluğun hesaplanmasına yardımcı olan bir tablo.
  • ROC Eğrileri ve AUC: Bunlar, çeşitli eşik ayarlarında gerçek pozitif oranı (Hatırlama) ile yanlış pozitif oranı arasındaki değiş tokuşu görselleştirir.

Bu farklı YOLO performans ölçütlerinin anlaşılması, özel ihtiyaçlara göre uyarlanmış model performansının daha incelikli bir şekilde değerlendirilmesine olanak tanır.

Gerçek Dünya Yapay Zeka/ML Uygulamaları

  1. Tıbbi Görüntü Analizi: YOLO11 kullanarak tümör tespiti gibi görevlerde, genel doğruluk dikkate alınırken, gerçek tümörleri (yanlış negatifler) kaçırma riskini en aza indirmek için Geri Çağırma (duyarlılık) gibi ölçütlere genellikle öncelik verilir. Sağlık Hizmetlerinde Yapay Z eka çözümleri bu ölçütleri dikkatlice dengelemelidir.
  2. Otonom Araçlar: Otomotiv çözümlerinde yapay zeka için, nesne algılama modellerinin yayaları, araçları ve engelleri tanımlamada yüksek doğruluğa ihtiyacı vardır. Ancak, sadece genel doğruluğu ölçmek yeterli değildir; mAP gibi metrikler, güvenlik için hem doğru sınıflandırmayı hem de hassas lokalizasyonu(sınırlayıcı kutu tahmini) sağlamak için kritik öneme sahiptir.

Model Doğruluğunun İyileştirilmesi

Çeşitli teknikler model doğruluğunu artırmaya yardımcı olabilir, ancak genellikle diğer ölçütlerle veya hesaplama maliyetiyle değiş tokuş içerir:

Model Eğitim İpuçları gibi danışmanlık kaynakları pratik rehberlik sağlayabilir. Ultralytics HUB gibi platformlar, kullanıcıların modelleri eğitmesine ve genellikle TensorBoard gibi araçlar kullanılarak görselleştirilen diğer önemli ölçümlerin yanı sıra doğruluğu kolayca izlemesine olanak tanır. Alandaki ilerlemeyi takip etmek için Stanford AI Index Report gibi kaynaklara bakılabilir veya Papers With Code'daki veri kümelerine göz atılabilir. Gibi çerçeveler PyTorch ( resmi siteye bakınız) ve TensorFlow (bkz. resmi site) bu modelleri oluşturmak ve eğitmek için yaygın olarak kullanılmaktadır.

Sonuç olarak, doğruluk YZ model performansını değerlendirmek için değerli ve sezgisel bir ölçüt olsa da, nadiren tek başına kullanılmalıdır. Makine öğrenimi görevinin belirli hedeflerini ve verilerin doğasını, özellikle de potansiyel dengesizlikleri veya değişen hata maliyetlerini göz önünde bulundurmak, hassasiyet, geri çağırma, F1 puanı veya mAP gibi en uygun değerlendirme metriklerini seçmek için çok önemlidir. Açıklanabilir Yapay Zeka (XAI) tekniklerinden yararlanmak, tek metrik değerlerinin ötesinde daha derin içgörüler de sağlayabilir.

Tümünü okuyun