YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

Doğruluk (Accuracy)

Makine öğreniminde doğruluğun önemini, hesaplanmasını, dengesiz veri kümeleriyle ilgili sınırlamalarını ve model performansını iyileştirme yollarını keşfedin.

Doğruluk, makine öğrenimindeki (ML) en temel ve sezgisel değerlendirme metriklerinden biridir. Bir modelin yaptığı tüm tahminler arasında doğru tahminlerin oranını ölçer. Basitliği nedeniyle doğruluk, geliştiricilerin bir yapay zeka modelinin performansına dair genel bir fikir edinmek için baktıkları ilk metriktir, özellikle sınıflandırma görevlerinde. Daha ayrıntılı değerlendirmelere geçmeden önce hızlı bir sağlık kontrolü görevi görür.

Gerçek Dünya Uygulamaları

Doğruluk, sınıflandırmanın kritik olduğu birçok alanda temel bir performans göstergesidir. İşte iki örnek:

  • Tıbbi Teşhis: Yapay zeka destekli sağlık hizmetlerinde, tıbbi görüntü analizi için tasarlanmış bir model, X-ışını görüntülerini zatürre belirtileri gösteriyor veya göstermiyor olarak sınıflandırmak için eğitilebilir. Yüksek doğruluk, modelin vakaların yüksek bir yüzdesinde hastalığın varlığını veya yokluğunu doğru bir şekilde tanımladığı ve radyologlara güvenilir destek sağladığı anlamına gelir.
  • Üretim Kalite Kontrolü: Akıllı üretimde, bir bilgisayarlı görü sistemi, bir taşıma bandındaki ürünleri incelemek için kullanılabilir. Model, her öğeyi "kusurlu" veya "kusursuz" olarak sınıflandırır. Yüksek doğruluk, hatalı ürünlerin kaldırılmak üzere doğru bir şekilde tanımlanmasını sağlarken, iyi ürünlerin yanlış işaretlenmesini en aza indirerek üretim verimliliğini ve kalitesini doğrudan etkiler.

Doğruluk Sınırlamaları

Kullanışlılığına rağmen, doğruluk özellikle dengesiz veri kümeleriyle uğraşırken oldukça yanıltıcı olabilir. Dengesiz bir veri kümesi, farklı sınıflardaki örnek sayısının önemli ölçüde değiştiği bir veri kümesidir. Örneğin, sahtekarlık tespitinde, meşru işlemler sahte olanlardan çok daha fazladır. Her zaman "sahte değil" tahmininde bulunan bir model %99'un üzerinde doğruluk elde edebilir, ancak amaçlanan amacı için tamamen işe yaramaz olur. Bunun nedeni, nadir fakat kritik vakaları belirleyememesidir. Bu senaryo, yüksek bir doğruluk puanının bir modelin etkinliği hakkında yanlış bir izlenim verdiği doğruluk paradoksunu vurgular.

Doğruluk ve Diğer Metrikler

Bir modelin performansının eksiksiz bir resmini elde etmek için, doğrulukla birlikte diğer metrikleri de dikkate almak çok önemlidir.

  • Hassasiyet (Precision): Gerçekte doğru olan pozitif tahminlerin oranını ölçer. Şu soruyu yanıtlar: "Pozitif sınıf için yaptığım tüm tahminlerden kaçı doğruydu?" Yanlış pozitifin maliyeti yüksek olduğunda yüksek hassasiyet hayati önem taşır.
  • Geri Çağırma (Recall): Duyarlılık olarak da bilinen bu metrik, doğru bir şekilde tanımlanan gerçek pozitiflerin oranını ölçer. Şu soruyu yanıtlar: "Tüm gerçek pozitif vakalardan modelim kaç tanesini buldu?" Tıbbi tarama gibi yanlış negatifin maliyeti yüksek olduğunda yüksek geri çağırma kritik öneme sahiptir.
  • F1-Skoru: Bu, kesinlik ve hatırlamanın harmonik ortalamasıdır ve her ikisini de dengeleyen tek bir skor sağlar. Hem yanlış pozitiflerin hem de yanlış negatiflerin önemli olduğu dengesiz veri kümelerinde modelleri değerlendirmek için özellikle kullanışlıdır.
  • Karışıklık Matrisi (Confusion Matrix): Doğru pozitifler, doğru negatifler, yanlış pozitifler ve yanlış negatiflerin sayılarını göstererek bir sınıflandırma modelinin performansını görselleştiren bir tablodur. Doğruluk, kesinlik ve geri çağırmayı hesaplamak için gereken verileri sağlar.
  • Ortalama Ortalama Kesinlik (Mean Average Precision - mAP): Nesne tespiti (object detection) gibi daha karmaşık görevler için mAP, standart metriktir. Yalnızca sınıflandırmanın doğruluğunu değil, aynı zamanda tahmin edilen sınırlayıcı kutuların (bounding boxes) farklı güven düzeylerindeki yerelleştirme doğruluğunu da değerlendirir. Daha derin bir anlayış için çeşitli model karşılaştırmalarını inceleyebilirsiniz.

Model Doğruluğunu İyileştirme

Model doğruluğunu artırmaya yardımcı olabilecek çeşitli teknikler vardır, ancak bunlar genellikle diğer metrikler veya hesaplama maliyeti ile ödünleşmeyi içerir:

Model Eğitimi İpuçları gibi kaynaklara danışmak pratik rehberlik sağlayabilir. Ultralytics HUB gibi platformlar, kullanıcıların modelleri eğitmesine ve diğer temel metriklerin yanı sıra doğruluğu da kolayca izlemesine olanak tanır; bu genellikle TensorBoard gibi araçlar kullanılarak görselleştirilir. Alandaki ilerlemeyi takip etmek, Stanford AI Index Report gibi kaynaklar aracılığıyla veya Papers With Code üzerindeki veri kümelerine göz atarak yapılabilir. PyTorch ve TensorFlow gibi çerçeveler, bu modelleri oluşturmak ve eğitmek için yaygın olarak kullanılır.

Sonuç olarak, doğruluk, AI model performansını değerlendirmek için değerli ve sezgisel bir ölçüt olsa da, nadiren tek başına kullanılmalıdır. ML görevinin özel hedeflerini ve verilerin doğasını, özellikle potansiyel dengesizlikleri veya değişen hata maliyetlerini dikkate almak, en uygun değerlendirme ölçütlerini seçmek için önemlidir. Açıklanabilir AI (XAI) tekniklerini kullanmak, tek metrik değerlerinin ötesinde daha derin içgörüler de sağlayabilir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı