Sözlük

Doğruluk

Makine öğreniminde doğruluğun önemini, hesaplanmasını, dengesiz veri kümeleriyle ilgili sınırlamaları ve model performansını iyileştirmenin yollarını keşfedin.

Doğruluk, makine öğreniminde (ML) en temel ve sezgisel değerlendirme ölçütlerinden biridir. Yapılan tüm tahminler içinde bir model tarafından yapılan doğru tahminlerin oranını ölçer. Basitliği nedeniyle, doğruluk genellikle geliştiricilerin özellikle sınıflandırma görevlerinde bir yapay zeka modelinin performansı hakkında genel bir fikir edinmek için baktıkları ilk metriktir. Daha incelikli değerlendirmelere geçmeden önce hızlı bir sağlık kontrolü işlevi görür.

Gerçek Dünya Uygulamaları

Doğruluk, sınıflandırmanın kritik olduğu birçok alanda önemli bir performans göstergesidir. İşte iki örnek:

  • Tıbbi Teşhis: Yapay zeka destekli sağlık hizmetlerinde, tıbbi görüntü analizi için tasarlanmış bir model, röntgen görüntülerini pnömoni belirtileri gösterip göstermediğine göre sınıflandırmak üzere eğitilebilir. Yüksek doğruluk, modelin vakaların yüksek bir yüzdesinde hastalığın varlığını veya yokluğunu doğru bir şekilde tanımladığı ve radyologlara güvenilir destek sağladığı anlamına gelir.
  • Üretim Kalite Kontrolü: Akıllı üretimde, bir konveyör bant üzerindeki ürünleri incelemek için bir bilgisayar görüş sistemi kullanılabilir. Model, her bir ürünü "kusurlu" veya "kusurlu olmayan" olarak sınıflandırır. Yüksek doğruluk, hatalı ürünlerin kaldırılmak üzere doğru şekilde tanımlanmasını sağlarken, iyi ürünlerin yanlış işaretlenmesini en aza indirerek üretim verimliliğini ve kalitesini doğrudan etkiler.

Doğruluk Sınırlamaları

Kullanışlı olmasına rağmen doğruluk, özellikle dengesiz veri kümeleriyle uğraşırken oldukça yanıltıcı olabilir. Dengesiz bir veri kümesi, farklı sınıflardaki örneklerin sayısının önemli ölçüde değiştiği bir veri kümesidir. Örneğin, dolandırıcılık tespitinde, meşru işlemlerin sayısı sahte işlemlerden çok daha fazladır. Her zaman "hileli değil" tahmininde bulunan bir model %99'un üzerinde doğruluk oranına ulaşabilir ancak amaçlanan hedef için tamamen yararsız olacaktır. Bunun nedeni, nadir ancak kritik vakaları tanımlayamamasıdır. Bu senaryo, yüksek bir doğruluk puanının bir modelin etkinliği hakkında yanlış bir fikir verdiği doğruluk paradoksunu vurgular.

Diğer Metriklere Karşı Doğruluk

Bir modelin performansının tam bir resmini elde etmek için, doğruluğun yanı sıra diğer ölçütleri de dikkate almak çok önemlidir.

  • Hassasiyet: Gerçekten doğru olan pozitif tahminlerin oranını ölçer. "Pozitif sınıf için yaptığım tüm tahminlerden kaç tanesi doğruydu?" sorusuna cevap verir. Yanlış pozitifin maliyeti yüksek olduğunda yüksek hassasiyet hayati önem taşır.
  • Geri Çağırma: Hassasiyet olarak da bilinen bu metrik, doğru tespit edilen gerçek pozitiflerin oranını ölçer. "Tüm gerçek pozitif vakalar arasında modelim kaç tanesini buldu?" sorusuna yanıt verir. Tıbbi taramada olduğu gibi yanlış negatifin maliyeti yüksek olduğunda yüksek geri çağırma kritik önem taşır.
  • F1-Skor: Bu, hassasiyet ve geri çağırmanın harmonik ortalamasıdır ve her ikisini de dengeleyen tek bir puan sağlar. Hem yanlış pozitiflerin hem de yanlış negatiflerin önemli olduğu dengesiz veri kümelerindeki modelleri değerlendirmek için özellikle kullanışlıdır.
  • Karışıklık Matrisi: Doğru pozitiflerin, doğru negatiflerin, yanlış pozitiflerin ve yanlış negatiflerin sayılarını göstererek bir sınıflandırma modelinin performansını görselleştiren bir tablo. Doğruluk, kesinlik ve geri çağırmayı hesaplamak için gereken verileri sağlar.
  • Ortalama Ortalama Hassasiyet (mAP): Nesne algılama gibi daha karmaşık görevler için mAP standart metriktir. Yalnızca sınıflandırmanın doğruluğunu değil, aynı zamanda farklı güven düzeylerinde tahmin edilen sınırlayıcı kutuların yerelleştirme doğruluğunu da değerlendirir. Daha derin bir anlayış için çeşitli model karşılaştırmalarını keşfedebilirsiniz.

Model Doğruluğunun Artırılması

Çeşitli teknikler model doğruluğunu artırmaya yardımcı olabilir, ancak genellikle diğer ölçütlerle veya hesaplama maliyetiyle değiş tokuş içerir:

Model Eğitim İpuçları gibi danışmanlık kaynakları pratik rehberlik sağlayabilir. Ultralytics HUB gibi platformlar, kullanıcıların modelleri eğitmesine ve genellikle TensorBoard gibi araçlar kullanılarak görselleştirilen diğer önemli ölçümlerin yanı sıra doğruluğu kolayca izlemesine olanak tanır. Alandaki ilerlemeyi takip etmek, Stanford AI Index Report gibi kaynaklar aracılığıyla veya Papers With Code'daki veri kümelerine göz atarak yapılabilir. PyTorch ve TensorFlow gibi çerçeveler bu modelleri oluşturmak ve eğitmek için yaygın olarak kullanılmaktadır.

Sonuç olarak, doğruluk YZ model performansını değerlendirmek için değerli ve sezgisel bir ölçüt olsa da, nadiren tek başına kullanılmalıdır. Makine öğrenimi görevinin belirli hedeflerini ve verilerin doğasını, özellikle de potansiyel dengesizlikleri veya değişen hata maliyetlerini göz önünde bulundurmak, en uygun değerlendirme metriklerini seçmek için çok önemlidir. Açıklanabilir Yapay Zeka (XAI) tekniklerinden yararlanmak, tek bir metrik değerinin ötesinde daha derin içgörüler de sağlayabilir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı