Makine öğreniminde doğruluğun önemini, hesaplanmasını, dengesiz veri kümeleriyle ilgili sınırlamalarını ve model performansını iyileştirme yollarını keşfedin.
Doğruluk, bir sınıflandırma modelinin performansını değerlendirmek için en temel ölçütlerden biri olarak hizmet eder. Bu işlenen toplam tahmin sayısı içinde sistem tarafından yapılan doğru tahminlerin oranını temsil eder. Daha geniş bir çerçevede makine öğrenimi (ML), doğruluk genellikle geliştiricilerin bir modelin etkili bir şekilde öğrenip öğrenmediğini veya sadece tahmin edip etmediğini ölçmek için gözden geçirdiği ilk sayıdır. Sağlarken etkinliğin hızlı bir görüntüsü, sıklıkla diğer yöntemlerle birlikte kullanılır. sağlamak için değerlendirme ölçütleri Özellikle karmaşık veri kümelerindeki sınıflar arasında ayrım yaparken model davranışının kapsamlı bir şekilde anlaşılması.
Doğruluk hesaplaması basittir, bu da onu verilerden paydaşlara kadar çok çeşitli paydaşlar için oldukça erişilebilir hale getirir bilim insanlarından işletme yöneticilerine kadar. Matematiksel olarak doğru pozitiflerin ve doğru negatiflerin sayısı olarak tanımlanır toplam vaka sayısına bölünür. İçin denetimli öğrenme görevleri, bu metrik 'de sağlanan temel gerçekle algoritmanın ne sıklıkta uyum sağladığını gösterir. eğitim verileri. Ancak, yüksek doğruluk her zaman mükemmel bir model anlamına gelir; güvenilirliği büyük ölçüde altta yatan verilerin dağılımına bağlıdır.
Doğruluk, otomatik karar vermenin insan uzmanlara yardımcı olduğu çeşitli sektörlerde çok önemli bir rol oynamaktadır.
ile modeller geliştirirken ultralytics paketinin standart bir parçası olduğu için doğruluğu değerlendirmek
doğrulama iş akışı. Aşağıdaki örnekte bir doğrulama iş akışının nasıl yükleneceği gösterilmektedir
YOLO11 sınıflandırma modeli ve bunu doğrulamak için
doğruluk ölçümleri.
from ultralytics import YOLO
# Load a pretrained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")
# Validate the model on the MNIST160 dataset
# The function returns a metrics object containing top1 and top5 accuracy
metrics = model.val(data="mnist160")
# Display the Top-1 accuracy (percentage of times the top prediction was correct)
print(f"Top-1 Accuracy: {metrics.top1:.2f}")
Sezgisel olsa da, doğruluk bir ürünle uğraşırken yanıltıcı olabilir dengesiz veri kümesi. Bu olgu doğruluk paradoksu olarak bilinir. Örneğin, dolandırıcılık tespit senaryosunda, dolandırıcılık vakalarının yalnızca %1'i işlemlerin hileli olduğunu, her işlem için basitçe "meşru" tahmininde bulunan bir model %99 doğruluk. Ancak, birincil görevi olan sahtekarlığı tespit etme konusunda tamamen başarısız olacaktır. Bu gibi durumlarda, model azınlık sınıfı için yüksek doğruluk ancak sıfır tahmin gücü sergiler.
Bunu ele almak için uygulayıcılar şunları kullanır sınıfları dengelemek veya bakmak için veri artırımı yapılan hata türlerini inceleyen farklı metriklerde.
Model performansını tam olarak anlamak için doğruluk, ilgili terimlerden ayırt edilmelidir:
Doğruluğun artırılması, yinelemeli bir deneme sürecini içerir. Geliştiriciler genellikle öğrenmeyi ayarlamak için hiperparametre ayarı Optimum yakınsama için oranlar ve yığın boyutları. Ayrıca, aşağıdaki gibi gelişmiş mimarilerin kullanılması Transformers ya da en son Ultralytics YOLO önemli kazanımlar sağlayabilir. Son olarak, eğitim veri setinin temiz ve çeşitli olmasını sağlamak için aktif öğrenme modelin daha iyi genelleştirilmesine yardımcı olur görülmemiş gerçek dünya verilerine.
