AI'da doğruluğun temellerini keşfedin. Ultralytics kullanarak performansı değerlendirmeyi, doğruluk paradoksunu önlemeyi ve sonuçları ölçmeyi öğrenin.
Doğruluk, yapay zeka sistemlerinin değerlendirilmesinde temel bir ölçüt görevi görür ve bir modelin toplam tahmin sayısına göre yaptığı doğru tahminlerin yüzdesini ölçer. Makine öğrenimi ve özellikle denetimli öğrenme bağlamında, bu metrik, bir algoritmanın eğitim sürecinde sağlanan temel gerçeklerle ne kadar etkili bir şekilde uyum sağladığının üst düzey bir özetini sunar. Bu, "Model ne sıklıkla haklıdır?" gibi basit bir soruyu yanıtlayan en sezgisel performans ölçütü olmakla birlikte, geliştiriciler daha ayrıntılı metriklere dalmadan önce sistemin güvenilirliğinin birincil göstergesi olarak işlev görür.
Doğruluk mükemmel bir başlangıç noktası olsa da, en etkili olduğu durum, tüm sınıfların eşit olarak temsil edildiği dengeli eğitim verilerine uygulandığında görülür. Örneğin, kediler ve köpekleri ayırt eden standart bir görüntü sınıflandırma görevinde, veri kümesi her birinden 500 görüntü içeriyorsa, doğruluk güvenilir bir ölçüttür. Ancak, dengesiz veri kümeleriyle zorluklar ortaya çıkar ve bu da "doğruluk paradoksu"na yol açar.
Bir model, işlemlerin yalnızca %1'inin sahte olduğu bir sahtecilik tespiti için eğitilirse, her işlemi "meşru" olarak tahmin eden bir model %99 doğruluk oranına ulaşırken, amaçlanan görevinde tamamen başarısız olur. Bunu azaltmak için mühendisler genellikle Ultralytics kullanarak veri seti dağılımını görselleştirir ve modellerin yalnızca çoğunluk sınıfını ezberlemediğinden emin olurlar.
Model performansını tam olarak anlamak için, doğruluğu benzer metriklerden ayırmak çok önemlidir:
Doğruluk, genel bir doğruluk görünümü sağlarken, kesinlik ve geri çağırma, yanlış pozitifler veya yanlış negatifler gibi belirli hata türleri hakkında bilgi sağlar.
Doğruluğun faydası, çeşitli endüstrilere yayılır ve kritik ortamlarda bilgisayar görüşü ve tahmine dayalı modellerin güvenilirliğini doğrular.
Pratik senaryolarda Pythonkullanarak, geliştiriciler kolayca bir modelin doğruluğunu ölçebilirler. Aşağıdaki örnek, bir YOLO26 sınıflandırma modelini doğrulayarak en iyi 1 doğruluğunu elde etmeyi göstermektedir. En iyi 1 doğruluğu, modelin en yüksek olasılıklı tahminin doğru etiketle eşleşme sıklığını ifade eder.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Validate the model on a standard dataset (e.g., MNIST)
metrics = model.val(data="mnist")
# Print the Top-1 Accuracy
print(f"Top-1 Accuracy: {metrics.top1:.4f}")
Bir model düşük doğruluktan muzdarip olduğunda, performansı artırmak için çeşitli teknikler kullanılabilir. Mühendisler genellikle veri artırma yöntemini kullanarak eğitim setinin çeşitliliğini yapay olarak artırır ve modelin aşırı uyumlanmasını önler. Ayrıca, hiperparametre ayarlama( öğrenme hızıgibi ayarların düzenlenmesi) yakınsamayı önemli ölçüde etkileyebilir . Karmaşık görevler için transfer öğrenimi, bir modelin önceden eğitilmiş büyük bir veri kümesinden ( ImageNetgibi) bilgileri kullanarak daha küçük, belirli bir veri kümesinde daha yüksek doğruluk elde etmesini sağlar.