Test Data
Test verisinin makine öğrenimindeki hayati rolünü keşfet. Gerçek dünya doğruluğunu sağlamak için tarafsız veri kümelerini kullanarak Ultralytics YOLO26 performansını nasıl değerlendireceğini öğren.
Test Verisi, bir makine öğrenmesi (ML) modelinin nihai performansını değerlendirmek için kesinlikle ayrılmış, daha büyük bir veri kümesinin özel bir alt kümesidir. Öğrenme aşamalarının başlarında kullanılan verilerin aksine test verisi, geliştirme döngüsünün en sonuna kadar algoritma tarafından tamamen "görülmemiş" halde kalır. Bu yalıtım, bir bilgisayarlı görü (CV) modelinin veya başka bir yapay zeka sisteminin yeni, gerçek dünya girdilerine ne kadar iyi genelleştirileceğine dair tarafsız bir değerlendirme sağladığı için kritiktir. Test verisi, bir üretim ortamını simüle ederek, geliştiricilerin modellerinin eğitim örneklerini sadece ezberlemek yerine altta yatan kalıpları gerçekten öğrendiklerini doğrulamalarına yardımcı olur.
Link to this sectionML Yaşam Döngüsünde Test Verisinin Rolü#
Standart makine öğrenmesi iş akışında, veriler tipik olarak her biri benzersiz bir amaca hizmet eden üç farklı kategoriye ayrılır. Bu bölümler arasındaki ayrımı anlamak, sağlam yapay zeka (AI) sistemleri oluşturmak için hayati önem taşır.
- Eğitim Verisi: Bu, modeli eğitmek için kullanılan veri kümesinin en büyük kısmıdır. Algoritma, bu özel örnek kümesindeki hataları en aza indirmek için dahili parametrelerini veya ağırlıklarını yinelemeli olarak ayarlar.
- Doğrulama Verisi: Bu alt küme, hiperparametreleri ayarlamak ve mimari kararlara rehberlik etmek için eğitim sürecinde sıklıkla kullanılır. Modelin eğitim verilerinde iyi performans gösterip yeni verilerde başarısız olduğu aşırı öğrenmeyi (overfitting) önlemek için geçici bir kontrol görevi görür.
- Test Data: This is the final "exam" for the model. It is never used to update weights or tune settings. Evaluation on test data yields definitive performance metrics, such as accuracy, recall, and Mean Average Precision (mAP), which stakeholders use to decide if a model is ready for model deployment.
Properly managing these splits is often facilitated by tools like the Ultralytics Platform, which can automatically organize uploaded datasets into these essential categories to ensure rigorous model evaluation.
Link to this sectionTarafsız Değerlendirmenin Önemi#
Test verisinin birincil değeri, veri kümesi yanlılığını ve varyans sorunlarını tespit etme yeteneğinde yatar. Bir model eğitim verilerinde %99 doğruluk elde ediyor ancak test verilerinde sadece %60 oranında başarılı oluyorsa, bu yüksek varyansa (aşırı öğrenme) işaret eder. Aksine, her ikisindeki düşük performans, yetersiz öğrenmeyi (underfitting) gösterir.
Using a designated test set adheres to scientific principles of reproducibility and objectivity. Without a pristine test set, developers risk "teaching to the test," effectively leaking information from the evaluation phase back into the training phase—a phenomenon known as data leakage. This results in overly optimistic performance estimates that crumble when the model faces real-world data.
Link to this sectionGerçek Dünya Uygulamaları#
Test verisi, sistemler canlıya alınmadan önce güvenlik ve güvenilirliği sağlamak amacıyla yapay zeka kullanan tüm sektörlerde esastır.
- Otonom Sürüş: Otonom araçların geliştirilmesinde eğitim verileri, açık havada kat edilen milyonlarca kilometre yoldan oluşabilir. Ancak test verileri, aracın eğitim sırasında asla açıkça "görmediği" yoğun kar, ani engeller veya kafa karıştırıcı trafik işaretleri gibi nadir ve zorlu senaryoları içermelidir. Bu, nesne algılama sisteminin öngörülemeyen ortamlarda güvenli bir şekilde tepki verebilmesini sağlar.
- Sağlık Teşhisi: Tıbbi görüntülemede tümör tespiti için bir model oluştururken eğitim seti, belirli bir hastanenin veritabanından gelebilir. Modelin genel kullanım için sağlam ve güvenli olduğunu doğrulamak amacıyla, test verileri ideal olarak farklı hastanelerden, farklı makinelerle çekilmiş ve çeşitli hasta demografilerini temsil eden taramalardan oluşmalıdır. Bu dış doğrulama, yapay zekanın belirli bir ekipman türüne veya popülasyona karşı yanlı olmadığını onaylar.
Link to this sectionPerformansı Kod ile Değerlendirme#
ultralytics paketini kullanarak, bir modelin performansını ayrılmış bir veri kümesi üzerinde kolayca değerlendirebilirsin. val modu genellikle eğitim sırasında doğrulama için kullanılsa da, veri kümesi YAML yapılandırmanda tanımlanan belirli bir test bölümünde çalışacak şekilde de yapılandırılabilir.
Here is how to evaluate a pre-trained YOLO26 model to obtain metrics like mAP50-95:
from ultralytics import YOLO
# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")
# Evaluate the model's performance on the validation set
# (Note: In a strict testing workflow, you would point 'data'
# to a YAML that defines a specific 'test' split and use split='test')
metrics = model.val(data="coco8.yaml")
# Print a specific metric, e.g., mAP at 50-95% IoU
print(f"Mean Average Precision (mAP50-95): {metrics.box.map}")This process generates comprehensive metrics, allowing developers to objectively compare different architectures, such as YOLO26 vs YOLO11, and ensure the chosen solution meets the project's defined goals. Rigorous testing is the final gatekeeping step in ensuring high-quality AI safety standards are met.






