Sözlük

Test Verileri

Yapay zekada test verilerinin önemini, model performansını değerlendirmedeki, aşırı uyumu tespit etmedeki ve gerçek dünya güvenilirliğini sağlamadaki rolünü keşfedin.

Makine öğreniminde Test Verisi, bir modelin tamamen eğitildikten ve ayarlandıktan sonra son değerlendirmesi için kullanılan bir veri kümesinin ayrı, bağımsız bir bölümüdür. Bu veri kümesi model için bir "final sınavı" görevi görür ve yeni, görülmemiş veriler üzerindeki performansının tarafsız bir şekilde değerlendirilmesini sağlar. Temel ilke, modelin geliştirilmesi sırasında asla test verilerinden öğrenmemesi veya bunlardan etkilenmemesidir. Bu katı ayrım, doğruluk veya ortalama Ortalama Kesinlik (mAP) gibi test seti üzerinde hesaplanan performans ölçümlerinin, modelin gerçek dünya senaryolarına genelleme yeteneğinin gerçek bir yansıması olmasını sağlar. Titiz model testi, model dağıtımından önce kritik bir adımdır.

Test Verilerinin Makine Öğrenimi Yaşam Döngüsündeki Rolü

Tipik bir Makine Öğrenimi (ML) projesinde, veriler farklı amaçlara hizmet edecek şekilde dikkatlice bölümlere ayrılır. Bu bölümler arasındaki ayrımı anlamak esastır.

  • Eğitim Verileri: Bu, modeli öğretmek için kullanılan verilerin en büyük alt kümesidir. Model, eğitim setindeki örneklere göre dahili ağırlıklarını ayarlayarak kalıpları, özellikleri ve ilişkileri yinelemeli olarak öğrenir. Etkili model oluşturma, yüksek kaliteli eğitim verilerine ve bu model eğitim ipuçları kılavuzundaki gibi en iyi uygulamaların izlenmesine bağlıdır.
  • Doğrulama Verileri: Bu, eğitim süreci sırasında kullanılan ayrı bir veri kümesidir. Amacı, modelin görünmeyen veriler üzerindeki performansı hakkında geri bildirim sağlamaktır; bu da hiperparametre ayarlamasına (örneğin, öğrenme oranını ayarlama ) yardımcı olur ve aşırı uyumu önler. Bu, öğrenme stratejisini yönlendirmeye yardımcı olan bir alıştırma testi gibidir. Değerlendirme genellikle özel bir doğrulama modu kullanılarak gerçekleştirilir.
  • Test Verileri: Bu veri seti, tüm eğitim ve doğrulama bitene kadar tamamen izole tutulur. Modelin performansı hakkında nihai, tarafsız bir rapor sağlamak için yalnızca bir kez kullanılır. Modelde daha fazla ayarlama yapmak için test verilerini kullanmak sonuçları geçersiz kılacaktır; bu hata bazen "veri sızıntısı" veya "teste öğretme" olarak adlandırılır. Bu son değerlendirme, Ultralytics YOLO modeli gibi bir modelin dağıtımdan sonra nasıl performans göstereceğini anlamak için çok önemlidir. Ultralytics HUB gibi araçlar, proje yaşam döngüsü boyunca bu veri kümelerinin yönetilmesine yardımcı olabilir.

Bir Kıyaslama Veri Kümesi test kümesi olarak kullanılabilirken, birincil rolü, genellikle ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC) gibi akademik yarışmalarda kullanılan farklı modelleri karşılaştırmak için genel bir standart olarak hareket etmektir. Bunun örneklerini model karşılaştırma sayfalarında görebilirsiniz.

Gerçek Dünya Uygulamaları

  1. Otomotivde Yapay Zeka: Bir geliştirici, eğitim ve doğrulama için binlerce saatlik sürüş görüntüsünü kullanarak otonom bir araç için bir nesne algılama modeli oluşturur. Bu model bir filoya yerleştirilmeden önce bir test veri setine karşı değerlendirilir. Bu test seti, gece şiddetli yağmurda sürüş, kar fırtınasında seyir veya diğer nesneler tarafından kısmen gizlenmiş yayaları tespit etme gibi zorlu, daha önce görülmemiş senaryoları içerir. Modelin bu test setindeki performansı, genellikle nuScenes gibi kıyaslama ölçütlerinden elde edilen veriler kullanılarak, otomotiv uygulamalarında yapay zeka için gerekli olan katı güvenlik ve güvenilirlik standartlarını karşılayıp karşılamadığını belirler.
  2. Tıbbi Görüntü Analizi: Bir bilgisayarla görme (CV) modeli, bir hastaneden alınan göğüs röntgeni görüntülerinden pnömoni belirtilerini tespit etmek üzere eğitilmiştir. Klinik olarak kullanışlı olduğundan emin olmak için modelin farklı bir hastane sisteminden alınan görüntülerden oluşan bir veri kümesi üzerinde test edilmesi gerekir. Bu test verileri, farklı ekipmanlarla çekilen, farklı hasta popülasyonlarından alınan ve farklı radyologlar tarafından yorumlanan görüntüleri içerecektir. Modelin performansının bu harici test seti üzerinde değerlendirilmesi, FDA gibi düzenleyici kurumlardan onay almak ve sağlık hizmetlerinde yapay zeka kullanımını onaylamak için çok önemlidir. Bu süreç, modelin veri seti önyargısından kaçınmasını ve yeni klinik ortamlarda güvenilir bir performans göstermesini sağlamaya yardımcı olur.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı