Sözlük

Çapraz Doğrulama

Model doğruluğunu artırmak, aşırı uyumu önlemek ve sağlam performans sağlamak için makine öğreniminde çapraz doğrulamanın gücünü keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Çapraz Doğrulama, bir modelin bağımsız bir veri kümesine ne kadar iyi genelleme yapacağını değerlendirmek için makine öğreniminde (ML) kullanılan önemli bir istatistiksel tekniktir. Çapraz Doğrulama, verilerin eğitim ve test kümelerine tek bir şekilde bölünmesi yerine, verilerin birden fazla alt kümeye veya 'katlara' bölünmesini içerir. Model bazı katlar üzerinde yinelemeli olarak eğitilir ve kalan kat üzerinde değerlendirilir. Bu süreç, basit bir eğitim/test ayrımına kıyasla modelin görünmeyen veriler üzerindeki performansının daha güvenilir bir tahminini sağlar ve bir modelin gürültü de dahil olmak üzere eğitim verilerini çok iyi öğrendiği aşırı uyum riskini önemli ölçüde azaltır.

Çapraz Doğrulama Nasıl Çalışır?

En yaygın kullanılan yöntem K-Kat Çapraz Doğrulamadır. Süreç şu adımları içerir:

  1. Karıştırma ve Bölme: Tüm veri kümesi rastgele karıştırılır ve 'K' eşit boyutlu katlara (alt kümelere) bölünür.
  2. Yinelemeli Eğitim ve Doğrulama: Model K kez eğitilir. Her iterasyonda 'i' (1'den K'ya kadar):
  3. Performans Toplama: K iterasyonun her birinde kaydedilen performans metriğinin ortalaması alınarak modelin genelleme kabiliyetine ilişkin tek ve daha sağlam bir tahmin elde edilir.

Scikit-learn gibi birçok popüler makine öğrenimi kütüphanesi, Tabakalı K-Fold (dengesiz veri kümeleri için gereklidir) ve Leave-One-Out CV dahil olmak üzere çeşitli Çapraz Doğrulama stratejilerinin verimli uygulamalarını sunar.

Neden Çapraz Doğrulama Kullanılmalı?

Çapraz Doğrulama, birkaç temel nedenden dolayı güvenilir model değerlendirmesinin temel taşıdır:

  • Daha Güvenilir Performans Tahminleri: CV, birden fazla doğrulama seti üzerinden sonuçların ortalamasını alarak, tek bir eğitim/test bölünmesiyle ilişkili varyansı azaltır ve modelin pratikte nasıl performans gösterebileceğine dair daha istikrarlı bir ölçü sunar. Bu, araştırmada tekrarlanabilirliği teşvik eder.
  • Verimli Veri Kullanımı: Her veri noktası farklı katlamalarda hem eğitim hem de doğrulama verisi olarak hizmet verdiğinden sınırlı veri kümelerini daha iyi kullanır. Bu, özellikle veri toplamanın pahalı veya zor olduğu durumlarda faydalıdır.
  • Aşırı Uyum / Düşük Uyum Tespiti: Eğitim performansı ile ortalama doğrulama performansı arasındaki tutarsızlıkları ortaya çıkararak aşırı karmaşık (aşırı uyum) veya çok basit(yetersiz uyum) modellerin belirlenmesine yardımcı olur.
  • Sağlam Hiperparametre Ayarlama: CV, optimum hiperparametrelerin seçilmesi için daha güvenilir bir temel sağlar. Farklı hiperparametre setleri, ortalama çapraz doğrulama performanslarına göre değerlendirilebilir ve bu da daha iyi genellemeye sahip modellere yol açar. Ultralytics , CV ilkelerini içerebilen Hiperparametre Ayar lama araçları sunar.

Çapraz Doğrulama ve Basit Eğitim/Doğrulama Ayrımı

Basit bir eğitme/doğrulama ayrımı verileri bir kez böler: bir kısım eğitim için, bir kısım doğrulama için. Uygulaması kolay olsa da, temel dezavantajı performans değerlendirmesinin büyük ölçüde hangi belirli veri noktalarının doğrulama kümesine gireceğine bağlı olmasıdır. Özellikle "kolay" veya "zor" bir doğrulama seti aşırı iyimser veya kötümser performans tahminlerine yol açabilir.

Çapraz Doğrulama, doğrulama için sistematik olarak farklı alt kümeler kullanarak bunun üstesinden gelir ve her veri noktasının değerlendirme sürecine tam olarak bir kez katkıda bulunmasını sağlar. Bu, model sağlamlığının daha istikrarlı ve güvenilir bir şekilde değerlendirilmesini sağlar. Hem eğitim hem de CV tabanlı ayarlama sırasında görülmeyen nihai bir test veri setinin, seçilen modelin nihai değerlendirmesi için hala ayrılması gerektiğini unutmamak önemlidir. Ultralytics YOLO ile K-Kat Çapraz Doğrulamanın uygulanması hakkında ayrıntılı rehberlik sağlar.

Gerçek Dünya Uygulamaları

Çapraz Doğrulama, çeşitli alanlarda güvenilir yapay zeka sistemleri oluşturmak için vazgeçilmezdir:

  1. Tıbbi Görüntü Analizi: Beyin Tümörü veri kümesi gibi veri kümelerini kullanarak beyin taramalarındaki tümörleri tespit etmek gibi tıbbi görüntü analizi için bir Evrişimsel Sinir Ağı (CNN ) geliştirirken CV, klinik denemeleri düşünmeden veya düzenleyici onay (örneğin FDA'dan) almadan önce modelin teşhis doğruluğunu ve çeşitli hasta verilerindeki genellemesini titizlikle değerlendirmek için kullanılır.
  2. Otonom Araçlar: Nesne algılama modelleri için Ultralytics YOLOOtonom araçlarda kullanılan CV, Argoverse gibi karmaşık veri kümelerinde sıklıkla bulunan çeşitli çevresel koşullarda (aydınlatma, hava durumu, yol türleri) yayaları, bisikletlileri ve diğer araçları tespit etmede güvenilir performans sağlamaya yardımcı olur. Genellikle Ortalama Hassasiyet (mAP) gibi metriklerle ölçülen bu sağlam değerlendirme, Otomotivde Yapay Zeka çözümlerinde olduğu gibi güvenlik açısından kritik sistemlerde model dağıtımından önce kritik öneme sahiptir.

Diğer uygulamalar arasında görüntü segmentasyonu için modellerin değerlendirilmesi, duygu analizi gibi doğal dil işleme (NLP) görevleri ve finansal modellemede risk değerlendirmesi yer alır. Ultralytics HUB gibi platformlar, geliştirme yaşam döngüsünü kolaylaştırmak için genellikle bu tür değerlendirme tekniklerini entegre eder veya kolaylaştırır.

Tümünü okuyun