Overfitting
Makine öğreniminde aşırı öğrenmenin (overfitting) nedenlerini ve belirtilerini keşfet. Yüksek varyansı nasıl önleyeceğini ve Ultralytics YOLO26 kullanarak genellemeyi nasıl iyileştireceğini öğren.
Aşırı öğrenme, makine öğreniminde bir modelin eğitim verilerini çok iyi öğrenerek, temel veri dağılımı yerine gürültüyü ve rastgele dalgalanmaları yakalaması durumudur. Aşırı öğrenen bir model, yeni ve görülmemiş verilere uygulanan genel kalıpları öğrenmek yerine, eğitim setindeki belirli örnekleri etkili bir şekilde ezberler. Bu durum, eğitim verilerinde mükemmel bir performans sağlar ancak gerçek dünya senaryolarında düşük bir genelleme yeteneği ile sonuçlanır. Genellikle "yüksek varyans" olarak tanımlanır; yani modelin tahminleri, eğitim için kullanılan belirli veri setine bağlı olarak önemli ölçüde değişir.
Link to this sectionAşırı Öğrenme Neden Olur#
Aşırı öğrenmenin temel nedeni, mevcut veri miktarına göre aşırı model karmaşıklığıdır. Eğer bir sinir ağı çok büyükse (yani çok fazla katmana veya parametreye sahipse), eğitim örneklerini kolayca ezberleyebilir. Diğer katkıda bulunan faktörler şunlardır:
- Yetersiz Eğitim Verisi: Küçük veri setleri, daha geniş popülasyonda bulunmayan yanıltıcı korelasyonlar içerebilir. Sınırlı verilerle eğitilen modeller, bu tesadüfi kalıpları öğrenmeye eğilimlidir.
- Veri Gürültüsü ve Aykırı Değerler: Eğitim verilerindeki yüksek gürültü seviyeleri veya temsili olmayan aykırı değerler, modeli yanıltarak iç parametrelerini gerçek sinyale değil, anomalilere uyacak şekilde ayarlamasına neden olabilir.
- Uzun Eğitim Süresi: Çok fazla epok boyunca eğitim yapmak, modelin ağırlıklarını eğitim setindeki gürültüye uyana kadar iyileştirmeye devam etmesine olanak tanır. Bu durum genellikle doğrulama verileri kullanılarak izlenir.
Link to this sectionAşırı Öğrenme vs. Yetersiz Öğrenme#
Aşırı öğrenmeyi yetersiz öğrenmeden ayırt etmek önemlidir. Aşırı öğrenme çok fazla ayrıntıyı (gürültü dahil) öğrenmeyi içerirken, yetersiz öğrenme modelin verinin temel yapısını hiç kavrayamayacak kadar basit olması durumudur. Yetersiz öğrenen bir model hem eğitim hem de yeni veriler üzerinde kötü performans gösterir ve bu durum genellikle yüksek sapma (bias) ile sonuçlanır. Bu iki uç noktayı dengelemek, sapma-varyans ödünleşimi olarak bilinir.
Link to this sectionAşırı Öğrenmeyi Önleme#
Mühendisler, aşırı öğrenmeyi azaltmak ve model sağlamlığını artırmak için çeşitli teknikler kullanırlar:
- Düzenlileştirme: L1/L2 düzenlileştirmesi veya dropout katmanları ekleme gibi teknikler, eğitim sırasında cezalar veya rastgelelik getirerek modelin belirli özelliklere aşırı bağımlı hale gelmesini önler.
- Erken Durdurma: Bir doğrulama seti üzerindeki kayıp fonksiyonunu izlemek, eğitim doğruluğu artmaya devam etse bile, görülmemiş veriler üzerindeki performans iyileşmeyi durdurduğunda eğitimin durdurulmasına olanak tanır.
- Veri Çoğaltma: Veri çoğaltma kullanarak eğitim setinin boyutunu ve çeşitliliğini yapay olarak artırmak, modelin tam görüntüleri ezberlemesini zorlaştırır.
- Çapraz Doğrulama: k-katlı çapraz doğrulama gibi tekniklerin kullanılması, modelin farklı veri alt kümelerinde test edilmesini sağlayarak performansının daha güvenilir bir tahminini sunar.
Link to this sectionGerçek Dünya Örnekleri#
Aşırı öğrenme, yapay zekayı üretim ortamlarında devreye alırken ciddi sonuçlara yol açabilir:
- Tıbbi Teşhis: Sağlık hizmetlerinde yapay zeka alanında, cilt kanserini tespit etmek için eğitilen bir model, eğitim görüntülerindeki aydınlatma koşullarına veya cetvel işaretlerine aşırı uyum sağlayabilir. Farklı aydınlatmaya veya ekipmana sahip bir klinikte devreye alındığında, model ilgisiz arka plan ipuçlarına güvendiği için kötü huylu lezyonları doğru şekilde tanımlayamayabilir.
- Finansal Tahmin: Bir hisse senedi fiyat tahmin modeli, belirli ve tekrarlanamayan bir olaydan (bir kerelik ekonomik kriz gibi) kaynaklanan geçmiş piyasa eğilimlerine aşırı uyum sağlayabilir. Böyle bir model, temel piyasa dinamiklerini öğrenmek yerine geçmişteki anomalileri ezberlediği için gelecekteki hisse senedi hareketlerini muhtemelen doğru bir şekilde tahmin edemeyecektir.
Link to this sectionKod Örneği: YOLO26 ile Erken Durdurma#
Ultralytics Platformu veya yerel eğitim betiklerini kullanarak, erken durdurma sabrını ayarlayarak aşırı öğrenmeyi önleyebilirsin. Bu, doğrulama uygunluğu belirli sayıda epok boyunca iyileşmezse eğitimi durdurur.
from ultralytics import YOLO
# Load the YOLO26 model (latest generation)
model = YOLO("yolo26n.pt")
# Train with early stopping enabled (patience=50 epochs)
# If validation metrics don't improve for 50 epochs, training stops.
results = model.train(data="coco8.yaml", epochs=100, patience=50)Link to this sectionİlgili Kavramlar#
- Genelleme: Bir modelin yeni ve daha önce görülmemiş verilere uyum sağlama ve iyi performans gösterme yeteneği; aşırı öğrenmenin tam tersidir.
- Çapraz Doğrulama: İstatistiksel bir analizin sonuçlarının bağımsız bir veri setine nasıl genelleneceğini değerlendirmek için kullanılan bir teknik.
- Düzenlileştirme: Verilen eğitim setine bir fonksiyonu uygun şekilde uyarlayarak hataları azaltmak ve aşırı öğrenmeyi önlemek için kullanılan yöntemler.






