Training Data

Eğitim verisinin yapay zeka modellerini nasıl güçlendirdiğini öğren. Kaynak bulma, etiketleme ve bilgisayarlı görü görevlerinde üstün doğruluk için Ultralytics YOLO26'yı nasıl eğiteceğini keşfet.

Eğitim verisi, bir makine öğrenimi modeline kalıpları nasıl tanıyacağını, tahminlerde bulunacağını veya belirli görevleri nasıl gerçekleştireceğini öğretmek için kullanılan başlangıç veri kümesidir. Yapay zeka sistemleri için temel bir ders kitabı görevi görerek, algoritmanın iç parametrelerini ayarlamak için analiz ettiği temel gerçeği sağlar. Denetimli öğrenme bağlamında eğitim verisi, modelin ikisi arasındaki ilişkiyi öğrenmesini sağlayan, karşılık gelen çıktı etiketleriyle eşleştirilmiş girdi örneklerinden oluşur. Bu verilerin kalitesi, miktarı ve çeşitliliği, modelin nihai doğruluğunu ve yeni, görülmemiş bilgilere uyum sağlama yeteneğini doğrudan etkiler.

Link to this sectionYapay Zekada Eğitim Verisinin Rolü#

Eğitim verisinin birincil işlevi, modelin tahminleri ile gerçek sonuçlar arasındaki hatayı en aza indirmektir. Model eğitimi süreci sırasında algoritma, bir görüntüdeki kenarlar veya bir cümledeki anahtar kelimeler gibi belirli etiketlerle ilişkili özellikleri belirleyerek verileri yinelemeli olarak işler. Bu süreç, eğitim sırasında hiperparametreleri ayarlamak için kullanılan doğrulama verisinden ve modelin performansının nihai değerlendirmesi için ayrılan test verisinden farklıdır.

Yüksek kaliteli eğitim verisi, modelin karşılaşacağı gerçek dünya senaryolarını temsil etmelidir. Veri kümesi yanlılık içeriyorsa veya çeşitlilikten yoksunsa, model eğitim örneklerini ezberleyip yeni girdilerde iyi performans gösteremediği aşırı uyum sorunundan muzdarip olabilir. Buna karşılık eksik uyum, veriler modelin altında yatan kalıpları yakalaması için çok basit veya yetersiz olduğunda ortaya çıkar.

Link to this sectionGerçek Dünya Uygulamaları#

Eğitim verisi, sistemlerin geçmiş örneklerden öğrenmesini sağlayarak hemen hemen her sektördeki yeniliklere güç verir.

Sağlık Sektöründe Yapay Zeka: Tıbbi teşhiste eğitim verisi, "sağlıklı" veya zatürre gibi belirli patolojileri içeren olarak etiketlenmiş binlerce röntgen görüntüsünden oluşabilir. Ultralytics YOLO26 gibi modeller, bu etiketli örnekleri işleyerek olası anormallikleri yüksek hassasiyetle vurgulayıp radyologlara yardımcı olmayı ve teşhis sürelerini önemli ölçüde hızlandırmayı öğrenebilir.
Otonom Araçlar: Sürücüsüz araçlar, milyonlarca millik sürüş görüntülerini içeren devasa veri kümelerine dayanır. Bu eğitim verisi; yayaları, trafik işaretlerini, diğer araçları ve şerit çizgilerini gösteren açıklamalı kareleri içerir. Waymo Open Dataset veya nuScenes gibi kapsamlı kütüphanelerden elde edilen bu bilgiler, aracın algılama sistemine karmaşık ortamlarda güvenli bir şekilde gezinmeyi öğretir.

Link to this sectionVeri Kaynağı Bulma ve Yönetme#

Sağlam eğitim verisi elde etmek, genellikle bir makine öğrenimi projesinin en zorlu kısmıdır. Veriler, Google Dataset Search gibi genel depolardan veya nesne algılama için COCO gibi özel koleksiyonlardan temin edilebilir. Ancak ham veriler, doğruluğu sağlamak için genellikle dikkatli bir veri temizleme ve etiketleme gerektirir.

Ultralytics Platform gibi araçlar, veri kümelerini yüklemek, etiketlemek ve yönetmek için entegre bir ortam sunarak bu iş akışını kolaylaştırmıştır. Etkili yönetim ayrıca, mevcut görüntülere çevirme, döndürme veya renk ayarı gibi dönüşümler uygulayarak eğitim setinin boyutunu yapay olarak artırmak için kullanılan bir teknik olan veri artırmayı da içerir. Bu, modellerin girdi verilerindeki varyasyonlara karşı daha dayanıklı hale gelmesine yardımcı olur.

Link to this sectionYOLO26 ile Pratik Örnek#

Aşağıdaki Python örneği, ultralytics kütüphanesini kullanarak eğitimin nasıl başlatılacağını göstermektedir. Burada önceden eğitilmiş bir YOLO26 modeli, eğitim hatlarını doğrulamak için tasarlanmış küçük bir veri kümesi olan COCO8 veri kümesi üzerinde ince ayar ile eğitilmektedir.

from ultralytics import YOLO

# Load a pre-trained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 5 epochs
# The 'data' argument specifies the dataset configuration file
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Link to this sectionVeri Kalitesinin Önemi#

"Çöp girerse, çöp çıkar" atasözü makine öğrenimi için temeldir. Transformer veya derin Evrişimli Sinir Ağları (CNN) gibi en gelişmiş mimariler bile zayıf eğitim verisini telafi edemez. Temel gerçeği temsil eden etiketlerin yanlış olduğu etiket gürültüsü gibi sorunlar, performansı ciddi şekilde düşürebilir. Bu nedenle, genellikle insan döngüsünde doğrulama içeren titiz kalite güvence süreçleri, veri kümesinin bütünlüğünü korumak için şarttır.

Ayrıca, Yapay Zeka Etiği ilkelerine bağlı kalmak, eğitim verilerinin demografik veya sosyoekonomik önyargılar açısından incelenmesini gerektirir. Yapay zekada adalet sağlamak, dengeli ve temsili bir eğitim veri kümesiyle başlar; bu da dağıtılan uygulamalarda ayrımcı sonuçların önlenmesine yardımcı olur.