Data Augmentation
Veri artırmanın model dayanıklılığını nasıl artırdığını ve aşırı uyumu nasıl azalttığını keşfet. Bilgisayarlı görü için Ultralytics YOLO26 performansını artıracak temel teknikleri öğren.
Veri çoğaltma, makine öğrenimi ve bilgisayarlı görü alanında, mevcut verilerin değiştirilmiş sürümlerini oluşturarak eğitim veri setinin boyutunu ve çeşitliliğini yapay olarak artırmak için kullanılan kritik bir tekniktir. Tamamen yeni veriler toplamak ve bunları etiketlemek—ki bu zaman alıcı ve pahalı olabilir—yerine, çoğaltma işlemi orijinal örneklere çeşitli dönüşümler uygular. Bu değişiklikler, makine öğrenimi modellerinin kalıpları daha dayanıklı bir şekilde tanımayı öğrenmesine yardımcı olarak, gerçek dünya ortamlarındaki varyasyonlarla karşılaştıklarında bile iyi performans göstermelerini sağlar. Geliştiriciler, eğitim sırasında modelleri daha geniş bir senaryo yelpazesine maruz bırakarak, aşırı öğrenmeyi etkili bir şekilde azaltabilir ve genellemeyi iyileştirebilirler.
Link to this sectionModern Yapay Zekada Önemi#
Bilgisayarlı görü alanında modeller, eğitim verilerinden biraz farklı görüntüler sunulduğunda genellikle zorlanır. Aydınlatma, yönelim veya arka plan karmaşasındaki değişiklikler, yeterli çeşitliliği görmemiş bir modelin kafasını karıştırabilir. Veri çoğaltma, bu varyasyonları programatik olarak simüle ederek bu sorunu çözer. Örneğin, bir kedi resmi döndürülebilir, çevrilebilir veya hafifçe bulanıklaştırılabilir; böylece modele, bu değişikliklere rağmen öznenin hala bir "kedi" olduğu öğretilir.
This process is integral to the success of modern architectures like Ultralytics YOLO26, which relies on rich and varied datasets to achieve high accuracy in tasks such as object detection and image segmentation. By synthesizing new training examples, augmentation allows models to learn invariant features—characteristics that do not change despite alterations in the input.
Link to this sectionYaygın Teknikler ve Yöntemler#
Veri çoğaltma, basit geometrik ayarlamalardan karmaşık üretken yaklaşımlara kadar uzanan çok çeşitli dönüşüm tekniklerini kapsar:
- Geometrik Dönüşümler: Bunlar; görüntüleri döndürme, ölçeklendirme, çevirme, kırpma ve öteleme (kaydırma) gibi işlemleri içerir. Bunlar, kameranın bakış açısındaki veya nesnenin konumundaki değişiklikleri temsil eder.
- Renk Uzayı Ayarlamaları: Parlaklığı, kontrastı, doygunluğu ve renk tonunu değiştirmek, modellerin farklı aydınlatma koşulları veya kamera sensörleriyle başa çıkmasına yardımcı olur.
- Gürültü Enjeksiyonu: Rastgele gürültü (Gauss gürültüsü gibi) eklemek, modelleri grenli veya düşük kaliteli girdi verilerine karşı daha dirençli hale getirebilir.
- Görüntüleri Karıştırma: MixUp veya (YOLO eğitiminde popüler olan) Mosaic gibi teknikler, birden fazla görüntüyü tek bir eğitim örneğinde birleştirerek modeli bağlamı ve nesne ilişkilerini daha etkili bir şekilde öğrenmeye zorlar.
- Üretken Yaklaşımlar: Gelişmiş yöntemler, orijinal veri setinin özelliklerini taklit eden tamamen yeni ve sentetik eğitim örnekleri oluşturmak için Üretken Yapay Zeka veya difüzyon modelleri kullanır.
Link to this sectionGerçek Dünya Uygulamaları#
Veri çoğaltmanın pratik etkisi, veri kıtlığının veya yüksek değişkenliğin zorluk teşkil ettiği çok sayıda endüstriye yayılmaktadır.
Link to this sectionOtonom Sürüş#
Otonom araçların geliştirilmesinde, mümkün olan her hava durumu veya aydınlatma senaryosu için veri toplamak neredeyse imkansızdır. Mühendisler, açık hava görüntülerine yağmur, sis, kar veya parlama simüle etmek için veri çoğaltmayı kullanırlar. Bu, algılama sisteminin çevresel faktörlerden bağımsız olarak yayaları, trafik işaretlerini ve diğer araçları güvenilir bir şekilde tespit edebilmesini sağlayarak güvenliği ve güvenilirliği artırır.
Link to this sectionTıbbi Görüntüleme#
Tıbbi görüntü analizi genellikle gizlilik endişeleri ve belirli durumların nadirliği nedeniyle sınırlı veri setlerinden muzdariptir. Çoğaltma, araştırmacıların elastik deformasyonlar, döndürmeler veya yoğunluk değişimleri uygulayarak röntgen veya MRI taramalarından oluşan küçük veri setlerini genişletmelerine olanak tanır. Bu, hasta pozisyonu veya tarama kalitesi değişse bile tümörleri veya kırıkları yüksek hassasiyetle tanımlayabilen sağlam tanı modelleri eğitilmesine yardımcı olur.
Link to this sectionİlgili Kavramları Ayırt Etme#
Veri çoğaltmayı Sentetik Veriden ayırmak önemlidir. Her ikisi de veri seti boyutunu artırmayı amaçlasa da, sentetik veri (genellikle 3D oluşturma veya simülasyon motorları kullanılarak) sıfırdan yapay olarak üretilir; veri çoğaltma ise mevcut gerçek dünya verilerini değiştirir. Ayrıca, Veri Ön İşleme verilerin temizlenmesini ve biçimlendirilmesini (örneğin yeniden boyutlandırma, normalleştirme) içerir, ancak çoğaltmanın aksine, bu işlem eğitim örneği sayısını mutlaka artırmaz.
Link to this sectionUltralytics ile Çoğaltma Uygulama#
Modern çerçeveler, çoğaltmayı doğrudan eğitim hattına entegre eder. Aşağıdaki örnek, ultralytics paketini kullanarak bir YOLO26 modeli eğitimi sırasında çevirme ve ölçeklendirme gibi çoğaltmaların nasıl uygulanacağını göstermektedir.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Train with custom data augmentation hyperparameters
# fliplr: 50% chance of horizontal flip, scale: image scaling gain
results = model.train(data="coco8.yaml", epochs=10, fliplr=0.5, scale=0.5)Geliştiriciler bu hiperparametreleri ayarlayarak, verimli model geliştirme için Ultralytics Platform esnekliğinden yararlanıp çoğaltma stratejilerini veri setlerinin ve uygulamalarının özel ihtiyaçlarına göre uyarlayabilirler.






