Veri Artırma
Veri artırma ile makine öğrenimi modellerinizi geliştirin. Doğruluğu artırma, aşırı uyumu azaltma ve sağlamlığı iyileştirme tekniklerini keşfedin.
Veri artırma, stratejik bir tekniktir
makine öğrenimi (ML) için kullanılır
boyutunu ve çeşitliliğini yapay olarak genişletir.
eğitim veri kümesi gerek kalmadan
yeni ham veri toplamak. Geliştiriciler, mevcut veri örneklerine çeşitli dönüşümler uygulayarak, değiştirilmiş ancak
görüntülerin, metinlerin veya seslerin gerçekçi versiyonları. Bu süreç, aşağıdakileri azaltmak için gereklidir
aşırı uyumBir modelin genelleştirilebilir kalıpları öğrenmek yerine eğitim örneklerini ezberlediği yaygın bir sorundur.
Sonuç olarak, etkili güçlendirme daha yüksek
doğruluk ve modelin
gerçek dünya ortamlarında görünmeyen verilere maruz kaldığında sağlam bir performans sergiler.
Temel Teknikler ve Yöntemler
Bu alanda
bilgisayarla görme (CV)büyütme, farklı koşulları simüle etmek için giriş görüntülerinin manipüle edilmesini içerir. Bu dönüşümler
model yön, ışık ve ölçek değişikliklerine karşı değişmez hale gelir.
-
Geometrik Dönüşümler: Bunlar bir görüntünün uzamsal düzenini değiştirir. Yaygın işlemler şunları içerir
rastgele döndürme, yatay çevirme, kırpma ve ölçekleme. Örneğin, aşağıdakileri kullanarak
OpenCV geometrik dönüşümleri
bir modelin bir nesneyi baş aşağı veya eğik olmasına bakmaksızın tanımasını sağlar.
-
Fotometrik Dönüşümler: Bunlar, görsel görünümü değiştirmek için piksel değerlerini ayarlar
geometriyi değiştirmek. Parlaklığı, kontrastı, doygunluğu ayarlama ve ekleme
Gauss gürültüsü modelin işlemesine yardımcı olur
değişen aydınlatma koşulları.
-
Gelişmiş Karıştırma: Modern
nesne algılama çerçeveler
genellikle Mosaic, MixUp ve CutMix gibi karmaşık teknikler kullanır. Bu yöntemler birden fazla görüntüyü tek bir
eğitim örneği, modeli bağlamsal ilişkileri öğrenmeye teşvik eder. Bunları nasıl uygulayacağınızı şu yolla keşfedebilirsiniz
ve
Ultralytics Albumentations entegrasyonu.
Gerçek Dünya Uygulamaları
Veri artırımı, yüksek kaliteli verilerin az olduğu veya elde edilmesinin pahalı olduğu sektörlerde vazgeçilmezdir.
-
Tıbbi Görüntüleme: İçinde
tibbi̇ görüntü anali̇zi̇gizlilik yasaları ve belirli koşulların nadirliği veri kümesi boyutlarını sınırlamaktadır. X-ışınlarını veya MRI taramalarını
rotasyonlar ve elastik deformasyonlar, araştırmacılar için sağlam modeller eğitebilir
tümör tespi̇ti̇Bu sayede yapay zeka, hasta pozisyonundan veya makine kalibrasyonundan bağımsız olarak anomalileri tespit edebilir.
-
Otonom Sürüş: Sürücüsüz araçların öngörülemeyen ortamlarda yol alması gerekir. İçin veri toplamak
mümkün olan her hava koşulunu sağlamak mümkün değildir. Mühendisler yağmur, sis veya düşük ışık koşullarını simüle etmek için
açık gün çekimlerinde senaryolar. Bu hazırlık
otonom araçlar tepki vermek için
gibi kuruluşlar tarafından açıklanan güvenlik standartlarını önemli ölçüde iyileştirerek olumsuz hava koşullarında güvenli bir şekilde
NHTSA.
Ultralytics YOLO'da Artırmanın Uygulanması
Bu ultralytics kütüphanesi, büyütmelerin doğrudan
model eğitimi boru hattı. Ayarlayabilirsiniz
dönüşümlerin yoğunluğunu ve olasılığını kontrol etmek için hiperparametreler.
from ultralytics import YOLO
# Load the YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model with custom data augmentation parameters
# These arguments modify the training data on-the-fly
model.train(
data="coco8.yaml",
epochs=5,
degrees=30.0, # Apply random rotations between -30 and +30 degrees
fliplr=0.5, # 50% probability of flipping images horizontally
mosaic=1.0, # Use Mosaic augmentation (combining 4 images)
mixup=0.1, # Apply MixUp augmentation with 10% probability
)
İlgili Kavramları Ayırt Etme
Veri artırımını benzer veri stratejilerinden ayırmak önemlidir:
-
vs Sentetik Veri: Güçlendirme mevcut gerçek dünya verilerini değiştirirken,
senteti̇k veri̇ler üretilir
tamamen sıfırdan bilgisayar simülasyonları kullanarak veya
üretken yapay zeka. Güçlendirme, sahip olduklarınıza çeşitlilik katar; sentetik veri ise sahip olmadıklarınızı yaratır.
-
vs. Veri Ön İşleme:
Veri ön işleme içerir
Bir modele uygun hale getirmek için verilerin temizlenmesi ve biçimlendirilmesi (örneğin, yeniden boyutlandırma, normalleştirme). Güçlendirme gerçekleşir
Ön işlemeden sonra veri kümesinin biçiminden ziyade çeşitliliğini artırmaya odaklanır.
-
Transfer Öğrenimine karşı:
Transfer öğrenme kaldıraçlar
önceden eğitilmiş bir modelden elde edilen bilgi (örn.
ImageNet) yeni bir görevi çözmek için. Genellikle birlikte kullanılsa da, transfer öğrenmesi model ağırlıkları ile ilgiliyken, artırma
giriş verileriyle ilgilidir.
Modern büyütme kütüphanelerine daha derinlemesine bir bakış için
Albümantasyon dokümantasyonu kapsamlı bir liste sunar
PyTorch ve YOLO11 ile uyumlu mevcut dönüşümlerin listesi.