Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Veri Artırma

Veri artırma ile makine öğrenimi modellerinizi geliştirin. Doğruluğu artırma, aşırı uyumu azaltma ve sağlamlığı iyileştirme tekniklerini keşfedin.

Veri artırma, stratejik bir tekniktir makine öğrenimi (ML) için kullanılır boyutunu ve çeşitliliğini yapay olarak genişletir. eğitim veri kümesi gerek kalmadan yeni ham veri toplamak. Geliştiriciler, mevcut veri örneklerine çeşitli dönüşümler uygulayarak, değiştirilmiş ancak görüntülerin, metinlerin veya seslerin gerçekçi versiyonları. Bu süreç, aşağıdakileri azaltmak için gereklidir aşırı uyumBir modelin genelleştirilebilir kalıpları öğrenmek yerine eğitim örneklerini ezberlediği yaygın bir sorundur. Sonuç olarak, etkili güçlendirme daha yüksek doğruluk ve modelin gerçek dünya ortamlarında görünmeyen verilere maruz kaldığında sağlam bir performans sergiler.

Temel Teknikler ve Yöntemler

Bu alanda bilgisayarla görme (CV)büyütme, farklı koşulları simüle etmek için giriş görüntülerinin manipüle edilmesini içerir. Bu dönüşümler model yön, ışık ve ölçek değişikliklerine karşı değişmez hale gelir.

  • Geometrik Dönüşümler: Bunlar bir görüntünün uzamsal düzenini değiştirir. Yaygın işlemler şunları içerir rastgele döndürme, yatay çevirme, kırpma ve ölçekleme. Örneğin, aşağıdakileri kullanarak OpenCV geometrik dönüşümleri bir modelin bir nesneyi baş aşağı veya eğik olmasına bakmaksızın tanımasını sağlar.
  • Fotometrik Dönüşümler: Bunlar, görsel görünümü değiştirmek için piksel değerlerini ayarlar geometriyi değiştirmek. Parlaklığı, kontrastı, doygunluğu ayarlama ve ekleme Gauss gürültüsü modelin işlemesine yardımcı olur değişen aydınlatma koşulları.
  • Gelişmiş Karıştırma: Modern nesne algılama çerçeveler genellikle Mosaic, MixUp ve CutMix gibi karmaşık teknikler kullanır. Bu yöntemler birden fazla görüntüyü tek bir eğitim örneği, modeli bağlamsal ilişkileri öğrenmeye teşvik eder. Bunları nasıl uygulayacağınızı şu yolla keşfedebilirsiniz ve Ultralytics Albumentations entegrasyonu.

Gerçek Dünya Uygulamaları

Veri artırımı, yüksek kaliteli verilerin az olduğu veya elde edilmesinin pahalı olduğu sektörlerde vazgeçilmezdir.

  1. Tıbbi Görüntüleme: İçinde tibbi̇ görüntü anali̇zi̇gizlilik yasaları ve belirli koşulların nadirliği veri kümesi boyutlarını sınırlamaktadır. X-ışınlarını veya MRI taramalarını rotasyonlar ve elastik deformasyonlar, araştırmacılar için sağlam modeller eğitebilir tümör tespi̇ti̇Bu sayede yapay zeka, hasta pozisyonundan veya makine kalibrasyonundan bağımsız olarak anomalileri tespit edebilir.
  2. Otonom Sürüş: Sürücüsüz araçların öngörülemeyen ortamlarda yol alması gerekir. İçin veri toplamak mümkün olan her hava koşulunu sağlamak mümkün değildir. Mühendisler yağmur, sis veya düşük ışık koşullarını simüle etmek için açık gün çekimlerinde senaryolar. Bu hazırlık otonom araçlar tepki vermek için gibi kuruluşlar tarafından açıklanan güvenlik standartlarını önemli ölçüde iyileştirerek olumsuz hava koşullarında güvenli bir şekilde NHTSA.

Ultralytics YOLO'da Artırmanın Uygulanması

Bu ultralytics kütüphanesi, büyütmelerin doğrudan model eğitimi boru hattı. Ayarlayabilirsiniz dönüşümlerin yoğunluğunu ve olasılığını kontrol etmek için hiperparametreler.

from ultralytics import YOLO

# Load the YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model with custom data augmentation parameters
# These arguments modify the training data on-the-fly
model.train(
    data="coco8.yaml",
    epochs=5,
    degrees=30.0,  # Apply random rotations between -30 and +30 degrees
    fliplr=0.5,  # 50% probability of flipping images horizontally
    mosaic=1.0,  # Use Mosaic augmentation (combining 4 images)
    mixup=0.1,  # Apply MixUp augmentation with 10% probability
)

İlgili Kavramları Ayırt Etme

Veri artırımını benzer veri stratejilerinden ayırmak önemlidir:

  • vs Sentetik Veri: Güçlendirme mevcut gerçek dünya verilerini değiştirirken, senteti̇k veri̇ler üretilir tamamen sıfırdan bilgisayar simülasyonları kullanarak veya üretken yapay zeka. Güçlendirme, sahip olduklarınıza çeşitlilik katar; sentetik veri ise sahip olmadıklarınızı yaratır.
  • vs. Veri Ön İşleme: Veri ön işleme içerir Bir modele uygun hale getirmek için verilerin temizlenmesi ve biçimlendirilmesi (örneğin, yeniden boyutlandırma, normalleştirme). Güçlendirme gerçekleşir Ön işlemeden sonra veri kümesinin biçiminden ziyade çeşitliliğini artırmaya odaklanır.
  • Transfer Öğrenimine karşı: Transfer öğrenme kaldıraçlar önceden eğitilmiş bir modelden elde edilen bilgi (örn. ImageNet) yeni bir görevi çözmek için. Genellikle birlikte kullanılsa da, transfer öğrenmesi model ağırlıkları ile ilgiliyken, artırma giriş verileriyle ilgilidir.

Modern büyütme kütüphanelerine daha derinlemesine bir bakış için Albümantasyon dokümantasyonu kapsamlı bir liste sunar PyTorch ve YOLO11 ile uyumlu mevcut dönüşümlerin listesi.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın