YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

Veri Artırma

Veri artırma ile makine öğrenimi modellerinizi geliştirin. Doğruluğu artırma, aşırı uyumu azaltma ve sağlamlığı iyileştirme tekniklerini keşfedin.

Veri artırma, bir eğitim veri kümesinin boyutunu ve çeşitliliğini yapay olarak artırmak için kullanılan makine öğrenimindeki (ML) kritik bir tekniktir. Bu, mevcut veri örneklerinin değiştirilmiş, ancak gerçekçi sürümlerini oluşturarak elde edilir. Temel amaç, yapay zeka modellerinin performansını ve sağlamlığını, özellikle eğitim sırasında daha geniş bir koşul çeşitliliğine maruz bırakarak bilgisayar görüşünde (CV) iyileştirmektir. Bu, bir modelin eğitim verilerini çok iyi öğrendiği ancak yeni, görülmemiş verilere genellemede başarısız olduğu ve sonuçta daha yüksek model doğruluğuna yol açan aşırı öğrenmeyi önlemeye yardımcı olur.

Veri Artırma Nasıl Çalışır

Bilgisayarlı görmede, veri artırma, görüntülere bir dizi dönüşüm uygulamayı içerir. Bu dönüşümler, bir modelin dağıtımdan sonra karşılaşabileceği gerçek dünya varyasyonlarını simüle etmek için tasarlanmıştır. Yaygın teknikler şunları içerir:

  • Geometrik Dönüşümler: Bunlar, bir görüntünün uzamsal yönünü değiştirir. Örnekler arasında rastgele döndürmeler, ölçekleme, ötelemeler (kaydırma), kırpma ve çevirme (yatay veya dikey) bulunur. Bunlar, modele nesnenin konumuna ve yönüne göre değişmez olmayı öğretir.
  • Renk Uzayı Dönüşümleri: Bunlar, bir görüntünün renk özelliklerini değiştirir. Parlaklık, kontrast, doygunluk ve renk tonunda yapılan ayarlamalar, modeli aydınlatma koşullarındaki değişikliklere karşı daha dirençli hale getirir.
  • Gelişmiş Teknikler: Daha karmaşık yöntemler, görüntü içeriğini daha önemli ölçüde değiştirmeyi içerir. Bunlar, rastgele gürültü (Gaussian gürültüsü gibi) eklemeyi, bulanıklaştırma efektleri uygulamayı veya iki mevcut görüntüyü doğrusal olarak birleştirerek yeni görüntüler oluşturan Mixup ve bir görüntünün bölgelerini rastgele kaldıran Cutout gibi yöntemleri kullanmayı içerebilir. Bu yöntemler hakkında Veri Artırmanın Nihai Kılavuzu'nda daha fazla bilgi edinebilirsiniz.

PyTorch ve TensorFlow gibi birçok derin öğrenme çatısı, veri artırma için araçlar sağlar. Albumentations gibi özel kütüphaneler, çok sayıda yüksek performanslı artırma tekniği sunar ve Ultralytics YOLO11 gibi modellerle entegre edilerek eğitim verilerini sorunsuz bir şekilde çeşitlendirir.

Gerçek Dünya Uygulamaları

Veri artırma, daha güvenilir yapay zeka sistemleri oluşturmak için birçok alanda standart bir uygulamadır.

  1. Sağlık Hizmetlerinde Yapay Zeka: Tıbbi görüntü analizinde, hasta gizliliği düzenlemeleri ve belirli hastalıkların nadir görülmesi nedeniyle veri kümeleri genellikle küçüktür. Taramalarda tümörleri tespit etmek için bir model eğitmek için döndürme, ölçekleme ve parlaklık değişiklikleri gibi artırma teknikleri, daha çeşitli bir eğitim örnekleri kümesi oluşturur. Bu, modelin görüntüleme ekipmanındaki veya hasta konumlandırmasındaki değişikliklerden bağımsız olarak anormallikleri doğru bir şekilde tanımlamasına yardımcı olarak tanı güvenilirliğini artırır.
  2. Otomotiv için Yapay Zeka: Otonom araçlar için güçlü nesne algılama sistemleri geliştirmek, sayısız sürüş senaryosundan elde edilen verileri gerektirir. Mümkün olan her koşul için veri toplamak yerine, artırma farklı hava koşullarını (örneğin, sentetik yağmur veya kar ekleme), aydınlatmayı (gündüz, alacakaranlık, gece) ve tıkanmaları (örneğin, başka bir araba tarafından kısmen gizlenmiş bir yaya) simüle edebilir. Bu, aracın algılama sistemini öngörülemeyen gerçek dünya ortamlarında daha güvenilir hale getirir.

Diğer önemli uygulamalar arasında kalite kontrol için üretimde yapay zeka ve değişken saha koşullarında mahsul hastalıklarını tespit etmek için tarımda yapay zeka yer alır.

Veri Artırma ve İlgili Kavramlar

Veri artırmayı diğer veriyle ilgili tekniklerden ayırmak önemlidir.

  • Sentetik Veri: Her iki yöntem de veri kümelerini geliştirse de, farklı şekilde çalışırlar. Veri artırma mevcut gerçek verileri değiştirir. Buna karşılık, sentetik veri üretimi, simülasyonlar veya GAN'lar gibi üretken modeller kullanılarak sıfırdan tamamen yeni, yapay veriler oluşturur. Artırma gözlemlenen veriler etrafındaki varyansı genişletirken, sentetik veri orijinal veri kümesinde bulunmayan yeni senaryolar oluşturabilir, bu kavram bilgisayarlı görmede sentetik verilere genel bakışta incelenmiştir.
  • Veri Temizleme (Data Cleaning): Veri temizleme, bir veri kümesindeki hataları, tutarsızlıkları ve yanlışlıkları belirlemeye ve düzeltmeye odaklanan daha geniş veri ön işleme (data preprocessing) hattının bir parçasıdır. Amacı, veri kalitesini iyileştirmektir. Veri artırma ise veri miktarını ve çeşitliliğini artırmakla ilgilidir. Temiz bir veri kümesi, artırma uygulamadan önce ideal bir başlangıç noktasıdır.
  • Transfer Öğrenimi: Bu teknik, ImageNet gibi büyük bir benchmark veri kümesi üzerinde önceden eğitilmiş bir modelin daha sonra daha küçük, göreve özgü bir veri kümesi üzerinde ince ayar yapılmasını içerir. Veri artırma, performansı daha da artırmak ve yeni veriler üzerinde aşırı öğrenmeyi önlemek için genellikle ince ayar aşamasında kullanılır.

Ultralytics HUB gibi platformlar, kullanıcıların güçlü, son teknoloji ürünü vizyon yapay zeka modelleri oluşturmasına yardımcı olmak için temel bir adım olarak veri artırmayı da dahil ederek tüm model eğitim sürecini kolaylaştırır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı