YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

Sentetik Veri

Yapay zeka/ML için sentetik verilerin gücünü ortaya çıkarın! Model eğitimini ve yeniliği artırırken veri kıtlığının, gizlilik sorunlarının ve maliyetlerin üstesinden gelin.

Sentetik veri, gerçek dünya verilerini taklit etmek için yapay olarak oluşturulan bilgilerdir. Yapay zeka (AI) ve makine öğrenimi (ML) alanlarında, AI modellerini eğitmek için gerçek dünya verilerine güçlü bir alternatif veya tamamlayıcı olarak hizmet eder. Kapsamlı, yüksek kaliteli ve düzgün etiketlenmiş gerçek dünya veri kümelerini toplamak maliyetli, zaman alıcı ve bazen gizlilik düzenlemeleri veya belirli olayların nadirliği nedeniyle pratik olmayabilir. Sentetik veri, geliştiricilerin talep üzerine çok miktarda mükemmel şekilde etiketlenmiş veri oluşturmasını sağlayarak bu sınırlamaları ele alarak ve sağlam bilgisayarlı görü (CV) sistemlerinin geliştirilmesini hızlandırarak bir çözüm sunar.

Sentetik Veri Nasıl Oluşturulur?

Sentetik veri, her biri farklı uygulamalar için uygun olan çeşitli gelişmiş teknikler kullanılarak oluşturulabilir. Bu yöntemler, oluşturulan verilerin aydınlatma, nesne yerleşimi ve çevresel koşullar gibi özellikleri üzerinde hassas kontrol sağlar.

  • 3B Modelleme ve Simülasyon: Geliştiriciler, fotogerçekçi sanal dünyalar oluşturmak için bilgisayar grafikleri ve simülasyon ortamları kullanır. Bu yaklaşım, fizik motorlarının gerçek dünya fiziğini simüle edebildiği robotik ve otonom sistemlerde yaygındır. NVIDIA DRIVE Sim gibi platformlar, otonom sürüşlü araçları eğitmek için veri oluşturmak için kullanılır.
  • Üretken Modeller: Üretken Çekişmeli Ağlar (GAN'lar) ve daha yakın zamanda difüzyon modelleri gibi teknikler, üretken yapay zeka'nın temel bir bileşenidir. Bu modeller, tamamen yeni, gerçekçi örnekler oluşturmak için gerçek verilerden temel kalıpları öğrenir. Bu, özellikle çeşitli insan yüzleri veya karmaşık sahneler oluşturmak için kullanışlıdır.
  • Prosedürel Üretim: Bu yöntem, verileri otomatik olarak oluşturmak için algoritmalar ve kurallar kullanır. Büyük ölçekli ortamlar oluşturmak için video oyunu geliştirmede yaygın olarak kullanılır ve minimum manuel çabayla çeşitli eğitim verileri üretmek için uyarlanabilir.
  • Alan Rastgeleştirme: Bir simülasyonun parametrelerinin (aydınlatma, doku ve nesne konumları gibi) kasıtlı olarak değiştirildiği bir teknik. Bu, eğitilmiş modelin temel özelliklere odaklanmasını sağlayarak simüle edilmiş ortamlardan gerçek dünya ortamlarına daha iyi genellemesine yardımcı olur. Tobin ve diğerleri tarafından yazılan çığır açan bir makale, bunun robotik manipülasyon için etkinliğini göstermiştir.

Gerçek Dünya Uygulamaları

Sentetik veri kullanımı, gerçek dünya verilerinin bir darboğaz olduğu yerlerde atılımlar sağlayarak birçok sektörde genişlemektedir.

  1. Otonom Araçlar: Sürücüsüz otomobilleri eğitmek, kazalar veya aşırı hava koşulları gibi nadir ve tehlikeli senaryolar da dahil olmak üzere milyonlarca mil sürüşten elde edilen verileri gerektirir. Bu verileri gerçek dünyada toplamak güvenli ve pratik değildir. Sentetik veriler, geliştiricilerin bu uç durumları güvenli, kontrollü bir ortamda simüle etmelerini sağlayarak nesne algılama ve navigasyon sistemlerinin sağlamlığını artırır. Waymo gibi şirketler, test ve doğrulama için büyük ölçüde simülasyona güvenmektedir.
  2. Sağlık Hizmetlerinde Yapay Zeka: Tıbbi görüntü analizinde, hasta verileri oldukça hassastır ve HIPAA gibi katı gizlilik yasalarıyla korunmaktadır. Ayrıca, nadir hastalıklar için veri kıttır. Sentetik veriler, veri gizliliğinden ödün vermeden gerçekçi tıbbi taramalar (örneğin, BT veya MRG) oluşturmak için kullanılabilir. Bu, daha büyük ve daha dengeli veri kümeleri oluşturmaya yardımcı olarak yapay zeka yanlılığını azaltır ve cilt kanseri tespiti gibi durumlar için tanı modellerinin doğruluğunu artırır.

Sentetik Veri - Veri Artırma Karşılaştırması

Sentetik veri ve veri artırma (data augmentation) veri kümelerini geliştirmeyi amaçlasa da, farklı şekilde çalışırlar.

  • Veri Artırma: Bu teknik, mevcut gerçek dünya görüntülerine döndürme, kırpma veya renk kaydırma gibi dönüşümler uygulamayı içerir. Orijinal verilerin değiştirilmiş versiyonlarını oluşturarak eğitim kümesinin çeşitliliğini artırır. Ultralytics YOLO modellerinde kullanılan artırmalar hakkında daha fazla bilgi edinebilirsiniz.
  • Sentetik Veri: Bu, simülasyonlar veya üretken modeller kullanılarak sıfırdan tamamen yeni veriler oluşturmayı içerir. Mevcut veri noktalarından türetilmez ve orijinal veri kümesinde tamamen bulunmayan senaryoları temsil edebilir.

Özetle, veri artırma mevcut verileri çeşitlendirirken, sentetik veri yeni veriler oluşturur. Her ikisi de güçlü tekniklerdir ve Ultralytics HUB gibi platformlar aracılığıyla yönetilen son derece sağlam ve doğru derin öğrenme modelleri oluşturmak için birleştirilebilirler.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı