Synthetic Data
Sentetik verinin yapay zekayı ve makine öğrenimini nasıl güçlendirdiğini keşfet. Model doğruluğunu artırmak için Ultralytics YOLO26 adına yüksek kaliteli veri kümeleri üretmeyi hemen öğren.
Sentetik veri, gerçek dünya verilerinin istatistiksel özelliklerini, modellerini ve yapısal karakteristiklerini taklit eden yapay olarak üretilmiş bilgilerdir. Yapay zeka (AI) ve makine öğrenimi (ML) gibi hızla gelişen alanlarda, bu veri; orijinal verileri toplamanın pahalı, zaman alıcı veya gizlilik düzenlemeleriyle kısıtlı olduğu durumlarda kritik bir kaynak görevi görür. Gerçek dünya olaylarından elde edilen organik verilerin aksine, sentetik veri bilgisayar simülasyonları ve gelişmiş üretken modeller gibi teknikler kullanılarak algoritmik olarak oluşturulur. Gartner analistleri, 2030 yılına kadar sentetik verilerin AI modellerinde gerçek verilerin önüne geçeceğini ve akıllı sistemlerin oluşturulma ve dağıtılma şeklini kökten değiştireceğini öngörüyor.
Link to this sectionAI Geliştirmede Sentetik Verinin Rolü#
Sentetik veri setlerini kullanmanın temel nedeni, geleneksel veri toplama ve etiketleme yöntemlerinde var olan sınırlamaları aşmaktır. Sağlam bilgisayarlı görü (CV) modellerini eğitmek, genellikle çeşitli senaryolar içeren devasa veri setleri gerektirir. Nadir hastalık teşhisi veya tehlikeli uç durumdaki trafik kazaları gibi gerçek dünya verilerinin kıt olduğu durumlarda, sentetik veriler bu açığı kapatır.
Bu veriyi üretmek, geliştiricilerin ihtiyaç anında mükemmel şekilde etiketlenmiş eğitim verileri oluşturmasına olanak tanır. Buna nesne algılama için hassas sınırlayıcı kutular (bounding boxes) veya anlamsal bölütleme için piksel mükemmelliğinde maskeler dahildir ve manuel etiketleme süreçlerinde sıkça karşılaşılan insan hatalarını ortadan kaldırır. Ayrıca, mühendislerin veri setlerini yeterince temsil edilmeyen gruplar veya çevresel koşullarla bilinçli bir şekilde dengelemesine olanak tanıyarak AI yanlılığı sorununu ele alır ve daha adil bir model performansı sağlar.
Link to this sectionGerçek Dünya Uygulamaları#
Sentetik veri; veri gizliliği, güvenlik ve ölçeklenebilirliğin ön planda olduğu sektörlerde devrim yaratıyor.
- Otonom Sürüş Simülasyonları: Otonom araçları yalnızca fiziksel dünyada test etmek risklidir ve coğrafi olarak sınırlıdır. Şirketler, algılama sistemlerini eğitmek için NVIDIA Omniverse gibi fotogerçekçi simülatörlerden yararlanır. Bu simülatörler milyarlarca sanal mil oluşturarak AI'yı gerçek dünyada tutarlı bir şekilde yakalaması zor olan tehlikeli hava koşullarına, düzensiz yaya davranışlarına ve karmaşık şehir yerleşimlerine maruz bırakır.
- Sağlık ve Tıbbi Görüntüleme: HIPAA ve GDPR gibi hasta gizliliği yasaları, tıbbi kayıtların paylaşımını sıkı bir şekilde düzenler. Sentetik veri, X-ışınları veya MRI taramaları gibi, kişisel olarak tanımlanabilir hiçbir bilgi içermeden patoloji işaretlerini koruyan gerçekçi tıbbi görüntü analizi veri setlerinin oluşturulmasını sağlar. Bu sayede araştırmacılar, hasta gizliliğini ihlal etmeden iş birliği içinde tümör algılama modelleri eğitebilirler.
Link to this sectionGörüntüleme AI'sı İçin Sentetik Veri Oluşturma#
Yüksek kaliteli sentetik veriler oluşturmak genellikle iki ana yaklaşım içerir: simülasyon motorları ve üretken AI. Unity Engine gibi simülasyon motorları, fizik tabanlı aydınlatma ve dokularla sahneleri oluşturmak için 3D grafikler kullanır. Alternatif olarak, Üretken Çekişmeli Ağlar (GANs) ve difüzyon modelleri gibi üretken modeller, yeni ve fotogerçekçi örnekleri sentezlemek için gerçek verilerin dağılımını öğrenir.
Sentetik bir veri seti oluşturulduktan sonra, yüksek performanslı modelleri eğitmek için kullanılabilir. Aşağıdaki Python örneği, bir görüntü üzerinde çıkarım (inference) yapmak için ultralytics paketini kullanarak potansiyel olarak sentetik verilerle eğitilmiş bir modelin nasıl yükleneceğini göstermektedir.
from ultralytics import YOLO
# Load the YOLO26 model (latest stable generation for superior accuracy)
model = YOLO("yolo26n.pt")
# Run inference on a source image (this could be a synthetic validation image)
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detection results to verify model performance
results[0].show()Link to this sectionSentetik Veri ve Veri Çoğaltma (Data Augmentation) Karşılaştırması#
Her iki teknik de veri setlerini genişletmeyi amaçlasa da farklı şekillerde işlediği için sentetik veriyi veri çoğaltma yönteminden ayırmak faydalıdır.
- Veri Çoğaltma, hafif varyasyonlar oluşturmak için mevcut gerçek dünya görüntülerine döndürme, kırpma veya renk ayarı gibi dönüşümler uygulamayı içerir. Orijinal veri kaynağına dayanır.
- Sentetik Veri, algoritmalar veya simülasyonlar kullanarak sıfırdan tamamen yeni veri örneklerinin oluşturulmasını içerir. Her çıktı için orijinal bir görüntü gerektirmez, bu da kamera tarafından hiç yakalanmamış senaryoların üretilmesine olanak tanır.
Ultralytics Platform üzerindeki modern iş akışları genellikle her iki yaklaşımı da birleştirir: veri setindeki boşlukları doldurmak için sentetik veriler kullanılır ve YOLO26 gibi modellerin sağlamlığını en üst düzeye çıkarmak için eğitim sırasında veri çoğaltma uygulanır.






