Veri kalitesine öncelik vererek model performansını artırmak için veri odaklı yapay zekayı keşfedin. Ultralytics kullanarak Ultralytics için veri kümelerini düzenlemeyi öğrenin.
Veri Odaklı Yapay Zeka, model mimarisini veya hiperparametreleri ayarlamaya odaklanmak yerine, modeli eğitmek için kullanılan veri kümesinin kalitesini iyileştirmeye odaklanan bir makine öğrenimi felsefesi ve yaklaşımıdır. Geleneksel model odaklı geliştirmede, mühendisler genellikle veri kümesini sabit tutarken, daha iyi performans elde etmek için algoritmayı yinelerler. Veri odaklı yapay zeka, bu paradigmayı tersine çevirerek, birçok modern uygulama için model mimarisinin zaten yeterince gelişmiş olduğunu ve performansı iyileştirmenin en etkili yolunun sistematik olarak verinin kendisini mühendislik yapmak olduğunu öne sürer. Veri merkezli yapay zeka bu paradigmayı tersine çevirerek, birçok modern uygulama için model mimarisinin zaten yeterince gelişmiş olduğunu ve performansı iyileştirmenin en etkili yolunun verileri sistematik olarak mühendislik yapmak olduğunu öne sürer. Bu, veri kümelerinin tutarlı, çeşitli ve gerçek dünyadaki sorunları temsil etmesini sağlamak için temizleme, etiketleme, genişletme ve düzenleme işlemlerini içerir.
Veri merkezli metodolojilere geçiş, "çöp girerse çöp çıkar" ilkesinin makine öğreniminde temel bir gerçek olduğunu kabul eder . Veriler gürültülü veya önyargılıysa, sadece daha fazla veri eklemek her zaman çözüm değildir. Bunun yerine, bu yaklaşım yüksek kaliteli bilgisayar görme veri kümelerinin önemini vurgular. Veri kalitesini ve tutarlılığını önceliklendirerek, geliştiriciler genellikle büyük ve dağınık veri kümelerine kıyasla daha küçük, iyi düzenlenmiş veri kümeleriyle daha yüksek doğruluk elde edebilirler. Bu, makine öğreniminin gelişmiş bir aşamasına işaret eder.
Bu felsefe, aktif öğrenme ile yakından bağlantılıdır. Bu model, hangi veri noktalarının etiketlemek için en değerli olduğunu belirlemeye yardımcı olur. Ultralytics gibi araçlar, veri açıklama ve yönetimini kolaylaştırarak ekiplerin veri setinin sağlığını iyileştirmek için işbirliği yapmasını sağlar. Bu, veri setinin genellikle statik bir eser olarak ele alındığı, tamamen denetimli öğrenme iş akışlarından farklıdır.
Veri odaklı bir strateji uygulamak, basit veri toplamanın ötesine geçen birkaç pratik adımı içerir.
Veri odaklı yaklaşımlar, güvenilirliğin tartışılmaz olduğu sektörleri dönüştürüyor.
Veri Merkezli AI ile Model Merkezli AI'yı birbirinden ayırmak önemlidir. Model merkezli bir iş akışında, veri kümesi sabittir ve amaç, model mimarisini değiştirerek metrikleri iyileştirmektir (örneğin, YOLO11 'den özel bir ResNet'e geçmek) veya öğrenme oranı gibi parametreleri ayarlamak. Veri merkezli bir iş akışında, model mimarisi sabittir (örneğin, YOLO26'da standartlaştırma) ve amaç, etiketleri temizleyerek, çeşitli örnekler ekleyerek veya uç değerleri işleyerek metrikleri iyileştirmektir .
Aşağıdaki kod parçacığı, basit bir veri odaklı incelemeyi göstermektedir: eğitimden önce veri kümenizde bozuk görüntüler olup olmadığını kontrol etmek. Bu, eğitim boru hattınızın hatalı veriler nedeniyle başarısız olmamasını sağlar.
from ultralytics.data.utils import check_cls_dataset
# Validate a classification dataset structure and integrity
# This helps identify issues with data organization before training begins
try:
# Checks the dataset defined in a YAML or path structure
check_cls_dataset("mnist", split="train")
print("Dataset structure is valid and ready for data-centric curation.")
except Exception as e:
print(f"Data issue found: {e}")
Veri odaklı yapay zekayı etkili bir şekilde uygulamak için geliştiriciler sağlam araçlara güveniyorlar. Ultralytics , verilerinizin yaşam döngüsünü yönetmek için merkezi bir hub görevi görüyor ve etiketleme sürecini hızlandırırken tutarlılığı koruyan otomatik açıklama özellikleri sunuyor. Ayrıca, Ayrıca, keşif araçlarını kullanarak kullanıcılar veri kümelerini anlamsal olarak sorgulayabilir (ör. "gece çekilmiş tüm kırmızı araba resimlerini bul") ve dağılım ve önyargıları anlayabilir.
Verilere odaklanarak, mühendisler otonom araçlar veya akıllı perakende gibi dinamik ortamlarda kullanıma daha sağlam, adil ve pratik sistemler oluşturabilirler. Bu değişim, birçok sorun için kodun çözülmüş bir sorun olduğunu, ancak verilerin inovasyonun öncüsü olmaya devam ettiğini kabul etmektedir.