Data-Centric AI
Veri kalitesine öncelik vererek model performansını artırmak için Veri Merkezli Yapay Zekayı keşfet. Ultralytics Platform'u kullanarak Ultralytics YOLO26 için veri kümelerini nasıl düzenleyeceğini öğren.
Veri Odaklı Yapay Zeka, makine öğrenimine yönelik, model mimarisini veya hiperparametreleri ayarlamaya odaklanmak yerine, bir modeli eğitmek için kullanılan veri kümesinin kalitesini iyileştirmeye odaklanan bir felsefe ve yaklaşımdır. Geleneksel model odaklı geliştirmede mühendisler, daha iyi performans elde etmek için algoritma üzerinde yinelemeler yaparken genellikle veri kümesini sabit tutarlar. Veri odaklı yapay zeka bu paradigmayı tersine çevirerek, birçok modern uygulama için model mimarisinin zaten yeterince gelişmiş olduğunu ve performansı artırmanın en etkili yolunun verinin kendisini sistematik olarak işlemek olduğunu öne sürer. Bu süreç; verilerin tutarlı, çeşitli ve gerçek dünya problemini temsil eder durumda olmalarını sağlamak için veri kümelerinin temizlenmesini, etiketlenmesini, artırılmasını ve kürasyonunu içerir.
Link to this sectionTemel Felsefe: Nicelikten Ziyade Veri Kalitesi#
Veri odaklı metodolojilere geçiş, "çöp girerse çöp çıkar" ilkesinin makine öğreniminde temel bir gerçek olduğunu kabul eder. Eğer veri gürültülü veya yanlıysa, sadece daha fazla veri eklemek her zaman çözüm değildir. Bunun yerine bu yaklaşım, yüksek kaliteli bilgisayarlı görü veri kümelerinin önemini vurgular. Geliştiriciler, veri kalitesine ve tutarlılığa öncelik vererek, genellikle devasa ve karmaşık veri kümeleriyle olduğundan daha küçük ve iyi küratörlük edilmiş veri kümeleriyle daha yüksek doğruluk oranlarına ulaşabilirler.
Bu felsefe, modelin hangi veri noktalarının bir sonraki aşamada etiketlenmesinin en değerli olduğunu belirlemeye yardımcı olduğu aktif öğrenme ile yakından ilişkilidir. Ultralytics Platform gibi araçlar, veri etiketleme ve yönetimi süreçlerini kolaylaştırarak ekiplerin veri kümesi sağlığını iyileştirme konusunda iş birliği yapmalarına olanak tanıyarak bu süreci destekler. Bu yaklaşım, veri kümesinin genellikle statik bir varlık olarak ele alındığı tamamen denetimli öğrenme iş akışlarıyla zıtlık oluşturur.
Link to this sectionVeri Odaklı Yapay Zekada Temel Teknikler#
Veri odaklı bir stratejiyi uygulamak, basit veri toplamanın ötesine geçen çeşitli pratik adımları içerir.
- Etiket Tutarlılığı: Tüm etiketleyicilerin nesneleri tamamen aynı şekilde etiketlediğinden emin olmak çok önemlidir. Örneğin, nesne algılamada, bir arabanın yan aynasının sınırlayıcı kutuya (bbox) dahil edilip edilmeyeceğini kesin olarak tanımlamak, model performansı üzerinde önemli bir etkiye sahip olabilir.
- Veri Artırma: Uç durumları kapsamak için mevcut verilere sistematik olarak dönüşümler uygulamak. Döndürme (rotation) ve mozaik artırma gibi tekniklerin modellerin daha iyi genelleme yapmasına nasıl yardımcı olduğunu anlamak için veri artırma hakkındaki temel kılavuzumuzu okuyabilirsin.
- Hata Analizi: Modelin başarısız olduğu belirli sınıfları veya senaryoları tanımlamak ve bu boşlukları gidermek için hedefe yönelik veri toplamak. Bu süreç genellikle zayıf noktaları tespit etmek için karmaşıklık matrislerinin incelenmesini içerir.
- Veri Temizleme: Yinelenen görüntüleri kaldırmak, yanlış etiketlenmiş örnekleri düzeltmek ve sinir ağının kafasını karıştırabilecek düşük kaliteli verileri filtrelemek.
Link to this sectionGerçek Dünya Uygulamaları#
Veri odaklı yaklaşımlar, güvenilirliğin tartışılamaz olduğu sektörleri dönüştürüyor.
-
Tıbbi Görüntüleme: Tıbbi görüntülemede tümör tespiti gibi alanlarda milyonlarca görüntü elde etmek imkansızdır. Bunun yerine araştırmacılar, uzmanlar tarafından gözden geçirilmiş, yüksek doğruluklu veri kümelerini küratörlük etmeye odaklanır. Veri odaklı bir yaklaşım, bir segmentasyon maskesindeki her pikselin kesin olmasını sağlar, çünkü belirsiz etiketler hayati tehlike yaratan hatalara yol açabilir.
-
Üretimde Kalite Kontrol: Görsel denetim sistemleri dağıtılırken, çizik veya ezik gibi kusurlar mükemmel parçalara kıyasla nadirdir. Veri odaklı bir strateji, modelin her öğe için sadece "geçer" tahmini yapmamasını sağlamak amacıyla veri kümesini dengelemek için kusur verilerini sentezlemeyi veya özellikle yakalamayı içerir.
Link to this sectionVeri Odaklı Yapay Zeka vs. Model Odaklı Yapay Zeka#
Veri Odaklı Yapay Zeka ile Model Odaklı Yapay Zeka'yı ayırt etmek önemlidir. Model odaklı bir iş akışında veri kümesi sabittir ve hedef, model mimarisini değiştirerek (örneğin YOLO11'den özel bir ResNet'e geçerek) veya öğrenme oranı gibi parametreleri ayarlayarak metrikleri iyileştirmektir. Veri odaklı bir iş akışında ise model mimarisi sabittir (örneğin YOLO26'yı standartlaştırarak) ve hedef, etiketleri temizleyerek, çeşitli örnekler ekleyerek veya aykırı değerleri ele alarak metrikleri iyileştirmektir.
Aşağıdaki kod parçacığı, basit bir veri odaklı incelemeyi göstermektedir: eğitimden önce veri kümeni bozuk görüntüler için kontrol etmek. Bu, eğitim hattının kötü veriler nedeniyle başarısız olmamasını sağlar.
from ultralytics.data.utils import check_cls_dataset
# Validate a classification dataset structure and integrity
# This helps identify issues with data organization before training begins
try:
# Checks the dataset defined in a YAML or path structure
check_cls_dataset("mnist", split="train")
print("Dataset structure is valid and ready for data-centric curation.")
except Exception as e:
print(f"Data issue found: {e}")Link to this sectionVeri Odaklı Geliştirme İçin Araçlar#
Veri odaklı yapay zekayı etkili bir şekilde uygulamak için geliştiriciler güçlü araçlara ihtiyaç duyarlar. Ultralytics Platform, verinin yaşam döngüsünü yönetmek için merkezi bir merkez görevi görür ve tutarlılığı korurken etiketleme sürecini hızlandıran otomatik etiketleme için özellikler sunar. Ayrıca explorer araçlarını kullanmak, kullanıcıların dağılımı ve yanlılığı anlamak için veri kümelerini anlamsal olarak sorgulamalarına (örneğin "gece vakti kırmızı arabaların olduğu tüm görüntüleri bul") olanak tanır.
Veriye odaklanarak mühendisler, otonom araçlar veya akıllı perakende gibi dinamik ortamlarda dağıtım için daha sağlam, adil ve pratik sistemler inşa edebilirler. Bu değişim, birçok problem için kodun halledilmiş bir sorun olduğunu, ancak verinin inovasyonun sınırlarını oluşturmaya devam ettiğini kabul eder.






