Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Veri Odaklı Yapay Zeka

Model performansını artırmak için veri kümesi kalitesini iyileştirme yaklaşımı olan Veri Merkezli YZ'yi keşfedin. Güçlü bir YZ için neden sadece daha iyi bir modelin değil, daha iyi verilerin de önemli olduğunu öğrenin.

Veri Merkezli Yapay Zeka, yapay zekanın geliştirilmesine yönelik stratejik bir yaklaşımdır. yapay zeka (AI) sistemleri model mimarisi üzerinde yineleme yapmak yerine öncelikle eğitim verilerinin kalitesini artırmaya odaklanır. Geleneksel iş akışlarında, geliştiriciler genellikle veri kümesini sabit bir girdi olarak ele alır ve ince ayar yapmak için önemli çaba harcar hiperparametreler veya karmaşık tasarımlar sinir ağı (NN) yapıları. Buna karşılık, bir veri merkezli metodoloji model kodunu ele alır - örneğin Ultralytics YOLO11-nispeten statik bir temel olarak, mühendislik çabalarını sistematik veri temizleme, etiketleme tutarlılığı ve artırmaya yönlendirerek performans.

Temel Felsefe: Nicelikten Çok Nitelik

Herhangi birinin etkinliği makine öğrenimi (ML) sistemi temelde "çöp girer, çöp çıkar" prensibiyle sınırlıdır. En gelişmiş algoritmalar bile Gürültülü veya yanlış etiketlenmiş girdilerden etkili örüntüler. Veri Merkezli Yapay Zeka, birçok pratik uygulama için uygulamalarında, eğitim verileri en başarı için önemli bir değişkendir. Bu yaklaşım, daha küçük, yüksek kaliteli bir veri setinin genellikle daha iyi sonuçlar verdiğini vurgulamaktadır büyük, gürültülü birinden daha iyi sonuçlar verir.

Andrew Ng gibi bu felsefenin savunucuları, aşağıdaki hususları ileri sürmektedir YZ topluluğunun odağı orantısız bir şekilde model merkezli inovasyona yönelmiştir. Sağlam sistemler inşa etmek, mühendisler aktif öğrenme süreçlerine katılmalıdır burada hata modlarını yinelemeli olarak belirler ve veri kümesini iyileştirerek bunları düzeltirler. Bu hassasiyeti içerir veri etiketleme, kopyaları kaldırma ve kenar işleme Modelin classify zorlandığı durumlar.

Temel Teknikler ve Uygulama

Veri merkezli bir stratejinin uygulanması, veri setini maksimum düzeyde tasarlamak için tasarlanmış çeşitli teknik süreçleri içerir bilgi yoğunluğu ve tutarlılığı.

  • Sistematik Veri Temizliği: Bu, ek açıklamalardaki hataların tespit edilmesini ve düzeltilmesini içerir, örneğin Sıkı olmayan sınırlayıcı kutuların tanımlanması bir nesneyi kapsar veya sınıf uyuşmazlığı hatalarını düzeltir.
  • Veri Büyütme: Geliştiriciler şunları kullanır yapay olarak veri artırma teknikleri veri kümesinin çeşitliliğini genişletir. Döndürme, ölçekleme ve renk ayarı gibi dönüşümler uygulayarak model, görülmeyen ortamlara daha iyi genelleme yapmayı öğrenir.
  • Sentetik Veri Üretimi: Gerçek dünya verileri az olduğunda, ekipler aşağıdakileri üretebilir Veri setindeki boşlukları doldurmak için sentetik veriler, nadir sınıfların yeterince temsil edilmesini sağlamak.
  • Hata Analizi: Yalnızca aşağıdaki gibi toplu ölçümlere bakmak yerine doğruluk, mühendisler belirli örnekleri analiz eder model başarısız olur ve bu belirli zayıflıkları ele almak için hedeflenen verileri toplar.

Aşağıdaki Python kodu, eğitim sırasında veri merkezli artırma tekniklerinin nasıl uygulanacağını göstermektedir ultralytics Paket.

from ultralytics import YOLO

# Load the YOLO11 model
model = YOLO("yolo11n.pt")

# Train with specific data augmentations to improve generalization
# 'degrees' adds rotation, 'mixup' blends images, and 'copy_paste' adds object instances
results = model.train(
    data="coco8.yaml",
    epochs=10,
    degrees=15.0,  # Random rotation up to +/- 15 degrees
    mixup=0.1,  # Apply MixUp augmentation with 10% probability
    copy_paste=0.1,  # Use Copy-Paste augmentation
)

Gerçek Dünya Uygulamaları

Veri merkezli bir yaklaşım benimsemek, aşağıdaki sektörlerde kritik öneme sahiptir bilgisayarla görme (CV) hassasiyeti pazarlık edilemez.

  1. Hassas Tarım: İçinde Tarımda yapay zeka, yapay zeka ile Sağlıklı bir mahsul ile erken evre hastalığı olan bir mahsulün ayırt edilmesi genellikle ince görsel ipuçlarına dayanır. Veri merkezli bir ekip şunlara odaklanacaktır küratörlük yüksek kaliteli bilgisayarla görme veri seti özellikle çeşitli aydınlatma koşulları ve büyüme aşamaları altındaki hastalık örneklerini içeren Model, alakasız arka plan özelliklerini hastalık sınıfıyla ilişkilendirmeyi öğrenmez.
  2. Endüstriyel Denetim: İçin Üretimde yapay zeka, kusurlar meydana gelebilir her on bin birimde sadece bir kez. Standart bir model eğitim çalışması bu nadir olayları göz ardı edebilir. İstihdam ederek anomali tespit stratejileri ve manuel Mühendisler, bu belirli kusurların daha fazla görüntüsünü tedarik ederek veya sentezleyerek sistemin yüksek kalite kontrol standartları için gerekli geri çağırma oranları ISO gibi kuruluşlar tarafından tanımlanmıştır.

İlgili Kavramları Ayırt Etme

Veri Merkezli Yapay Zekayı anlamak, onu makine öğrenimi ekosistemindeki benzer terimlerden ayırmayı gerektirir.

  • Model Merkezli Yapay Zeka: Bu, veri setinin sabit tutulduğu ters yaklaşımdır ve iyileştirmeler şu yollarla aranmaktadır hiperparametre ayarı veya mimari değişiklikler. üzerinde bulunan araştırma makalelerinde en son teknolojinin sınırlarını zorlamak için gerekli olsa da IEEE Xplore, genellikle azalan getiri sağlar verilerin temizlenmesine kıyasla üretim.
  • Büyük Veri: Büyük Veri öncelikle aşağıdakileri ifade eder bilginin hacmi, hızı ve çeşitliliği. Veri Merkezli Yapay Zeka mutlaka "büyük" veri gerektirmez; Daha ziyade, "akıllı" veri gerektirir. Küçük, mükemmel etiketlenmiş bir veri kümesi genellikle büyük, gürültülü bir veri kümesinden daha iyi performans gösterir. Bir.
  • Keşifsel Veri Analizi (EDA): Veri görselleştirme ve EDA adımları veri merkezli iş akışı içinde. EDA tutarsızlıkların belirlenmesine yardımcı olur, ancak Veri Merkezli YZ şunları kapsar iyileştirmek için bu sorunları düzeltmenin tüm mühendislik yaşam döngüsü çıkarım motoru.
  • MLOps: Makine Öğrenimi Operasyonları (MLOps) yapay zeka üretiminin yaşam döngüsünü yönetmek için altyapı ve boru hatları sağlar. Veri Merkezli Yapay Zeka içinden akan verilerin güvenilir modeller oluşturmasını sağlamak için MLOps boru hatlarında uygulanan metodoloji.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın