Daha az etiketle doğruluğu artıran, maliyet-etkin bir makine öğrenimi yöntemi olan aktif öğrenmeyi keşfedin. Yapay zeka eğitimini nasıl dönüştürdüğünü öğrenin!
Aktif öğrenme dinamik bir yaklaşımdır optimize etmek için tasarlanmış makine öğrenimi (ML) Ek açıklama için en bilgilendirici veri noktalarını seçerek eğitim süreci. Standart gözetim altında öğrenmede, bir model pasif olarak büyük, önceden etiketlenmiş bir veri kümesi ile beslenir, bu da eğer veriler gereksiz veya bilgilendirici olmayan örnekler içerir. Aktif öğrenme, modelin aşağıdakileri yapmasına izin vererek bu paradigmayı değiştirir Bir bilgi kaynağını (genellikle bir insan uzman veya "kahin") belirli bir etiket istemek için etkileşimli olarak sorgular, belirsiz örnekler. Bu hedefe yönelik strateji, aşağıdaki işlemlerin miktarını önemli ölçüde azaltır yüksek eğitim verisi elde etmek için gerekli doğruluğu ile sınırlı projeler için idealdir. bütçeler veya katı zaman kısıtlamaları.
Aktif öğrenme süreci, genellikle aşağıdaki gibi tanımlanan yinelemeli bir döngü olarak işler döngü içinde insan iş akışı. Bu döngüsü, insan çabasının yalnızca modelin iyileştirilmesine en çok katkıda bulunan verilere odaklanmasını sağlar. Bu tipik iş akışı şunları içerir:
Bu yöntemin etkinliği büyük ölçüde örnekleme stratejisine bağlıdır. Belirsizlik örneklemesi algoritmanın karar sınırına en yakın örnekleri seçtiği en yaygın tekniktir. Kapsamlı ayrıntılar Bu stratejiler hakkında çeşitli aktif öğrenme literatür araştırmaları.
Aşağıdaki kod parçacığı, temel bir belirsizlik örnekleme döngüsünün nasıl uygulanacağını göstermektedir. Bir model yükler, tahmin eder ve düşük güvenirlikli tespitleri belirleyerek bunları manuel inceleme için işaretler.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on a list or directory of unlabeled images
results = model.predict(["image1.jpg", "image2.jpg"])
# Identify images where the model is uncertain
uncertain_samples = []
for result in results:
# Check if detections exist and if the maximum confidence is below a threshold
if result.boxes.conf.numel() > 0 and result.boxes.conf.max() < 0.6:
uncertain_samples.append(result.path)
print(f"Flagging {result.path} for manual labeling.")
print(f"Total uncertain images found: {len(uncertain_samples)}")
Aktif öğrenme özellikle aşağıdaki alanlarda değerlidir veri etiketleme pahalıdır veya uzmanlık gerektirir Uzmanlık.
Aktif öğrenme, etiketsiz verilerin kullanılmasını içerirken, diğer makine öğrenimi paradigmalarından farklıdır:
Aktif öğrenmeyi uygulamak için sağlam bir Makine Öğrenimi Operasyonları (MLOps) Model, veri kümesi ve açıklama arayüzü arasındaki veri akışını yönetmek için boru hattı. Verileri destekleyen araçlar versiyonlama ve yönetim, hangi örneklerin sorgulandığını takip etmek için gereklidir. Genel amaçlı kütüphaneler gibi scikit-learn bazı faydalar sunsa da, bilgisayarla görme iş akışları genellikle aşağıdakilerle özel entegrasyon gerektirir Seçilen görüntüleri görselleştirmek ve açıklama eklemek için görüntü veri kümeleri etkili bir şekilde. İleri düzey kullanıcılar Tahmin çıktılarının nasıl olduğunu görmek için Ultralytics GitHub deposu bu veri iyileştirme döngülerini besleyecek şekilde yapılandırılabilir.
