Yarı Denetimli Öğrenmenin AI modellerini geliştirmek, etiketleme maliyetlerini azaltmak ve doğruluğu artırmak için etiketli ve etiketsiz verileri nasıl birleştirdiğini keşfedin.
Yarı gözetimli öğrenme (YGÖ), aşağıdaki alanlarda güçlü bir paradigmadır boşluğu dolduran makine öğrenimi (ML) tam denetimli öğrenme ile denetimsiz öğrenme. Gözetim altında iken yöntemleri tamamen açıklamalı veri setleri gerektirir ve denetimsiz yöntemler tamamen etiketler olmadan çalışır, SSL Çok daha büyük bir etiketsiz veri havuzunun yanı sıra az miktarda etiketli veriden yararlanma. Birçok gerçek dünyada senaryolarında, ham veri elde etmek nispeten ucuzdur, ancak veri etiketleme pahalı, zaman alıcı ve insan uzmanlığı gerektirir. SSL, öğrenmeyi yönlendirmek için sınırlı etiketli örnekleri kullanarak bu darboğazı giderir süreci, modelin geniş etiketlenmemiş segmentlerden yapı ve kalıpları çıkarmasına izin vererek, böylece genel model doğruluğu ve genelleme.
SSL'nin arkasındaki temel mekanizma, etiketli verilerden etiketsiz verilere bilgi yaymayı içerir. Bu mekanizma Süreç genellikle küçük etiketli veri kümesi üzerinde bir başlangıç modelinin eğitilmesiyle başlar. Bu model daha sonra çıkarım yapmak için kullanılır etiketsiz veriler üzerinde tahminler. En emin tahminler -genellikle sözde etiketler olarak adlandırılır- zemin olarak ele alınır ve model bu genişletilmiş veri kümesi üzerinde yeniden eğitilir. Bu yinelemeli döngü şunları sağlar karar sınırlarını öğrenmek için sinir ağları sadece etiketli verilerden öğrenilenlerden daha sağlamdır.
SSL'de kullanılan yaygın teknikler şunlardır:
Yarı denetimli öğrenme, özellikle verinin bol olduğu ancak uzman açıklamasının yetersiz olduğu sektörlerde dönüştürücüdür. kıt.
SSL'yi tam olarak anlamak için onu benzer öğrenme paradigmalarından ayırmak faydalı olacaktır:
Yarı denetimli bir iş akışının uygulanması genellikle bir "öğretmen-öğrenci" döngüsü veya yinelemeli eğitim içerir. Aşağıda
kullanan kavramsal bir örnektir. ultralytics Python paketinden nasıl çıkarım yapılabileceğini göstermek için
Daha fazla eğitim için sözde etiket görevi görebilecek tahminler oluşturmak için etiketsiz veriler.
from ultralytics import YOLO
# Initialize the YOLO11 model (Teacher)
model = YOLO("yolo11n.pt")
# Train initially on a small, available labeled dataset
model.train(data="coco8.yaml", epochs=10)
# Run inference on a directory of unlabeled images to generate predictions
# These results can be filtered by confidence to create 'pseudo-labels'
results = model.predict(source="./unlabeled_data", save_txt=True, conf=0.8)
# The saved text files from prediction can now be combined with the original
# dataset to retrain a robust 'Student' model.
Aşağıdakiler gibi derin öğrenme çerçeveleri PyTorch ve TensorFlow özel SSL uygulamak için gerekli yapı taşlarını sağlar döngüler ve kayıp fonksiyonları. Modeller büyüdükçe ve veriye aç hale geldikçe, SSL gibi teknikler standart uygulama haline gelmektedir veri verimliliğini en üst düzeye çıkarmak için.
Yakında çıkacak olan Ultralytics Platformu, bu gibi iş akışlarını kolaylaştırmak ve ekiplerin geçişi yönetmesine yardımcı olmak için tasarlanmıştır kolaylaştırarak ham verilerden model dağıtımına veri küratörlüğü ve otomatik açıklama süreçleri. Tarafından Etiketsiz verileri etkin bir şekilde kullanan kuruluşlar, aşağıdaki gibi yüksek performanslı yapay zeka çözümlerini kullanabilir YOLO11 güvenmekten daha hızlı ve daha uygun maliyetli denetimli yöntemler.
