Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Yarı Denetimli Öğrenme

Yarı Denetimli Öğrenmenin AI modellerini geliştirmek, etiketleme maliyetlerini azaltmak ve doğruluğu artırmak için etiketli ve etiketsiz verileri nasıl birleştirdiğini keşfedin.

Yarı gözetimli öğrenme (YGÖ), aşağıdaki alanlarda güçlü bir paradigmadır boşluğu dolduran makine öğrenimi (ML) tam denetimli öğrenme ile denetimsiz öğrenme. Gözetim altında iken yöntemleri tamamen açıklamalı veri setleri gerektirir ve denetimsiz yöntemler tamamen etiketler olmadan çalışır, SSL Çok daha büyük bir etiketsiz veri havuzunun yanı sıra az miktarda etiketli veriden yararlanma. Birçok gerçek dünyada senaryolarında, ham veri elde etmek nispeten ucuzdur, ancak veri etiketleme pahalı, zaman alıcı ve insan uzmanlığı gerektirir. SSL, öğrenmeyi yönlendirmek için sınırlı etiketli örnekleri kullanarak bu darboğazı giderir süreci, modelin geniş etiketlenmemiş segmentlerden yapı ve kalıpları çıkarmasına izin vererek, böylece genel model doğruluğu ve genelleme.

Yarı Denetimli Öğrenme Nasıl Çalışır

SSL'nin arkasındaki temel mekanizma, etiketli verilerden etiketsiz verilere bilgi yaymayı içerir. Bu mekanizma Süreç genellikle küçük etiketli veri kümesi üzerinde bir başlangıç modelinin eğitilmesiyle başlar. Bu model daha sonra çıkarım yapmak için kullanılır etiketsiz veriler üzerinde tahminler. En emin tahminler -genellikle sözde etiketler olarak adlandırılır- zemin olarak ele alınır ve model bu genişletilmiş veri kümesi üzerinde yeniden eğitilir. Bu yinelemeli döngü şunları sağlar karar sınırlarını öğrenmek için sinir ağları sadece etiketli verilerden öğrenilenlerden daha sağlamdır.

SSL'de kullanılan yaygın teknikler şunlardır:

  • Sözde Etiketleme: Model, etiketlenmemiş veriler için etiketler üretir ve yüksek güvenirlikli tahminler eğitim verilerine eklenir. Bu genellikle şu alanlarda kullanılır güven eşikleri ile birlikte.
  • Tutarlılık Düzenlemesi: Bu yöntem, modelin bir kişi için aynı tahmini üretmesini teşvik eder. orijinal görüntü ve onun bozulmuş bir versiyonu (örn. veri artırımı). Eğer model nesne, görüntünün çevrilmesi veya hafifçe döndürülmesi sınıflandırmayı değiştirmemelidir. Hakkında daha fazla bilgi edinebilirsiniz Akademik literatürdeki tutarlılık düzenlemesi kavramları.
  • Grafik Tabanlı Yöntemler: Veri noktaları bir grafikte düğümler olarak temsil edilir ve burada kenarlar Benzerlik. Etiketler, etiketli düğümlerden etiketsiz komşularına yayılır, bu teknik genellikle grafik sinir ağı (GNN) araştırması.

Gerçek Dünya Uygulamaları

Yarı denetimli öğrenme, özellikle verinin bol olduğu ancak uzman açıklamasının yetersiz olduğu sektörlerde dönüştürücüdür. kıt.

  1. Tıbbi Görüntü Analizi: Sağlık hizmetlerinde, bir gibi görevler için etiketli veri kümesi tümör tespi̇ti̇ yüksek ücretli radyologların MRI veya CT taramalarına manuel olarak açıklama eklemelerini gerektirir. SSL ile araştırmacılar bir modeli aşağıdakiler üzerinde eğitebilir doktor onaylı taramalardan oluşan küçük bir set oluşturun ve daha sonra binlerce açıklamasız hastane arşivinden yararlanarak performans. Bu, maliyetleri önemli ölçüde azaltırken yüksek teşhis standartlarını da korur. Sağlık hizmetlerinde yapay zeka.
  2. Konuşma Tanıma: özel ses asistanları büyük miktarda ses verisi gerektirir. Bir yandan Binlerce saatlik sesi yazıya dökmek pratik değildir, teknoloji şirketleri yazıya dökülmüş küçük bir konuşma setini kullanarak bir temel modeli eğitir. Bu model daha sonra milyonlarca saatlik yazıya dökülmemiş sesin nüanslarından öğrenir. web verileri, farklı aksan ve lehçeleri anlama yeteneğini geliştirerek otomatik konuşma tanıma yoluyla.

İlgili Kavramların Farklılaştırılması

SSL'yi tam olarak anlamak için onu benzer öğrenme paradigmalarından ayırmak faydalı olacaktır:

  • SSL vs. Kendi Kendine Denetimli Öğrenme: Bir kısaltmayı paylaşmalarına rağmen, farklıdırlar. Kendi kendine denetimli öğrenme, verilerden kendi etiketlerini oluşturur yapı (örneğin, bir cümledeki bir sonraki kelimeyi veya bir görüntüdeki eksik bir yamayı tahmin etme) herhangi bir insan etiketi olmadan. Yarı denetimli öğrenme, süreci yönlendirmek için hala insan tarafından sağlanan etiketlerden oluşan bir tohum kümesine dayanır.
  • SSL ve Aktif Öğrenme: İçinde aktif öğrenme, model hangi veri noktalarının en kafa karıştırıcı olduğunu belirler ve açıkça bir insandan etiketleme yapmasını ister onlar. Buna karşın SSL, etiketlenmemiş verileri iş akışını kesintiye uğratmadan otomatik olarak çözmeye çalışır. insan girdisi.
  • SSL ve Transfer Öğrenimi: Transfer öğrenmesi şunları içerir bir kaynak görevden ( ImageNet gibi) model ağırlıkları ve bir hedef görev üzerinde ince ayar yapmak. SSL, aynı hedeften gelen etiketsiz verileri kullanmaya odaklanır Baştan itibaren öğrenmeyi iyileştirmek için dağıtım.

Pratik Uygulama

Yarı denetimli bir iş akışının uygulanması genellikle bir "öğretmen-öğrenci" döngüsü veya yinelemeli eğitim içerir. Aşağıda kullanan kavramsal bir örnektir. ultralytics Python paketinden nasıl çıkarım yapılabileceğini göstermek için Daha fazla eğitim için sözde etiket görevi görebilecek tahminler oluşturmak için etiketsiz veriler.

from ultralytics import YOLO

# Initialize the YOLO11 model (Teacher)
model = YOLO("yolo11n.pt")

# Train initially on a small, available labeled dataset
model.train(data="coco8.yaml", epochs=10)

# Run inference on a directory of unlabeled images to generate predictions
# These results can be filtered by confidence to create 'pseudo-labels'
results = model.predict(source="./unlabeled_data", save_txt=True, conf=0.8)

# The saved text files from prediction can now be combined with the original
# dataset to retrain a robust 'Student' model.

Araçlar ve Geleceğe Bakış

Aşağıdakiler gibi derin öğrenme çerçeveleri PyTorch ve TensorFlow özel SSL uygulamak için gerekli yapı taşlarını sağlar döngüler ve kayıp fonksiyonları. Modeller büyüdükçe ve veriye aç hale geldikçe, SSL gibi teknikler standart uygulama haline gelmektedir veri verimliliğini en üst düzeye çıkarmak için.

Yakında çıkacak olan Ultralytics Platformu, bu gibi iş akışlarını kolaylaştırmak ve ekiplerin geçişi yönetmesine yardımcı olmak için tasarlanmıştır kolaylaştırarak ham verilerden model dağıtımına veri küratörlüğü ve otomatik açıklama süreçleri. Tarafından Etiketsiz verileri etkin bir şekilde kullanan kuruluşlar, aşağıdaki gibi yüksek performanslı yapay zeka çözümlerini kullanabilir YOLO11 güvenmekten daha hızlı ve daha uygun maliyetli denetimli yöntemler.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın