Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Yarı Denetimli Öğrenme

Yarı denetimli öğrenmenin, etiketli ve etiketlenmemiş verileri birleştirerek model doğruluğunu nasıl artırdığını keşfedin. Ultralytics kullanarak SSL iş akışlarını uygulamayı öğrenin.

Yarı denetimli öğrenme (SSL), makine öğreniminde (ML) iki geleneksel eğitim yöntemi arasında köprü görevi gören stratejik bir paradigmadır. Denetimli öğrenme tamamen tamamen etiketlenmiş veri kümelerine dayanırken, denetimsiz öğrenme herhangi bir etiket olmadan verilerde kalıplar bulmaya çalışır. SSL ise az miktarda etiketli veriyi çok daha büyük bir etiketlenmemiş veri havuzuyla birleştirerek çalışır. Bu yaklaşım, özellikle güvenlik kameralarından veya uydulardan alınan video görüntüleri gibi ham görüntülerin toplanmasının nispeten ucuz olduğu, ancak insan uzmanlar tarafından veri etiketleme sürecinin maliyetli, yavaş ve yoğun emek gerektiren gerçek dünya bilgisayar görme (CV) senaryolarında SSL, etiketlenmemiş örneklerin içinde gizli olan yapıyı etkili bir şekilde kullanarak, kapsamlı bir açıklama bütçesi gerektirmeden model doğruluğunu ve genellemeyi önemli ölçüde iyileştirebilir.

Yarı Denetimli Öğrenmenin Temel Mekanizmaları

SSL'nin temel amacı, etiketli küçük örnek kümesinde bulunan bilgileri daha büyük etiketlenmemiş kümeye yaymaktır. Bu, sinir ağının verilerin düşük yoğunluklu bölgelerinden geçen karar sınırlarını öğrenmesini sağlar ve daha sağlam sınıflandırma veya algılama ile sonuçlanır.

Çoğu yarı denetimli iş akışını iki popüler teknik yönlendirmektedir:

  • Sözde Etiketleme: Bu yöntemde, model önce sınırlı etiketli verilerle eğitilir. Daha sonra etiketlenmemiş veriler üzerinde çıkarım yapmak için kullanılır. Belirli bir güven eşiğini aşan tahminler "sözde etiketler" veya temel gerçek olarak değerlendirilir. Bu güvenilir tahminler eğitim verilerine eklenir ve model yeniden eğitilerek performansı yinelemeli olarak iyileştirilir.
  • Tutarlılık Düzenlemesi: Bu teknik, veri artırmaya dayanır. Buradaki fikir, bir modelin bir görüntü ve aynı görüntünün biraz değiştirilmiş (artırılmış) versiyonu için benzer tahminler üretmesi gerektiğidir. Orijinal ve artırılmış versiyon arasındaki tahmin farkını en aza indirerek, model gürültüden ziyade nesnenin temel özelliklerine odaklanmayı öğrenir ve aşırı uyumlanma ile başa çıkma yeteneğini geliştirir.

YOLO ile Pratik Uygulama

Aşağıdaki Python , ultralytics paketini kullanan basit bir sözde etiketleme iş akışını göstermektedir. Burada, küçük bir veri kümesinde bir YOLO26 modeli eğitiyoruz ve ardından bunu, etiketlenmemiş görüntülerin bulunduğu bir dizin için etiketler oluşturmak üzere kullanıyoruz.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train initially on a small available labeled dataset
model.train(data="coco8.yaml", epochs=10)

# Run inference on unlabeled data to generate pseudo-labels
# Setting save_txt=True saves the detections as text files for future training
results = model.predict(source="./unlabeled_images", save_txt=True, conf=0.85)

Gerçek Dünya Uygulamaları

Yarı denetimli öğrenme, verilerin bol olduğu ancak uzmanlığın az olduğu sektörleri dönüştürüyor.

  • Tıbbi Görüntüleme: Sağlık hizmetlerinde yapay zeka alanında, taramalar (X-ışınları, MRG'ler) elde etmek standart bir prosedürdür, ancak her pikseli tümör tespitiiçin sertifikalı bir radyolog tarafından notlandırmak çok pahalıdır. SSL, araştırmacıların uzmanlar tarafından notlandırılmış vakaların sadece bir kısmını kullanarak yüksek performanslı modeller eğitmelerine olanak tanır ve binlerce arşivlenmiş taramadan yararlanarak modelin biyolojik yapıları anlamasını geliştirir. .
  • Otonom Sürüş: Otonom araç şirketleri, filo araçlarından her gün petabaytlarca video verisi toplar. Nesne algılama ve anlamsal segmentasyon için her kareyi etiketlemek imkansızdır. SSL sayesinde sistem, etiketlenmemiş sürüş saatlerinin büyük çoğunluğundan öğrenerek karmaşık yol ortamlarını, hava koşullarını ve nadir görülen sınır durumlarını daha iyi anlayabilir.

İlgili Kavramları Ayırt Etme

AI çözümlerini etkili bir şekilde uygulamak için, SSL'nin benzer stratejilerden nasıl farklı olduğunu anlamak çok önemlidir:

  • vs. Aktif Öğrenme: Her ikisi de etiketlenmemiş verilerle ilgilenmekle birlikte, etiketleme yaklaşımları farklıdır. SSL, model tahminlerine göre otomatik olarak etiketler atar. Buna karşılık, aktif öğrenme en "karışık" veya belirsiz veri noktalarını belirler ve açıkça bir insan müdahalesi talep ederek bunları etiketler, insanın zamanını tamamen ortadan kaldırmak yerine optimize eder.
  • vs. Transfer Öğrenimi: Transfer öğrenimi, büyük bir harici veri seti ( ImageNetgibi) üzerinde önceden eğitilmiş bir modeli alıp, onu belirli görevinize göre ince ayarlamaktır. SSL ise, eğitim sürecinin kendisi sırasında belirli veri kümesi dağılımınızın etiketlenmemiş kısmını kullanmaya odaklanır.
  • vs. Öz Denetimli Öğrenme: İsimleri benzer olsa da, öz denetimli öğrenme genellikle "gerekçe görevleri"ni (örneğin, görüntü parçalarından oluşan bir yapboz bulmacasını çözmek gibi) ifade eder; bu görevlerde veriler, herhangi bir harici etiket olmadan kendi denetim sinyallerini üretir. SSL, süreci yönlendirmek için daha küçük bir doğrulanmış etiket kümesinin kullanılmasını özellikle ima eder.

Araçlar ve Geleceğe Bakış

Derin öğrenme (DL) modellerinin boyutu büyüdükçe, veri kullanımının verimliliği çok önemli hale geliyor. PyTorch ve TensorFlow , bu gelişmiş eğitim döngüleri için hesaplama arka ucunu sağlar . Ayrıca, Ultralytics gibi araçlar veri kümesi yönetiminin yaşam döngüsünü basitleştiriyor. Otomatik açıklama gibi özellikleri kullanarak ekipler, yarı denetimli iş akışlarını daha kolay bir şekilde uygulayabilir ve ham verileri hızla üretime hazır model ağırlıklarına dönüştürebilir. MLOps'taki bu gelişme, yüksek doğruluklu görme sistemleri oluşturmanın önündeki engellerin daha da azalmasını sağlıyor.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın