Sözlük

Yarı Denetimli Öğrenme

Yarı Denetimli Öğrenmenin yapay zeka modellerini geliştirmek, etiketleme maliyetlerini azaltmak ve doğruluğu artırmak için etiketli ve etiketsiz verileri nasıl birleştirdiğini keşfedin.

Yarı denetimli öğrenme (SSL), denetimli öğrenme ile denetimsiz öğrenme arasındaki boşluğu dolduran bir makine öğrenimi (ML) tekniğidir. Öğrenme doğruluğunu artırmak için az miktarda etiketli veri ile birlikte büyük miktarda etiketsiz veriden yararlanır. Birçok gerçek dünya senaryosunda, etiketsiz veri elde etmek ucuzdur, ancak veri etiketleme işlemi maliyetli ve zaman alıcıdır. SSL, modellerin daha küçük etiketli set tarafından sağlanan yapı ve bilgiler tarafından yönlendirilen geniş etiketsiz örnek havuzundan öğrenmesine izin vererek bu zorluğun üstesinden gelir. Bu yaklaşım, modellerin yüksek performans elde etmek için devasa veri kümelerine ihtiyaç duyduğu derin öğrenmede (DL) özellikle güçlüdür.

Yarı Gözetimli Öğrenme Nasıl Çalışır?

SSL'nin arkasındaki temel fikir, etiketli verileri bir başlangıç modeli oluşturmak için kullanmak ve daha sonra bu modeli etiketsiz veriler üzerinde tahminler yapmak için kullanmaktır. Modelin en emin tahminleri daha sonra "sözde etiketler" olarak ele alınır ve eğitim setine eklenir. Model daha sonra orijinal etiketler ve yüksek güvenirlikli sözde etiketlerin bu kombinasyonu üzerinde yeniden eğitilir. Bu yinelemeli süreç, modelin yalnızca küçük etiketli kısmı değil, tüm veri kümesinin altında yatan yapıyı öğrenmesini sağlar.

Yaygın SSL teknikleri şunları içerir:

  • Tutarlılık Düzenlemesi: Bu yöntem, giriş verisi hafifçe bozulduğunda bile modelin tahminlerinin tutarlı kalması gerektiği fikrini uygular. Örneğin, küçük veri artırımına sahip bir görüntü aynı sınıflandırmayı vermelidir.
  • Üretken Modeller: Generative Adversarial Networks (GANs) gibi teknikler, gerçek veri dağılımına benzeyen veriler üretmeyi öğrenerek sınıflar arasındaki karar sınırlarının daha iyi tanımlanmasına yardımcı olabilir.
  • Grafik Tabanlı Yöntemler: Bu yöntemler veri noktalarını bir grafikteki düğümler olarak temsil eder ve etiketleri yakınlıklarına veya benzerliklerine göre etiketli düğümlerden etiketsiz düğümlere yayar. Teknik bir genel bakış akademik araştırmalarda bulunabilir.

Gerçek Dünya Uygulamaları

SSL, etiketlemenin darboğaz oluşturduğu alanlarda oldukça etkilidir. Öne çıkan iki örnek şunlardır:

  1. Tıbbi Görüntü Analizi: Tümör tespiti için MRI veya CT gibi tıbbi taramaların etiketlenmesi uzman radyologlar gerektirir ve çok pahalıdır. SSL ile bir model birkaç yüz etiketli tarama üzerinde eğitilebilir ve ardından hastane arşivlerinden binlerce etiketsiz tarama kullanılarak iyileştirilebilir. Bu, önemli ölçüde daha az manuel çaba ile sağlam görüntü sınıflandırma ve segmentasyon modellerinin geliştirilmesine olanak tanır.
  2. Web İçeriği ve Belge Sınıflandırması: Milyarlarca web sayfasını, haber makalesini veya müşteri yorumunu manuel olarak sınıflandırmak pratik değildir. SSL, başlangıç metin sınıflandırıcısını eğitmek için küçük, manuel olarak kategorize edilmiş bir belge kümesi kullanabilir. Model daha sonra, duygu analizi veya konu kategorizasyonu gibi görevler için zaman içinde geliştirmek üzere kendi tahminlerini kullanarak etiketsiz belgelerden oluşan devasa külliyatı sınıflandırır.

Diğer Öğrenme Paradigmaları ile Karşılaştırma

SSL'yi ilgili Yapay Zeka (AI) kavramlarından ayırmak önemlidir:

  • Kendi Kendine Denetimli Öğrenme (SSL): Kısaltması aynı olsa da kendi kendine denetimli öğrenme farklıdır. Etiketlerin ön görevler (örneğin, bir cümledeki maskelenmiş bir kelimeyi tahmin etmek) aracılığıyla verilerin kendisinden oluşturulduğu bir tür denetimsiz öğrenmedir. Manuel olarak etiketlenmiş herhangi bir veri kullanmazken, yarı denetimli öğrenme model eğitim sürecini yönlendirmek için küçük, açıkça etiketlenmiş bir veri kümesi gerektirir.
  • Aktif Öğrenme: Bu teknik de etiketleme maliyetlerini azaltmayı amaçlar. Ancak bir aktif öğrenme modeli, tüm etiketlenmemiş verileri kullanmak yerine, en bilgilendirici veri noktalarını etiketlemek için bir insan açıklamacıyı akıllıca sorgular. Buna karşın SSL, tipik olarak eğitim sırasında doğrudan insan etkileşimi olmadan etiketlenmemiş verileri kullanır.
  • Transfer Öğrenimi: Bu, büyük bir veri kümesi ( ImageNet gibi) üzerinde önceden eğitilmiş bir modelin kullanılmasını ve ardından daha küçük, göreve özgü bir veri kümesi üzerinde ince ayar yapılmasını içerir. Her ikisi de mevcut bilgiden yararlanırken, SSL hedef görevin etiketlenmemiş verilerinden öğrenirken, transfer öğrenimi farklı (ancak genellikle ilgili) bir görevden gelen bilgiden yararlanır.

Araçlar ve Eğitim

PyTorch(PyTorch resmi sitesi) ve TensorFlow(TensorFlow resmi sitesi) dahil olmak üzere birçok modern Derin Öğrenme (DL) çerçevesi, SSL algoritmalarını uygulamak için işlevler sunar veya uyarlanabilir. Scikit-learn gibi kütüphaneler bazı SSL yöntemleri sağlar. Ultralytics HUB gibi platformlar, etiketli ve etiketsiz veri karışımlarını içerebilen veri kümelerinin yönetimini kolaylaştırarak süreci kolaylaştırır ve bu tür veri yapılarından yararlanmak için tasarlanmış modellerin eğitimini ve dağıtımını basitleştirir. SSL alanındaki araştırmalar, NeurIPS ve ICML gibi büyük yapay zeka konferanslarında sıklıkla sunulan katkılarla gelişmeye devam etmektedir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı