Yarı Denetimli Öğrenme
Yarı Denetimli Öğrenmenin AI modellerini geliştirmek, etiketleme maliyetlerini azaltmak ve doğruluğu artırmak için etiketli ve etiketsiz verileri nasıl birleştirdiğini keşfedin.
Yarı denetimli öğrenme (SSL), denetimli öğrenme ve denetimsiz öğrenme arasındaki boşluğu dolduran bir makine öğrenimi (ML) tekniğidir. Öğrenme doğruluğunu artırmak için az miktarda etiketli veri ile birlikte büyük miktarda etiketlenmemiş veriden yararlanır. Birçok gerçek dünya senaryosunda, etiketlenmemiş veri elde etmek ucuzdur, ancak veri etiketleme süreci maliyetli ve zaman alıcıdır. SSL, modellerin daha küçük etiketli küme tarafından sağlanan yapı ve bilgilerden yola çıkarak, çok sayıda etiketlenmemiş örnekten öğrenmesine olanak tanıyarak bu zorluğun üstesinden gelir. Bu yaklaşım, modellerin yüksek performans elde etmek için muazzam veri kümelerine ihtiyaç duyduğu derin öğrenmede (DL) özellikle güçlüdür.
Yarı Denetimli Öğrenme Nasıl Çalışır
SSL'nin ardındaki temel fikir, etiketlenmiş verileri kullanarak bir başlangıç modeli oluşturmak ve ardından bu modeli etiketlenmemiş veriler üzerinde tahminler yapmak için kullanmaktır. Modelin en güvenilir tahminleri daha sonra "sözde etiketler" olarak kabul edilir ve eğitim kümesine eklenir. Model daha sonra orijinal etiketler ve yüksek güvenilirlikli sözde etiketlerin bu kombinasyonu üzerinde yeniden eğitilir. Bu yinelemeli süreç, modelin yalnızca küçük etiketlenmiş bölümün değil, tüm veri kümesinin temel yapısını öğrenmesini sağlar.
Yaygın SSL teknikleri şunları içerir:
- Tutarlılık Düzenlileştirme (Consistency Regularization): Bu yöntem, modelin tahminlerinin, girdi verileri hafifçe bozulduğunda bile tutarlı kalması gerektiği fikrini zorlar. Örneğin, küçük veri artırma (data augmentation) içeren bir görüntü aynı sınıflandırmayı vermelidir.
- Üretken Modeller: Üretken Çekişmeli Ağlar (GAN'lar) gibi teknikler, gerçek veri dağılımına benzeyen veriler oluşturmayı öğrenebilir ve sınıflar arasındaki karar sınırlarını daha iyi tanımlamaya yardımcı olabilir.
- Grafik Tabanlı Yöntemler: Bu yöntemler, veri noktalarını bir grafikteki düğümler olarak temsil eder ve etiketli düğümlerden etiketlenmemiş olanlara, yakınlıklarına veya benzerliklerine göre etiketleri yayar. Akademik araştırmalarda teknik bir genel bakış bulunabilir.
Gerçek Dünya Uygulamaları
SSL, etiketlemenin bir darboğaz olduğu alanlarda oldukça etkilidir. İşte iki önemli örnek:
- Tıbbi Görüntü Analizi: Tümör tespiti için MRI veya CT gibi tıbbi taramaların etiketlenmesi uzman radyologlar gerektirir ve çok pahalıdır. SSL ile bir model birkaç yüz etiketli tarama üzerinde eğitilebilir ve daha sonra hastane arşivlerinden binlerce etiketsiz tarama kullanılarak rafine edilebilir. Bu, önemli ölçüde daha az manuel çaba ile sağlam görüntü sınıflandırma ve segmentasyon modellerinin geliştirilmesine olanak tanır.
- Web İçeriği ve Belge Sınıflandırması: Milyarlarca web sayfasını, haber makalesini veya müşteri incelemesini manuel olarak sınıflandırmak pratik değildir. SSL, ilk metin sınıflandırıcısını eğitmek için manuel olarak kategorize edilmiş küçük bir belge kümesi kullanabilir. Model daha sonra, duygu analizi veya konu kategorizasyonu gibi görevler için zaman içinde kendini geliştirmek için kendi tahminlerini kullanarak devasa etiketlenmemiş belge külliyatını sınıflandırır.
Diğer Öğrenme Paradigmaları ile Karşılaştırma
SSL'yi ilgili Yapay Zeka (AI) kavramlarından ayırmak önemlidir:
- Kendi Kendine Denetimli Öğrenme (SSL): Bir kısaltmayı paylaşmasına rağmen, öz denetimli öğrenme farklıdır. Etiketlerin ön görevler aracılığıyla (örneğin, bir cümledeki maskelenmiş bir kelimeyi tahmin etmek) verilerin kendisinden oluşturulduğu bir tür denetimsiz öğrenmedir. Manuel olarak etiketlenmiş herhangi bir veri kullanmazken, yarı denetimli öğrenme, model eğitim sürecine rehberlik etmek için küçük, açıkça etiketlenmiş bir veri kümesi gerektirir.
- Aktif Öğrenme: Bu teknik de etiketleme maliyetlerini azaltmayı amaçlar. Ancak, tüm etiketlenmemiş verileri kullanmak yerine, aktif öğrenme modeli en bilgilendirici veri noktalarını etiketlemek için bir insan açıklamacıyı akıllıca sorgular. Buna karşın SSL, tipik olarak eğitim sırasında doğrudan insan etkileşimi olmadan etiketlenmemiş verileri kullanır.
- Transfer Öğrenimi: Bu, büyük bir veri kümesi ( ImageNet gibi) üzerinde önceden eğitilmiş bir modelin kullanılmasını ve ardından daha küçük, göreve özgü bir veri kümesi üzerinde ince ayar yapılmasını içerir. Her ikisi de mevcut bilgiden yararlanırken, SSL hedef görevin etiketlenmemiş verilerinden öğrenir, transfer öğrenimi ise farklı (ancak genellikle ilgili) bir görevden gelen bilgiden yararlanır.
Araçlar ve Eğitim
PyTorch (PyTorch resmi sitesi) ve TensorFlow (TensorFlow resmi sitesi) dahil olmak üzere birçok modern Derin Öğrenme (DL) çatısı, SSL algoritmalarını uygulamak için işlevler sunar veya uyarlanabilir. Scikit-learn gibi kütüphaneler bazı SSL yöntemleri sağlar. Ultralytics HUB gibi platformlar, etiketli ve etiketsiz verilerin karışımlarını içerebilen veri kümelerinin yönetimini kolaylaştırarak, bu tür veri yapılarını kullanmak üzere tasarlanmış modellerin eğitimini ve dağıtımını basitleştirerek süreci kolaylaştırır. SSL alanındaki araştırmalar gelişmeye devam ediyor ve katkılar genellikle NeurIPS ve ICML gibi büyük yapay zeka konferanslarında sunuluyor.