Kendi Kendine Denetimli Öğrenme
Kendi kendine denetimli öğrenmenin verimli eğitim için etiketsiz verilerden nasıl yararlandığını ve bilgisayarla görme, NLP ve daha birçok alanda yapay zekayı nasıl dönüştürdüğünü keşfedin.
Kendi Kendine Denetimli Öğrenme (SSL), modellerin büyük miktarda etiketlenmemiş veriden öğrenmesini sağlayan bir makine öğrenimi tekniğidir. SSL, insan tarafından sağlanan etiketlere güvenmek yerine, bir "bahane görevi" oluşturup çözerek verilerin kendisinden otomatik olarak etiketler üretir. Bu süreç, modeli, görüntülerdeki dokular ve şekiller veya metindeki gramer yapıları gibi verilerin altında yatan anlamlı kalıpları ve özellikleri öğrenmeye zorlar. Öğrenilen bu özellikler güçlü bir temel oluşturarak modelin ince ayar aşamasında çok daha az etiketli veriyle sonraki görevlerde olağanüstü iyi performans göstermesini sağlar. SSL, veriye aç olan tam denetimli öğrenme ile daha az yönlendirilebilen tamamen denetimsiz öğrenme arasındaki boşluğu doldurur.
Öz Denetimli Öğrenme Nasıl Çalışır?
SSL'nin arkasındaki temel fikir, modelin çözmesi gereken kendi yarattığı bir problem olan bahane görevidir. Bu görev için etiketler doğrudan giriş verilerinden türetilir. Ön metin görevini çözerek sinir ağı, verilerin temel özelliklerini yakalayan değerli temsilleri veya katıştırmaları öğrenir.
Bilgisayarla görmede yaygın bahane görevleri şunları içerir:
- Görüntü Dönüşünü Tahmin Etme: Modele rastgele döndürülmüş (örneğin 0, 90, 180 veya 270 derece) bir görüntü gösterilir ve modelin dönüş açısını tahmin etmesi gerekir. Bunu doğru bir şekilde yapmak için nesnenin orijinal yönünü tanıması gerekir.
- Görüntü Boyama: Bir görüntünün bir kısmı maskelenir veya kaldırılır ve model eksik yamayı tahmin etmelidir. Bu, modeli görüntülerin bağlamı ve dokusu hakkında bilgi edinmeye teşvik eder.
- Kontrastlı Öğrenme: Modele benzer (artırılmış) görüntülerin temsillerini birbirine yaklaştırması ve farklı görüntülerin temsillerini birbirinden uzaklaştırması öğretilir. SimCLR gibi çerçeveler bu yaklaşımın popüler örnekleridir.
Etiketsiz veriler üzerinde yapılan bu ön eğitim, daha spesifik görevler için bir başlangıç noktası olarak kullanılabilecek sağlam model ağırlıkları ile sonuçlanır.
SSL ve Diğer Öğrenme Paradigmaları
SSL'yi ilgili makine öğrenimi paradigmalarından ayırmak çok önemlidir:
- Denetimli Öğrenme: Her bir girdinin doğru bir çıktı ile eşleştirildiği, tamamen etiketlenmiş verilere dayanır. SSL ise tam tersine, kendi etiketlerini verinin kendisinden üreterek manuel veri etiketleme ihtiyacını önemli ölçüde azaltır.
- Denetimsiz Öğrenme: Önceden tanımlanmış ön görevler olmaksızın etiketlenmemiş verilerde örüntü bulmayı ( kümeleme gibi) veya boyutluluğu azaltmayı amaçlar. SSL, denetimsiz öğrenme gibi etiketlenmemiş verileri kullanırken, temsil öğrenimini yönlendirmek için bahane görevleri aracılığıyla açık denetleyici sinyaller oluşturarak farklılık gösterir.
- Yarı Denetimli Öğrenme: Az miktarda etiketli veri ile çok miktarda etiketsiz verinin bir kombinasyonunu kullanır. SSL ön eğitimi genellikle yarı denetimli ince ayardan önce bir ön adım olabilir.
- Aktif Öğrenme: Bir insan tarafından etiketlenmek üzere etiketlenmemiş bir havuzdan en bilgilendirici veri noktalarını akıllıca seçmeye odaklanır. SSL, döngüde insan müdahalesi olmadan tüm etiketlenmemiş verilerden öğrenir. Bu iki yöntem, veri merkezli bir yapay zeka iş akışında tamamlayıcı olabilir.
Gerçek Dünya Uygulamaları
SSL, çeşitli alanlarda önemli ölçüde gelişmiş Yapay Zeka (AI) yeteneklerine sahiptir:
- Bilgisayarla Görme Modellerinin Geliştirilmesi: SSL ön eğitimi, Ultralytics YOLO gibi modellerin , otonom araçlarda nesne algılama veya tıbbi görüntü analizi gibi görevler için ince ayar yapılmadan önce büyük etiketsiz görüntü veri kümelerinden sağlam görsel özellikler öğrenmesini sağlar. SSL'den elde edilen önceden eğitilmiş ağırlıkların kullanılması, model eğitimi sırasında genellikle daha iyi performans ve daha hızlı yakınsama sağlar.
- Büyük Dil Modellerine (LLM'ler) Güç Sağlama: GPT-4 ve BERT gibi temel modeller, geniş metin derlemleri üzerinde ön eğitim aşamaları sırasında SSL ön metin görevlerine (maskeli dil modelleme gibi) büyük ölçüde güvenir. Bu sayede dil yapısını, dilbilgisini ve bağlamı anlayarak sofistike sohbet robotlarından makine çevirisine ve metin özetlemeye kadar çeşitli uygulamalara güç sağlarlar.
SSL, pahalı etiketli veri kümelerine olan bağımlılığı önemli ölçüde azaltarak güçlü yapay zeka modellerinin geliştirilmesini demokratikleştirir. PyTorch ve TensorFlow gibi araçların yanı sıra Ultralytics HUB gibi platformlar, en yeni yapay zeka çözümlerini oluşturmak ve dağıtmak için SSL tekniklerinden yararlanma ortamları sağlar. SSL ile ilgili en son araştırmaları NeurIPS ve ICML gibi en iyi yapay zeka konferanslarında bulabilirsiniz.