Tek Seferde Öğrenme (OSL), makine öğrenimi (ML) içinde, her sınıf için yalnızca tek bir eğitim örneğine dayalı olarak yeni örnekleri sınıflandırmayı amaçlayan özel bir alandır. Bu, yüksek doğruluk elde etmek için genellikle sınıf başına binlerce etiketli örnek gerektiren geleneksel denetimli öğrenme yöntemleriyle keskin bir tezat oluşturur. OSL özellikle eğitim verilerinin az, pahalı veya toplanmasının zaman alıcı olduğu senaryolarla ilgilidir, bu da onu veri sınırlamalarının yaygın olduğu gerçek dünya uygulamaları için çok önemli bir teknik haline getirir.
Tek Atışta Öğrenme Nasıl Çalışır?
OSL modelleri, bir girdiyi çok sayıda örnekten doğrudan bir sınıf etiketiyle eşleştirmeyi öğrenmek yerine, tipik olarak bir benzerlik işlevi öğrenir. Temel fikir, yeni, görülmemiş bir örneğin (sorgu) her sınıf için mevcut tek etiketli örneğe (destek) ne kadar benzer olduğunu belirlemektir. Sorgu örneği belirli bir sınıfın destek örneğine yüksek oranda benziyorsa, o sınıf etiketi atanır. Bu işlem genellikle, benzerliklerini belirlemek için iki girdiyi aynı anda işleyen Siyam Ağları gibi derin öğrenme (DL) mimarilerinin kullanılmasını içerir. Bu ağlar, metrik öğrenme gibi tekniklerle OSL görevine uyarlanmadan önce sağlam özellik temsillerini öğrenmek için transfer öğrenimi kullanılarak genellikle büyük veri kümeleri ( ImageNet gibi) üzerinde önceden eğitilir.
Tek Seferde Öğrenmede Temel Kavramlar
- Destek Kümesi: Bu, modelin öğrenmesi gereken her sınıf için sağlanan tek etiketli örneği içerir.
- Sorgu Kümesi: Bu, modelin destek kümesine dayalı olarak sınıflandırması gereken etiketsiz örnekleri içerir.
- Benzerlik/Metrik Öğrenme: Veri noktaları arasındaki benzerliği ölçen bir mesafe fonksiyonu veya metrik öğrenme süreci, sorgu örneklerini destek örnekleriyle karşılaştırmak için çok önemlidir.
- Epizodik Eğitim: Modelin, eğitim sırasında tek seferlik senaryoyu simüle etmek için daha büyük bir veri kümesinden örneklenen birçok küçük OSL görevi (bölüm) üzerinde eğitildiği yaygın bir eğitim stratejisi.
Tek Seferlik Öğrenme ve İlgili Paradigmalar
OSL'yi anlamak, onu ilgili kavramlardan ayırmayı gerektirir:
- Az Atışlı Öğrenme (FSL): OSL, FSL'nin aşırı bir varyantı olarak kabul edilir. OSL sınıf başına yalnızca bir örnek kullanırken, FSL sınıf başına az sayıda (k > 1, tipik olarak 5 veya 10) örnek kullanır. Her ikisi de veri kıtlığını ele alır ancak mevcut örneklerin sayısı bakımından farklılık gösterir. Bu paradigmalar hakkında daha fazla bilgiyi az sayıda, sıfır sayıda ve transfer öğrenimini anlamaya yönelik blog yazımızda bulabilirsiniz.
- Sıfır Atışlı Öğrenme (ZSL): ZSL daha da zor bir sorunu ele alır: eğitim sırasında hiç görülmemiş sınıflardan örnekleri sınıflandırmak. Bu genellikle, görülen ve görülmeyen sınıfları birbirine bağlayan anlamsal öznitelikler veya metin açıklamaları gibi yardımcı bilgilerden yararlanılarak elde edilir. OSL bir örnek görmeyi gerektirir; ZSL sıfır örnek görmeyi gerektirir ancak ek anlamsal bağlama ihtiyaç duyar.
- Transfer Öğrenimi ve İnce Ayar: OSL genellikle transfer öğrenimini (büyük bir veri kümesi üzerinde ön eğitim) kullansa da amaç farklıdır. Standart transfer öğrenimi veya ince ayar genellikle adaptasyon için makul miktarda hedef verinin mevcut olduğunu varsayarken, OSL özellikle tek örnek kısıtlamasıyla ilgilenir. Ultralytics YOLO modellerinin özel eğitimi gibi teknikler genellikle önceden eğitilmiş ağırlıkların ince ayarını içerir, ancak tipik olarak sınıf başına birden fazla örnekle yapılır.
Gerçek Dünya Uygulamaları
OSL, daha önce veri sınırlamaları nedeniyle engellenen çeşitli uygulamaları mümkün kılar:
- Yüz Tanıma: Güvenlik sistemlerinin veya kişisel cihazların bir kişiyi tek bir fotoğrafla kaydettikten sonra tanımlaması veya doğrulaması gerekebilir. NIST, çoğu benzer az sayıda veya tek seferlik zorluklarla karşılaşan yüz tanıma teknolojileri üzerinde kapsamlı testler yürütmektedir.
- Nadir Nesne Tespiti: İmalat kalite kontrolü veya yaban hayatının korunması gibi alanlarda, nadir kusurların veya nesli tükenmekte olan türlerin belirlenmesi yalnızca bir veya çok az sayıda önceki örnekle mümkün olabilir. gibi modeller olsa da Ultralytics YOLO11 yeterli veri ile nesne tespitinde mükemmeldir, OSL teknikleri aşırı nadir sınıflar için bunları artırabilir.
- İmza Doğrulama: Dosyada saklanan tek bir referans imzaya dayalı olarak bir kişinin imzasının doğrulanması. Araştırmalar, genellikle düşük veri rejimlerinde bu görev için derin öğrenmeyi araştırmaktadır.
- İlaç Keşfi: Potansiyel yeni ilaç adaylarının belirlenmesi veya çok sınırlı deneysel sonuçlara dayanarak molekül özelliklerinin tahmin edilmesi, araştırma sürecinin hızlandırılması. Çalışmalar, OSL'nin ilaç-hedef etkileşimlerini tahmin etmede uygulandığını göstermektedir.
Zorluklar ve Gelecek Yönelimleri
OSL'deki temel zorluk genellemedir: bir model aşırı uyum sağlamadan bir sınıfın özünü tek bir örnekten güvenilir bir şekilde nasıl öğrenebilir? Tek destek örneğinin seçimi ve kalitesi kritik öneme sahiptir. Devam eden araştırmalar, OSL performansını artırmak için daha sağlam özellik temsilleri, daha iyi benzerlik ölçütleri geliştirmeye ve meta öğrenme ("öğrenmeyi öğrenme") gibi tekniklerden yararlanmaya odaklanmaktadır. OSL yeteneklerinin genel amaçlı görme modellerine ve Ultralytics HUB gibi platformlara entegre edilmesi, veri kısıtlı ortamlarda uygulanabilirliklerini önemli ölçüde artırabilir. OSL modellerinin değerlendirilmesi, bu zorlu koşullar altında performans ölçütlerinin dikkatle ele alınmasını gerektirir.