Sözlük

Sıfır Atışla Öğrenme

Zero-Shot Learning'i keşfedin: modellerin görünmeyen verileri sınıflandırmasını sağlayan, nesne algılama, NLP ve daha fazlasında devrim yaratan son teknoloji bir yapay zeka yaklaşımı.

Sıfır Atışlı Öğrenme (ZSL), bir modelin eğitim verisi aşamasında hiç görmediği kategorilerdeki nesneleri tanıyabildiği ve sınıflandırabildiği makine öğreniminde (ML) büyüleyici bir yetenektir. Her olası sınıf için açık örnekler gerektiren geleneksel denetimli öğrenmenin aksine ZSL, bir modelin bilgisini yeni, görülmemiş sınıflara genelleştirmesini sağlar. Bu, gözlemlenen ve gözlemlenmeyen sınıfların öznitelikler veya metin katıştırmaları gibi üst düzey anlamsal tanımlamalarla ilişkilendirilmesiyle elde edilir. Bu, özellikle kapsamlı etiketli veri toplamanın pratik olmadığı gerçek dünya senaryolarında bir yapay zeka modelinin daha esnek ve ölçeklenebilir olmasını sağlar.

Nasıl Çalışıyor?

ZSL'nin arkasındaki temel fikir, hem görüntülerden gelen görsel özelliklerin hem de metinden gelen anlamsal bilgilerin temsil edilebileceği ortak bir gömme alanı oluşturmaktır. Eğitim sırasında model, görülen sınıfların görüntülerini karşılık gelen anlamsal vektörlerle (öznitelikler veya kelime katıştırmaları) eşleştirmeyi öğrenir. Örneğin, model bir "atın" görsel özelliklerini öğrenir ve bunları "dört bacağı vardır", "bir memelidir" ve "binilebilir" gibi anlamsal bir tanıma bağlar.

"Zebra" gibi görünmeyen bir sınıfın görüntüsü sunulduğunda, model sınıfın görsel özelliklerini çıkarır. Eş zamanlı olarak, "zebra "nın anlamsal tanımını -örneğin, "ata benzer", "çizgileri vardır"- gömme uzayında konumlandırmak için kullanır. Model, çıkarılan görsel özelliklere en yakın anlamsal tanımı bularak, tek bir eğitim görüntüsü olmadan bile görüntüyü doğru bir şekilde "zebra" olarak sınıflandırabilir. Bu süreç genellikle OpenAI'nin CLIP'i gibi görme ve dili birbirine bağlama konusunda mükemmel olan önceden eğitilmiş güçlü çok modlu modellere dayanır.

Sıfır Atışlı Öğrenmeye Karşı Diğer Paradigmalar

ZSL'yi ilgili öğrenme tekniklerinden ayırmak önemlidir:

  • Az Atışlı Öğrenme (FSL): FSL'de model, her yeni sınıf için çok az sayıda etiketli örnekle (örn. 1 ila 5) eğitilir. Bu, hedef sınıfın sıfır örneği ile çalışan ZSL'den farklıdır.
  • Tek Seferde Öğrenme (OSL): Modelin yeni bir sınıftan tam olarak bir örnek aldığı FSL'nin bir alt türüdür. Genel FSL'den daha fazla veri kısıtlıdır ancak ZSL'den farklı olarak yine de en az bir örnek gerektirir.
  • Transfer Öğrenimi: ZSL bir transfer öğrenme biçimidir, ancak benzersizdir. Standart transfer öğrenimi tipik olarak yeni (daha küçük) etiketli bir veri kümesi üzerinde önceden eğitilmiş bir modelin ince ayarını içerirken, ZSL bilgiyi yalnızca yardımcı anlamsal bilgileri kullanarak yeni sınıflara aktarır ve bu sınıfların herhangi bir etiketli örneğine ihtiyaç duymaz.

Gerçek Dünya Uygulamaları

ZSL, bilgisayarla görme sistemlerini daha dinamik ve uyarlanabilir hale getiren çok sayıda pratik uygulamaya sahiptir.

  1. Açık Kelime Dağarcığı Nesne Tespiti: YOLO-World gibi modeller, metinle tanımlanan herhangi bir nesneyi tespit etmek için ZSL'den yararlanır. Bir kullanıcı "mavi gömlekli kişi" veya "sızıntı yapan boru" gibi metin komutları verebilir ve model bu nesneleri, bu belirli kategoriler üzerinde açıkça eğitilmeden bir görüntü veya video akışında bulabilir. Bu, gerçekten genel amaçlı görüntü sistemleri oluşturma yolunda önemli bir adımdır.
  2. Otonom Tür Tanımlama: Yaban hayatının korunmasına yönelik yapay zekada, ZSL nadir veya yeni keşfedilen türleri tanımlayabilir. Yaygın hayvanlar üzerine eğitilmiş bir model, orijinal eğitim setinde hiç zürafa görüntüsü olmasa bile, bir zürafayı tanımlamak için Wikipedia gibi bir bilgi tabanından tanımlayıcı nitelikleri (örneğin, "uzun boyunludur", "beneklidir", "otoburdur") kullanabilir.

Zorluklar ve Gelecek Yönelimleri

Potansiyeline rağmen ZSL, hubness problemi (anlamsal uzaydaki bazı noktaların çok fazla noktaya en yakın komşu olması) ve domain shift (özellikler ve nitelikler arasındaki ilişkilerin görülen ve görülmeyen sınıflar arasında farklılık göstermesi) gibi zorluklarla karşı karşıyadır. Bu sorunları ele almak için araştırmacılar, modelin çıkarım sırasında hem görülen hem de görülmeyen sınıfları tanıması gereken Genelleştirilmiş Sıfır Atışlı Öğrenme (GZSL) gibi daha sağlam teknikler geliştirmektedir. Ultralytics HUB gibi temel modellerin ve platformların evrimi, ZSL'nin entegrasyonunu ve dağıtımını daha da basitleştirecek, yapay zeka sistemlerini kapsamlı veri etiketlemeye daha az bağımlı ve insan benzeri akıl yürütme ile daha uyumlu hale getirecektir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı