Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Sıfır Atışlı Öğrenme

Zero-Shot Öğrenmeyi Keşfedin: Modellerin görülmemiş verileri sınıflandırmasını sağlayan, nesne algılama, NLP ve daha fazlasında devrim yaratan, en son teknolojiye sahip bir yapay zeka yaklaşımı.

Sıfır Atışlı Öğrenme (Zero-Shot Learning - ZSL), bir modelin eğitim verisi aşamasında hiç görmediği kategorilerden nesneleri tanıyabildiği ve sınıflandırabildiği makine öğreniminde (ML) büyüleyici bir yetenektir. Her olası sınıf için açık örnekler gerektiren geleneksel denetimli öğrenmenin aksine, ZSL bir modelin bilgisini yeni, görülmemiş sınıflara genellemesini sağlar. Bu, gözlemlenen ve gözlemlenmeyen sınıfların nitelikler veya metin gömmeleri gibi üst düzey semantik açıklamalar yoluyla ilişkilendirilmesiyle elde edilir. Bu, bir yapay zeka modelinin, özellikle kapsamlı etiketli veri toplamanın pratik olmadığı gerçek dünya senaryolarında daha esnek ve ölçeklenebilir olmasını sağlar.

Nasıl Çalışır?

ZSL'nin ardındaki temel fikir, hem görüntülerden elde edilen görsel özelliklerin hem de metinden elde edilen semantik bilgilerin temsil edilebildiği ortak bir gömme alanı oluşturmaktır. Eğitim sırasında, model görülen sınıfların görüntülerini karşılık gelen semantik vektörlerine (nitelikler veya kelime gömmeleri) eşlemeyi öğrenir. Örneğin, model bir "at"ın görsel özelliklerini öğrenir ve bunları "dört bacağı var", "bir memeli" ve "binilebilir" gibi bir semantik açıklamaya bağlar.

"Zebra" gibi görülmemiş bir sınıfın görüntüsü sunulduğunda, model görsel özelliklerini çıkarır. Aynı anda, "zebra"nın anlamsal açıklamasını (örneğin, "at benzeri", "çizgili") gömme alanında bulmak için kullanır. Çıkarılan görsel özelliklere en yakın anlamsal açıklamayı bularak, model tek bir eğitim görüntüsü olmadan bile görüntüyü doğru bir şekilde "zebra" olarak sınıflandırabilir. Bu süreç genellikle vizyon ve dili birleştirmede mükemmel olan OpenAI'nin CLIP'i gibi güçlü, önceden eğitilmiş çok modlu modellere dayanır.

Sıfır Atışlı Öğrenme ve Diğer Paradigmalar

ZSL'yi ilgili öğrenme tekniklerinden ayırmak önemlidir:

  • Az Veriyle Öğrenme (Few-Shot Learning - FSL): FSL'de model, her yeni sınıf için çok az sayıda etiketli örnekle (örneğin, 1 ila 5) eğitilir. Bu, hedef sınıfın sıfır örneğiyle çalışan ZSL'den farklıdır.
  • Tek Çekim Öğrenimi (OSL): FSL'nin, modelin yeni bir sınıfa ait yalnızca bir örnek aldığı bir alt türüdür. Genel FSL'den daha fazla veri kısıtlamasına sahiptir, ancak ZSL'den farklı olarak en az bir örnek gerektirir.
  • Transfer Öğrenimi: ZSL bir transfer öğrenimi biçimidir, ancak benzersizdir. Standart transfer öğrenimi tipik olarak önceden eğitilmiş bir modelin yeni (daha küçük) etiketli bir veri kümesi üzerinde ince ayar yapılmasını içerirken, ZSL, yalnızca yardımcı anlamsal bilgileri kullanarak yeni sınıflara bilgi aktarır ve bu sınıfların etiketli örneklerine olan ihtiyacı ortadan kaldırır.

Gerçek Dünya Uygulamaları

ZSL'nin çok sayıda pratik uygulaması vardır ve bu da bilgisayar görüşü sistemlerini daha dinamik ve uyarlanabilir hale getirir.

  1. Açık Kelime Haznesi Nesne Tespiti: YOLO-World gibi modeller, metinle tanımlanan herhangi bir nesneyi tespit etmek için ZSL'den yararlanır. Bir kullanıcı "mavi tişörtlü kişi" veya "sızdıran boru" gibi metin istemleri sağlayabilir ve model, bu belirli kategorilerde açıkça eğitilmeden bu nesneleri bir görüntü veya video akışında bulabilir. Bu, gerçekten genel amaçlı görme sistemleri oluşturmaya yönelik önemli bir adımdır.
  2. Otonom Tür Tanımlama: Yaban hayatı koruma için yapay zekâda, ZSL nadir veya yeni keşfedilen türleri tanımlayabilir. Yaygın hayvanlar üzerinde eğitilmiş bir model, orijinal eğitim setinde hiç zürafa resmi olmasa bile, bir zürafayı tanımlamak için Wikipedia gibi bir bilgi tabanından açıklayıcı özellikler (örneğin, "uzun bir boynu var", "benekli", "otoburdur") kullanabilir.

Zorluklar ve Gelecek Yönelimler

Potansiyeline rağmen, ZSL, hubness problemi (anlamsal uzaydaki bazı noktaların çok fazla noktaya en yakın komşu haline geldiği durum) ve alan kayması (özellikler ve nitelikler arasındaki ilişkilerin görülen ve görülmeyen sınıflar arasında farklılık gösterdiği durum) gibi zorluklarla karşı karşıyadır. Bu sorunları çözmek için araştırmacılar, modelin çıkarım sırasında hem görülen hem de görülmeyen sınıfları tanıması gereken Genelleştirilmiş Sıfır Atışlı Öğrenme (GZSL) gibi daha sağlam teknikler geliştirmektedir. Temel modellerin ve Ultralytics HUB gibi platformların evrimi, ZSL'nin entegrasyonunu ve dağıtımını daha da basitleştirecek ve AI sistemlerini kapsamlı veri etiketlemesine daha az bağımlı ve insan benzeri akıl yürütmeyle daha uyumlu hale getirecektir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı