Zero-Shot Learning'i keşfedin: modellerin görünmeyen verileri sınıflandırmasını sağlayan, nesne algılama, NLP ve daha fazlasında devrim yaratan son teknoloji bir yapay zeka yaklaşımı.
Sıfır Atışlı Öğrenme (ZSL), bir modelin eğitim verisi aşamasında hiç görmediği kategorilerdeki nesneleri tanıyabildiği ve sınıflandırabildiği makine öğreniminde (ML) büyüleyici bir yetenektir. Her olası sınıf için açık örnekler gerektiren geleneksel denetimli öğrenmenin aksine ZSL, bir modelin bilgisini yeni, görülmemiş sınıflara genelleştirmesini sağlar. Bu, gözlemlenen ve gözlemlenmeyen sınıfların öznitelikler veya metin katıştırmaları gibi üst düzey anlamsal tanımlamalarla ilişkilendirilmesiyle elde edilir. Bu, özellikle kapsamlı etiketli veri toplamanın pratik olmadığı gerçek dünya senaryolarında bir yapay zeka modelinin daha esnek ve ölçeklenebilir olmasını sağlar.
ZSL'nin arkasındaki temel fikir, hem görüntülerden gelen görsel özelliklerin hem de metinden gelen anlamsal bilgilerin temsil edilebileceği ortak bir gömme alanı oluşturmaktır. Eğitim sırasında model, görülen sınıfların görüntülerini karşılık gelen anlamsal vektörlerle (öznitelikler veya kelime katıştırmaları) eşleştirmeyi öğrenir. Örneğin, model bir "atın" görsel özelliklerini öğrenir ve bunları "dört bacağı vardır", "bir memelidir" ve "binilebilir" gibi anlamsal bir tanıma bağlar.
"Zebra" gibi görünmeyen bir sınıfın görüntüsü sunulduğunda, model sınıfın görsel özelliklerini çıkarır. Eş zamanlı olarak, "zebra "nın anlamsal tanımını -örneğin, "ata benzer", "çizgileri vardır"- gömme uzayında konumlandırmak için kullanır. Model, çıkarılan görsel özelliklere en yakın anlamsal tanımı bularak, tek bir eğitim görüntüsü olmadan bile görüntüyü doğru bir şekilde "zebra" olarak sınıflandırabilir. Bu süreç genellikle OpenAI'nin CLIP'i gibi görme ve dili birbirine bağlama konusunda mükemmel olan önceden eğitilmiş güçlü çok modlu modellere dayanır.
ZSL'yi ilgili öğrenme tekniklerinden ayırmak önemlidir:
ZSL, bilgisayarla görme sistemlerini daha dinamik ve uyarlanabilir hale getiren çok sayıda pratik uygulamaya sahiptir.
Potansiyeline rağmen ZSL, hubness problemi (anlamsal uzaydaki bazı noktaların çok fazla noktaya en yakın komşu olması) ve domain shift (özellikler ve nitelikler arasındaki ilişkilerin görülen ve görülmeyen sınıflar arasında farklılık göstermesi) gibi zorluklarla karşı karşıyadır. Bu sorunları ele almak için araştırmacılar, modelin çıkarım sırasında hem görülen hem de görülmeyen sınıfları tanıması gereken Genelleştirilmiş Sıfır Atışlı Öğrenme (GZSL) gibi daha sağlam teknikler geliştirmektedir. Ultralytics HUB gibi temel modellerin ve platformların evrimi, ZSL'nin entegrasyonunu ve dağıtımını daha da basitleştirecek, yapay zeka sistemlerini kapsamlı veri etiketlemeye daha az bağımlı ve insan benzeri akıl yürütme ile daha uyumlu hale getirecektir.