Zero-Shot Learning'i keşfedin: modellerin görünmeyen verileri classify sağlayan, nesne algılama, NLP ve daha fazlasında devrim yaratan son teknoloji bir yapay zeka yaklaşımı.
Sıfır Atışla Öğrenme (ZSL) güçlü bir paradigmadır yapay öğrenmeyi mümkün kılan makine öğrenimi (ML) sırasında hiç karşılaşmadıkları nesneleri tanımak, classify veya detect etmek için istihbarat modelleri eğitim verisi aşaması. Geleneksel olarak denetimli öğrenmede, bir modelin aşağıdakiler üzerinde eğitilmesi gerekir tanımlaması gereken her belirli kategori için binlerce etiketli görüntü. ZSL bu kısıtlamayı şu şekilde ortadan kaldırır Yardımcı bilgilerden yararlanma - tipik olarak metin açıklamaları, nitelikler veya semantik Yerleştirmeler- görülen ve görülmeyen arasındaki boşluğu doldurmak için sınıflar. Bu özellik şunları sağlar yapay zeka (AI) sistemleri önemli ölçüde daha esnek, ölçeklenebilir ve ayrıntılı bilgi toplamanın mümkün olmadığı dinamik ortamları idare edebilir olası her nesne için veri sağlamak pratik değildir.
ZSL'nin temel mekanizması, bilginin tanıdık kavramlardan tanıdık olmayanlara paylaşılan bir yöntemle aktarılmasını içerir. anlamsal uzay. Sadece piksel desenlerini ezberleyerek bir "kediyi" tanımayı öğrenmek yerine, model görsel özellikler ve anlamsal nitelikler arasındaki ilişkiyi öğrenir (örn. "tüylü" "bıyık", "dört bacak") türetilmiştir. doğal dil işleme (NLP).
Bu süreç genellikle aşağıdakilere dayanır görüntü ve metni hizalayan çok modlu modeller temsiller. Örneğin, aşağıdaki gibi temel araştırmalar OpenAI'nin CLIP'i modellerin görsel kavramları nasıl öğrenebileceğini gösteriyor doğal dil denetimi. Bir ZSL modeli, nadir bir kuş türü gibi görünmeyen bir nesneyle karşılaştığında görsel özellikleri belirler ve bunları anlamsal vektörlerden oluşan bir sözlükle karşılaştırır. Eğer görsel özellikler Yeni sınıfın anlamsal açıklaması, model onu doğru bir şekilde classify ve etkili bir şekilde "sıfır atış" tahmini.
ZSL'yi tam olarak anlamak için, onu şu alanlarda kullanılan benzer öğrenme stratejilerinden ayırmak yararlı olacaktır bilgisayar görüşü (CV):
Zero-Shot Learning, sistemlerin kendi özelliklerinin ötesinde genelleme yapabilmelerini sağlayarak çeşitli sektörlerde inovasyonu teşvik etmektedir. başlangıç eğitimi.
Ultralytics YOLO modeli Zero-Shot'ı örneklemektedir Eylem halinde öğrenme. Kullanıcıların modeli yeniden eğitmeden çalışma zamanında dinamik olarak özel sınıflar tanımlamasına olanak tanır. Bu bağlanarak elde edilir. YOLO11 ile algılama backbone CLIP tabanlı bir metin kodlayıcı.
Aşağıdaki Python örneği, bir standardın parçası olmayan nesneleri detect etmek için YOLO'ün nasıl kullanılacağını göstermektedir
COCO veri kümesi, örneğin belirli giysi renkleri gibi, aşağıdakileri kullanarak ultralytics Paket.
from ultralytics import YOLOWorld
# Load a pre-trained YOLO-World model
model = YOLOWorld("yolov8s-world.pt")
# Define custom classes for Zero-Shot detection using text prompts
# The model will now look for these specific descriptions
model.set_classes(["blue backpack", "red apple", "person wearing sunglasses"])
# Run inference on an image to detect the new zero-shot classes
results = model.predict("path/to/image.jpg")
# Show the results
results[0].show()
ZSL büyük bir potansiyel sunsa da, alan kaydırma problemi gibi zorluklarla karşı karşıyadır. Eğitim sırasında öğrenilen anlamsal nitelikler, görünmeyen sınıfların görsel görünümüyle mükemmel bir şekilde eşleşmez. Ek olarak, ZSL modelleri önyargıdan muzdarip olabilir; burada tahmin doğruluğu aşağıdakiler için önemli ölçüde daha yüksektir Görülen sınıflar görülmeyen sınıflara kıyasla (Genelleştirilmiş Sıfır Atışlı Öğrenme).
Stanford Üniversitesi Yapay Zeka Laboratuvarı gibi kuruluşların araştırmaları ve IEEE Bilgisayar Topluluğu bu sınırlamaları ele almaya devam ediyor. As temel modeller daha sağlam hale gelir, ZSL standart bir özellik haline gelmesi bekleniyor. bilgisayarla görme araçlarına olan bağımlılığı azaltarak veri etiketleme çabaları ve erişimin demokratikleştirilmesi gelişmiş yapay zeka yetenekleri.

