Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Sıfır Atışlı Öğrenme

Zero-Shot Learning'i keşfedin: modellerin görünmeyen verileri classify sağlayan, nesne algılama, NLP ve daha fazlasında devrim yaratan son teknoloji bir yapay zeka yaklaşımı.

Sıfır Atışla Öğrenme (ZSL) güçlü bir paradigmadır yapay öğrenmeyi mümkün kılan makine öğrenimi (ML) sırasında hiç karşılaşmadıkları nesneleri tanımak, classify veya detect etmek için istihbarat modelleri eğitim verisi aşaması. Geleneksel olarak denetimli öğrenmede, bir modelin aşağıdakiler üzerinde eğitilmesi gerekir tanımlaması gereken her belirli kategori için binlerce etiketli görüntü. ZSL bu kısıtlamayı şu şekilde ortadan kaldırır Yardımcı bilgilerden yararlanma - tipik olarak metin açıklamaları, nitelikler veya semantik Yerleştirmeler- görülen ve görülmeyen arasındaki boşluğu doldurmak için sınıflar. Bu özellik şunları sağlar yapay zeka (AI) sistemleri önemli ölçüde daha esnek, ölçeklenebilir ve ayrıntılı bilgi toplamanın mümkün olmadığı dinamik ortamları idare edebilir olası her nesne için veri sağlamak pratik değildir.

Zero-Shot Öğrenme Nasıl Çalışır?

ZSL'nin temel mekanizması, bilginin tanıdık kavramlardan tanıdık olmayanlara paylaşılan bir yöntemle aktarılmasını içerir. anlamsal uzay. Sadece piksel desenlerini ezberleyerek bir "kediyi" tanımayı öğrenmek yerine, model görsel özellikler ve anlamsal nitelikler arasındaki ilişkiyi öğrenir (örn. "tüylü" "bıyık", "dört bacak") türetilmiştir. doğal dil işleme (NLP).

Bu süreç genellikle aşağıdakilere dayanır görüntü ve metni hizalayan çok modlu modeller temsiller. Örneğin, aşağıdaki gibi temel araştırmalar OpenAI'nin CLIP'i modellerin görsel kavramları nasıl öğrenebileceğini gösteriyor doğal dil denetimi. Bir ZSL modeli, nadir bir kuş türü gibi görünmeyen bir nesneyle karşılaştığında görsel özellikleri belirler ve bunları anlamsal vektörlerden oluşan bir sözlükle karşılaştırır. Eğer görsel özellikler Yeni sınıfın anlamsal açıklaması, model onu doğru bir şekilde classify ve etkili bir şekilde "sıfır atış" tahmini.

İlgili Kavramlardan Ayrım

ZSL'yi tam olarak anlamak için, onu şu alanlarda kullanılan benzer öğrenme stratejilerinden ayırmak yararlı olacaktır bilgisayar görüşü (CV):

  • Az Atışlı Öğrenme (FSL): Bir yandan ZSL hedef sınıfın hiçbir örneğini gerektirmez, FSL modele çok küçük bir destek kümesi sağlar (genellikle 1 ila 5 örnek) uyum sağlamak için. ZSL tamamen anlamsal çıkarıma dayandığı için daha zordur. görsel örneklerden daha fazla.
  • Tek Seferlik Öğrenme: Bir alt kümesi FSL'de model tam olarak bir etiketli örnekten öğrenir. ZSL temelde farklılık gösterir çünkü yeni kategoriye ait tek bir resim bile yok.
  • Transfer Öğrenimi: Bu geniş kapsamlı terimi, bilginin bir görevden diğerine aktarılmasını ifade eder. ZSL, özel bir transfer öğrenme türüdür. Geleneksel sınıflandırma yöntemlerine ihtiyaç duymadan bilgiyi görünmeyen sınıflara aktarmak için anlamsal öznitelikleri kullanır. yeni veriler üzerinde ince ayar.

Gerçek Dünya Uygulamaları

Zero-Shot Learning, sistemlerin kendi özelliklerinin ötesinde genelleme yapabilmelerini sağlayarak çeşitli sektörlerde inovasyonu teşvik etmektedir. başlangıç eğitimi.

  1. Açık Kelime Dağarcığı Nesne Tespiti: Gibi modern mimariler YOLO, nesneleri aşağıdakilere göre detect etmek için ZSL kullanır kullanıcı tanımlı metin istemleri. Bu sayede tanımlandığı senaryolarda nesne algılama Geniş video arşivlerinde belirli öğeleri aramak gibi, önceden sınıfların sabit bir listesini yapmak mümkün değildir. Google Research ve diğer kurumlardaki araştırmacılar aktif olarak bu açık sözlük yeteneklerini geliştirmek.
  2. Tıbbi Teşhis: İçinde Sağlık hizmetlerinde yapay zeka, etiketli veri elde etme nadir hastalıklar zor ve pahalıdır. ZSL modelleri yaygın durumlar ve nadir görülen durumların açıklamaları üzerine eğitilebilir tıbbi ders kitaplarından (örn. PubMed makaleleri) semptomları inceleyerek X-ışınları veya MRI taramalarındaki potansiyel nadir anomalileri, büyük bir pozitif veri kümesi gerektirmeden işaretlemek için sistem davalar.
  3. Yaban Hayatı Koruma: İçin Tarım ve ekolojide yapay zeka, tanımlama nadiren fotoğraflanan nesli tükenmekte olan türler kritik öneme sahiptir. ZSL korumacıların bu hayvanları detect etmesine olanak sağlıyor gibi biyolojik veri tabanlarında tanımlanan öznitelik tabanlı açıklamaları (örn. belirli kürk desenleri veya boynuz şekilleri) kullanarak Yaşam Ansiklopedisi.

Ultralytics ile Sıfır Atış Tespiti

Ultralytics YOLO modeli Zero-Shot'ı örneklemektedir Eylem halinde öğrenme. Kullanıcıların modeli yeniden eğitmeden çalışma zamanında dinamik olarak özel sınıflar tanımlamasına olanak tanır. Bu bağlanarak elde edilir. YOLO11 ile algılama backbone CLIP tabanlı bir metin kodlayıcı.

Aşağıdaki Python örneği, bir standardın parçası olmayan nesneleri detect etmek için YOLO'ün nasıl kullanılacağını göstermektedir COCO veri kümesi, örneğin belirli giysi renkleri gibi, aşağıdakileri kullanarak ultralytics Paket.

from ultralytics import YOLOWorld

# Load a pre-trained YOLO-World model
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes for Zero-Shot detection using text prompts
# The model will now look for these specific descriptions
model.set_classes(["blue backpack", "red apple", "person wearing sunglasses"])

# Run inference on an image to detect the new zero-shot classes
results = model.predict("path/to/image.jpg")

# Show the results
results[0].show()

Zorluklar ve Geleceğe Bakış

ZSL büyük bir potansiyel sunsa da, alan kaydırma problemi gibi zorluklarla karşı karşıyadır. Eğitim sırasında öğrenilen anlamsal nitelikler, görünmeyen sınıfların görsel görünümüyle mükemmel bir şekilde eşleşmez. Ek olarak, ZSL modelleri önyargıdan muzdarip olabilir; burada tahmin doğruluğu aşağıdakiler için önemli ölçüde daha yüksektir Görülen sınıflar görülmeyen sınıflara kıyasla (Genelleştirilmiş Sıfır Atışlı Öğrenme).

Stanford Üniversitesi Yapay Zeka Laboratuvarı gibi kuruluşların araştırmaları ve IEEE Bilgisayar Topluluğu bu sınırlamaları ele almaya devam ediyor. As temel modeller daha sağlam hale gelir, ZSL standart bir özellik haline gelmesi bekleniyor. bilgisayarla görme araçlarına olan bağımlılığı azaltarak veri etiketleme çabaları ve erişimin demokratikleştirilmesi gelişmiş yapay zeka yetenekleri.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın