Sözlük

Sıfır Atışlı Öğrenme

Eğitim verisi olmadan classify detect classify için Zero-Shot Learning (ZSL) teknolojisini keşfedin. Ultralytics YOLO gerçek zamanlı açık sözlük algılamayı nasıl mümkün kıldığını öğrenin.

Zero-Shot Learning (ZSL), yapay zeka modellerinin eğitim aşamasında hiç karşılaşmadıkları detect tanıma, classify veya detect olanağı sağlayan bir makine öğrenimi paradigmasıdır. Geleneksel denetimli öğrenmede, bir modelin tanımlaması gereken her bir kategori için binlerce etiketli örneğe ihtiyacı vardır. ZSL, görülen ve görülmeyen sınıflar arasındaki boşluğu doldurmak için yardımcı bilgileri (genellikle metin açıklamaları, anlamsal öznitelikler veya gömülü bilgiler) kullanarak bu katı bağımlılığı ortadan kaldırır. Bu özellik, yapay zeka (AI) sistemlerinin çok daha esnek, ölçeklenebilir ve her olası nesne için kapsamlı veri toplamak pratik olmayan dinamik ortamları yönetebilmesini sağlar.

Zero-Shot Öğrenme Nasıl Çalışır?

ZSL'nin temel mekanizması, paylaşılan bir anlamsal alan kullanarak tanıdık kavramlardan tanıdık olmayan kavramlara bilgi aktarımı yapmaktır. semantik alan. Sadece siyah ve beyaz çizgilerin piksel desenlerini ezberleyerek "zebra"yı tanımayı öğrenmek yerine, model görsel özellikler ile doğal dil işleme (NLP) kaynaklı anlamsal özellikler (örneğin, "at benzeri şekil", "çizgili desen", "dört bacak") arasındaki ilişkiyi öğrenir. Bu, modelin "zebra"yı tanımak için sadece siyah ve beyaz çizgilerin piksel desenlerini ezberlemesine gerek kalmadan,

Bu süreç genellikle görüntü ve metin temsillerini uyumlu hale getiren çok modlu modellere dayanır. Örneğin, OpenAI'nin CLIP gibi temel araştırmalar, modellerin doğal dil denetiminden görsel kavramları nasıl öğrenebileceğini gösterir. ZSL modeli, görünmeyen bir nesneyle karşılaştığında, görsel özellikleri çıkarır ve Bir ZSL modeli görülmemiş bir nesneyle karşılaştığında, görsel özellikleri çıkarır ve bunları anlamsal vektörler sözlüğüyle karşılaştırır. Görsel özellikler yeni sınıfın anlamsal açıklamasıyla uyumluysa , model classify doğru bir şekilde classify ve etkili bir şekilde "sıfır atış" tahmini gerçekleştirebilir. Bu yaklaşım, geniş bir görev yelpazesinde genelleme yapan modern temel modeller için temeldir.

Gerçek Dünya Uygulamaları

Zero-Shot Learning, sistemlerin ilk eğitim verilerinin ötesinde genelleme yapabilmelerini sağlayarak çeşitli sektörlerde yenilikçiliği teşvik etmektedir. .

Açık Kelime Dağarcığı Nesne Algılama: YOLO gibi modern mimariler, kullanıcı tanımlı metin komutlarına dayalı olarak detect için ZSL'yi kullanır. Bu, önceden sabit bir sınıf listesi tanımlamanın imkansız olduğu senaryolarda, örneğin geniş video arşivlerinde belirli öğeleri arama gibi durumlarda nesne algılamaya olanak tanır. Google 'teki araştırmacılar, bu açık kelime dağarcığı yeteneklerinin sınırlarını zorlamaya devam ediyor.
Tıbbi Teşhis: Sağlık hizmetlerinde yapay zeka, nadir görülen hastalıklar için etiketli veri elde etmek genellikle zor ve pahalıdır. ZSL modelleri, PubMed gibi veritabanlarında bulunan tıbbi literatürden yaygın durumlar ve nadir görülen semptomların açıklamaları üzerinde eğitilebilir, böylece sistem, büyük bir pozitif vaka veri setine ihtiyaç duymadan tıbbi görüntülemede potansiyel nadir anomalileri işaretleyebilir. .
Yaban Hayatı Koruma: Tarım ve ekolojide yapay zeka için, nadiren fotoğrafı çekilen nesli tükenmekte olan türleri belirlemek çok önemlidir. ZSL, koruma uzmanlarının Encyclopedia of Life gibi biyolojik veritabanlarında tanımlanan özellik tabanlı açıklamaları kullanarak detect etmelerini sağlar. Bu, nesli tükenmekte olan türlerin

Ultralytics ile Sıfır Atış Tespiti

Ultralytics YOLO modeli, Zero-Shot Learning'in işleyişini örneklemektedir. Kullanıcıların, modeli yeniden eğitmeden çalışma sırasında dinamik olarak özel sınıflar tanımlamasına olanak tanır. Bu , doğal dili anlayan bir metin kodlayıcı backbone sağlam bir algılama backbone birbirine bağlayarak gerçekleştirilir.

Aşağıdaki Python , YOLO kullanarak, standart eğitim setinin açıkça bir parçası olmayan detect ultralytics Paket.

from ultralytics import YOLOWorld

# Load a pre-trained YOLO-World model capable of Zero-Shot Learning
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes via text prompts (e.g., specific accessories)
# The model adjusts to detect these new classes without retraining
model.set_classes(["blue backpack", "red apple", "sunglasses"])

# Run inference on an image to detect the new zero-shot classes
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

İlgili Kavramlardan Ayrım

ZSL'yi tam olarak anlamak için, onu şu alanlarda kullanılan benzer öğrenme stratejilerinden ayırmak yararlı olacaktır bilgisayar görüşü (CV):

Az Atışlı Öğrenme (FSL): ZSL hedef sınıfın örneklerini gerektirmezken, FSL modele uyum sağlaması için çok küçük bir destek seti (genellikle 1 ila 5 örnek) sağlar. ZSL, görsel örneklerden ziyade tamamen anlamsal çıkarımlara dayandığı için genellikle daha zorlu olarak kabul edilir.
Tek Seferlik Öğrenme: Bir alt kümesi FSL'de model tam olarak bir etiketli örnekten öğrenir. ZSL temelde farklılık gösterir çünkü yeni kategoriye ait tek bir resim bile yok.
Transfer Öğrenimi: Bu geniş kapsamlı terimi, bilginin bir görevden diğerine aktarılmasını ifade eder. ZSL, özel bir transfer öğrenme türüdür. Geleneksel sınıflandırma yöntemlerine ihtiyaç duymadan bilgiyi görünmeyen sınıflara aktarmak için anlamsal öznitelikleri kullanır. yeni veriler üzerinde ince ayar.

Zorluklar ve Geleceğe Bakış

ZSL büyük bir potansiyel sunarken, eğitim sırasında öğrenilen anlamsal özelliklerin görülmemiş sınıfların görsel görünümüne tam olarak uymadığı etki alanı kayması sorunu gibi zorluklarla da karşı karşıyadır. Ayrıca, ZSL modelleri, görülen sınıflar için tahmin doğruluğunun görülmemiş sınıflara kıyasla önemli ölçüde daha yüksek olduğu önyargı sorunundan muzdarip olabilir. Bu nedenle, bu çalışmada, ZSL'nin önyargı sorununu ortadan kaldırmak için bir yaklaşım geliştirilmiştir. Bu yaklaşım, ZSL'nin önyargı sorununu ortadan kaldırmak için bir yaklaşım geliştirmiştir.

Stanford Üniversitesi'nin AI Lab ve IEEE Computer Society gibi kuruluşların araştırmaları bu sınırlamaları ele almaya devam ediyor. Bilgisayar görmearaçları daha sağlam hale geldikçe, ZSL'nin standart bir özellik haline gelmesi ve büyük veri etiketleme çabalarına olan bağımlılığı azaltması bekleniyor. Gelişmiş modelleri kullanıma sunmadan önce veri kümelerini verimli bir şekilde yönetmek isteyen ekipler için Ultralytics , açıklama ve veri kümesi yönetimi için kapsamlı araçlar sunuyor.

Sıfır Atışlı Öğrenme

Sektörler arası iş akışlarını kolaylaştırmak için Ultralytics YOLO modellerini eğitin

Yeniliklerinizi güçlendirmek için esnek kurumsal lisanslama çözümü

Ultralytics YOLO ile yapay zeka modellerini saniyeler içinde eğitin

Zero-Shot Öğrenme Nasıl Çalışır?

Gerçek Dünya Uygulamaları

Ultralytics ile Sıfır Atış Tespiti

İlgili Kavramlardan Ayrım

Zorluklar ve Geleceğe Bakış

Bu kategoride daha fazla okuyun

Bilgisayar görme teknolojisi ile desteklenen 12 hava görüntüsü kullanım örneği

Monoküler derinlik tahmini nedir? Genel bakış

AI tehdit tespiti için Ultralytics YOLO kullanımına bir bakış

Ultralytics topluluğuna katılın