Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Tek Çekim Öğrenimi

AI'da Tek Seferlik Öğrenmeyi Keşfedin. Verimli bilgisayar görüşü için Ultralytics ve Siamese ağlarını kullanarak tek bir görüntüden classify nasıl classify öğrenin.

One-Shot Learning, tek bir eğitim örneğinden nesne kategorileri hakkında bilgi öğrenmek için tasarlanmış, makine öğreniminde (ML) kullanılan özel bir sınıflandırma tekniğidir. Etkili bir genelleme yapmak için binlerce açıklamalı görüntü içeren büyük veri kümelerine ihtiyaç duyan geleneksel derin öğrenme (DL) algoritmalarından farklı olarak, One-Shot Learning, yeni bir kavramı anında kavrama konusunda insanın bilişsel yeteneğini taklit eder. Örneğin , bir kişi genellikle egzotik bir kuşu sadece bir kez gördükten sonra tanıyabilir; bu metodoloji, yapay zeka (AI) sistemlerinde bu verimliliği taklit etmeye çalışır. Bu , veri etiketlemenin pahalı olduğu, verilerin kıt olduğu veya tüm modeli yeniden eğitmeden dinamik olarak yeni kategorilerin eklenmesi gereken senaryolarda özellikle değerlidir.

Kavramın Arkasındaki Mekanizmalar

Tek Atışlı Öğrenmenin temel prensibi, hedefi standart sınıflandırmadan benzerlik değerlendirmesine kaydırmaktır. Sinir ağını (NN) belirli bir sınıf etiketi (örneğin, "köpek" veya "kedi") çıkarmak için eğitmek yerine, model bir mesafe fonksiyonu öğrenir. Bunun için kullanılan yaygın bir mimari Siyam sinir ağıdır. Bu , aynı model ağırlıklarını paylaşan iki özdeş alt ağdan oluşur.

Çalışma sırasında, ağ giriş görüntülerini gömme olarak bilinen kompakt sayısal vektörlere dönüştürmek için özellik çıkarma işlemi gerçekleştirir. Sistem daha sonra yeni bir sorgu görüntüsünün gömmesini tek bir referans görüntünün gömmesiyle karşılaştırır "çekim"in gömülmesiyle karşılaştırır. Genellikle Öklid mesafesi veya kosinüs benzerliğikullanılarak hesaplanan matematiksel mesafe belirli bir eşiğin altındaysa, görüntülerin aynı sınıfa ait olduğu belirlenir. Bu, modelin kimliği doğrulamasını veya classify öğrenilen özellik uzayındaki yakınlıklarına göre classify sağlar.

Aşağıdaki Python , gömülü öğeleri nasıl çıkaracağınızı ve bir YOLO26 sınıflandırma modelinden ultralytics Paket.

import numpy as np
from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model for feature extraction
model = YOLO("yolo26n-cls.pt")

# Extract embeddings for a reference 'shot' and a query image
# The embed() method returns the feature vector directly
shot_vec = model.embed("reference_img.jpg")[0]
query_vec = model.embed("query_img.jpg")[0]

# Calculate similarity (higher dot product implies greater similarity)
similarity = np.dot(shot_vec, query_vec) / (np.linalg.norm(shot_vec) * np.linalg.norm(query_vec))

print(f"Similarity Score: {similarity:.4f}")

İlgili Paradigmaları Ayırt Etmek

One-Shot Learning'i diğer veri verimli öğrenme tekniklerinden ayırmak önemlidir, çünkü bunlar farklı kısıtlamalarla benzer sorunları çözerler:

  • Az Atışlı Öğrenme (FSL): Bu , Tek Atışlı Öğrenmeyi kapsayan daha geniş bir kategoridir. FSL'de, modele genellikle sınıf başına iki ila beş görüntüden oluşan küçük bir "destek küme" örnekleri sağlanır. Tek Atışlı Öğrenme, destek kümesinin boyutu tam olarak bir olduğu aşırı bir durumdur.
  • Sıfır Atış Öğrenme (ZSL): ZSL , modelin görsel olarak hiç görmediği kategorileri tanımakla ilgilenir. Referans görüntü yerine, ZSL anlamsal özelliklere veya metin açıklamalarına (örneğin, görsel özellikleri "çizgili at" metin açıklamasıyla ilişkilendirerek "zebra"yı tanımlamak) doğal dil işleme (NLP) yoluyla güvenir.
  • Transfer Öğrenimi: Bu , ImageNet gibi büyük bir veritabanında önceden eğitilmiş bir modeli ImageNet gibi büyük bir veritabanında önceden eğitilmiş bir modeli alıp yeni bir görev için ince ayar yapmayı içerir. Transfer öğrenimi, Tek Seferlik Öğrenmede kullanılan özellik çıkarıcıları güçlendirirken, standart transfer öğrenimi genellikle aşırı uyum sağlamadan ağırlıkları etkili bir şekilde güncellemek için birden fazla örnek gerektirir .

Gerçek Dünya Uygulamaları

One-Shot Learning, büyük miktarda eğitim verisi toplamak pratik olmayan sektörlerde yeni olanaklar sunmuştur. .

Yüz Tanıma ve Güvenlik

One-Shot Learning'in en yaygın uygulaması biyometrik güvenliktir. Akıllı telefonda Face ID'yi kurarken veya çalışan erişim sistemine kaydolurken, cihaz kullanıcının yüzünün tek bir matematiksel temsilini yakalar . Günlük kullanım sırasında, yüz tanıma sistemi canlı kamera görüntüsünü bu depolanan "tek çekim" ile karşılaştırarak kimliği doğrular. Bu, temel FaceNet araştırmasında tartışılanlar gibi sağlam gömme tekniklerine dayanır ve ışıklandırma veya açıdaki değişikliklerin benzerlik eşleşmesini bozmamasını sağlar .

Endüstriyel Kalite Kontrolü

Üretimde yapay zeka alanında, "kusurlu" parçaların dengeli bir veri seti oluşturmak zordur, çünkü kusurlar nadir ve tutarsızdır. Tek Seferlik Öğrenme , bilgisayar görme (CV) sistemlerinin tek bir "mükemmel" referans parçanın temsilini öğrenmesini sağlar. Montaj hattındaki herhangi bir parça, bu referanstan Montaj hattındaki bu referanstan önemli ölçüde uzak bir gömme sonucu veren herhangi bir parça, anormallik tespiti için işaretlenir. Bu, binlerce bozuk parça görüntüsüne ihtiyaç duymadan anında kalite güvence sağlar ve bu görüntüler Ultralytics aracılığıyla yönetilebilir ve dağıtılabilir .

Zorluklar ve Geleceğe Bakış

Güçlü olmasına rağmen, Tek Seferlik Öğrenme gürültüye karşı hassastır; tek referans görüntüsü bulanık, engellenmiş veya temsili değilse, modelin o sınıfı tanıma yeteneği önemli ölçüde azalır. Araştırmacılar genellikle meta öğrenmeyi veya "öğrenmeyi öğrenmeyi" kullanarak model kararlılığını ve genellemeyi iyileştirirler. Mimariler geliştikçe, YOLO26 gibi yeni modeller, tek seferlik çıkarımları daha hızlı ve daha doğru hale getiren daha sağlam özellik çıkarıcıları içermekte ve daha uyarlanabilir ve akıllı kenar AI cihazlarının önünü açmaktadır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın