Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Gömme (Embeddings)

Gömme (embedding) nedir ve NLP, öneriler ve bilgisayarlı görü için verilerdeki semantik ilişkileri yakalayarak yapay zekayı nasıl güçlendirir öğrenin.

Gömüler, ayrık değişkenlerin yoğun, düşük boyutlu ve sürekli vektör temsilleridir. modern veri̇ bi̇çi̇mi̇nde temel yapay zeka (AI). Büyük ve verimsiz vektörlerle sonuçlanabilen tek vuruşlu kodlama gibi seyrek temsillerin aksine, katıştırmalar, yüksek boyutlu verileri eşleştirerek anlamsal ilişkileri ve verilerin altında yatan anlamı yakalar kelimeler, görüntüler veya ses gibi girdileri kompakt bir sayısal uzaya dönüştürür. Bu öğrenilmiş vektör uzayında benzer özellikler veya bağlamlar birbirlerine yakın konumdadır, bu da makine öğrenimi (ML) modeller karmaşık örüntüleri sezgisel olarak anlamak ve işlemek için.

Yerleştirmeler Nasıl Çalışır?

Yerleştirmelerin arkasındaki temel kavram, ham verilerin bilgisayarların işleyebileceği matematiksel bir forma dönüştürülmesidir verimli bir şekilde. Bu süreç tipik olarak bir sinir ağı (NN) öğrenen girdileri gerçek sayıların vektörlerine eşlemek için. sırasında model eği̇ti̇mi̇ aşaması, ağ ayarlar Bu vektörler arasındaki mesafe, temsil ettikleri öğelerin benzerliğine karşılık gelecektir.

Örneğin, içinde doğal dil işleme (NLP)"kral" ve "kraliçe" kelimelerinin gömülmeleri matematiksel olarak birbirlerine daha yakın olacaktır anlamsal ilişkilerini yansıtan "elma "dan daha fazla. Bu dönüşüm bir çeşit boyutsallık azaltmaBu, gürültüyü atarken temel bilgileri koruyarak sınıflandırma veya kümeleme önemli ölçüde daha etkilidir.

Oluşturma ve Eğitim

Gömüler tipik olarak eğitimin bir yan ürünü olarak oluşturulur derin öğrenme (DL) modeller üzerinde büyük veri kümeleri. Aşağıdaki gibi çerçeveler PyTorch ve TensorFlow özellikle katmanlar sağlamak bu temsilleri öğrenmek için tasarlanmıştır.

  1. Başlatma: Gömme vektörleri genellikle rastgele değerlerle başlatılır.
  2. Öğrenme: Model belirli bir hedef için en iyi duruma getirilirken - örneğin bir sonraki kelimeyi tahmin etmek gibi dizisi veya bir görüntüdeki nesnelerin tanımlanması - model ağırlıkları ile ilişkili gömme katmanı güncellenir.
  3. Sonuç: Son öğrenilen ağırlıklar gömme arama tablosu olarak hizmet eder, burada her bir girdi belirteci veya nesnesi belirli bir yoğun vektöre karşılık gelir.

Görüntüler için standart katıştırmalar oluşturabilirsiniz bilgisayarla görme (CV) iş akışları. Aşağıdaki Python parçacığı, önceden eğitilmiş bir görüntü kullanarak bir görüntüden katıştırmaların nasıl çıkarılacağını göstermektedir Ultralytics YOLO11 sınıflandırma modeli.

from ultralytics import YOLO

# Load a YOLO11 classification model
model = YOLO("yolo11n-cls.pt")

# Generate embeddings for an image from a URL
# The embed() method specifically returns the feature vector
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")

# Output the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")

Gerçek Dünya Uygulamaları

Gömüler, sistemlerin yapılandırılmamış verileri işleme biçiminde devrim yaratarak daha önce İmkansız.

  • Anlamsal Arama Motorları: Geleneksel arama motorları, genellikle başarısız olan anahtar kelime eşleştirmesine dayanır sorgularda eş anlamlı kelimeler kullanıldığında. Anlamsal arama kaldıraçlar Bir sorgunun amacını belgelerin veya görüntülerin içeriğiyle eşleştirmek için katıştırmalar. Vektörü karşılaştırarak sorgu gömme ve belge gömme arasındaki mesafe, sistem kavramsal olarak aynı olan sonuçları getirir. tam olarak aynı kelimeleri paylaşmasalar bile.
  • Kişiselleştirilmiş Öneri Sistemleri: Netflix veya Amazon gibi platformlar, kullanıcıyı modellemek için katıştırmaları kullanır tercihleri ve öğe özellikleri. Bir kullanıcı bir bilim kurgu filmi izlerse öneri̇ si̇stemi̇ olabilir benzer gömme vektörlerine sahip diğer filmleri önerir. Genellikle en yakın komşu kullanılarak uygulanan bu yaklaşım algoritmaları bir vektör veritabanımilyonlarca öğeye verimli bir şekilde ölçeklenir.
  • Sıfır Atışlı Öğrenme: Gibi gelişmiş modeller KLİP metin ve görüntüler için ortak katıştırmalar öğrenir. Bu, bir sistemin daha önce hiç görmediği görüntüleri classify olanak tanır. olarak bilinen bir teknik olan görüntü gömme ile sınıf adlarının metin gömmelerini karşılaştırarak eğitim sıfır atışla öğrenme.

Gömme (Embeddings) ve İlgili Kavramlar

Yerleştirmeler ve ilgili terimler arasındaki ayrımı anlamak, yapay zeka ortamında gezinmek için çok önemlidir.

  • Gömme ve Özellik Çıkarma: Her ikisi de verilerin sayısal özelliklere dönüştürülmesini içerir, özellik çıkarma başvurabilir manuel tekniklere (kenar algılama gibi) veya otomatik tekniklere. Gömmeler, otomatikleştirilmiş, öğrenilmiş Genellikle diğer modeller veya benzerlik görevleri için girdi olarak kullanılan yoğun vektörlerle sonuçlanan özellik çıkarma.
  • Gömme ve Vektör Arama: Gömme, veri yapısıdır (vektörün kendisi). Vektör arama bu Benzer öğeleri bulmak için bu katıştırmalardan oluşan bir koleksiyonu sorgulama işlemi. Gibi teknolojiler Pinecone veya Milvus gömülmeleri depolamak ve bu aramayı gerçekleştirmek için tasarlanmıştır verimli bir şekilde.
  • Gömme ve Tokenizasyon: Metin işlemede, belirteçleştirme 'nin adımıdır. metni daha küçük birimlere bölmek belirteçler. Bu belirteçler, karşılık gelen gömme vektörlerini arayan ayrık tanımlayıcılardır (tamsayılar). Böylece, tokenization, boru hattındaki gömülmelerin alınmasından önce gelir.

Soyut kavramları matematiksel vektörlere dönüştüren katıştırmalar, insan sezgisi ile makine mantığı, sofistike örüntü tanıma görülen yetenekler günümüzün en gelişmiş yapay zeka uygulamalarında.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın