Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Gömme (Embeddings)

Gömme (embedding) nedir ve NLP, öneriler ve bilgisayarlı görü için verilerdeki semantik ilişkileri yakalayarak yapay zekayı nasıl güçlendirir öğrenin.

Gömme, ayrık değişkenlerin yoğun, düşük boyutlu, sürekli vektör temsilleridir ve insan verileri ile makine mantığı arasında temel bir çevirmen görevi görür. Yapay Zeka (AI) alanında, bilgisayarlar metin, görüntü veya ses gibi dağınık, yapılandırılmamış verileri sezgisel olarak anlayamazlar. Gömme, bu girdileri vektörler olarak bilinen gerçek sayı listelerine dönüştürerek bu sorunu çözer. Vektörler, yüksek boyutlu matematiksel uzayda var olurlar. Gömme işlemleri, bu girdileri yüksek boyutlu matematiksel uzayda bulunan vektörler olarak bilinen gerçek sayı listelerine dönüştürerek bu sorunu çözer. Bir nesneye rastgele bir kimlik atayan geleneksel kodlamaların aksine, gömme işlemleri eğitim yoluyla öğrenilir ve "kral" ve "kraliçe" kelimeleri veya iki farklı kedinin görüntüleri gibi anlamsal olarak benzer öğelerin vektör uzayında birbirine yakın konumlandırılmasını sağlar. .

Yerleştirmeler Nasıl Çalışır?

Gömme oluşturma, ham verilerin özellik çıkarma için tasarlanmış bir sinir ağına beslenmesini içerir. Eğitim sırasında model, girişin temel özelliklerini kompakt bir sayısal forma sıkıştırmayı öğrenir. Örneğin, bir fotoğrafı analiz eden bir Bilgisayar Görme (CV) modeli sadece pikselleri görmez; şekilleri, dokuları ve renkleri çok boyutlu bir grafikte belirli bir koordinata eşler. Benzerliği ölçerken, sistemler bu koordinatlar arasındaki mesafeyi kosinüs benzerliği veya Öklid mesafesi gibi metrikler kullanarak hesaplar. Bu matematiksel yakınlık, algoritmaların sınıflandırma ve kümeleme gibi karmaşık görevleri yüksek verimlilikle gerçekleştirmesini sağlar.

Gerçek Dünya Uygulamaları

Gömme yapılar, modern yazılım ürünlerinde kullanılan birçok akıllı özelliğin motoru görevi görür.

  • Anlamsal Arama: Geleneksel arama motorları genellikle tam anahtar kelime eşleşmesine dayanır, ancak kullanıcı "oto" sorgusu yaparken belge "araba" içeriyorsa bu yöntem başarısız olur. Gömme, kelimelerin ardındaki anlamı yakalar. Arama sorgusunu ve veritabanı belgelerini vektörler olarak temsil ederek, sistem belirli kelimeler farklı olsa bile kullanıcının amacına uygun sonuçları alabilir.
  • Öneri Sistemleri: Akış hizmetleri ve e-ticaret siteleri, kullanıcı deneyimlerini kişiselleştirmek için gömülü öğeler kullanır. Bir kullanıcı bir bilim kurgu filmi izlerse, sistem o filmin gömülü vektörünü tanımlar ve veritabanında benzer vektörlere sahip diğer filmleri arar . Bu, yalnızca manuel etiketler veya kategoriler yerine içerik benzerliğine dayalı doğru öneriler sunar .
  • Sıfır Atış Öğrenme: Gelişmiş modeller, metin ve görüntüler gibi farklı modaliteleri birbirine bağlamak için ortak gömmeleri kullanır. Bu, bir sistemin eğitim sırasında açıkça görmediği nesneleri, görüntü gömmesi ile nesnenin adının metin gömmesi arasında ilişki kurarak tanımayı sağlar.

Python ile Gömme Oluşturma

En son teknolojiye sahip modeller gibi YOLO26 verimli bir şekilde güçlü görüntü gömülerini oluşturmak için kullanılabilir. Aşağıdaki örnek, bir görüntüden kullanarak ultralytics Python paketi.

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate embeddings for an image
# The embed() method returns the feature vector representing the image content
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")

Gömme (Embeddings) ve İlgili Kavramlar

AI çözümlerini etkili bir şekilde uygulamak için, gömülü terimleri yakından ilişkili teknik terimlerden ayırmak yararlıdır.

  • Gömme ve Vektör Arama: Gömme, veri temsilinin kendisidir (sayılar listesi). Vektör arama, bu gömmeye en yakın komşuları bulmak için veritabanını sorgulama işlemidir. Vektör veritabanı olarak bilinen özel araçlar, bu gömmeleri büyük ölçekte depolamak ve aramak için sıklıkla kullanılır.
  • Gömme ve Tokenizasyon: Doğal Dil İşleme (NLP) alanında tokenizasyon, metni daha küçük parçalara (tokenler) ayırmanın ilk adımıdır. Bu tokenler daha sonra gömme işlemlerine eşlenir. Dolayısıyla tokenizasyon verileri hazırlarken, gömme işlemleri verilerin anlamını temsil eder.
  • Gömme ve Derin Öğrenme: Derin öğrenme, sinir ağlarına dayanan daha geniş bir makine öğrenimi alanıdır. Gömme, derin öğrenme mimarisi içindeki belirli bir çıktı veya katmandır ve genellikle ham girdiler ile modelin karar verme katmanları arasında köprü görevi görür.

Özelleştirilmiş gömülü öğeler oluşturmak için açıklama ve model eğitimi dahil olmak üzere veri kümelerinin yaşam döngüsünü yönetmek isteyen geliştiriciler Ultralytics kullanabilirler. Bu kapsamlı araç, veri yönetiminden dağıtıma kadar iş akışını basitleştirerek uygulamalarınızı destekleyen gömülü öğelerin yüksek kaliteli, iyi düzenlenmiş verilerden elde edilmesini sağlar. PyTorch veya TensorFlowgibi çerçeveler kullanıyor olun, gömülü öğeleri ustaca kullanmak, gelişmiş desen tanıma sistemleri oluşturmanın önemli bir adımıdır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın