Gömme (embedding) nedir ve NLP, öneriler ve bilgisayarlı görü için verilerdeki semantik ilişkileri yakalayarak yapay zekayı nasıl güçlendirir öğrenin.
Gömüler, ayrık değişkenlerin yoğun, düşük boyutlu ve sürekli vektör temsilleridir. modern veri̇ bi̇çi̇mi̇nde temel yapay zeka (AI). Büyük ve verimsiz vektörlerle sonuçlanabilen tek vuruşlu kodlama gibi seyrek temsillerin aksine, katıştırmalar, yüksek boyutlu verileri eşleştirerek anlamsal ilişkileri ve verilerin altında yatan anlamı yakalar kelimeler, görüntüler veya ses gibi girdileri kompakt bir sayısal uzaya dönüştürür. Bu öğrenilmiş vektör uzayında benzer özellikler veya bağlamlar birbirlerine yakın konumdadır, bu da makine öğrenimi (ML) modeller karmaşık örüntüleri sezgisel olarak anlamak ve işlemek için.
Yerleştirmelerin arkasındaki temel kavram, ham verilerin bilgisayarların işleyebileceği matematiksel bir forma dönüştürülmesidir verimli bir şekilde. Bu süreç tipik olarak bir sinir ağı (NN) öğrenen girdileri gerçek sayıların vektörlerine eşlemek için. sırasında model eği̇ti̇mi̇ aşaması, ağ ayarlar Bu vektörler arasındaki mesafe, temsil ettikleri öğelerin benzerliğine karşılık gelecektir.
Örneğin, içinde doğal dil işleme (NLP)"kral" ve "kraliçe" kelimelerinin gömülmeleri matematiksel olarak birbirlerine daha yakın olacaktır anlamsal ilişkilerini yansıtan "elma "dan daha fazla. Bu dönüşüm bir çeşit boyutsallık azaltmaBu, gürültüyü atarken temel bilgileri koruyarak sınıflandırma veya kümeleme önemli ölçüde daha etkilidir.
Gömüler tipik olarak eğitimin bir yan ürünü olarak oluşturulur derin öğrenme (DL) modeller üzerinde büyük veri kümeleri. Aşağıdaki gibi çerçeveler PyTorch ve TensorFlow özellikle katmanlar sağlamak bu temsilleri öğrenmek için tasarlanmıştır.
Görüntüler için standart katıştırmalar oluşturabilirsiniz bilgisayarla görme (CV) iş akışları. Aşağıdaki Python parçacığı, önceden eğitilmiş bir görüntü kullanarak bir görüntüden katıştırmaların nasıl çıkarılacağını göstermektedir Ultralytics YOLO11 sınıflandırma modeli.
from ultralytics import YOLO
# Load a YOLO11 classification model
model = YOLO("yolo11n-cls.pt")
# Generate embeddings for an image from a URL
# The embed() method specifically returns the feature vector
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")
# Output the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")
Gömüler, sistemlerin yapılandırılmamış verileri işleme biçiminde devrim yaratarak daha önce İmkansız.
Yerleştirmeler ve ilgili terimler arasındaki ayrımı anlamak, yapay zeka ortamında gezinmek için çok önemlidir.
Soyut kavramları matematiksel vektörlere dönüştüren katıştırmalar, insan sezgisi ile makine mantığı, sofistike örüntü tanıma görülen yetenekler günümüzün en gelişmiş yapay zeka uygulamalarında.

