Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Gömme (Embeddings)

Gömme (embedding) nedir ve NLP, öneriler ve bilgisayarlı görü için verilerdeki semantik ilişkileri yakalayarak yapay zekayı nasıl güçlendirir öğrenin.

Gömütlemeler, kelimeler, resimler veya hatta kullanıcılar gibi yüksek boyutlu verileri anlamlı, yoğun ve düşük boyutlu sayısal vektörlere dönüştürmek için güçlü bir yöntem sunan modern makine öğreniminin (ML) temel taşıdır. Bir gömütlemenin temel amacı, orijinal verinin semantik ilişkilerini ve temel bağlamını yakalamaktır. Bu vektör uzayında, benzer anlamlara veya özelliklere sahip öğeler birbirine daha yakın konumlandırılır. Bu, AI modellerinin ham, yapılandırılmamış verilerle imkansız olacak karmaşık akıl yürütme ve benzerlik görevlerini gerçekleştirmesini sağlar.

Gömütlemeler (Embeddings) Nasıl Oluşturulur?

Gömütlemeler tipik olarak bir derin öğrenme modeli tarafından eğitim sürecinde otomatik olarak öğrenilir. Genellikle PyTorch veya TensorFlow gibi framework'lerle oluşturulmuş bir sinir ağı, bir cümledeki bir sonraki kelimeyi tahmin etmek veya bir görüntüyü sınıflandırmak gibi ilgili bir görev üzerinde eğitilir. Bu ağ içindeki gizli katmanlardan biri daha sonra gömütleme katmanı olarak kullanılır. Model görevini gerçekleştirmeyi öğrendikçe, her bir girdi öğesini en önemli özelliklerini kapsayan bir vektöre eşlemeyi etkili bir şekilde öğrenerek bu katmandaki ağırlıkları ayarlar. Bu işlem, büyük miktarda bilgiyi kompakt ve kullanışlı bir biçimde sıkıştıran bir boyut azaltma biçimidir.

Uygulamalar ve Örnekler

Gömütlemeler, doğal dil işlemeden (NLP) bilgisayarlı görüye kadar çok çeşitli AI uygulamaları için temeldir.

  • E-ticaret Öneri Motorları: Öneri sistemleri, hem kullanıcıları hem de ürünleri temsil etmek için gömme (embedding) kullanır. Bir kullanıcı sık sık benzer gömmelere sahip öğeler satın alır veya görüntülerse (örneğin, çeşitli koşu ekipmanları türleri), sistem bu vektör komşuluğundaki diğer ürünleri (enerji jelleri veya su mataraları gibi) belirleyebilir ve bunları önerebilir. Bu, basit anahtar kelime eşleştirmesinden çok daha etkilidir.
  • Semantic Search and Image Retrieval (Anlamsal Arama ve Görüntü Erişimi): Etiketlere veya meta verilere güvenmek yerine, anlamsal arama sistemleri, kavramsal anlama dayalı sonuçlar bulmak için gömme (embedding) kullanır. Bir kullanıcı "yaz tatili fotoğrafları" arayabilir ve sistem, bu kelimeler görüntünün açıklamasında olmasa bile plajların, dağların ve seyahat sahnelerinin görüntülerini alır. Bu, hem metin hem de görüntüler için hizalanmış gömmeler üreten ve güçlü çok modlu model yetenekleri sağlayan CLIP gibi modeller tarafından desteklenir. Aynı ilke, birçok modern uygulamada önemli bir özellik olan güçlü görsel aramaya olanak tanır. Hatta benzerlik arama kılavuzumuzla kendinizinkini oluşturabilirsiniz.

Diğer uygulamalar arasında moleküllerin etkileşimlerini tahmin etmek için gömüldüğü ilaç keşfi ve benzer ses özelliklerine sahip şarkıları öneren müzik akışı hizmetleri yer alır.

Gömme (Embeddings) ve İlgili Kavramlar

Gömme (embeddings) kavramını ilgili terimlerden ayırmak faydalıdır:

  • Gömme (Embedding) - Öznitelik Çıkarımı (Feature Extraction) Karşılaştırması: Gömme, derin öğrenme yoluyla elde edilen gelişmiş, genellikle otomatik bir öznitelik çıkarımı biçimidir. Geleneksel öznitelik mühendisliği özellikleri manuel olarak tanımlamayı (örneğin, görüntüler için renk histogramları) içerebilirken, gömmeler eğitim sırasında ilgili özellikleri doğrudan verilerden öğrenir.
  • Gömme (Embedding) - Vektör Araması / Vektör Veritabanları Karşılaştırması: Gömme, veri öğelerinin vektör temsilleridir. Vektör araması, bir sorgu vektörüne en çok benzeyen (en yakın) olanları bulmak için bir gömme koleksiyonunu sorgulama işlemidir, genellikle verimlilik için Yaklaşık En Yakın Komşu (Approximate Nearest Neighbor - ANN) algoritmaları kullanılır. Vektör veritabanları (örneğin, Pinecone veya Milvus), büyük hacimli gömmeler üzerinde hızlı vektör aramaları depolamak, indekslemek ve gerçekleştirmek için optimize edilmiş özel veritabanlarıdır.
  • Gömme (Embedding) - Tokenizasyon Karşılaştırması: Tokenizasyon, metni daha küçük birimlere (token'lar) ayırma işlemidir. Bu token'lar daha sonra gömmelere eşlenir. Bu nedenle, tokenizasyon, gömme temsilinin oluşturulmasından veya alınmasından önce gelen ön bir adımdır. BERT ve GPT-4 gibi önemli NLP modelleri bu iki adımlı sürece dayanır.

Gömütlemeler, makine öğrenimi modelleri için verileri temsil etmenin güçlü bir yolunu sağlayarak, çeşitli veri türlerinde semantik benzerlikleri ve karmaşık kalıpları anlamalarını sağlar. Nesne algılama ve görüntü sınıflandırma gibi görevler için gelişmiş AI modellerinin oluşturulmasını basitleştiren Ultralytics HUB gibi modern ML platformlarının yetenekleri için ayrılmaz bir parçadır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı