Sözlük

Gömüler

Yerleştirmelerin ne olduğunu ve NLP, öneriler ve bilgisayarla görme için verilerdeki anlamsal ilişkileri yakalayarak yapay zekayı nasıl güçlendirdiklerini öğrenin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Makine öğrenimi (ML) ve yapay zeka (AI) alanında, katıştırmalar, kelimeler, cümleler, görüntüler veya diğer öğeler gibi karmaşık verileri çok boyutlu bir uzayda yoğun sayısal vektörler olarak temsil etmek için temel bir tekniktir. Bu dönüşüm verilerden öğrenilir ve algoritmaların girdinin semantik anlamını, bağlamını veya temel özelliklerini yakalamasını sağlar. Birincil avantajı, eğitim verilerine dayanarak benzer kabul edilen öğelerin bu "gömme uzayında" yakın noktalarla eşleştirilmesi ve makinelerin karmaşık ilişkileri ve kalıpları tek vuruşlu kodlama gibi geleneksel seyrek temsillerden çok daha etkili bir şekilde anlamasına olanak sağlamasıdır.

Yerleştirmeler Nedir?

Gömmeler, ayrık değişkenlerin (kelimeler gibi) veya karmaşık nesnelerin (resimler veya kullanıcı profilleri gibi) öğrenilmiş, nispeten düşük boyutlu vektör temsilleridir. Her bir boyutun tek bir öğeye karşılık geldiği ve içsel ilişki bilgisinden yoksun olduğu çok yüksek boyutlu, seyrek vektörler oluşturan one-hot kodlama gibi yöntemlerin aksine, katıştırmalar, her bir boyutun öğenin özelliklerini temsil etmeye katkıda bulunduğu yoğun vektörlerdir (genellikle onlarca ila binlerce boyuta sahiptir). En önemlisi, bu vektörlerin gömme uzayındaki konumu anlamsal ilişkileri yakalar. Örneğin, kelime yerleştirmelerinde, "kral" ve "kraliçe" veya "yürümek" ve "koşmak" gibi benzer anlamlara sahip veya benzer bağlamlarda kullanılan kelimeler, matematiksel olarak yakın vektörlere sahip olacaktır (örneğin, Kosinüs Benzerliği kullanılarak). Bu yakınlık, verilerden öğrenilen anlamsal benzerliği yansıtır.

Yerleştirmeler Nasıl Çalışır?

Gömmeler tipik olarak kendi kendine denetimli öğrenme gibi teknikler aracılığıyla büyük veri kümeleri üzerinde eğitilen sinir ağı (NN) modelleri kullanılarak oluşturulur. Örneğin, Word2Vec tarafından örneklendirilen kelime katıştırmaları için yaygın bir teknik, büyük bir metin külliyatı içinde çevresindeki kelimelere (bağlamına) dayalı olarak bir kelimeyi tahmin etmek için bir modelin eğitilmesini içerir. Bu eğitim süreci sırasında ağ, geri yayılım gibi yöntemlerle tahmin hatalarını en aza indirmek için her bir kelime için gömme vektörleri de dahil olmak üzere dahili parametrelerini ayarlar. Ortaya çıkan vektörler sözdizimsel ve anlamsal bilgileri dolaylı olarak kodlar. Gömme uzayındaki boyut sayısı kritik bir hiper parametredir ve modelin ayrıntıları yakalama kapasitesi ile hesaplama maliyeti ve aşırı uyum riskini etkiler. Bu yüksek boyutlu veri uzaylarını görselleştirmek genellikle t-SNE veya PCA gibi boyut azaltma tekniklerini gerektirir ve bunlar TensorFlow or gibi araçlar kullanılarak keşfedilebilir.

Gömme Uygulamaları

Gömüler, çeşitli alanlardaki birçok modern yapay zeka sisteminde çok önemli bileşenlerdir:

  • Doğal Dil İşleme (NLP): Gömüler kelimeleri, cümleleri veya tüm belgeleri temsil eder. BERT ve Transformer mimarileri gibi modeller, makine çevirisi, duygu analizi, soru yanıtlama ve etkili semantik arama gibi görevler için dil nüanslarını anlamak üzere büyük ölçüde katıştırmalara güvenir. Örnek: Bir müşteri destek sohbet robotu, kullanıcının sorgusu tam anahtar kelimeleri kullanmasa bile bilgi tabanında en alakalı yanıtı bulmak için cümle katıştırmalarını kullanır.
  • Tavsiye Sistemleri: Gömüler kullanıcıları ve öğeleri (filmler, ürünler veya makaleler gibi) temsil edebilir. Kullanıcılar ve beğendikleri öğeler gömme uzayında birbirine yakın olacak şekilde gömmeleri öğrenerek, sistemler bir kullanıcının daha önce etkileşimde bulunduğu veya benzer kullanıcılar tarafından beğenilenlere benzer yeni öğeler önerebilir(işbirlikçi filtreleme). Netflix ve Amazon gibi şirketler bunu yaygın olarak kullanmaktadır.
  • Bilgisayarla Görme (CV): Görüntüler veya görüntü yamaları, görsel özellikleri yakalayan gömülere dönüştürülebilir. Bu, görüntü alma (görsel olarak benzer görüntüleri bulma), görüntü sınıflandırma gibi görevler için temeldir ve aşağıdaki gibi modeller tarafından gerçekleştirilen nesne algılama ve görüntü segmentasyonu gibi daha karmaşık görevler için temel oluşturur Ultralytics YOLO. Örnek: Bir e-ticaret platformu, kullanıcıların bir giyim eşyasının fotoğrafını yüklemelerine ve kataloglarında benzer ürünleri bulmalarına olanak sağlamak için görüntü yerleştirmeleri kullanır. Ultralytics HUB gibi platformlar, bu tür modellerin eğitimini ve dağıtımını kolaylaştırır.
  • Grafik Analitiği: Gömüler, genellikle Grafik Sinir Ağları (GNN'ler) kullanarak bağlantı tahmini veya topluluk tespiti gibi görevler için ağ yapısını ve düğüm ilişkilerini yakalayarak grafiklerdeki düğümleri ve kenarları temsil edebilir.

Gömüler ve İlgili Kavramlar

Yerleştirmeleri ilgili terimlerden ayırmak faydalı olacaktır:

  • Gömmeler ve Özellik Çıkarma: Gömmeler, derin öğrenme yoluyla elde edilen sofistike ve genellikle otomatikleştirilmiş bir özellik çıkarma biçimidir. Geleneksel özellik mühendisliği, özelliklerin manuel olarak tanımlanmasını içerebilirken (örneğin, görüntüler için renk histogramları), katıştırmalar eğitim sırasında ilgili özellikleri doğrudan verilerden öğrenir.
  • Gömüler ve Vektör Arama / Vektör Veritabanları: Gömüler, veri öğelerinin vektör temsilleridir. Vektör arama, bir sorgu vektörüne en benzer (en yakın) olanları bulmak için bir gömme koleksiyonunu sorgulama işlemidir ve genellikle verimlilik için Yaklaşık En Yakın Komşu (YSA) algoritmaları kullanılır. Vektör veritabanları ( Pinecone veya Milvus gibi) büyük hacimli katıştırmaları depolamak, indekslemek ve bunlar üzerinde hızlı vektör aramaları gerçekleştirmek için optimize edilmiş özel veritabanlarıdır.

Gömüler, makine öğrenimi modelleri için verileri temsil etmenin güçlü bir yolunu sunarak, metinden görüntülere kadar çeşitli veri türlerindeki anlamsal benzerlikleri ve karmaşık desenleri anlamalarını sağlar. Bunlar, çok sayıda yapay zeka uygulamasında gelişmeleri yönlendiren temel bir teknolojidir ve aşağıdaki gibi modern makine öğrenimi çerçevelerinin yeteneklerinin ayrılmaz bir parçasıdır PyTorch ve TensorFlow.

Tümünü okuyun