Yerleştirmelerin ne olduğunu ve NLP, öneriler ve bilgisayarla görme için verilerdeki anlamsal ilişkileri yakalayarak yapay zekayı nasıl güçlendirdiklerini öğrenin.
Makine öğrenimi (ML) ve yapay zeka (AI) alanında, katıştırmalar, kelimeler, cümleler, görüntüler veya diğer öğeler gibi karmaşık verileri çok boyutlu bir uzayda yoğun sayısal vektörler olarak temsil etmek için temel bir tekniktir. Bu dönüşüm verilerden öğrenilir ve algoritmaların girdinin semantik anlamını, bağlamını veya temel özelliklerini yakalamasını sağlar. Birincil avantajı, eğitim verilerine dayanarak benzer kabul edilen öğelerin bu "gömme uzayında" yakın noktalarla eşleştirilmesi ve makinelerin karmaşık ilişkileri ve kalıpları tek vuruşlu kodlama gibi geleneksel seyrek temsillerden çok daha etkili bir şekilde anlamasına olanak sağlamasıdır.
Gömmeler, ayrık değişkenlerin (kelimeler gibi) veya karmaşık nesnelerin (resimler veya kullanıcı profilleri gibi) öğrenilmiş, nispeten düşük boyutlu vektör temsilleridir. Her bir boyutun tek bir öğeye karşılık geldiği ve içsel ilişki bilgisinden yoksun olduğu çok yüksek boyutlu, seyrek vektörler oluşturan one-hot kodlama gibi yöntemlerin aksine, katıştırmalar, her bir boyutun öğenin özelliklerini temsil etmeye katkıda bulunduğu yoğun vektörlerdir (genellikle onlarca ila binlerce boyuta sahiptir). En önemlisi, bu vektörlerin gömme uzayındaki konumu anlamsal ilişkileri yakalar. Örneğin, kelime yerleştirmelerinde, "kral" ve "kraliçe" veya "yürümek" ve "koşmak" gibi benzer anlamlara sahip veya benzer bağlamlarda kullanılan kelimeler, matematiksel olarak yakın vektörlere sahip olacaktır (örneğin, Kosinüs Benzerliği kullanılarak). Bu yakınlık, verilerden öğrenilen anlamsal benzerliği yansıtır.
Gömmeler tipik olarak kendi kendine denetimli öğrenme gibi teknikler aracılığıyla büyük veri kümeleri üzerinde eğitilen sinir ağı (NN) modelleri kullanılarak oluşturulur. Örneğin, Word2Vec tarafından örneklendirilen kelime katıştırmaları için yaygın bir teknik, büyük bir metin külliyatı içinde çevresindeki kelimelere (bağlamına) dayalı olarak bir kelimeyi tahmin etmek için bir modelin eğitilmesini içerir. Bu eğitim süreci sırasında ağ, geri yayılım gibi yöntemlerle tahmin hatalarını en aza indirmek için her bir kelime için gömme vektörleri de dahil olmak üzere dahili parametrelerini ayarlar. Ortaya çıkan vektörler sözdizimsel ve anlamsal bilgileri dolaylı olarak kodlar. Gömme uzayındaki boyut sayısı kritik bir hiper parametredir ve modelin ayrıntıları yakalama kapasitesi ile hesaplama maliyeti ve aşırı uyum riskini etkiler. Bu yüksek boyutlu veri uzaylarını görselleştirmek genellikle t-SNE veya PCA gibi boyut azaltma tekniklerini gerektirir ve bunlar TensorFlow or gibi araçlar kullanılarak keşfedilebilir.
Gömüler, çeşitli alanlardaki birçok modern yapay zeka sisteminde çok önemli bileşenlerdir:
Yerleştirmeleri ilgili terimlerden ayırmak faydalı olacaktır:
Gömüler, makine öğrenimi modelleri için verileri temsil etmenin güçlü bir yolunu sunarak, metinden görüntülere kadar çeşitli veri türlerindeki anlamsal benzerlikleri ve karmaşık desenleri anlamalarını sağlar. Bunlar, çok sayıda yapay zeka uygulamasında gelişmeleri yönlendiren temel bir teknolojidir ve aşağıdaki gibi modern makine öğrenimi çerçevelerinin yeteneklerinin ayrılmaz bir parçasıdır PyTorch ve TensorFlow.