Embeddings
Gömülü gösterimlerin (embeddings) insan verileri ile makine mantığı arasındaki köprüyü nasıl kurduğunu keşfet. Ultralytics YOLO26 kullanarak yapay zeka görevleri için vektör temsilleri oluşturmayı öğren ve Ultralytics Platform'u keşfet.
Embedding'ler, ayrık değişkenlerin yoğun, düşük boyutlu, sürekli vektör temsilleridir ve insan verisi ile makine mantığı arasında temel bir çevirmen görevi görür. Yapay Zeka (AI) dünyasında bilgisayarlar, metin, görsel veya ses gibi karmaşık ve yapılandırılmamış verileri sezgisel olarak anlayamazlar. Embedding'ler, bu girdileri yüksek boyutlu matematiksel bir uzayda var olan ve vektör olarak bilinen gerçek sayı listelerine dönüştürerek bu sorunu çözer. Bir nesneye sadece rastgele bir kimlik atayabilen geleneksel kodlamaların aksine, embedding'ler eğitim yoluyla öğrenilir ve böylece "kral" ve "kraliçe" kelimeleri veya iki farklı kedinin fotoğrafı gibi anlamsal olarak benzer öğelerin vektör uzayında birbirine yakın konumlandırılması sağlanır.
Link to this sectionEmbedding'ler Nasıl Çalışır?#
The creation of an embedding involves feeding raw data into a neural network designed for feature extraction. During training, the model learns to compress the essential characteristics of the input into a compact numerical form. For example, a Computer Vision (CV) model analyzing a photograph doesn't just see pixels; it maps shapes, textures, and colors into a specific coordinate in a multi-dimensional graph. When measuring similarity, systems calculate the distance between these coordinates using metrics like cosine similarity or Euclidean distance. This mathematical proximity allows algorithms to perform complex tasks like classification and clustering with high efficiency.
Link to this sectionGerçek Dünya Uygulamaları#
Embedding'ler, modern yazılım ürünlerinde kullanılan birçok akıllı özelliğin motoru görevi görür.
- Anlamsal Arama: Geleneksel arama motorları genellikle tam anahtar kelime eşleşmesine güvenir, bu da bir kullanıcı "oto" araması yaptığında ancak belgede "araba" geçtiğinde başarısız olur. Embedding'ler kelimelerin arkasındaki anlamı yakalar. Arama sorgusunu ve veritabanı belgelerini vektör olarak temsil ederek, sistem belirli kelimeler farklı olsa bile kullanıcının niyetine uyan sonuçları getirebilir.
- Öneri Sistemleri: Yayın servisleri ve e-ticaret siteleri, kullanıcı deneyimlerini kişiselleştirmek için embedding'leri kullanır. Bir kullanıcı bilim kurgu filmi izlerse, sistem o filmin embedding vektörünü tanımlar ve veritabanında yakın vektörlere sahip diğer filmleri arar. Bu, sadece manuel etiketler veya kategoriler yerine içerik benzerliğine dayalı doğru öneriler sunulmasını sağlar.
- Sıfır Örnekli Öğrenme (Zero-Shot Learning): Gelişmiş modeller, metin ve görsel gibi farklı modaliteleri birbirine bağlamak için ortak embedding'ler kullanır. Bu, görselin embedding'ini nesnenin adının metin embedding'i ile ilişkilendirerek, sistemin eğitim sırasında hiç görmediği nesneleri tanımasını sağlar.
Link to this sectionPython ile Embedding Oluşturma#
YOLO26 gibi en son teknoloji modeller, güçlü görsel embedding'lerini verimli bir şekilde oluşturmak için kullanılabilir. Aşağıdaki örnek, ultralytics Python paketi kullanılarak bir görselden nasıl özellik vektörü çıkarılacağını göstermektedir.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate embeddings for an image
# The embed() method returns the feature vector representing the image content
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")
# Print the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")Link to this sectionEmbedding'ler vs. İlgili Kavramlar#
Yapay zeka çözümlerini etkili bir şekilde uygulamak için, embedding'leri yakından ilişkili teknik terimlerden ayırt etmek faydalıdır.
- Embedding'ler vs. Vektör Arama: Embedding, verinin bizzat kendisinin temsilidir (sayı listesi). Vektör arama, bu embedding'e en yakın komşuları bulmak için bir veritabanını sorgulama işlemidir. Bu embedding'leri ölçekli bir şekilde depolamak ve aramak için genellikle vektör veritabanı adı verilen özel araçlar kullanılır.
- Embedding'ler vs. Tokenlaştırma: Doğal Dil İşleme (NLP) alanında tokenlaştırma, metni daha küçük parçalara (token'lara) ayırmanın ön adımıdır. Bu token'lar daha sonra embedding'lere eşlenir. Dolayısıyla, tokenlaştırma veriyi hazırlar, embedding'ler ise verinin anlamını temsil eder.
- Embedding'ler vs. Derin Öğrenme: Derin öğrenme, sinir ağlarına dayalı daha geniş bir makine öğrenimi alanıdır. Embedding'ler ise derin öğrenme mimarisinde genellikle ham girdiler ile modelin karar verme katmanları arasında köprü görevi gören özel bir çıktı veya katmandır.
Veri setlerinin yaşam döngüsünü yönetmek isteyen geliştiriciler, özel embedding'ler oluşturmak için ek açıklama (annotation) ve model eğitimi dahil olmak üzere Ultralytics Platform'u kullanabilirler. Bu kapsamlı araç, veri yönetiminden dağıtıma kadar iş akışını basitleştirerek uygulamalarını güçlendiren embedding'lerin yüksek kaliteli ve iyi derlenmiş verilerden elde edilmesini sağlar. İster PyTorch ister TensorFlow gibi çerçeveler kullan, embedding'lerde uzmanlaşmak sofistike örüntü tanıma sistemleri oluşturmada kritik bir adımdır.






