Vector Database
Vektör veritabanlarının anlamsal geri alma için yüksek boyutlu gömmeleri (embeddings) nasıl yönettiğini keşfet. Ultralytics YOLO26 ve benzerlik araması ile yapay zeka uygulamalarını güçlendirmeyi öğren.
Vektör veritabanı; genellikle gömme (embeddings) olarak adlandırılan yüksek boyutlu vektör verilerini yönetmek, indekslemek ve sorgulamak için tasarlanmış özel bir depolama sistemidir. Tam anahtar kelime eşleşmesi için yapılandırılmış verileri satırlar ve sütunlar halinde düzenleyen geleneksel bir ilişkisel veritabanından farklı olarak, bir vektör veritabanı anlamsal (semantik) geri getirme için optimize edilmiştir. Akıllı sistemlerin, birbirinin aynısı olan değil, kavramsal olarak benzer olan veri noktalarını bulmasını sağlar. Bu yetenek, modern yapay zeka (YZ) altyapısının temelidir ve uygulamaların; görüntüler, ses, video ve metin gibi yapılandırılmamış verileri, aralarındaki matematiksel ilişkileri analiz ederek işlemesine ve anlamasına olanak tanır. Bu veritabanları, görsel arama ve kişiselleştirilmiş öneriler gibi görevleri kolaylaştırarak akıllı ajanlar için uzun süreli bellek görevi görür.
Link to this sectionVektör Veritabanları Nasıl Çalışır#
The function of a vector database centers on the concept of vector space, where data items are mapped as points in a multi-dimensional coordinate system. The process begins with feature extraction, where a deep learning (DL) model converts raw inputs into numerical vectors.
-
Veri Yükleme (Ingestion): Veriler, gömmeler (embeddings) oluşturmak için son teknoloji YOLO26 gibi bir sinir ağı tarafından işlenir. Bu vektörler, girdinin anlamsal anlamını yoğun bir kayan noktalı sayı listesine sıkıştırır.
-
İndeksleme: Geri getirme sırasında düşük çıkarım gecikmesini sağlamak için veritabanı, bu vektörleri özel algoritmalar kullanarak düzenler. Hierarchical Navigable Small World (HNSW) veya Inverted File Index (IVF) gibi teknikler, sistemin her bir girişi taramadan milyarlarca vektör arasında verimli bir şekilde gezinmesini sağlar.
-
Sorgulama: Bir kullanıcı bir arama sorgusu (örneğin, belirli bir ayakkabı stiline ait bir resim) gönderdiğinde, sistem sorguyu bir vektöre dönüştürür ve kosinüs benzerliği veya Öklid mesafesi gibi mesafe metriklerini kullanarak depolanan vektörlerle olan yakınlığını hesaplar.
-
Geri Getirme (Retrieval): Veritabanı, bağlamsal olarak en alakalı sonuçları temsil eden "en yakın komşuları" döndürür.
Aşağıdaki Python kod parçası, bir vektör veritabanını doldurmadan önceki ön koşul adımı olan standart bir ultralytics modeli kullanarak gömmelerin (embeddings) nasıl oluşturulacağını gösterir.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate feature embeddings for an image file
# The 'embed' method creates the vector representation needed for the database
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Output the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")Link to this sectionGerçek Dünya Uygulamaları#
Vektör veritabanları, günümüzde kurumsal ortamlarda kullanılan birçok gelişmiş bilgisayarlı görü (CV) ve Doğal Dil İşleme (NLP) uygulamasının arkasındaki motordur.
- Geri Getirme Destekli Üretim (RAG): Üretken YZ çağında vektör veritabanları, Büyük Dil Modellerinin (LLM) geniş bir özel ve güncel veri kütüphanesine erişmesini sağlar. Sistem, kullanıcının isteminin anlamsal anlamına göre ilgili belgeleri getirerek LLM'lerdeki halüsinasyonları azaltır ve olgusal, bağlam farkındalığına sahip yanıtlar sağlar.
- Görsel Öneri Motorları: Perakende sektöründe YZ alanında platformlar, "benzer stilleri satın al" özelliklerini desteklemek için vektör veritabanlarını kullanır. Bir kullanıcı belirli bir yazlık elbiseyi görüntülerse, sistem veritabanında benzer görsel gömmelere sahip (desenler, kesimler ve renklerle eşleşen) diğer ürün görsellerini sorgular ve basit etiket tabanlı filtrelemeden daha iyi bir kullanıcı deneyimi sağlar.
- Anomali ve Tehdit Algılama: Güvenlik sistemleri, anomali algılama için vektör veritabanlarından yararlanır. "Normal" davranışların veya yetkili personelin gömmelerini depolayarak sistem, vektör uzayında beklenen kümenin dışına düşen aykırı değerleri anında işaretleyebilir, böylece veri güvenliğini ve tesis izlemeyi geliştirebilir.
Link to this sectionİlgili Kavramları Ayırt Etme#
Bu sistemleri etkili bir şekilde uygulamak için, vektör veritabanını makine öğrenimi operasyonları (MLOps) ortamındaki ilgili teknolojilerden ayırt etmek faydalıdır.
- Vektör Veritabanı ile Vektör Arama Arasındaki Fark: Vektör arama, benzer vektörleri bulmanın eylemi veya algoritmik sürecidir ("nasıl" kısmı). Vektör veritabanı ise veriyi depolamak, indeksi yönetmek ve bu aramaları ölçekli bir şekilde gerçekleştirmek için oluşturulmuş sağlam altyapıdır ("nerede" kısmı).
- Vektör Veritabanı ile Öznitelik Deposu (Feature Store) Arasındaki Fark: Öznitelik deposu, model eğitimi ve çıkarımında kullanılan öznitelikleri yönetmek ve tutarlılığı sağlamak için merkezi bir havuzdur. Öznitelik verilerini işlese de, bir vektör veritabanını tanımlayan benzerlik tabanlı geri getirme sorguları için temelden optimize edilmemiştir.
- Vektör Veritabanı ile Veri Gölü Arasındaki Fark: Veri gölü, çok miktarda ham veriyi kendi yerel formatında depolar. Vektör veritabanı ise, benzerlik araması için özel olarak optimize edilmiş, bu verilerin işlenmiş matematiksel temsillerini (gömmelerini) depolar.
Link to this sectionModern YZ İş Akışlarıyla Entegrasyon#
Bir vektör veritabanı uygulamak, genellikle verimli YOLO26 gibi modellerin gömme motoru görevi gördüğü bir hattı içerir. Bu modeller görsel verileri uç noktada (edge) veya bulutta işler ve ortaya çıkan vektörler Pinecone, Milvus veya Qdrant gibi çözümlere aktarılır.
Veri kürasyonundan otomatik açıklamaya, model eğitiminden dağıtıma kadar tüm bu yaşam döngüsünü kolaylaştırmak isteyen ekipler için Ultralytics Platform, kapsamlı bir ortam sunar. Geliştiriciler, model eğitimini verimli dağıtım stratejileriyle entegre ederek vektör veritabanlarını besleyen gömmelerin doğru olduğundan emin olabilir, bu da daha kaliteli arama sonuçları ve daha akıllı YZ ajanları elde edilmesini sağlar.






