Vektör veritabanlarının, akıllı sistemler için verimli benzerlik aramaları, semantik arama ve anomali tespiti sağlayarak AI'da nasıl devrim yarattığını keşfedin.
Vektör veritabanı, yüksek boyutlu vektör verilerini yönetmek, indekslemek ve sorgulamak için tasarlanmış özel bir depolama sistemidir, genellikle gömme olarak adlandırılır. Gelenekselin aksine Tam anahtar kelime eşleştirmesi için yapılandırılmış verileri satır ve sütunlarda depolayan ilişkisel veritabanları, vektör veritabanları anlamsal benzerliklerine göre öğeleri bulmak için optimize edilmiştir. Bu özellik onları modern teknolojinin temel taşlarından biri haline getirmektedir. yapay zeka (AI) altyapısı, sistemlerin yapılandırılmamış verileri (görüntü, ses ve metin gibi) anlamlandırarak işlemesine olanak tanır. Bunlar arasındaki bağlamsal ilişkiler. Esasen aşağıdakiler için uzun süreli bellek görevi görürler makine öğrenimi uygulamalarına olanak sağlayarak Aynı olmaktan ziyade kavramsal olarak ilişkili olan bilgilerin etkin bir şekilde geri getirilmesi.
Bir vektör veritabanının temel işlevselliği, ham verilerin bir vektör veritabanı aracılığıyla matematiksel vektörlere dönüştürülmesine dayanır. özellik çıkarma olarak bilinen süreç. A derin öğrenme modeli, örneğin Vision Transformer (ViT) veya bir Evrişimsel Sinir Ağı (CNN), verileri analiz eder ve verilerin özelliklerini temsil eden uzun bir sayı listesi olan bir vektör çıktısı verir.
Bu vektörler oluşturulduktan sonra, veritabanı bunları aşağıdaki gibi özel algoritmalar kullanarak indeksler Yaklaşık En Yakın Komşu (YSA). Bir kullanıcı bir sorgu gerçekleştirdiğinde, sistem arama terimini (görüntü veya metin) bir vektöre dönüştürür ve gibi mesafe metriklerini kullanarak depolanan vektörlere yakınlık Kosinüs Benzerliği veya Öklid Mesafesi. Bu, veritabanının hızlı bir şekilde en alakalı sonuçları temsil eden "en yakın" komşuları belirler.
Aşağıdaki kod parçacığı, katıştırmaların nasıl oluşturulacağını göstermektedir Verileri depolamadan önceki ilk adım olan YOLO11 modeli bir vektör veritabanı.
from ultralytics import YOLO
# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")
# Generate feature embeddings for an image file
# This converts the visual content into a numerical vector
results = model.embed("bus.jpg")
# Output the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")
Vektör veritabanları, ticari ve kurumsal yazılımlardaki birçok akıllı özelliğin arkasındaki motordur.
Ekosistemi anlamak için vektör veritabanını ilgili terimlerden ayırmak faydalı olacaktır:
Pazar, vektör depolamanın uygulanması için açık kaynaklı araçlardan yönetilen araçlara kadar çeşitli sağlam seçenekler sunmaktadır hizmetler:
Bu araçların entegre edilmesiyle MLOps iş akışı, geliştiriciler şunları yapabilir Veri içeriğini gerçekten "anlayan" ve semantik arama gibi gelişmiş yetenekler sağlayan sistemler oluşturmak, anomali tespiti ve kişiselleştirilmiş içerik sunumu.
