Sözlük

Vektör Veritabanı

Vektör veritabanlarının akıllı sistemler için verimli benzerlik aramaları, semantik arama ve anormallik tespiti sağlayarak yapay zekada nasıl devrim yarattığını keşfedin.

Bir vektör veritabanı, vektör katıştırmaları olarak bilinen yüksek boyutlu verileri depolamak, yönetmek ve aramak için tasarlanmış özel bir veritabanı türüdür. Yapılandırılmış veriler ve tam eşleşmeler için optimize edilmiş geleneksel ilişkisel veritabanlarının aksine, vektör veritabanları benzerliklerine göre öğeleri bulmada mükemmeldir. Bu özellik, öneri motorlarından görsel aramaya kadar çok çeşitli modern yapay zeka uygulamaları için temeldir ve onları makine öğrenimi altyapısında kritik bir bileşen haline getirir. Yapay zeka modelleri için uzun süreli bellek görevi görerek eğitim sırasında öğrenilen karmaşık örüntülerden yararlanmalarını sağlarlar.

Vektör Veritabanları Nasıl Çalışır?

Bir vektör veritabanının temel işlevi, bir vektör aramasını verimli bir şekilde yürütmektir. Süreç, bir görüntü, bir metin bloğu veya bir ses klibi gibi yapılandırılmamış veriler, vektör gömme adı verilen sayısal bir temsil oluşturmak için bir derin öğrenme modelinden geçirildiğinde başlar. Bu yerleştirmeler orijinal verinin anlamsal anlamını yakalar.

Vektör veritabanı daha sonra bu katıştırmaları depolar ve özel algoritmalar kullanarak bunları indeksler. Bir sorgu yapıldığında (örneğin, bir görüntü ile arama), sorgu verileri de bir vektöre dönüştürülür. Veritabanı daha sonra bu sorgu vektörünü, "en yakın" veya en benzer öğeleri bulmak için Kosinüs Benzer liği veya Öklid Uzak lığı gibi benzerlik metriklerini kullanarak depolanan vektörlerle karşılaştırır. Bunu milyonlarca veya milyarlarca vektörle ölçekli olarak gerçekleştirmek için, genellikle yüksek verimli Yaklaşık En Yakın Komşu ( YSA) algoritmalarına güvenirler.

Gerçek Dünya Uygulamaları

Vektör veritabanları, kullanıcıların günlük olarak etkileşimde bulunduğu birçok akıllı özelliğe güç sağlar.

  1. E-ticarette Görsel Arama: Bir kullanıcı beğendiği bir ürünün fotoğrafını yükleyebilir. Ultralytics YOLO11 modeli gibi bir bilgisayarla görme modeli, görüntü için bir gömme oluşturur. Bu gömme, e-ticaret sitesinin tüm ürün kataloğu için gömmeler içeren vektör veritabanını sorgulamak için kullanılır. Veritabanı en benzer vektörleri döndürerek sitenin perakende için yapay zekada önemli bir özellik olan görsel olarak aynı veya biçimsel olarak ilişkili ürünleri göstermesine olanak tanır.
  2. Belgeler için Anlamsal Arama: Bir şirket, raporlar ve destek biletleri gibi tüm dahili belgeleri için katıştırmalar oluşturabilir. Bir çalışan daha sonra belirli anahtar kelimeler yerine "Geçen çeyrekte kârımız ne kadardı?" gibi bir doğal dil sorusu kullanarak arama yapabilir. Doğal Dil İşleme (NLP) modeli bu sorguyu bir katıştırmaya dönüştürür ve vektör veritabanı katıştırmaları anlamsal olarak en yakın olan belgeleri bularak tam ifade eşleşmese bile ilgili bilgileri sağlar. Bu, erişim destekli üretim (RAG) sistemlerinin temel bir bileşenidir.

Vektör Veritabanları ve İlgili Kavramlar

Vektör veri tabanlarını yakından ilişkili terimlerden ayırmak faydalı olacaktır:

  • Gömüler: Gömüler, verilerin vektör temsilleridir. Vektör veritabanı, bu katıştırmaları verimli bir şekilde depolamak, indekslemek ve sorgulamak için oluşturulmuş özel bir sistemdir. Gömüleri kitap, vektör veritabanını da bunları düzenleyen akıllı kütüphane olarak düşünün.
  • Vektör Arama: Vektör arama, bir veri kümesindeki en benzer vektörleri bulma işlemidir. Bir vektör veritabanı, özellikle gerçek zamanlı çıkarım için bu işlemi hızlı ve ölçeklenebilir hale getiren temel teknolojidir.

Bu bileşenler, genellikle uçtan uca model ve veri kümesi yönetimi için Ultralytics HUB gibi platformlar tarafından kolaylaştırılan eksiksiz bir MLOps iş akışının bir parçası olarak yönetilir.

Popüler Vektör Veritabanları

Her biri ölçeklenebilirlik, dağıtım ve özellikler açısından farklı güçlü yönlere sahip çeşitli açık kaynaklı ve ticari vektör veritabanları mevcuttur. En yaygın kullanılanlardan bazıları şunlardır:

  • Pinecone: Popüler, tam olarak yönetilen bir vektör veritabanı hizmeti.
  • Milvus: Yüksek performans ve ölçeklenebilirlik için tasarlanmış açık kaynaklı bir vektör veritabanı.
  • Weaviate: Grafik özelliklerine sahip açık kaynaklı, yapay zekaya özgü bir veritabanı.
  • Chroma DB: Basitlik ve geliştirici deneyimine odaklanan açık kaynaklı bir gömme veritabanı.
  • Qdrant: Performans ve güvenlik için Rust ile yazılmış açık kaynaklı bir vektör veritabanı ve benzerlik arama motoru.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı