Sözlük

Vektör Niceleme

Makine öğreniminde veri sıkıştırma ve ayrıştırma için vektör nicelemeyi keşfedin. VQ-VAE'leri, vektör aramayı ve Ultralytics dağıtımlarını nasıl optimize ettiğini öğrenin.

Vektör niceleme, modern makine öğrenimi (ML) ve dijital sinyal işlemede yaygın olarak kullanılan güçlü bir veri sıkıştırma ve ayrıştırma tekniğidir. Temelde, bu teknik büyük bir sürekli nokta veya vektör kümesini gruplara ayırarak ve her grubu tek bir "prototip" vektörle temsil ederek çalışır; bu vektörler topluca kod kitabı olarak bilinen bir yapı oluşturur. Sürekli yüksek boyutlu vektörleri bu ayrık kod kitabı girdilerine eşleyerek, sistemler bellek kullanımını önemli ölçüde azaltırken etkili boyut indirgemesi için verilerin temel anlamsal özelliklerini koruyabilir.

Derin Öğrenmede Ayrıştırmanın Rolü

Günümüz derin öğrenmede (DL), bu kavram Vektör Kuantize Edilmiş Varyasyonel Otokodlayıcı (VQ-VAE) tarafından yaygın bir şekilde popüler hale getirilmiştir. Özellik çıkarma işlemini gerçekleştirmek için sürekli bir gizli uzay öğrenen standart otokodlayıcıların aksine, VQ-VAE’ler ayrık bir temsil öğrenir. Bu, üretici modellerin görüntüleri, sesleri veya videoları, Büyük Dil Modelleri'nin (LLM'ler) metin girdilerini işleme biçimine benzer şekilde, ayrık belirteçler dizisi olarak ele almasına olanak tanır. Erken uygulamaların modern belirteç tabanlı görme sistemlerinin yolunu nasıl açtığını görmek için ayrık temsil öğrenimi üzerine temel araştırmaları inceleyebilirsiniz.

Gerçek Dünya Uygulamaları

Vektör niceleme, performans ve bellek verimliliğinin hayati önem taşıdığı birçok gerçek dünya yapay zeka uygulamasında kritik bir rol oynar:

Üretken Yapay Zeka ve Medya Sıkıştırma: Vektör niceleme, karmaşık görsel verileri ayrık gizli kodlara sıkıştırarak son derece verimli görüntü ve video üretimi sağlar. Sürekli pikselleri ayrık tokenlere eşleyen modeller, hesaplama yükünü önemli ölçüde azaltır ve gizli difüzyon modelleri gibi gelişmiş mimarilere yardımcı olur.
Yüksek Hızlı Vektör Arama: Hızlı benzerlik araması gerçekleştirmek için, modern sistemler milyonlarca gömülü veriyi sorgulamalıdır. Vektör kuantizasyonu bu devasa veri kümelerini sıkıştırarak, arama motorlarının hızlı yaklaşık en yakın komşu (ANN) aramaları yapmasına olanak tanır; bu da perakende ve ürün öneri sistemlerinde yapay zeka için son derece faydalıdır. Yüksek boyutlu veri işleme konusunda daha fazla bilgi için OpenAI'nin gömülü verilerle ilgili kılavuzuna göz atın.

İlgili Kavramları Ayırt Etme

Vektör niceleme ile benzer terimler arasındaki ince farkları anlamak, verimli bir bilgisayar görme (CV) mimarisi tasarlarken faydalıdır:

Vektör Kuantizasyonu ve Model Kuantizasyonu: Model niceleme genellikle, Ultralytics gibi modellerin donanım dağıtımlarında çıkarım sürecini hızlandırmak için sinir ağı ağırlıklarının sayısal hassasiyetini (örneğin, 32 bitlik kayan noktadan 8 bitlik tamsayıya) azaltmayı ifade eder. Vektör niceleme ise, veri vektörlerini sabit bir ayrık prototip sözlüğü içinde kümeler.
Vektör Sayısallaştırma ve Vektör Veritabanı: Vektör veritabanı, yüksek boyutlu verileri depolayan gerçek altyapıdır. Vektör niceleme, bu veritabanları tarafından bellek kullanımını en aza indirmek için sıklıkla kullanılan temel bir algoritmik tekniktir; bu konu, Qdrant'ın vektör işleme açıklaması bölümünde ayrıntılı olarak ele alınmıştır.
Vektör Sayısallaştırma ve Vektör Arama: Vektör araması, vektör yakınlığına dayalı olarak benzer öğeleri bulmaya yönelik aktif bir süreçtir. Kuantizasyon, bu aramayı büyük ölçekte hesaplama açısından uygulanabilir hale getirmek için yapısal bir optimizasyon katmanı görevi görür.

Temel Uygulama Örneği

Vektör nicelleştirmenin pratikte sürekli girdileri ayrık simgelere nasıl eşlediğini görmek için, PyTorch kullanarak Öklid mesafelerini PyTorch önceden tanımlanmış bir kod kitabında en yakın prototipi bulabilirsiniz:

import torch

# Define a continuous input batch and a discrete codebook vocabulary
inputs = torch.randn(4, 128)  # 4 input vectors of dimension 128
codebook = torch.randn(10, 128)  # 10 discrete prototype vectors

# Compute distances and find the nearest codebook index for each input
distances = torch.cdist(inputs, codebook)
quantized_indices = torch.argmin(distances, dim=1)

# Retrieve the discrete quantized vectors corresponding to the inputs
quantized_vectors = codebook[quantized_indices]

tensor yerel olarak hesaplanması ve bu işlemlerin optimize edilmesi konusunda ayrıntılı bilgi için resmi PyTorch belgelerine bakın.

Ultralytics ile İş Akışlarını Geliştirme

Optimize edilmiş gömülü özellikleri iş akışınıza entegre etmek için sağlam araçlara ihtiyaç vardır. Ultralytics , eğitim verilerinin düzenlenmesine ve en gelişmiş görsel modellerin eğitilmesine yönelik uçtan uca bir ortam sunar. Veri yönetimini kolaylaştırarak ve model dağıtımını basitleştirerek, geliştiriciler vektör nicelemesine uygun yüksek kaliteli görsel özellikleri zahmetsizce oluşturabilir; bu da daha hızlı nesne algılama ve büyük ölçekli medya arama uygulamalarına yol açar.

Vektör Niceleme

17'den fazla formata aktarın. 43 küresel bölgeye dağıtın.

YOLO26 modelini H100 GPU'larda saat başına 2,39 $ karşılığında eğitin.

Vizyon yapay zeka projelerinizi destekleyecek esnek kurumsal lisanslama.

Bir sonraki projenizi desteklemek üzere tasarlanmış kurumsal lisanslama

Akıllı açıklama özelliği sayesinde etiketlemeyi 10 kata kadar hızlandırın

Etiketleyin. Eğitin. Dağıtın. Hepsi tek bir platformda.

Derin Öğrenmede Ayrıştırmanın Rolü

Gerçek Dünya Uygulamaları

İlgili Kavramları Ayırt Etme

Temel Uygulama Örneği

Ultralytics ile İş Akışlarını Geliştirme

Bu kategoride daha fazla okuyun

Ultralytics kullanarak Ultralytics YOLO dışa aktarma

Ultralytics ile güvenli olmayan palet istiflemesinin tespit edilmesi

Ultralytics ile poligon etiketleme kılavuzu

Hadi birlikte yapay zekanın geleceğini şekillendirelim!

Vektör Niceleme

17'den fazla formata aktarın. 43 küresel bölgeye dağıtın.

YOLO26 modelini H100 GPU'larda saat başına 2,39 $ karşılığında eğitin.

Vizyon yapay zeka projelerinizi destekleyecek esnek kurumsal lisanslama.

Bir sonraki projenizi desteklemek üzere tasarlanmış kurumsal lisanslama

Akıllı açıklama özelliği sayesinde etiketlemeyi 10 kata kadar hızlandırın

Etiketleyin. Eğitin. Dağıtın. Hepsi tek bir platformda.

Derin Öğrenmede Ayrıştırmanın Rolü

Gerçek Dünya Uygulamaları

İlgili Kavramları Ayırt Etme

Temel Uygulama Örneği

Ultralytics ile İş Akışlarını Geliştirme

Bu kategoride daha fazla okuyun

Ultralytics kullanarak Ultralytics YOLO dışa aktarma

Ultralytics ile güvenli olmayan palet istiflemesinin tespit edilmesi

Ultralytics ile poligon etiketleme kılavuzu

Hadi birlikte yapay zekanın geleceğini şekillendirelim!

Etiketleyin. Eğitin. Dağıtın. Hepsi tek bir platformda.