Glossario

Quantizzazione vettoriale

Scopri la quantizzazione vettoriale per la compressione dei dati e la discretizzazione nell'ambito del machine learning. Scopri come ottimizza le implementazioni di VQ-VAE, la ricerca vettoriale e Ultralytics .

La quantizzazione vettoriale è una potente tecnica di compressione e discretizzazione dei dati ampiamente utilizzata nel moderno machine learning (ML) e nell' elaborazione dei segnali digitali. Fondamentalmente, funziona dividendo un ampio insieme di punti o vettori continui in gruppi e rappresentando ciascun gruppo con un singolo vettore "prototipo", che insieme formano una struttura nota come codebook. Mappando i vettori continui ad alta dimensionalità su queste voci discrete del codebook, i sistemi possono ridurre drasticamente l'utilizzo di memoria, preservando al contempo le caratteristiche semantiche essenziali dei dati per un'efficace riduzione della dimensionalità.

Il ruolo della discretizzazione nel deep learning

Nel deep learning (DL) contemporaneo, questo concetto è stato reso famoso dal Vector Quantized Variational Autoencoder (VQ-VAE). A differenza degli autoencoder standard, che apprendono uno spazio latente continuo per effettuare l'estrazione delle caratteristiche, i VQ-VAE apprendono una rappresentazione discreta. Ciò consente ai modelli generativi di trattare immagini, audio o video come una sequenza di token discreti, in modo simile a come i modelli linguistici di grandi dimensioni (LLM) elaborano gli input di testo . È possibile esplorare la ricerca di base sull'apprendimento della rappresentazione discreta per vedere come le prime implementazioni abbiano aperto la strada ai moderni sistemi di visione basati sui token.

Applicazioni nel mondo reale

La quantizzazione vettoriale riveste un ruolo fondamentale in diverse applicazioni pratiche dell'intelligenza artificiale in cui le prestazioni e l'efficienza della memoria sono fondamentali:

IA generativa e compressione multimediale: Comprimendo dati visivi complessi in codici latenti discreti, la quantizzazione vettoriale consente una generazione di immagini e video altamente efficiente. I modelli che mappano pixel continui su token discreti riducono drasticamente il carico computazionale, facilitando architetture avanzate come i modelli di diffusione latente.
Ricerca vettoriale ad alta velocità: Per eseguire ricerche rapide per similarità, i sistemi moderni devono interrogare milioni di embedding. La quantizzazione vettoriale comprime questi vasti set di dati, consentendo ai motori di recupero di eseguire rapide ricerche approssimative del vicino più prossimo (ANN), il che è estremamente vantaggioso per l' IA nei sistemi di vendita al dettaglio e di raccomandazione dei prodotti. Consulta la guida di OpenAI sugli embedding per ulteriori informazioni sulla gestione dei dati ad alta dimensionalità.

Distinguere i concetti correlati

Comprendere le sottili differenze tra la quantizzazione vettoriale e altri termini simili è utile quando si progetta un'architettura efficiente di visione artificiale (CV):

Quantizzazione vettoriale vs. quantizzazione del modello: La quantizzazione del modello si riferisce generalmente alla riduzione della precisione numerica dei pesi delle reti neurali (ad esempio, da 32 bit in virgola mobile a 8 bit interi) per accelerare l'inferenza nelle implementazioni hardware di modelli come Ultralytics . La quantizzazione vettoriale, invece, raggruppa i vettori di dati in un vocabolario fisso di prototipi discreti.
Quantizzazione vettoriale vs. database vettoriale: Un database vettoriale è l'infrastruttura effettiva che memorizza dati ad alta dimensione. La quantizzazione vettoriale è una tecnica algoritmica sottostante spesso impiegata da questi database per ridurre al minimo l'impronta di memoria, come spiegato nella descrizione di Qdrant sulla gestione dei vettori.
Quantizzazione vettoriale vs. Ricerca vettoriale: La ricerca vettoriale è il processo attivo di individuazione di elementi simili in base alla vicinanza vettoriale. La quantizzazione funge da livello di ottimizzazione strutturale per rendere questa ricerca computazionalmente fattibile su vasta scala.

Esempio di implementazione di base

Per vedere come la quantizzazione vettoriale mappa gli input continui su valori discreti nella pratica, è possibile utilizzare PyTorch calcolare le distanze euclidee e individuare il prototipo più vicino in un libro dei codici predefinito:

import torch

# Define a continuous input batch and a discrete codebook vocabulary
inputs = torch.randn(4, 128)  # 4 input vectors of dimension 128
codebook = torch.randn(10, 128)  # 10 discrete prototype vectors

# Compute distances and find the nearest codebook index for each input
distances = torch.cdist(inputs, codebook)
quantized_indices = torch.argmin(distances, dim=1)

# Retrieve the discrete quantized vectors corresponding to the inputs
quantized_vectors = codebook[quantized_indices]

Per un approfondimento sul calcolo nativo tensor e sull'ottimizzazione di queste operazioni, consultare la documentazione ufficiale di PyTorch .

Ottimizzazione dei flussi di lavoro con la Ultralytics

L'integrazione di embedding ottimizzati nella propria pipeline richiede strumenti affidabili. La Ultralytics offre un ambiente end-to-end per la selezione dei dati di addestramento e l'addestramento di modelli di visione all'avanguardia. Grazie all'ottimizzazione della gestione dei dati e alla semplificazione dell'implementazione dei modelli, gli sviluppatori possono generare con facilità caratteristiche visive di alta qualità adatte alla quantizzazione vettoriale, consentendo un rilevamento degli oggetti più rapido e applicazioni di recupero multimediale su larga scala.

Quantizzazione vettoriale

Esporta in oltre 17 formati. Distribuisci in 43 regioni in tutto il mondo.

Addestra YOLO26 su GPU H100 a 2,39 $ l'ora.

Licenze aziendali flessibili per dare slancio ai tuoi progetti di intelligenza artificiale applicata alla visione.

Licenze aziendali pensate per dare slancio al tuo prossimo progetto

Etichetta fino a 10 volte più velocemente grazie all'annotazione intelligente

Annotare. Addestrare. Distribuire. Tutto in un'unica piattaforma.

Il ruolo della discretizzazione nel deep learning

Applicazioni nel mondo reale

Distinguere i concetti correlati

Esempio di implementazione di base

Ottimizzazione dei flussi di lavoro con la Ultralytics

Leggi di più in questa categoria

Come esportareYOLO Ultralytics utilizzando Ultralytics

Rilevamento di impilamenti non sicuri di pallet con Ultralytics

Guida all'annotazione dei poligoni con Ultralytics

Costruiamo insieme il futuro dell'intelligenza artificiale!

Quantizzazione vettoriale

Esporta in oltre 17 formati. Distribuisci in 43 regioni in tutto il mondo.

Addestra YOLO26 su GPU H100 a 2,39 $ l'ora.

Licenze aziendali flessibili per dare slancio ai tuoi progetti di intelligenza artificiale applicata alla visione.

Licenze aziendali pensate per dare slancio al tuo prossimo progetto

Etichetta fino a 10 volte più velocemente grazie all'annotazione intelligente

Annotare. Addestrare. Distribuire. Tutto in un'unica piattaforma.

Il ruolo della discretizzazione nel deep learning

Applicazioni nel mondo reale

Distinguere i concetti correlati

Esempio di implementazione di base

Ottimizzazione dei flussi di lavoro con la Ultralytics

Leggi di più in questa categoria

Come esportareYOLO Ultralytics utilizzando Ultralytics

Rilevamento di impilamenti non sicuri di pallet con Ultralytics

Guida all'annotazione dei poligoni con Ultralytics

Costruiamo insieme il futuro dell'intelligenza artificiale!

Annotare. Addestrare. Distribuire. Tutto in un'unica piattaforma.