Scopri come la ricerca vettoriale utilizza gli embedding per trovare dati simili. Impara a generare vettori di alta qualità con Ultralytics per un recupero preciso delle informazioni.
La ricerca vettoriale è un metodo sofisticato di recupero delle informazioni che identifica elementi simili all'interno di un set di dati in base alle loro caratteristiche matematiche piuttosto che alla corrispondenza esatta delle parole chiave. A differenza della tradizionale ricerca per parole chiave, che si basa sulla ricerca di stringhe di caratteri specifiche , la ricerca vettoriale analizza il significato semantico sottostante dei dati. Questa tecnica è fondamentale per le moderne applicazioni di intelligenza artificiale (AI) , perché consente ai computer di comprendere le relazioni tra concetti astratti, elaborando dati non strutturati come immagini, file audio e testi in linguaggio naturale con notevole precisione.
Il nucleo della ricerca vettoriale consiste nel trasformare i dati grezzi in vettori numerici ad alta dimensionalità noti come incorporamenti. Questo processo mappa gli elementi in punti in uno spazio multidimensionale in cui elementi concettualmente simili si trovano vicini l'uno all'altro.
Per implementare la ricerca vettoriale, è necessario prima convertire i dati in vettori. Il seguente frammento di codice mostra come
generare mappe delle caratteristiche e incorporamenti da un'immagine
utilizzando il ultralytics pacchetto e un modello YOLO26 pre-addestrato.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate feature embeddings for an image URL
# The 'embed' method returns the high-dimensional vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")
La ricerca vettoriale è il motore alla base di molte funzionalità intuitive nell'ecosistema software odierno, colmando il divario tra la visione artificiale (CV) e l'intento dell'utente.
È utile differenziare la ricerca vettoriale da termini simili per comprendere l'intera pipeline di machine learning (ML).
Per i team che sviluppano sistemi di ricerca per somiglianza, la gestione dei set di dati e l'addestramento dei modelli di embedding rappresentano un primo passo fondamentale. Ultralytics semplifica questo flusso di lavoro fornendo strumenti per la gestione dei dati, l'addestramento nel cloud e l'implementazione dei modelli. Garantendo che i modelli di base, sia per il rilevamento che per la classificazione degli oggetti, siano ad alte prestazioni, si assicura che i vettori risultanti forniscano risultati di ricerca accurati e significativi.
Inizia il tuo viaggio con il futuro del machine learning