Découvrez comment la recherche vectorielle utilise les plongements pour trouver des données similaires. Apprenez à générer des vecteurs de haute qualité avec Ultralytics pour une recherche d'informations précise.
La recherche vectorielle est une méthode sophistiquée de recherche d'informations qui identifie des éléments similaires dans un ensemble de données en se basant sur leurs caractéristiques mathématiques plutôt que sur des correspondances exactes de mots-clés. Contrairement à la recherche traditionnelle par mot-clé, qui repose sur la recherche de chaînes de caractères spécifiques , la recherche vectorielle analyse la signification sémantique sous-jacente des données. Cette technique est fondamentale pour les applications modernes d' intelligence artificielle (IA) , car elle permet aux ordinateurs de comprendre les relations entre des concepts abstraits, en traitant des données non structurées telles que des images, des fichiers audio et des textes en langage naturel avec une précision remarquable.
Le cœur de la recherche vectorielle consiste à transformer des données brutes en vecteurs numériques de haute dimension appelés « encastrements ». Ce processus associe des éléments à des points dans un espace multidimensionnel où des éléments conceptuellement similaires sont situés à proximité les uns des autres.
Pour mettre en œuvre la recherche vectorielle, vous devez d'abord convertir vos données en vecteurs. L'extrait de code suivant montre comment
générer cartes de caractéristiques et les intégrations à partir d'une image
à l'aide du ultralytics paquet et un modèle YOLO26 pré-entraîné.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate feature embeddings for an image URL
# The 'embed' method returns the high-dimensional vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")
La recherche vectorielle est le moteur qui sous-tend de nombreuses fonctionnalités intuitives dans l'écosystème logiciel actuel, comblant le fossé entre la vision par ordinateur (CV) et l'intention de l'utilisateur.
Il est utile de différencier la recherche vectorielle des termes similaires pour comprendre l'ensemble du pipeline d'apprentissage automatique (ML).
Pour les équipes qui développent des systèmes de recherche par similarité, la gestion des ensembles de données et la formation des modèles d'intégration constituent une première étape cruciale. Ultralytics simplifie ce flux de travail en fournissant des outils pour la gestion des données, la formation dans le cloud et le déploiement de modèles. En vous assurant que vos modèles de base, qu'ils soient destinés à la détection ou à la classification d'objets, sont hautement performants, vous garantissez que les vecteurs obtenus fournissent des résultats de recherche précis et pertinents.
Commencez votre parcours avec l'avenir de l'apprentissage automatique