Vector Database

Découvre comment les bases de données vectorielles gèrent les embeddings haute dimension pour la recherche sémantique. Apprends à booster tes applications IA avec Ultralytics YOLO26 et la recherche par similarité.

Une base de données vectorielle est un système de stockage spécialisé conçu pour gérer, indexer et interroger des données vectorielles de haute dimension, souvent appelées embeddings. Contrairement à une base de données relationnelle traditionnelle, qui organise les données structurées en lignes et en colonnes pour une correspondance exacte par mot-clé, une base de données vectorielle est optimisée pour la recherche sémantique. Elle permet aux systèmes intelligents de trouver des points de données conceptuellement similaires plutôt qu'identiques. Cette capacité est fondamentale pour l'infrastructure moderne de l'intelligence artificielle (IA), permettant aux applications de traiter et de comprendre des données non structurées — telles que les images, l'audio, la vidéo et le texte — en analysant les relations mathématiques entre elles. Ces bases de données servent de mémoire à long terme aux agents intelligents, facilitant des tâches comme la recherche visuelle et les recommandations personnalisées.

Link to this sectionComment fonctionnent les bases de données vectorielles#

Le fonctionnement d'une base de données vectorielle repose sur le concept d'espace vectoriel, où les éléments de données sont mappés sous forme de points dans un système de coordonnées multidimensionnel. Le processus commence par l'extraction de caractéristiques, où un modèle de deep learning (DL) convertit les entrées brutes en vecteurs numériques.

Ingestion : Les données sont traitées par un réseau de neurones, tel que le modèle de pointe YOLO26, pour générer des embeddings. Ces vecteurs compressent la signification sémantique de l'entrée en une liste dense de nombres à virgule flottante.
Indexation : Pour garantir une faible latence d'inférence lors de la récupération, la base de données organise ces vecteurs à l'aide d'algorithmes spécialisés. Des techniques comme Hierarchical Navigable Small World (HNSW) ou Inverted File Index (IVF) permettent au système de naviguer efficacement parmi des milliards de vecteurs sans avoir à scanner chaque entrée.
Requêtage : Lorsqu'un utilisateur soumet une requête de recherche (par exemple, une image d'un style de chaussure spécifique), le système convertit la requête en un vecteur et calcule sa proximité avec les vecteurs stockés en utilisant des métriques de distance telles que la similarité cosinus ou la distance euclidienne.
Récupération : La base de données renvoie les "plus proches voisins", qui représentent les résultats les plus pertinents sur le plan contextuel.

L'extrait Python suivant montre comment générer des embeddings en utilisant un modèle ultralytics standard, ce qui constitue l'étape préalable avant de peupler une base de données vectorielle.

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate feature embeddings for an image file
# The 'embed' method creates the vector representation needed for the database
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Output the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")

Link to this sectionApplications concrètes#

Les bases de données vectorielles sont le moteur de nombreuses applications avancées de vision par ordinateur (CV) et de traitement du langage naturel (NLP) utilisées aujourd'hui dans les environnements d'entreprise.

Génération augmentée par récupération (RAG) : À l'ère de l'IA générative, les bases de données vectorielles permettent aux grands modèles de langage (LLM) d'accéder à une vaste bibliothèque de données privées et à jour. En récupérant des documents pertinents basés sur la signification sémantique de la requête d'un utilisateur, le système réduit les hallucinations dans les LLM et fournit des réponses factuelles et contextuelles.
Moteurs de recommandation visuelle : Dans l'IA dans le commerce de détail, les plateformes utilisent des bases de données vectorielles pour alimenter les fonctionnalités de type "acheter des styles similaires". Si un utilisateur consulte une robe d'été spécifique, le système interroge la base de données pour trouver d'autres images de produits ayant des embeddings visuels similaires — correspondant aux motifs, coupes et couleurs — offrant une meilleure expérience utilisateur qu'un simple filtrage basé sur des tags.
Détection d'anomalies et de menaces : Les systèmes de sécurité exploitent les bases de données vectorielles pour la détection d'anomalies. En stockant les embeddings d'un comportement "normal" ou du personnel autorisé, le système peut instantanément signaler les valeurs aberrantes qui sortent du cluster attendu dans l'espace vectoriel, renforçant ainsi la sécurité des données et la surveillance des installations.

Link to this sectionDifférencier les concepts associés#

Pour mettre en œuvre ces systèmes efficacement, il est utile de distinguer la base de données vectorielle des technologies apparentées dans le paysage des opérations de machine learning (MLOps).

Base de données vectorielle vs recherche vectorielle : La recherche vectorielle est l' action ou le processus algorithmique consistant à trouver des vecteurs similaires (le "comment"). Une base de données vectorielle est l' infrastructure robuste construite pour stocker les données, gérer l'index et effectuer ces recherches à grande échelle (le "où").
Base de données vectorielle vs magasin de fonctionnalités (Feature Store) : Un magasin de fonctionnalités est un référentiel centralisé pour gérer les caractéristiques utilisées dans l'entraînement et l'inférence des modèles, garantissant la cohérence. Bien qu'il gère les données de caractéristiques, il n'est pas principalement optimisé pour les requêtes de récupération basées sur la similarité qui définissent une base de données vectorielle.
Base de données vectorielle vs Data Lake : Un data lake stocke de vastes quantités de données brutes dans leur format natif. Une base de données vectorielle stocke les représentations mathématiques traitées (embeddings) de ces données, optimisées spécifiquement pour la recherche par similarité.

Link to this sectionIntégration avec les flux de travail IA modernes#

La mise en œuvre d'une base de données vectorielle implique souvent un pipeline où des modèles comme l'efficace YOLO26 agissent comme moteur d'embedding. Ces modèles traitent les données visuelles en périphérie ou dans le cloud, et les vecteurs résultants sont poussés vers des solutions comme Pinecone, Milvus ou Qdrant.

Pour les équipes cherchant à rationaliser tout ce cycle de vie — de la curation des données et l'auto-annotation jusqu'à l'entraînement et au déploiement de modèles — l'Ultralytics Platform offre un environnement complet. En intégrant l'entraînement des modèles à des stratégies de déploiement efficaces, les développeurs peuvent s'assurer que les embeddings qui alimentent leurs bases de données vectorielles sont précis, ce qui permet d'obtenir des résultats de recherche de meilleure qualité et des agents IA plus intelligents.

Explore solutions

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

Vector Database

Link to this sectionComment fonctionnent les bases de données vectorielles#

Link to this sectionApplications concrètes#

Link to this sectionDifférencier les concepts associés#

Link to this sectionIntégration avec les flux de travail IA modernes#

Explore solutions

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

Construisons ensemble le futur de l'IA !