Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Base de données vectorielle

Découvrez comment les bases de données vectorielles révolutionnent l'IA en permettant des recherches de similarité efficaces, la recherche sémantique et la détection d'anomalies pour les systèmes intelligents.

A vector database is a specialized storage system designed to manage, index, and query high-dimensional vector data, often commonly referred to as embeddings. Unlike a traditional relational database, which organizes structured data into rows and columns for exact keyword matching, a vector database is optimized for semantic retrieval. It enables intelligent systems to find data points that are conceptually similar rather than identical. This capability is fundamental to modern artificial intelligence (AI) infrastructure, allowing applications to process and understand unstructured data—such as images, audio, video, and text—by analyzing the mathematical relationships between them. These databases serve as the long-term memory for intelligent agents, facilitating tasks like visual search and personalized recommendations.

Fonctionnement des bases de données vectorielles

La fonction d'une base de données vectorielle est centrée sur le concept d'espace vectoriel, où les éléments de données sont représentés sous forme de points dans un système de coordonnées multidimensionnel. Le processus commence par l' extraction de caractéristiques, où un modèle d'apprentissage profond (DL) convertit les entrées brutes en vecteurs numériques.

  1. Ingestion: Data is processed by a neural network, such as the state-of-the-art YOLO26, to generate embeddings. These vectors compress the semantic meaning of the input into a dense list of floating-point numbers.
  2. Indexation : afin de garantir une faible latence d'inférence lors de la récupération, la base de données organise ces vecteurs à l'aide d'algorithmes spécialisés. Des techniques telles que Hierarchical Navigable Small World (HNSW) ou Inverted File Index (IVF) permettent au système de naviguer efficacement parmi des milliards de vecteurs sans avoir à analyser chaque entrée.
  3. Querying: When a user submits a search query (e.g., an image of a specific shoe style), the system converts the query into a vector and calculates its proximity to stored vectors using distance metrics like cosine similarity or Euclidean distance.
  4. Récupération : la base de données renvoie les « voisins les plus proches », qui représentent les résultats les plus pertinents d'un point de vue contextuel.

Python suivant montre comment générer des représentations à l'aide d'un modèle standard. ultralytics modèle, qui est l'étape préalable au remplissage d'une base de données vectorielle.

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate feature embeddings for an image file
# The 'embed' method creates the vector representation needed for the database
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Output the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")

Applications concrètes

Les bases de données vectorielles sont le moteur de nombreuses applications avancées de vision par ordinateur (CV) et de traitement du langage naturel (NLP) utilisées aujourd'hui dans les environnements d'entreprise.

  • Génération augmentée par la récupération (RAG) : à l'ère de l' IA générative, les bases de données vectorielles permettent aux modèles linguistiques à grande échelle (LLM) d'accéder à une vaste bibliothèque de données privées et actualisées. En récupérant les documents pertinents en fonction de la signification sémantique de la requête d'un utilisateur, le système réduit les hallucinations dans les LLM et fournit des réponses factuelles et adaptées au contexte.
  • Moteurs de recommandation visuelle : dans le domaine de l'IA appliquée au commerce de détail, les plateformes utilisent des bases de données vectorielles pour alimenter les fonctionnalités « acheter des styles similaires ». Si un utilisateur consulte une robe d'été spécifique, le système interroge la base de données pour trouver d'autres images de produits présentant des intégrations visuelles similaires (motifs, coupes et couleurs correspondants), offrant ainsi une meilleure expérience utilisateur qu'un simple filtrage basé sur des balises.
  • Détection des anomalies et des menaces : les systèmes de sécurité exploitent les bases de données vectorielles pour la détection des anomalies. En stockant les intégrations des comportements « normaux » ou du personnel autorisé, le système peut instantanément signaler les valeurs aberrantes qui ne correspondent pas au cluster attendu dans l'espace vectoriel, améliorant ainsi la sécurité des données et la surveillance des installations.

Différencier des concepts connexes

Pour mettre en œuvre efficacement ces systèmes, il est utile de distinguer la base de données vectorielle des technologies connexes dans le domaine des opérations d'apprentissage automatique (MLOps) .

  • Base de données vectorielle vs recherche vectorielle: La recherche vectorielle est l'action ou le processus algorithmique qui consiste à trouver des vecteurs similaires (le « comment »). Une base de données vectorielle est une infrastructure robuste conçue pour stocker les données, gérer l'index et effectuer ces recherches à grande échelle (le « où »).
  • Base de données vectorielle vs magasin de caractéristiques: Un magasin de caractéristiques est un référentiel centralisé permettant de gérer les caractéristiques utilisées dans l'entraînement et l'inférence des modèles, garantissant ainsi leur cohérence. Bien qu'il traite les données de caractéristiques, il n'est pas principalement optimisé pour les requêtes de recherche basées sur la similarité qui définissent une base de données vectorielle.
  • Base de données vectorielle vs lac de données: un lac de données stocke de grandes quantités de données brutes dans leur format natif. Une base de données vectorielle stocke les représentations mathématiques traitées (intégrations) de ces données, optimisées spécifiquement pour la recherche par similarité.

Intégration avec les flux de travail modernes de l'IA

Implementing a vector database often involves a pipeline where models like the efficient YOLO26 act as the embedding engine. These models process visual data at the edge or in the cloud, and the resulting vectors are pushed to solutions like Pinecone, Milvus, or Qdrant.

For teams looking to streamline this entire lifecycle—from data curation and auto-annotation to model training and deployment—the Ultralytics Platform offers a comprehensive environment. By integrating model training with efficient deployment strategies, developers can ensure that the embeddings feeding their vector databases are accurate, resulting in higher quality search results and smarter AI agents.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant