Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024
Glossaire

Recherche vectorielle

Découvrez comment la recherche vectorielle révolutionne l'IA en permettant la similarité sémantique dans la récupération de données pour le NLP, la recherche visuelle, les systèmes de recommandation, et plus encore !

La recherche vectorielle est une méthode permettant de trouver des éléments similaires dans un grand ensemble de données en représentant les données sous forme de vecteurs numériques, appelés embeddings. Au lieu de faire correspondre des mots-clés exacts, elle identifie les éléments qui sont sémantiquement ou contextuellement similaires. Cette approche est fondamentale pour les systèmes d'intelligence artificielle (IA) modernes, permettant une récupération d'informations plus intuitive et précise pour les types de données complexes comme les images, le texte et l'audio. Elle va au-delà des requêtes littérales pour comprendre le sens ou l'intention sous-jacente, ce qui en fait un outil puissant pour la création de moteurs de recherche et de recommandation sophistiqués.

Comment fonctionne la recherche vectorielle ?

Le processus de recherche vectorielle implique plusieurs étapes clés qui transforment les données brutes en un format consultable basé sur le sens. Il est basé sur des modèles d'apprentissage profond et des algorithmes efficaces.

  1. Générer des embeddings : Tout d'abord, un modèle d'apprentissage automatique, tel qu'un transformateur ou un réseau neuronal convolutionnel (CNN), convertit les éléments de données (par exemple, des phrases, des images, des profils d'utilisateurs) en vecteurs numériques de haute dimension appelés embeddings. Chaque vecteur capture l'essence sémantique de l'élément.
  2. Indexation : Ces vecteurs générés sont stockés et indexés dans une base de données vectorielle spécialisée. Ces bases de données, telles que Pinecone ou Milvus, sont optimisées pour gérer et interroger efficacement de vastes quantités de données vectorielles.
  3. Interrogation : Lorsqu'un utilisateur soumet une requête (comme une phrase de texte ou une image), elle est convertie en un vecteur à l'aide du même modèle.
  4. Calcul de similarité : Le système utilise ensuite des algorithmes pour trouver les vecteurs de la base de données qui sont les plus « proches » du vecteur de requête. Cela se fait souvent à l'aide de mesures de distance telles que la similarité cosinus ou la distance euclidienne. Pour gérer des ensembles de données massifs, les systèmes utilisent généralement des algorithmes Approximate Nearest Neighbor (ANN) tels que ScaNN ou Faiss pour une recherche rapide et évolutive qui trouve des correspondances très pertinentes, voire exactes.

Applications concrètes

La recherche vectorielle est la technologie qui sous-tend de nombreuses fonctionnalités d'IA avancées. Elle permet aux systèmes d'aller au-delà de la simple correspondance et de fournir des résultats tenant compte du contexte dans divers secteurs.

  • Recherche sémantique d'images : Au lieu de se fier à des balises manuelles ou à des noms de fichiers, les utilisateurs peuvent rechercher des images en utilisant des expressions descriptives en langage naturel. Par exemple, un utilisateur pourrait rechercher « une voiture roulant sur une route de montagne au coucher du soleil », et le système extrairait des images visuellement similaires, comprenant les concepts de « voiture », « montagne » et « coucher du soleil » dans leur contexte. Vous pouvez explorer comment cela fonctionne avec le guide de recherche par similarité d'Ultralytics.
  • Systèmes de recommandation : Les plateformes de commerce électronique et de diffusion en continu utilisent la recherche vectorielle pour recommander des produits ou du contenu. Si vous regardez un film de science-fiction, le service peut trouver et suggérer d’autres films similaires en termes de genre, de ton et d’intrigue en comparant leurs embeddings vectoriels. Il s’agit d’une fonction essentielle de l'IA dans le commerce de détail pour améliorer l’expérience utilisateur et l’engagement.

Recherche vectorielle vs. Concepts associés

Il est utile de distinguer la recherche vectorielle des autres termes connexes pour comprendre son rôle spécifique dans l'écosystème de l'IA.

  • Recherche par mots-clés : La recherche traditionnelle par mots-clés repose sur la correspondance exacte des mots ou des expressions. Elle a du mal avec les synonymes, le contexte et les nuances linguistiques. La recherche vectorielle, en revanche, comprend les relations sémantiques, ce qui lui permet de trouver des résultats pertinents même si les mots-clés ne correspondent pas exactement.
  • Recherche sémantique : La recherche sémantique est le concept général de compréhension de l'intention et du sens contextuel d'une requête. La recherche vectorielle est une méthode essentielle utilisée pour mettre en œuvre la recherche sémantique. Alors que la recherche sémantique est le « quoi » (comprendre le sens), la recherche vectorielle est le « comment » (le mécanisme de récupération basé sur la proximité vectorielle).
  • Embeddings : Les embeddings sont les représentations vectorielles des données. La recherche vectorielle est le processus de requête d'une collection d'embeddings pour trouver les plus similaires. Les embeddings sont les données, tandis que la recherche vectorielle est l'action effectuée sur ces données.
  • Base de données vectorielle : Une base de données vectorielle est l'infrastructure spécialisée pour stocker, indexer et interroger efficacement les incorporations (embeddings). Des plateformes comme Ultralytics HUB aident à gérer les ensembles de données et les modèles qui produisent ces incorporations pour une utilisation dans les systèmes de recherche vectorielle.

En exploitant la puissance des embeddings et des algorithmes de recherche sophistiqués, la recherche vectorielle comble le fossé entre l'intention humaine et les données numériques, ce qui en fait un élément essentiel pour de nombreuses applications intelligentes, du traitement du langage naturel (NLP) aux tâches avancées de vision par ordinateur.

Rejoignez la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant
Lien copié dans le presse-papiers