Recherche sémantique
Découvrez la puissance de la recherche sémantique ! Apprenez comment l'IA, le NLP et le ML améliorent la précision de la recherche en comprenant l'intention et le contexte de l'utilisateur.
La recherche sémantique est une technique avancée de recherche d'informations qui vise à comprendre l'intention et la signification contextuelle de la requête d'un utilisateur, plutôt que de se contenter de faire correspondre des mots-clés. Contrairement aux moteurs de recherche traditionnels qui s'appuient sur la correspondance littérale des termes, la recherche sémantique utilise le traitement du langage naturel (NLP) et l'apprentissage automatique (ML) pour fournir des résultats plus pertinents et plus précis. L'objectif est de combler le fossé entre le langage humain et les données structurées que les ordinateurs peuvent facilement traiter, afin d'offrir une expérience de recherche plus intuitive et plus efficace.
Cette technologie s'appuie sur la conversion de données non structurées, telles que du texte ou des images, en représentations numériques appelées " embeddings". Des modèles tels que CLIP (Contrastive Language-Image Pre-Training) d'OpenAI ou BERT de Google sont entraînés à générer ces embeddings, qui capturent l'essence sémantique du contenu. Une fois les données représentées sous forme de vecteurs, une base de données vectorielle comme Milvus ou Weaviate utilise des algorithmes spécialisés comme FAISS de Meta pour effectuer une recherche de similarité rapide et efficace.
Applications dans le monde réel
La recherche sémantique a transformé la façon dont nous interagissons avec l'information numérique dans divers domaines. En voici deux exemples marquants :
- Recherche sémantique d'images : Dans les domaines créatifs ou pour la gestion de grands ensembles d'images, les utilisateurs ont souvent besoin de trouver des images basées sur des concepts abstraits. Par exemple, un graphiste peut rechercher "une plage paisible et isolée au coucher du soleil". Un système traditionnel aurait du mal à répondre à cette requête si les images n'étaient pas méticuleusement étiquetées. Un système de recherche sémantique, comme celui proposé par Ultralytics, analyse le contenu des images elles-mêmes et renvoie les visuels qui correspondent à l'ambiance et aux éléments décrits sans s'appuyer sur les noms de fichiers ou les balises. Pour en savoir plus sur la mise en œuvre de ce système, consultez notre guide sur la recherche par similarité.
- Découverte de produits pour le commerce électronique : Les détaillants en ligne exploitent la recherche sémantique pour améliorer l'expérience d'achat. Un client peut chercher "bottes chaudes pour un hiver enneigé" au lieu d'un nom de produit spécifique. Le moteur de recherche peut comprendre les concepts de "chaud" et "enneigé" et recommander des produits tels que des bottes isolées et imperméables, même si ces mots clés exacts ne figurent pas dans la description du produit. Comme l'expliquent les experts du secteur à Forbes, cela permet d'accroître la satisfaction des clients et d'améliorer les ventes.
Recherche sémantique et concepts connexes
Il est important de différencier la recherche sémantique de plusieurs termes liés à l'IA et à la science des données :
- Recherche par mots-clés : Il s'agit de la méthode traditionnelle qui consiste à faire correspondre les mots littéraux d'une requête à des documents. Elle ne peut pas comprendre les synonymes, le contexte ou l'intention de l'utilisateur, qui sont les points forts de la recherche sémantique.
- Recherche vectorielle: Il s'agit de la méthode qui consiste à trouver des éléments similaires en calculant la proximité de leur intégration vectorielle. Si la recherche vectorielle est un élément essentiel de la plupart des systèmes de recherche sémantique modernes, la recherche sémantique est un concept plus large qui comprend également l'étape initiale de compréhension du sens grâce à des modèles NLP sophistiqués proposés par des entreprises telles que Cohere.
- Graphique de connaissances: Un graphe de connaissances structure l'information sous la forme d'entités et de leurs relations. Il peut améliorer considérablement la recherche sémantique en fournissant un contexte structuré, comme le montre le Knowledge Graph de Google. Cependant, la recherche sémantique peut également fonctionner directement sur des données non structurées en utilisant uniquement des enchâssements, ce qui rend les deux technologies complémentaires.
- Reconnaissance des entités nommées (NER) : La reconnaissance d'entités nommées (NER) est une tâche secondaire du NLP qui permet d'identifier des entités spécifiques telles que des noms, des lieux et des organisations dans un texte. Elle peut être utilisée comme étape de prétraitement dans un pipeline NLP pour introduire des concepts clés dans un système de recherche sémantique, mais ce n'est pas le processus de recherche lui-même.
La recherche sémantique est la pierre angulaire des solutions modernes d'IA, permettant des systèmes plus intelligents et plus conviviaux. Cette technologie alimente tout, des recherches quotidiennes sur le web aux applications spécialisées d'IA, y compris la recherche visuelle construite avec les modèles YOLO d'Ultralytics et gérée par des plates-formes comme Ultralytics HUB.