Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Recherche sémantique

Découvrez comment la recherche sémantique utilise l'IA et les intégrations pour comprendre l'intention de l'utilisateur. Apprenez à créer des systèmes de recherche visuelle avec Ultralytics et notre plateforme.

La recherche sémantique est une technique sophistiquée de recherche d'informations qui vise à comprendre l'intention et le sens contextuel de la requête d'un utilisateur plutôt que de simplement faire correspondre des mots spécifiques. En tirant parti des progrès réalisés dans le domaine du traitement du langage naturel (NLP) et de l'apprentissage automatique (ML), cette technologie permet aux systèmes d'interpréter le langage humain avec plus de nuances. Elle est la pierre angulaire des applications modernes d' intelligence artificielle (IA) et permet des interactions plus intuitives entre les humains et les machines en comblant le fossé entre les requêtes ambiguës des utilisateurs et les données pertinentes.

Comment fonctionne la recherche sémantique ?

À la base, la recherche sémantique va au-delà de la simple correspondance littérale de caractères pour analyser la relation entre les concepts. Les moteurs de recherche traditionnels peuvent échouer si un utilisateur recherche « félin », mais que les documents ne contiennent que le mot « chat ». La recherche sémantique résout ce problème en transformant les données non structurées, telles que le texte, les images ou l'audio, en représentations mathématiques appelées « embeddings ».

Ces intégrations sont des vecteurs à haute dimension placés dans un « espace sémantique ». Dans cet espace, les éléments ayant des significations similaires sont positionnés à proximité les uns des autres. Par exemple, le vecteur correspondant au mot « voiture » serait mathématiquement plus proche des mots « automobile » et « route » que du mot « banane ». Lorsqu'un utilisateur soumet une requête, le système convertit cette requête en un vecteur et trouve les points de données les plus proches dans la base de données vectorielle. Ce processus s'appuie sur des modèles d'apprentissage profond pour effectuer l' extraction de caractéristiques, identifiant ainsi les caractéristiques essentielles des données.

Python suivant montre comment générer ces intégrations à l'aide du modèle Ultralytics , qui constitue l'étape fondamentale pour permettre la recherche sémantique visuelle.

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate feature embeddings for an image
# This converts the visual content into a numerical vector
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Output the shape of the embedding vector (e.g., length 1280)
print(f"Embedding vector shape: {results[0].shape}")

Applications concrètes

La recherche sémantique a révolutionné la manière dont les utilisateurs découvrent les informations dans divers secteurs, rendant les systèmes plus intelligents et plus efficaces.

  • Commerce électronique et découverte visuelle : dans le monde de l' IA dans le commerce de détail, la recherche sémantique alimente les fonctionnalités « shop the look ». Un client peut télécharger une photo d'une basket ou rechercher « vintage summer vibes ». Le système utilise la vision par ordinateur pour comprendre le style visuel et récupère les produits qui correspondent à l'esthétique recherchée, même si les descriptions des produits ne contiennent pas ces mots-clés exacts. Cela implique souvent des modèles multimodaux capables de comprendre à la fois les entrées textuelles et les entrées images.
  • Gestion des connaissances et RAG : les grandes organisations utilisent la recherche sémantique pour aider leurs employés à trouver des documents internes. Au lieu de se souvenir des noms de fichiers exacts, un employé peut poser une question telle que « Comment réinitialiser le serveur ? ». Le système utilise la génération augmentée par la recherche (RAG) pour trouver les documents politiques les plus pertinents en fonction de leur signification et les transmet à un grand modèle linguistique (LLM) afin de générer une réponse précise.
  • Recommandation de contenu : les plateformes de streaming utilisent la compréhension sémantique pour améliorer leur système de recommandation. En analysant les résumés de l'intrigue et les cartes des caractéristiques visuelles des films qu'un utilisateur apprécie, la plateforme peut suggérer d'autres titres qui partagent des thèmes ou des ambiances similaires, ce qui permet de fidéliser les utilisateurs plus longtemps.

Recherche sémantique vs. Concepts connexes

Pour bien comprendre l'utilité de la recherche sémantique, il est utile de la distinguer des termes connexes dans le domaine de la science des données.

  • Recherche vectorielle: bien que ces termes soient souvent utilisés de manière interchangeable, il existe une distinction technique entre eux. La recherche vectorielle est la méthode mathématique permettant de calculer la distance entre des vecteurs (souvent à l'aide de la similarité cosinus). La recherche sémantique est l'application plus large qui utilise la recherche vectorielle pour atteindre l'objectif de compréhension de l'intention de l'utilisateur.
  • Recherche par mot-clé : il s'agit de la méthode traditionnelle qui repose sur la correspondance exacte de chaînes de caractères. Elle est moins coûteuse en termes de calcul, mais fragile ; elle a du mal à gérer les synonymes et la polysémie (mots ayant plusieurs significations). La recherche sémantique nécessite plus de puissance de calcul, mais offre une pertinence nettement supérieure.
  • Apprentissage sans entraînement (Zero-Shot Learning): Il s'agit de la capacité d'un modèle à classify qu'il n'a jamais vues pendant son entraînement. Les moteurs de recherche sémantiques présentent souvent des capacités d'apprentissage sans entraînement, car ils peuvent mapper une nouvelle requête inconnue à des clusters existants de concepts connus dans l'espace d'intégration sans avoir besoin d'être réentraînés.

La mise en œuvre de la recherche sémantique nécessite généralement un pipeline robuste pour la gestion des ensembles de données et l'entraînement des modèles. Ultralytics simplifie ce processus en fournissant des outils permettant d'annoter les données, d'entraîner les modèles et de les déployer efficacement. Pour les développeurs qui souhaitent créer ces systèmes, le guide de rechercheUltralytics fournit des étapes pratiques pour intégrer ces puissantes fonctionnalités dans des applications.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant