Découvrez comment la recherche sémantique utilise l'IA et les intégrations pour comprendre l'intention de l'utilisateur. Apprenez à créer des systèmes de recherche visuelle avec Ultralytics et notre plateforme.
La recherche sémantique est une technique sophistiquée de recherche d'informations qui vise à comprendre l'intention et le sens contextuel de la requête d'un utilisateur plutôt que de simplement faire correspondre des mots spécifiques. En tirant parti des progrès réalisés dans le domaine du traitement du langage naturel (NLP) et de l'apprentissage automatique (ML), cette technologie permet aux systèmes d'interpréter le langage humain avec plus de nuances. Elle est la pierre angulaire des applications modernes d' intelligence artificielle (IA) et permet des interactions plus intuitives entre les humains et les machines en comblant le fossé entre les requêtes ambiguës des utilisateurs et les données pertinentes.
À la base, la recherche sémantique va au-delà de la simple correspondance littérale de caractères pour analyser la relation entre les concepts. Les moteurs de recherche traditionnels peuvent échouer si un utilisateur recherche « félin », mais que les documents ne contiennent que le mot « chat ». La recherche sémantique résout ce problème en transformant les données non structurées, telles que le texte, les images ou l'audio, en représentations mathématiques appelées « embeddings ».
Ces intégrations sont des vecteurs à haute dimension placés dans un « espace sémantique ». Dans cet espace, les éléments ayant des significations similaires sont positionnés à proximité les uns des autres. Par exemple, le vecteur correspondant au mot « voiture » serait mathématiquement plus proche des mots « automobile » et « route » que du mot « banane ». Lorsqu'un utilisateur soumet une requête, le système convertit cette requête en un vecteur et trouve les points de données les plus proches dans la base de données vectorielle. Ce processus s'appuie sur des modèles d'apprentissage profond pour effectuer l' extraction de caractéristiques, identifiant ainsi les caractéristiques essentielles des données.
Python suivant montre comment générer ces intégrations à l'aide du modèle Ultralytics , qui constitue l'étape fondamentale pour permettre la recherche sémantique visuelle.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate feature embeddings for an image
# This converts the visual content into a numerical vector
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Output the shape of the embedding vector (e.g., length 1280)
print(f"Embedding vector shape: {results[0].shape}")
La recherche sémantique a révolutionné la manière dont les utilisateurs découvrent les informations dans divers secteurs, rendant les systèmes plus intelligents et plus efficaces.
Pour bien comprendre l'utilité de la recherche sémantique, il est utile de la distinguer des termes connexes dans le domaine de la science des données.
La mise en œuvre de la recherche sémantique nécessite généralement un pipeline robuste pour la gestion des ensembles de données et l'entraînement des modèles. Ultralytics simplifie ce processus en fournissant des outils permettant d'annoter les données, d'entraîner les modèles et de les déployer efficacement. Pour les développeurs qui souhaitent créer ces systèmes, le guide de rechercheUltralytics fournit des étapes pratiques pour intégrer ces puissantes fonctionnalités dans des applications.