Hybrid Search

Explore comment la recherche hybride fusionne la correspondance par mots-clés et l'IA sémantique. Apprends à construire des pipelines de recherche contextuels en utilisant les métadonnées d'Ultralytics YOLO26.

En combinant la précision de la correspondance de mots-clés traditionnelle avec la compréhension contextuelle de l'IA moderne, cette méthodologie de recherche récupère et classe les informations en exploitant à la fois des représentations de données creuses et denses. Alors qu'un moteur de recherche standard repose entièrement sur des correspondances exactes de mots-clés (appelées recherche lexicale) et que les moteurs de recherche vectoriels reposent uniquement sur la similarité sémantique, un moteur de recherche hybride fusionne ces deux approches pour fournir des résultats très précis et conscients du contexte.

Link to this sectionComment ça fonctionne#

Un pipeline de recherche hybride typique exécute simultanément deux méthodes de récupération distinctes, fusionnant leurs résultats en un classement unique et optimisé :

Recherche lexicale (creuse) : utilise des algorithmes comme BM25 pour noter les correspondances exactes de mots-clés en fonction de la fréquence des termes. C'est crucial pour récupérer des entités spécifiques, des acronymes, des références de produits ou un jargon spécialisé qu'un modèle purement sémantique pourrait avoir du mal à identifier.
Recherche sémantique (dense) : génère des tableaux de nombres à haute dimension en utilisant des modèles d'IA pour comprendre le sens profond et le contexte d'une requête. Cela permet au système de trouver des résultats pertinents même si les mots exacts sont absents de la requête de recherche.

Une fois que les deux méthodes ont récupéré leurs résultats candidats, un algorithme de fusion — le plus courant étant Reciprocal Rank Fusion (RRF) — combine les listes. RRF calcule un nouveau score basé sur le rang de chaque élément dans les ensembles de résultats creux et denses respectifs. Cela garantit que les documents classés haut dans l'une ou les deux recherches remontent en haut de liste, équilibrant les correspondances contextuelles larges avec la précision chirurgicale des mots-clés.

Link to this sectionApplications réelles de l'IA et du ML#

Les architectures d'IA modernes s'appuient fortement sur cette technique pour surmonter les limites de l'utilisation d'une seule méthode de récupération dans les environnements de production.

RAG hybride (Génération augmentée par la récupération) : dans les systèmes de connaissances d'entreprise, fournir à un Large Language Model (LLM) le contexte le plus pertinent est essentiel pour prévenir les hallucinations. Une configuration RAG hybride garantit que le modèle récupère des documents qui correspondent aux contraintes techniques exactes tout en extrayant également des paragraphes sémantiquement liés.
Commerce électronique et découverte visuelle de produits : les détaillants utilisent la recherche hybride pour alimenter les catalogues de produits. Un utilisateur peut rechercher « chaussures de course rouges ». Le moteur lexical correspond aux mots-clés exacts de la marque ou de la catégorie, tandis qu'un modèle d'IA de vision utilise des embeddings d'image pour faire apparaître des articles visuellement similaires.

Aujourd'hui, presque toutes les principales bases de données vectorielles — notamment Pinecone, Qdrant, OpenSearch et PostgreSQL via pgvector — prennent en charge nativement la recherche hybride. Cela permet aux développeurs d'indexer efficacement à la fois les mots-clés creux et les vecteurs denses dans une seule infrastructure.

Link to this sectionGénération de métadonnées pour la recherche hybride#

Dans les pipelines de computer vision, tu peux extraire des mots-clés significatifs des images pour construire la composante creuse d'un index hybride. En utilisant Ultralytics YOLO26, tu peux automatiquement effectuer une object detection sur une image et utiliser ces class names comme metadata tags. Ces balises de mots-clés peuvent ensuite être associées aux embeddings vectoriels denses de l'image pour une indexation complète.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 object detection model
model = YOLO("yolo26n.pt")

# Run inference to detect objects in an image
results = model("store_aisle.jpg")

# Extract predicted class names to be indexed as keyword metadata (sparse data)
keywords = [model.names[int(box.cls)] for box in results[0].boxes]
print("Sparse keywords for lexical search:", keywords)

En enrichissant les embeddings d'images denses avec des mots-clés creux précis générés par l'IA, tu peux tirer parti de la Ultralytics Platform et des bases de données vectorielles compatibles hybrides pour construire des multimodal search engines robustes qui comprennent parfaitement à la fois les balises textuelles explicites et le contexte visuel implicite de tes données.

Explore solutions

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

Hybrid Search

Link to this sectionComment ça fonctionne#

Link to this sectionApplications réelles de l'IA et du ML#

Link to this sectionGénération de métadonnées pour la recherche hybride#

Explore solutions

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

Construisons ensemble le futur de l'IA !