Hybrid Search
Découvre comment la recherche hybride fusionne la correspondance par mots-clés et l'IA sémantique. Apprends à créer des pipelines de recherche sensibles au contexte en utilisant les métadonnées de Ultralytics YOLO26.
En combinant la précision de la correspondance par mots-clés traditionnelle avec la compréhension contextuelle de l'IA moderne, cette méthodologie de recherche récupère et classe les informations en exploitant à la fois des représentations de données creuses (sparse) et denses (dense). Alors qu'un moteur de recherche standard repose entièrement sur des correspondances exactes de mots-clés (appelées recherche lexicale) et que les moteurs de recherche vectoriels reposent uniquement sur la similarité sémantique, un moteur de recherche hybride fusionne ces deux approches pour fournir des résultats très précis et conscients du contexte.
Comment ça fonctionne
Un pipeline de recherche hybride typique exécute simultanément deux méthodes de récupération distinctes, fusionnant leurs sorties en un classement unique et optimisé :
- Recherche lexicale (creuse) : Utilise des algorithmes comme BM25 pour noter les correspondances exactes de mots-clés basées sur la fréquence des termes. C'est crucial pour récupérer des entités spécifiques, des acronymes, des références de produits ou du jargon spécialisé qu'un modèle purement sémantique pourrait avoir du mal à identifier.
- Recherche sémantique (dense) : Génère des tableaux de nombres de haute dimension à l'aide de modèles d'IA pour comprendre le sens profond et le contexte d'une requête. Cela permet au système de trouver des résultats pertinents même si les mots exacts sont absents de la requête de recherche.
Une fois que les deux méthodes récupèrent leurs résultats candidats, un algorithme de fusion — le plus courant étant la fusion de rang réciproque (RRF) — combine les listes. Le RRF calcule un nouveau score basé sur le rang de chaque élément dans les ensembles de résultats creux et denses respectifs. Cela garantit que les documents classés en haut dans l'une ou l'autre des recherches, ou dans les deux, remontent en tête, équilibrant les correspondances contextuelles larges avec la précision chirurgicale des mots-clés.
Applications réelles de l'IA et du ML
Les architectures d'IA modernes s'appuient fortement sur cette technique pour surmonter les limites liées à l'utilisation d'une seule méthode de récupération dans les environnements de production.
- RAG hybride (génération augmentée par la récupération) : Dans les systèmes de connaissances d'entreprise, fournir au modèle de langage étendu (LLM) le contexte le plus pertinent est essentiel pour prévenir les hallucinations. Une configuration RAG hybride garantit que le modèle récupère des documents qui correspondent à des contraintes techniques exactes tout en extrayant des paragraphes sémantiquement liés.
- Commerce électronique et découverte visuelle de produits : Les détaillants utilisent la recherche hybride pour alimenter leurs catalogues de produits. Un utilisateur peut rechercher « chaussures de running rouges ». Le moteur lexical fait correspondre les mots-clés exacts de la marque ou de la catégorie, tandis qu'un modèle d'IA de vision utilise des encodages d'image pour faire apparaître des articles visuellement similaires.
Aujourd'hui, presque toutes les bases de données vectorielles majeures — y compris Pinecone, Qdrant, OpenSearch et PostgreSQL via pgvector — prennent en charge nativement la recherche hybride. Cela permet aux développeurs d'indexer efficacement à la fois les mots-clés creux et les vecteurs denses au sein d'une infrastructure unique.
Génération de métadonnées pour la recherche hybride
Dans les pipelines de vision par ordinateur, tu peux extraire des mots-clés significatifs à partir d'images pour construire la composante creuse d'un index hybride. En utilisant Ultralytics YOLO26, tu peux effectuer automatiquement une détection d'objets sur une image et utiliser ces noms de classes comme balises de métadonnées. Ces balises de mots-clés peuvent ensuite être associées aux encodages vectoriels denses de l'image pour une indexation complète.
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 object detection model
model = YOLO("yolo26n.pt")
# Run inference to detect objects in an image
results = model("store_aisle.jpg")
# Extract predicted class names to be indexed as keyword metadata (sparse data)
keywords = [model.names[int(box.cls)] for box in results[0].boxes]
print("Sparse keywords for lexical search:", keywords)En enrichissant les encodages d'image denses avec des mots-clés creux précis générés par IA, les développeurs peuvent exploiter l' Ultralytics Platform et les bases de données vectorielles compatibles hybrides pour construire des moteurs de recherche multimodaux robustes qui comprennent parfaitement à la fois les balises textuelles explicites et le contexte visuel implicite de leurs données.






