Graphe de connaissances
Découvrez comment les graphes de connaissances révolutionnent l'IA en modélisant des relations complexes, permettant la recherche sémantique, les recommandations personnalisées, et plus encore.
Un graphe de connaissances est un modèle qui organise et connecte des informations provenant de diverses sources pour représenter la connaissance d'un domaine de manière structurée, comme le ferait un humain. Contrairement à une base de données traditionnelle qui stocke les données dans des tables, un graphe de connaissances capture les informations sous forme de réseau d'entités (objets du monde réel, événements, situations ou concepts abstraits) et les relations entre elles. Cette structure permet aux systèmes d'IA de comprendre le contexte, de tirer des conclusions et de répondre à des questions complexes plus efficacement qu'en se contentant de faire correspondre des mots-clés. Le concept est un élément central du Web sémantique, visant à rendre les données Internet lisibles par machine.
La structure d'un graphe de connaissances est constituée de nœuds (entités), d'arêtes (relations) et de propriétés (attributs décrivant les entités). Par exemple, dans un graphe sur les films, "Leonardo DiCaprio" serait un nœud d'entité, "a joué dans" serait une arête de relation, et "Titanic" serait un autre nœud d'entité. Le nœud "Leonardo DiCaprio" pourrait également avoir des propriétés telles que "Date de naissance". Les graphes de connaissances publics importants incluent le Knowledge Graph de Google et les projets open source comme DBpedia.
Applications dans l'IA et l'apprentissage automatique
Les graphiques de connaissances font partie intégrante de nombreuses applications intelligentes :
- Recherche sémantique : Les moteurs de recherche utilisent des graphes de connaissances pour comprendre l'intention derrière les requêtes et fournir des résultats contextuels plus pertinents au-delà de la simple correspondance de mots-clés. Cela leur permet de répondre à des questions directes comme « qui est le PDG d'Apple » en parcourant le graphe.
 - Systèmes de recommandation : En modélisant les relations entre les utilisateurs, les éléments et leurs attributs, les graphes de connaissances permettent des recommandations plus sophistiquées et personnalisées dans des domaines tels que l'IA dans le commerce de détail et la diffusion de contenu en continu.
 - Réponse aux questions et Chatbots : Les graphes de connaissances fournissent des connaissances structurées qui permettent aux systèmes d'IA de répondre à des questions complexes en naviguant dans les relations entre les entités, ce qui améliore les capacités de l'IA conversationnelle.
 - Intégration des données : Les graphes de connaissances peuvent unifier les données provenant de sources disparates, créant ainsi une vue cohérente et interconnectée de l'information au sein d'une organisation. Ceci est essentiel pour l'analyse des Big Data et est souvent interrogé à l'aide de langages comme SPARQL.
 - Amélioration d'autres modèles d'IA : Les graphes de connaissances peuvent fournir des connaissances contextuelles de base pour d'autres tâches d'IA. Par exemple, en Vision par ordinateur (CV), un graphe pourrait relier les objets identifiés par des modèles comme Ultralytics YOLO11 à des informations sur leurs propriétés ou leurs fonctions, ce qui conduirait à une compréhension plus riche de la scène. Des plateformes comme Ultralytics HUB gèrent les ensembles de données et les modèles qui peuvent exploiter ces connaissances structurées.
 
Exemples concrets
- Personnalisation du commerce électronique : Un détaillant en ligne utilise un graphe de connaissances reliant les clients, les produits, les marques, les catégories, l'historique de consultation et les données d'achat. Lorsqu'un utilisateur recherche des « chaussures de course », le graphe aide le système à comprendre les concepts connexes (par exemple, « marathon », « trail ») et les préférences de l'utilisateur afin de fournir des résultats et des recommandations hautement personnalisés pour les produits complémentaires. Cela améliore l'ensemble de l'expérience client.
 - Solutions d'IA dans le secteur de la santé : Un établissement de recherche médicale construit un graphe de connaissances reliant les maladies, les symptômes, les gènes, les médicaments et les publications de recherche provenant de sources telles que PubMed. Cela permet aux chercheurs d'interroger des relations complexes, telles que « Trouver les médicaments qui ciblent la protéine X et qui sont utilisés pour traiter la maladie Y », ce qui accélère la découverte de médicaments et améliore le support au diagnostic pour l'analyse d'images médicales.
 
Graphe de connaissances vs. Concepts connexes
- Base de données : Une base de données relationnelle traditionnelle stocke les données dans des tables rigides prédéfinies avec des lignes et des colonnes. Un graphe de connaissances utilise une structure de graphe flexible (nœuds et arêtes), qui est mieux adaptée pour représenter des relations complexes et évolutives et pour déduire de nouvelles connexions. Les bases de données graphiques modernes comme Neo4j sont spécialement conçues pour gérer cette structure.
 - Recherche vectorielle : Il s'agit d'une méthode permettant de trouver des éléments similaires en fonction de la proximité de leurs représentations vectorielles. Bien que les bases de données vectorielles soient très efficaces pour les recherches de similarité, elles ne stockent pas explicitement les relations comme le fait un graphe de connaissances. Les graphes de connaissances définissent des connexions explicites, tandis que la recherche vectorielle trouve des connexions implicites basées sur des caractéristiques apprises.
 - Grands modèles de langage (LLM): Les LLM stockent implicitement des connaissances dans leurs paramètres après avoir été entraînés sur de vastes quantités de texte. Les graphes de connaissances stockent les connaissances de manière explicite et vérifiable. Ils peuvent être utilisés ensemble ; un LLM peut répondre à une requête en récupérant d'abord des informations factuelles à partir d'un graphe de connaissances afin de réduire les hallucinations et de garantir la précision, une technique essentielle à la génération augmentée par récupération (RAG).