Une introduction au domaine émergent de l'IA neuro-symbolique
Explore comment l'IA neuro-symbolique vise à combiner apprentissage et logique pour construire des systèmes qui comprennent le contexte et fournissent des décisions plus transparentes et explicables.

De nos jours, grâce à la croissance rapide de l'intelligence artificielle (IA) et à la disponibilité croissante de la puissance de calcul, des modèles d'IA avancés sont publiés plus rapidement que jamais. En fait, le secteur de l'IA stimule une innovation significative dans de nombreuses industries.
Par exemple, dans le domaine de la santé, les systèmes d'IA sont utilisés pour assister des tâches telles que l'analyse d'images médicales pour un diagnostic précoce. Cependant, comme toute technologie, l'IA a ses limites.
La transparence est une préoccupation majeure. Par exemple, un modèle de détection d'objets peut localiser avec précision une tumeur dans une IRM cérébrale, mais il peut être difficile de comprendre comment le modèle est parvenu à cette conclusion. Ce manque d'explicabilité rend plus difficile pour les médecins et les chercheurs de faire entièrement confiance aux résultats de l'IA ou de les valider.
C'est exactement pourquoi il y a un intérêt croissant pour le domaine émergent de l'IA neuro-symbolique. L'IA neuro-symbolique combine les forces de reconnaissance de formes de l'apprentissage profond avec le raisonnement structuré et basé sur des règles que l'on trouve dans l'IA symbolique. L'objectif est de créer des systèmes qui font des prédictions précises, mais qui peuvent également expliquer leur raisonnement d'une manière que les humains peuvent comprendre.
Dans cet article, nous explorerons le fonctionnement de l'intelligence artificielle neuro-symbolique et comment elle réunit l'apprentissage et le raisonnement pour construire des systèmes plus transparents et conscients du contexte. Commençons !
Link to this sectionLes deux facettes de l'IA neuro-symbolique : Apprentissage et raisonnement#
Avant de plonger dans l'IA neuro-symbolique, examinons de plus près les deux sous-domaines qu'elle rassemble : l'apprentissage profond et l'IA symbolique.
L'apprentissage profond se concentre sur la reconnaissance de formes dans les données, tandis que l'IA symbolique utilise des règles, la logique ou le bon sens pour raisonner sur des problèmes. Chacun a ses forces, mais aussi ses limites. En les combinant, l'IA neuro-symbolique crée des systèmes capables à la fois d'apprendre à partir de données et d'expliquer leurs décisions plus clairement.
Link to this sectionUn aperçu de l'apprentissage profond#
L'apprentissage profond est une branche de l'apprentissage automatique qui utilise des réseaux de neurones artificiels, vaguement inspirés de la manière dont le cerveau traite l'information. Ces réseaux apprennent en analysant de grandes quantités de données et en ajustant leurs connexions internes pour améliorer leurs performances.
Cela leur permet de reconnaître des modèles dans des images, des sons et du texte sans avoir besoin de règles conçues manuellement pour chaque situation. Pour cette raison, l'apprentissage profond est très efficace pour les tâches axées sur la perception telles que la reconnaissance d'images, le traitement de la parole et la traduction linguistique.
Un bon exemple est un modèle de vision par ordinateur entraîné à segmenter des objets dans des images. Avec suffisamment d'exemples étiquetés, il peut apprendre à séparer les routes, les véhicules et les piétons dans des séquences de trafic en temps réel.
Cependant, malgré leur précision, les modèles d'apprentissage profond peinent souvent à expliquer clairement comment ils sont arrivés à un résultat spécifique. Ce défi, communément appelé le problème de la boîte noire, rend plus difficile pour les utilisateurs d'interpréter ou de vérifier les décisions du modèle, surtout dans des domaines sensibles comme la santé ou la finance. C'est important car une IA responsable nécessite de la transparence, de la confiance et la capacité de comprendre pourquoi un modèle a fait une certaine prédiction.
Link to this sectionExplorer l'IA symbolique#
L'IA symbolique adopte une approche plus structurée de l'intelligence et de la prise de décision. Elle représente les connaissances en utilisant des symboles et applique des règles logiques pour travailler avec ces connaissances, de manière similaire à la façon dont nous utilisons le raisonnement et le langage pour résoudre des problèmes. Chaque étape du processus de raisonnement est définie, ce qui rend les décisions de l'IA symbolique transparentes et plus faciles à expliquer.
Les connaissances symboliques fonctionnent particulièrement bien dans les tâches qui suivent des règles claires et bien définies, comme la planification, l'ordonnancement ou la gestion de connaissances structurées. Cependant, l'IA symbolique a du mal avec les données non structurées ou les situations qui ne s'intègrent pas parfaitement dans des catégories prédéfinies.
Un exemple courant d'approches symboliques en action est celui des premiers programmes d'échecs. Ils suivaient des règles conçues manuellement et des stratégies fixes plutôt que d'apprendre des parties précédentes ou de s'adapter à différents adversaires. En conséquence, leur style de jeu avait tendance à être rigide et prévisible.

Fig 1. Un regard sur la structure de l'IA et ses sous-domaines. (Image par l'auteur)
Link to this sectionQu'est-ce que l'IA neuro-symbolique ?#
Dans les années 2010, à mesure que l'apprentissage profond devenait plus largement adopté, les chercheurs ont commencé à chercher des moyens d'aller au-delà de la simple reconnaissance de formes pour comprendre les relations et le contexte. Ce changement a rendu possible pour les modèles d'IA non seulement de détecter des objets dans une scène, comme un chat et un tapis, mais aussi d'interpréter comment ces objets sont liés, par exemple en reconnaissant que le chat est assis sur le tapis.
Cependant, ce progrès a également mis en évidence une limite fondamentale. Les modèles d'apprentissage profond peuvent reconnaître des modèles extrêmement bien, mais ils peinent souvent à expliquer leur raisonnement ou à gérer des situations inconnues. Cette attention renouvelée pour le raisonnement a ramené les chercheurs vers un domaine qui existe depuis les années 1980 : l'IA neuro-symbolique.
L'IA neuro-symbolique intègre l'apprentissage profond et l'IA symbolique. Elle permet aux modèles d'apprendre à partir d'exemples de la même manière que l'apprentissage profond, tout en appliquant la logique et le raisonnement comme le fait l'IA symbolique.
En termes simples, l'IA neuro-symbolique peut reconnaître des informations, comprendre le contexte et fournir des explications plus claires pour ses décisions. Cette approche nous rapproche du développement de systèmes d'IA qui se comportent de manière plus fiable et plus humaine.

Fig 2. Comprendre l'IA neuro-symbolique (Image par l'auteur)
Link to this sectionLes bases du fonctionnement de l'IA neuro-symbolique#
Une architecture neuro-symbolique réunit l'apprentissage et le raisonnement au sein d'un cadre unique. Elle comprend généralement trois parties principales : une couche de perception neuronale qui interprète les données brutes, une couche de raisonnement symbolique qui applique la logique, et une couche d'intégration qui connecte les deux. Ensuite, nous examinerons de plus près chaque couche.
Link to this sectionLa couche de perception neuronale#
Le composant de perception neuronale traite les données non structurées, telles que les images, la vidéo, le texte ou l'audio, et les convertit en représentations internes avec lesquelles le système peut travailler. Il utilise généralement des modèles d'apprentissage profond pour détecter des modèles et identifier des objets ou des caractéristiques dans l'entrée. À ce stade, le système reconnaît ce qui est présent dans les données, mais il ne raisonne pas encore sur le sens, les relations ou le contexte.
Voici quelques types courants de modèles d'apprentissage profond utilisés dans cette couche :
- Réseaux de neurones convolutifs (CNN) : Ce sont un type de réseau de neurones conçu pour traiter des données sous forme de grille telles que les images. Les CNN utilisent des filtres convolutifs pour scanner une image et détecter des modèles comme les bords, les textures et les formes. En empilant ces modèles, ils apprennent à reconnaître des objets comme des voitures, des fruits et des personnes.
- Transformers : Les Transformers sont des modèles conçus pour comprendre comment différentes parties d'une entrée sont liées les unes aux autres. Au lieu de lire les informations strictement dans l'ordre, ils peuvent examiner plusieurs parties des données en même temps et décider quelles parties sont les plus importantes. Cela les aide à comprendre le contexte dans le texte, les images ou les deux. En raison de cette flexibilité, les Transformers sont l'architecture de base derrière la plupart des modèles linguistiques modernes et de nombreux systèmes vision-langage.
- Réseaux de neurones récurrents (RNN) : Ce type de modèle est conçu pour analyser des données séquentielles, telles que la parole ou les signaux de séries temporelles. Il conserve une mémoire des entrées précédentes, ce qui signifie que ses prédictions peuvent prendre en compte le contexte au fil du temps.
En fin de compte, ces modèles neuronaux extraient et représentent des caractéristiques significatives à partir de données brutes. Cette sortie devient ensuite l'entrée pour la couche de raisonnement symbolique, qui interprète et raisonne sur ce que le système a détecté.
Link to this sectionLa couche de raisonnement symbolique#
La couche de raisonnement symbolique prend les informations produites par la couche de perception neuronale et leur donne un sens en utilisant la logique. Au lieu de travailler uniquement à partir de modèles, elle s'appuie sur des éléments tels que des règles, des graphes de connaissances, des bases de connaissances et des ontologies (descriptions organisées de concepts et de la façon dont ils sont liés les uns aux autres). Celles-ci aident le système à comprendre comment différents éléments s'assemblent et quelles actions ont du sens dans une situation donnée.
Par exemple, dans une voiture autonome, la couche de perception neuronale peut reconnaître un feu rouge dans le flux vidéo de la caméra. La couche de raisonnement symbolique peut alors appliquer une règle telle que : « Si le feu est rouge, le véhicule doit s'arrêter. » Parce que le raisonnement est basé sur des règles claires, les décisions du système sont plus faciles à expliquer et à vérifier, ce qui est particulièrement important dans les situations où la sécurité et la responsabilité sont en jeu.
Link to this sectionLa couche d'intégration#
La couche d'intégration connecte la couche de perception neuronale et la couche de raisonnement symbolique, garantissant que l'apprentissage et le raisonnement fonctionnent ensemble. Dans une direction, elle convertit les sorties des modèles neuronaux (telles que la détection d'un piéton) en représentations symboliques qui décrivent l'objet et ses attributs.
Dans l'autre direction, elle prend des règles symboliques (par exemple, « un véhicule doit s'arrêter si un piéton est sur un passage piéton ») et les traduit en signaux qui guident les modèles neuronaux. Cela peut impliquer de mettre en évidence des zones pertinentes d'une image, d'influencer l'attention ou de façonner les voies de décision du modèle.
Cet échange bidirectionnel forme une boucle de rétroaction. Le côté neuronal gagne en structure et en interprétabilité grâce aux règles symboliques, tandis que le côté symbolique peut s'adapter plus efficacement en fonction des données du monde réel. Des techniques telles que les réseaux neuronaux logiques (LNN) aident à permettre cette interaction en intégrant des contraintes logiques directement dans les architectures neuronales.
En reliant la perception et le raisonnement de cette manière, l'IA neuro-symbolique peut produire des décisions qui sont à la fois précises et plus faciles à interpréter. De nombreux chercheurs voient cette approche comme une étape prometteuse vers une IA plus fiable et alignée sur l'humain, et potentiellement comme une base pour les futurs progrès vers l'intelligence artificielle générale (AGI).
Link to this sectionApplications de l'IA neuro-symbolique#
Maintenant que nous avons une meilleure compréhension de ce qu'est une IA neuro-symbolique et de son fonctionnement, jetons un œil à certains de ses cas d'utilisation réels.
Link to this sectionConduire plus prudemment : De la vision des piétons à leur compréhension#
Les véhicules autonomes doivent comprendre leur environnement pour fonctionner en toute sécurité. Ils utilisent des technologies comme la vision par ordinateur pour détecter les piétons, les véhicules, les marquages au sol et les panneaux de signalisation.
Bien que les modèles d'apprentissage profond puissent identifier ces objets avec précision, ils ne comprennent pas toujours ce que ces objets signifient dans le contexte ou comment ils sont liés les uns aux autres dans une situation réelle. Par exemple, un modèle neuronal peut reconnaître un piéton sur un passage pour piétons mais ne peut pas dire s'il est sur le point de traverser ou s'il est simplement debout en train d'attendre.
L'IA neuro-symbolique tente de combler cette lacune en permettant aux véhicules autonomes de combiner la reconnaissance visuelle avec le raisonnement logique, afin qu'ils puissent interpréter les situations plutôt que de simplement identifier les objets. Des recherches récentes en IA ont montré que les systèmes combinant la perception neuronale avec des règles symboliques peuvent améliorer la prédiction du comportement des piétons.
Dans ces systèmes, le composant neuronal analyse les signaux visuels tels que la posture, le mouvement et la position d'un piéton. Le composant symbolique applique ensuite des règles logiques, en tenant compte de facteurs tels que si la personne est près d'un passage pour piétons ou ce que le signal de trafic actuel indique.
En combinant ces deux perspectives, le système neuro-symbolique peut faire plus que simplement détecter un piéton. Il peut faire une prédiction raisonnable sur la probabilité que le piéton traverse, et il peut expliquer pourquoi il a pris cette décision. Cela conduit à un comportement plus sûr et plus transparent dans les véhicules autonomes.

Fig 3. Faire des prédictions basées sur le comportement observé des piétons en utilisant l'IA neuro-symbolique. (Source)
Link to this sectionInterprétation logique dans la réponse aux questions visuelles#
Une autre application importante de l'IA neuro-symbolique est la réponse aux questions visuelles (VQA). Les systèmes VQA sont conçus pour répondre à des questions sur des images.
Cela rassemble des grands modèles linguistiques (LLM) et des modèles visuels pour effectuer un raisonnement multimodal, combinant ce que le système voit avec ce qu'il comprend. Par exemple, si un système VQA reçoit une image et qu'on lui demande : « La tasse est-elle sur la table ? », il doit reconnaître les objets mais aussi comprendre la relation entre eux. Il doit déterminer si la tasse est effectivement située sur la table dans la scène.
Une étude récente a démontré comment l'IA neuro-symbolique peut améliorer la VQA en intégrant la perception neuronale avec le raisonnement symbolique. Dans le système proposé, le réseau de neurones analyse d'abord l'image pour reconnaître les objets et leurs attributs, tels que la couleur, la forme ou la taille.
Le composant de raisonnement symbolique applique ensuite des règles logiques pour interpréter comment ces objets sont liés les uns aux autres et pour répondre à la question. Si on demande « Combien de cylindres gris sont dans la scène ? », la partie neuronale identifie tous les cylindres et leurs couleurs, et la partie symbolique les filtre en fonction des critères et compte les bons.

Fig 4. Exemples de scénarios VQA où des connaissances abstraites et de la logique sont nécessaires. (Source)
Ces recherches montrent comment la VQA neuro-symbolique peut aller au-delà de la simple fourniture de réponses. Parce que le modèle peut montrer les étapes qu'il a suivies pour parvenir à une conclusion, il soutient l'IA explicable, où les systèmes font des prédictions et justifient leur raisonnement d'une manière que les gens peuvent comprendre.
Link to this sectionAvantages et inconvénients de l'IA neuro-symbolique#
Voici quelques-uns des principaux avantages de l'utilisation de l'IA neuro-symbolique :
- Capacités de raisonnement plus fortes : Contrairement aux modèles d'apprentissage profond purs, l'IA neuro-symbolique peut effectuer des tâches qui nécessitent un raisonnement en plusieurs étapes, de la planification, le respect de règles et la gestion de domaines de connaissances structurés, où l'IA symbolique excelle traditionnellement.
- Adaptabilité : Ces systèmes fonctionnent bien sur des tâches nouvelles ou inconnues car ils peuvent raisonner logiquement au-delà de ce sur quoi ils ont été formés. Au lieu de simplement mémoriser des données, ils comprennent les relations et les modèles.
- Robustesse au bruit et à l'ambiguïté : Les contraintes logiques peuvent aider à prévenir les erreurs lorsque les données sont bruyantes, incomplètes ou ambiguës. La couche de raisonnement peut appliquer des règles qui guident ou corrigent les prédictions neuronales.
Malgré son potentiel, l'IA neuro-symbolique est encore en évolution et s'accompagne de certains défis pratiques. Voici certaines de ses principales limites :
- Intégration complexe : Bien que ce cadre hybride offre une forte interprétabilité, concevoir des algorithmes qui fusionnent la perception et le raisonnement reste un défi.
- Évolutivité : Le raisonnement symbolique peut devenir lent ou coûteux en calcul lors de la manipulation de grands graphes de connaissances ou de jeux de règles complexes. Cela peut rendre les applications en temps réel, telles que la conduite autonome, le traitement vidéo ou le raisonnement sur les connaissances à grande échelle, plus difficiles à déployer efficacement.
- Robustesse du raisonnement : Si les règles symboliques sont trop rigides, les systèmes peuvent peiner dans des scénarios réels ambigus ou imprévisibles. Équilibrer l'apprentissage flexible avec un raisonnement fiable est encore un défi permanent.
Link to this sectionPoints clés#
L'IA neuro-symbolique représente une étape importante vers la construction de systèmes d'IA qui peuvent non seulement percevoir le monde mais aussi raisonner à son sujet et expliquer leurs décisions. Contrairement aux systèmes d'apprentissage profond traditionnels, qui reposent principalement sur des modèles appris à partir de données, l'IA neuro-symbolique combine l'apprentissage statistique avec une logique et des connaissances structurées. Plutôt que de remplacer l'apprentissage profond, elle s'appuie sur lui, nous rapprochant un peu plus du développement d'une IA capable de comprendre et de raisonner de manière plus humaine.
Rejoins notre communauté et explore notre dépôt GitHub. Consulte nos pages de solutions pour découvrir diverses applications de l'IA dans l'agriculture et de la vision par ordinateur dans la santé. Découvre nos options de licence et commence à construire ton projet d'IA visuelle !






