Compréhension du langage naturel (NLU)
Découvrez la compréhension du langage naturel (NLU) - l'avancée de l'IA qui permet aux machines de comprendre, d'interpréter et de répondre au langage humain.
La compréhension du langage naturel (NLU) est un sous-domaine de l'intelligence artificielle (IA) et du traitement du langage naturel (NLP) qui vise à permettre aux machines de comprendre le sens du langage humain. Contrairement au simple traitement des mots, la compréhension du langage naturel vise à interpréter l'intention, le contexte et le sentiment à partir d'un texte ou d'un discours. C'est la partie "compréhension" de l'équation de l'interaction homme-machine, qui permet aux logiciels de saisir ce que l'utilisateur veut vraiment dire, même lorsque le langage est ambigu, familier ou non structuré. Cette capacité est fondamentale pour créer des applications d'IA plus intuitives et plus puissantes, capables d'interagir avec les gens selon leurs propres termes.
Principaux éléments de l'unité nationale de recherche
Le NLU décompose la tâche complexe de la compréhension du langage en plusieurs éléments clés. Un système NLU effectue généralement une combinaison des tâches suivantes pour déconstruire et interpréter l'entrée de l'utilisateur :
- Reconnaissance de l'intention : Il s'agit d'identifier l'objectif ou le but de l'utilisateur. Par exemple, dans la phrase "Réserver un vol pour New York", l'intention est de "réserver un vol". Il s'agit d'une première étape essentielle pour tout système axé sur les tâches, tel qu'un chatbot ou un assistant virtuel. Vous pouvez en savoir plus sur la manière dont des services tels que Microsoft Azure LUIS traitent les intentions.
- Reconnaissance des entités nommées (NER): Il s'agit d'identifier et de classer les éléments d'information clés du texte dans des catégories prédéfinies telles que les noms, les organisations, les lieux, les dates et les quantités. Dans l'exemple de la réservation de vol, "New York" est une entité de lieu.
- Analyse des sentiments: Cette tâche consiste à déterminer le ton émotionnel d'un corps de texte, en le classant comme positif, négatif ou neutre. Elle est largement utilisée pour évaluer les réactions des clients, la réputation des marques et l'opinion publique.
- Extraction de relations : Cette tâche avancée permet d'identifier les relations sémantiques entre les différentes entités du texte. Par exemple, identifier que "Elon Musk" est le "PDG" de "Tesla" à partir d'un article de presse. Cela permet de construire des connaissances structurées à partir de données non structurées.
Les technologies qui alimentent l'unité nationale de langues
Le NLU moderne s'appuie fortement sur les progrès de l'apprentissage automatique (ML), en particulier l'apprentissage profond (DL). Les architectures de réseaux neuronaux comme Transformers et les modèles pré-entraînés comme BERT ont révolutionné les capacités de NLU en capturant efficacement les relations contextuelles complexes au sein du langage. Ces avancées sont fondamentales pour la puissance des grands modèles linguistiques (LLM) actuels. D'éminents instituts de recherche en IA tels que le Stanford NLP Group et des bibliothèques et plateformes open-source telles que spaCy et Hugging Face contribuent de manière décisive aux progrès réalisés dans ce domaine, tandis que des organisations telles que l'Association for Computational Linguistics (ACL) font avancer la recherche.
NLU vs. concepts apparentés
Il est important de distinguer le NLU des termes qui lui sont étroitement liés :
- Traitement du langage naturel (NLP) : Le NLU est un sous-domaine spécialisé du NLP. Alors que le NLP est un vaste domaine couvrant tous les aspects de l'intersection entre les ordinateurs et le langage humain, le NLU se concentre spécifiquement sur la compréhension et l'extraction de sens (l'entrée). Le NLP comprend également la génération de langage naturel (NLG), qui s'occupe de produire des textes semblables à ceux des humains (la sortie). En bref, le NLU concerne la "lecture", tandis que le NLP couvre la "lecture, l'écriture et la manipulation" du langage.
- Vision par ordinateur (VA): Le NLU traite des données linguistiques, tandis que le CV se concentre sur l'interprétation des informations provenant d'entrées visuelles telles que les images et les vidéos. Les modèles de vision artificielle comme Ultralytics YOLO sont utilisés pour des tâches telles que la détection d'objets. Toutefois, les deux domaines se recoupent de plus en plus dans des modèles multimodaux qui traitent à la fois le texte et les images, ce qui permet des applications qui font le lien entre le NLP et le CV. Bien que les plateformes telles que Ultralytics HUB soient principalement axées sur l'IA visuelle, les principes sous-jacents de l'apprentissage profond se recoupent souvent. Pour en savoir plus sur les applications de l'IA, vous pouvez consulter la documentation d'Ultralytics.