Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Compréhension du langage naturel (NLU)

Découvrez la compréhension du langage naturel (NLU) – la percée de l'IA qui permet aux machines de comprendre, d'interpréter et de répondre au langage humain.

La compréhension du langage naturel (CLN) est un sous-domaine de l'intelligence artificielle (IA) et du traitement automatique du langage naturel (TALN) qui vise à permettre aux machines de comprendre le sens du langage humain. Contrairement au simple traitement des mots, la CLN vise à interpréter l'intention, le contexte et le sentiment à partir d'un texte ou d'une parole. C'est la partie "compréhension" de l'équation de l'interaction homme-machine, permettant aux logiciels de saisir ce qu'un utilisateur veut vraiment dire, même lorsque le langage est ambigu, familier ou non structuré. Cette capacité est fondamentale pour créer des applications d'IA plus intuitives et plus puissantes, capables d'interagir avec les personnes selon leurs propres termes.

Composants principaux du NLU

La compréhension du langage naturel (NLU) décompose la tâche complexe de la compréhension du langage en plusieurs composantes clés. Un système de NLU effectue généralement une combinaison des tâches suivantes pour déconstruire et interpréter les entrées de l'utilisateur :

  • Reconnaissance d'intention : Il s'agit du processus d'identification du but ou de l'objectif de l'utilisateur. Par exemple, dans l'expression "Réserver un vol pour New York", l'intention est de "réserver un vol". Il s'agit d'une première étape essentielle pour tout système orienté tâches, tel qu'un chatbot ou un assistant virtuel. Vous pouvez en apprendre davantage sur la façon dont les services comme Microsoft Azure LUIS gèrent les intentions.
  • Reconnaissance d'Entités Nommées (REN): Cela implique d'identifier et de catégoriser les éléments d'information clés dans le texte en catégories prédéfinies telles que les noms, les organisations, les lieux, les dates et les quantités. Dans l'exemple de la réservation de vol, "New York" est une entité de lieu.
  • Analyse des sentiments : Cette tâche détermine le ton émotionnel derrière un corps de texte, en le classant comme positif, négatif ou neutre. Elle est largement utilisée pour évaluer les commentaires des clients, la réputation de la marque et l'opinion publique.
  • Extraction de relations : Cette tâche avancée identifie les relations sémantiques entre différentes entités dans le texte. Par exemple, identifier que « Elon Musk » est le « PDG » de « Tesla » à partir d'un article de presse. Cela aide à construire des connaissances structurées à partir de données non structurées.

Technologies au service du TALN

La compréhension du langage naturel (NLU) moderne repose fortement sur les progrès de l'apprentissage automatique (ML), en particulier de l'apprentissage profond (DL). Les architectures de réseaux neuronaux comme les Transformers et les modèles pré-entraînés comme BERT ont révolutionné les capacités de la NLU en capturant efficacement les relations contextuelles complexes au sein du langage. Ces avancées sont fondamentales pour la puissance des grands modèles de langage (LLM) actuels. D'éminents établissements de recherche en IA comme le Stanford NLP Group et les bibliothèques et plateformes open source comme spaCy et Hugging Face sont des contributeurs clés aux progrès du domaine, et des organisations comme l'Association for Computational Linguistics (ACL) font progresser la recherche.

NLU vs. Concepts connexes

Il est important de distinguer le NLU des termes étroitement liés :

  • Traitement du langage naturel (NLP) : NLU est un sous-domaine spécialisé du NLP. Alors que le NLP est un vaste domaine couvrant tous les aspects de l'intersection entre les ordinateurs et le langage humain, NLU se concentre spécifiquement sur la compréhension et l'extraction du sens (l'entrée). Le NLP comprend également la génération de langage naturel (NLG), qui s'intéresse à la production de texte de type humain (la sortie). En bref, NLU concerne la « lecture », tandis que le NLP couvre la « lecture, l'écriture et la manipulation » du langage.
  • Vision par ordinateur (CV) : La NLU traite des données linguistiques, tandis que la CV se concentre sur l'interprétation des informations provenant d'entrées visuelles comme des images et des vidéos. Les modèles de CV comme Ultralytics YOLO sont utilisés pour des tâches telles que la détection d'objets. Cependant, les domaines se croisent de plus en plus dans les modèles multimodaux qui traitent à la fois du texte et des images, permettant des applications qui font le pont entre la NLP et la CV. Bien que des plateformes telles que Ultralytics HUB soient principalement axées sur l'IA de vision, les principes sous-jacents de l'apprentissage profond se chevauchent souvent. Pour en savoir plus sur les applications de l'IA, vous pouvez consulter la documentation d'Ultralytics.

Rejoignez la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant
Lien copié dans le presse-papiers