Glossaire

Traitement du langage naturel (NLP)

Découvrez les concepts, les techniques et les applications du traitement du langage naturel (NLP) tels que les chatbots, l'analyse des sentiments et la traduction automatique.

Le traitement du langage naturel (TLN) est un domaine dynamique de l'intelligence artificielle (IA) et de l'apprentissage machine (ML) dont l'objectif est de permettre aux ordinateurs de comprendre, d'interpréter, de générer et d'interagir avec le langage humain de manière utile. L'objectif ultime du NLP est de combler le fossé de communication entre les humains et les machines, en permettant aux logiciels de traiter et d'analyser les données textuelles et vocales à une échelle et à une vitesse qui dépassent les capacités humaines. Cela implique le développement d'algorithmes et de modèles capables de gérer les complexités, les nuances et le contexte inhérents aux langues naturelles.

Comment fonctionne la PNL ?

Les systèmes NLP utilisent la linguistique computationnelle - une modélisation du langage humain basée sur des règles - ainsi que des modèles statistiques et d'apprentissage profond pour traiter les données linguistiques. Le processus commence généralement par le prétraitement des données, où le texte brut est décomposé en unités plus petites et plus faciles à gérer grâce à un processus appelé " tokenisation".

Une fois le tokenized effectué, les pipelines NLP modernes exploitent des architectures de réseaux neuronaux avancées telles que les réseaux neuronaux récurrents (RNN) et, plus récemment, l'architecture Transformer, très influente. Ces modèles, qui constituent la base des grands modèles de langage (LLM) actuels, analysent les relations contextuelles entre les mots. Cela leur permet d'effectuer des tâches complexes telles que la reconnaissance de l'intention, la traduction des langues et même la création de contenu original. Des institutions de premier plan comme le Stanford NLP Group et des organisations comme l'Association for Computational Linguistics (ACL) sont à la pointe de cette recherche.

Applications dans le monde réel

La PNL est à l'origine d'un large éventail d'applications que beaucoup d'entre nous utilisent quotidiennement. En voici deux exemples marquants :

  1. Latraduction automatique: Des outils tels que Google Translate utilisent des modèles NLP sophistiqués pour traduire automatiquement des textes et des discours d'une langue à l'autre. Ces systèmes analysent la structure et le sens des phrases dans la langue source et génèrent ensuite une traduction grammaticalement correcte et adaptée au contexte dans la langue cible. Ces modèles sont entraînés sur des ensembles massifs de textes parallèles provenant de sources telles que les actes des Nations unies.

  2. Analyse des sentiments: Les entreprises utilisent le NLP pour analyser les commentaires des clients sur les médias sociaux, les avis sur les produits et les enquêtes. En classant le ton émotionnel du texte comme positif, négatif ou neutre, les entreprises peuvent obtenir des informations sur l'opinion publique, la satisfaction des clients et la perception de la marque, ce qui leur permet de prendre des décisions fondées sur des données.

Parmi les autres applications courantes, citons les assistants virtuels intelligents comme Siri et Alexa, les filtres anti-spam, les outils de résumé de texte et les chatbots pour le service client.

La PNL et les concepts apparentés

Bien qu'apparentée, la PNL diffère de certains termes similaires :

  • Compréhension du langage naturel (NLU): Le NLU est un sous-ensemble du NLP spécifiquement axé sur l'aspect de la compréhension, c'est-à-dire l'extraction du sens, de l'intention et du contexte du langage. Le NLP est plus large et englobe également des tâches telles que la génération de texte et la synthèse vocale.
  • Génération de texte: Il s'agit d'une capacité ou d'une tâche spécifique au sein du NLP qui se concentre sur la production de texte semblable à celui d'un humain. Bien qu'elle soit au cœur de nombreuses applications de NLP (comme les chatbots ou la traduction), elle ne couvre pas les aspects de compréhension ou d'analyse du NLP.
  • Vision par ordinateur (VA): L'informatique visuelle traite de l'interprétation et de la compréhension des informations provenant d'entrées visuelles telles que les images et les vidéos, en se concentrant sur des tâches telles que la détection d'objets ou la segmentation d'images. Le NLP, quant à lui, se concentre sur les données linguistiques. Toutefois, les deux domaines se recoupent de plus en plus dans des modèles multimodaux qui traitent à la fois le texte et les images, ce qui permet des applications telles que le sous-titrage automatique des images. Pour en savoir plus sur le rapprochement entre NLP et CV, cliquez ici. Ultralytics est spécialisé dans la CV et propose des modèles tels que Ultralytics YOLO11 pour les tâches exigeant une grande précision et une grande rapidité.

Outils et plateformes

Le développement et le déploiement d'applications NLP impliquent souvent l'utilisation de bibliothèques et de plates-formes spécialisées :

  • Bibliothèques : Les bibliothèques open-source telles que spaCy et NLTK fournissent des outils pour les tâches NLP courantes telles que la tokenisation, l'analyse syntaxique et la reconnaissance d'entités.
  • Plateformes : Hugging Face offre un vaste référentiel de modèles pré-entraînés (en particulier les Transformers), d'ensembles de données et d'outils qui accélèrent considérablement le développement. Pour gérer le cycle de vie de bout en bout des modèles de ML, y compris ceux utilisés dans les pipelines NLP ou CV-NLP combinés, des plateformes comme Ultralytics HUB offrent de solides capacités MLOps, rationalisant l'entraînement, le déploiement et la surveillance. Explorez la documentation d'Ultralytics pour plus de ressources sur le développement et le déploiement de modèles.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers