Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Traitement du langage naturel (TAL)

Découvrez le traitement du langage naturel (NLP) avec Ultralytics. Apprenez comment le NLP alimente les chatbots, l'analyse des sentiments et la détection de vocabulaire ouvert avec Ultralytics .

Le traitement du langage naturel (NLP) est une branche dynamique de l' intelligence artificielle (IA) qui se concentre sur l'interaction entre les ordinateurs et le langage humain. Contrairement à la programmation traditionnelle qui repose sur des entrées précises et structurées, le NLP permet aux machines de comprendre, d'interpréter et de générer le langage humain d'une manière à la fois utile et significative. En combinant la linguistique informatique avec des modèles statistiques, d'apprentissage automatique et d' apprentissage profond (DL), le NLP permet aux systèmes de traiter des données textuelles et vocales dans le but d'en extraire le sens, le sentiment et le contexte.

Mécanismes de base

À la base, le NLP consiste à transformer du texte brut en un format numérique que les ordinateurs peuvent traiter, une étape souvent réalisée grâce à la tokenisation et à la création d' embeddings. Les systèmes modernes utilisent l' architecture Transformer, qui emploie un mécanisme d'auto-attention pour pondérer l'importance des différents mots d'une phrase les uns par rapport aux autres. Cela permet aux modèles de gérer les dépendances à long terme et les nuances telles que le sarcasme ou les expressions idiomatiques, qui étaient difficiles à gérer pour les anciens réseaux neuronaux récurrents (RNN).

Applications concrètes

La technologie PNL est omniprésente dans les logiciels modernes, alimentant les outils que les entreprises et les particuliers utilisent quotidiennement pour rationaliser les opérations et améliorer l'expérience utilisateur.

  • Automatisation du service client : de nombreuses entreprises utilisent des chatbots et des agents automatisés pour traiter les demandes des clients . Ces systèmes utilisent l' analyse des sentiments pour déterminer le ton émotionnel d'un message (en identifiant si un client est satisfait, frustré ou s'il pose une question), ce qui permet de hiérarchiser les réponses. Des outils tels que l' APIGoogle Natural Language fournissent aux développeurs des modèles pré-entraînés pour mettre en œuvre rapidement ces fonctionnalités.
  • Intégration vision-langage : dans le domaine de la vision par ordinateur (CV), le NLP permet la détection à « vocabulaire ouvert ». Au lieu de former un modèle sur une liste fixe de classes (comme les 80 classes du COCO ), des modèles tels que YOLO utilisent des encodeurs de texte pour identifier des objets à partir de des descriptions en langage naturel. Ce pont permet aux utilisateurs de trouver des éléments spécifiques, tels qu'une « personne portant un casque rouge », sans avoir à reformer le modèle.
  • Traduction linguistique : des services tels que Google exploitent la traduction automatique pour convertir instantanément un texte d'une langue à une autre, éliminant ainsi les barrières de communication à l'échelle mondiale.

Distinguer les termes apparentés

Pour comprendre la portée du NLP, il est utile de le différencier des concepts étroitement liés dans le domaine de la science des données:

  • Compréhension du langage naturel (NLU): Alors que le NLP est le domaine général, le NLU est un sous-ensemble spécifique axé sur la compréhension écrite. Le NLU consiste à déterminer l'intention et le sens derrière le texte, en tenant compte de l'ambiguïté et du contexte.
  • Modèles linguistiques de grande taille (LLM): Les LLM, tels que la série GPT ou Llama, sont des modèles d'apprentissage profond massifs entraînés sur des pétaoctets de données. Ce sont les outils utilisés pour effectuer des tâches avancées de TALN, capables de génération de texte et de raisonnement sophistiqués.
  • Reconnaissance optique de caractères (OCR): L'OCR consiste strictement à convertir des images de texte (documents numérisés) en texte codé par machine. Le NLP prend le relais une fois que l'OCR a numérisé le contenu afin de donner un sens à ce qui a été écrit.

Exemple de code : relier le texte et la vision

L'exemple suivant montre comment les concepts du NLP interagissent avec la vision par ordinateur. Nous utilisons le ultralytics package pour charger un modèle qui comprend les invites textuelles. En définissant des classes personnalisées avec le langage naturel, nous utilisons le vocabulaire interne du modèle (intégrations) pour detect dans une image.

from ultralytics import YOLOWorld

# Load a model with vision-language capabilities
model = YOLOWorld("yolov8s-world.pt")

# Define NLP-based search terms (classes) for the model to find
# The model uses internal text embeddings to understand these descriptions
model.set_classes(["blue bus", "pedestrian crossing", "traffic light"])

# Run inference to detect objects matching the text descriptions
results = model.predict("city_scene.jpg")

# Show the results
results[0].show()

Outils et orientations futures

Le développement d'applications NLP nécessite souvent des bibliothèques robustes. Les chercheurs utilisent fréquemment PyTorch pour construire des architectures neuronales personnalisées, tandis que le Natural Language Toolkit (NLTK) reste un incontournable pour les tâches de prétraitement éducatif . Pour le traitement de texte de niveau production, spaCy est largement adopté pour son efficacité.

À mesure que l'IA évolue, la convergence des modalités est une tendance clé. Les plateformes s'orientent vers des flux de travail unifiés où la vision et le langage sont traités comme des flux de données interconnectés. Ultralytics simplifie ce cycle de vie en proposant des outils permettant de gérer des ensembles de données, d'annoter des images et de former des modèles de pointe . Alors que le NLP gère l'aspect linguistique, des modèles de vision haute performance tels que YOLO26 garantissent que les données visuelles sont traitées avec la vitesse et la précision requises pour les applications en temps réel, créant ainsi une expérience fluide pour les systèmes d'IA multimodaux.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant