Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Compréhension du langage naturel (NLU)

Découvrez la compréhension du langage naturel (NLU) – la percée de l'IA qui permet aux machines de comprendre, d'interpréter et de répondre au langage humain.

La compréhension du langage naturel (NLU) est un sous-domaine spécialisé de l'intelligence artificielle (IA). de l'intelligence artificielle (IA) axée sur la la compréhension de la lecture par les machines. Alors que le traitement de texte standard peut compter les mots, la compréhension du langage naturel vise à déchiffrer le sens, l'intention et le sentiment qui se cachent derrière le langage humain. le sens, l'intention et le sentiment qui se cachent derrière le langage humain. C'est le "cerveau" qui permet aux logiciels de d'interpréter des textes non structurés, tels que des courriels, des chats ou des commandes vocales, et de les traduire en données structurées et exploitables. structurées et exploitables. Cette capacité est fondamentale pour construire des systèmes intuitifs tels que les chatbots et les assistants virtuels qui peuvent interagir avec les utilisateurs naturellement avec les utilisateurs.

Composants principaux du NLU

Pour "comprendre" efficacement la langue, les systèmes NLU décomposent les données d'entrée en plusieurs couches significatives. Ce processus transforme le texte brut en un format structuré sur lequel les algorithmes peuvent agir. Ce processus transforme le texte brut en un format structuré sur lequel les algorithmes peuvent agir.

  • Reconnaissance des intentions : Il s'agit d'identifier l'objectif de l'utilisateur. Par exemple, si un utilisateur tape "J'ai besoin d'un vol à destination de Tokyo", l'intention est d'identifier le but de l'utilisateur. vol pour Tokyo", l'intention est BookFlight. Ceci est crucial pour les agents d'IA orientés vers un but.
  • Reconnaissance d'entités nommées (NER): Cela permet d'extraire des éléments d'information spécifiques, tels que des noms, des dates, des lieux ou des codes de produits. Dans la phrase "Rencontre avec Glenn vendredi", le NER identifie "Glenn" comme un PERSON et "vendredi" en tant que DATE.
  • Analyse des sentiments: Elle évalue le ton émotionnel du texte (positif, négatif ou neutre). évalue le ton émotionnel du texte (positif, négatif ou neutre). Elle est largement utilisée dans l'assistance à la clientèle pour pour évaluer automatiquement la satisfaction des utilisateurs.
  • Raisonnement contextuel : NLU avancé, souvent alimenté par grands modèles de langage (LLM) et des transformateurs, va au-delà des phrases individuelles pour comprendre les références et les ambiguïtés (par exemple, comprendre à quoi "il" fait référence dans une conversation).

Applications concrètes

Le NLU est le moteur de nombreuses technologies que nous utilisons quotidiennement, car il comble le fossé entre la communication humaine et la logique des machines. la logique de la machine.

  1. Automatisation du service client : Les entreprises utilisent le NLU pour alimenter des agents d'assistance intelligents. Des plateformes comme IBM Watson Natural Language Understanding peuvent analyser les tickets d'assistance entrants, les acheminer vers le bon service en fonction de l'intention, et même suggérer des réponses en fonction de la description du problème. des réponses en fonction de la description du problème.
  2. Recherche sémantique : Contrairement à la recherche par mot-clé, qui correspond à des mots exacts, les moteurs de recherche pilotés par l'UAL comprennent le sens de la requête. comprennent le sens de la requête. Cela permet aux utilisateurs de poser des questions telles que "Qui est le PDG d'Ultralytics?" et d'obtenir une réponse directe plutôt qu'une liste de liens contenant le mot "CEO".
  3. Commande vocale : Les appareils s'appuient sur le NLU pour analyser les commandes vocales. Lorsqu'un utilisateur dit "Éteindre éteindre les lumières du salon", le système utilise le NLU pour identifier l'action ("éteindre") et l'entité cible ("lumières du salon"). l'entité cible ("lumières du salon").

NLU vs. NLP vs. Vision par ordinateur

Il est utile de distinguer le NLU des disciplines connexes de l'IA :

  • Traitement du langage naturel (NLP): Le NLP est le domaine général qui englobe toutes les tâches linguistiques. Le NLU est spécifiquement le sous-ensemble de la compréhension (de l'entrée au sens). compréhension (de l'entrée au sens). Un autre sous-ensemble, la génération de langage naturel (NLG), s'occupe de la création de texte (sens). la création de texte (Signification $\à$ Sortie).
  • Vision par ordinateur (VA): Tandis que le NLU traite le texte, le CV interprète les données visuelles. NLU traite le texte, CV interprète les données visuelles. Cependant, les systèmes modernes de modèles multimodaux combinent les deux. Par exemple, des modèles comme YOLO utilisent la NLU pour pour interpréter des invites textuelles (par exemple, "sac à dos bleu") et utilisent ensuite la CV pour trouver ces objets dans une image.

NLU dans l'IA de la vision : détection de vocabulaires ouverts

L'intégration de l'UAL avec la vision par ordinateur permet la "détection d'objets à vocabulaire ouvert". Au lieu d'être limité à une liste à une liste fixe de classes (comme les 80 classes de COCO), un modèle peut detect objets sur la base d'un texte descriptif. Le modèle Ultralytics YOLOWorld Le modèle de l'OCR illustre ce principe en utilisant un encodeur de texte embarqué pour "comprendre" les classes que vous souhaitez trouver. les classes que vous souhaitez trouver.

L'exemple suivant montre comment le NLU permet à un modèle de vision de detect objets personnalisés définis uniquement par du texte :

from ultralytics import YOLOWorld

# Load a YOLO-World model (incorporates NLU for text-based class definition)
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using natural language
# The model's NLU component understands these terms without retraining
model.set_classes(["person reading a book", "red coffee mug"])

# Run inference on an image
results = model.predict("library.jpg")

# Display results
results[0].show()

Outils et tendances futures

Le domaine du NLU progresse rapidement, sous l'impulsion des recherches menées par des groupes tels que le Stanford NLP Group et l Association for Computational Linguistics (ACL). Les technologies évoluent de la simple correspondance de mots-clés à une compréhension contextuelle approfondie.

Pour les développeurs, la future plateformeUltralytics (lancement en 2026) rationalisera le cycle de vie des modèles d'IA. modèles d'IA, en facilitant la gestion des ensembles de données et le déploiement de systèmes multimodaux complexes qui exploitent à la fois la vision et la compréhension du langage. la compréhension du langage. Les tâches de vision de pointe actuelles peuvent être gérées par YOLO11tandis que la R&D se poursuit sur la prochaine génération YOLO26, qui vise une intégration encore plus étroite de la vitesse et de la précision. Les services en nuage tels que Google Cloud Natural Language fournissent également des API robustes pour d'ajouter des fonctionnalités NLU pures aux applications.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant