Découvrez la compréhension du langage naturel (NLU) – la percée de l'IA qui permet aux machines de comprendre, d'interpréter et de répondre au langage humain.
La compréhension du langage naturel (NLU) est un sous-domaine spécialisé de l'intelligence artificielle (IA). de l'intelligence artificielle (IA) axée sur la la compréhension de la lecture par les machines. Alors que le traitement de texte standard peut compter les mots, la compréhension du langage naturel vise à déchiffrer le sens, l'intention et le sentiment qui se cachent derrière le langage humain. le sens, l'intention et le sentiment qui se cachent derrière le langage humain. C'est le "cerveau" qui permet aux logiciels de d'interpréter des textes non structurés, tels que des courriels, des chats ou des commandes vocales, et de les traduire en données structurées et exploitables. structurées et exploitables. Cette capacité est fondamentale pour construire des systèmes intuitifs tels que les chatbots et les assistants virtuels qui peuvent interagir avec les utilisateurs naturellement avec les utilisateurs.
Pour "comprendre" efficacement la langue, les systèmes NLU décomposent les données d'entrée en plusieurs couches significatives. Ce processus transforme le texte brut en un format structuré sur lequel les algorithmes peuvent agir. Ce processus transforme le texte brut en un format structuré sur lequel les algorithmes peuvent agir.
BookFlight. Ceci est crucial pour les agents d'IA orientés vers un but.
PERSON et
"vendredi" en tant que DATE.
Le NLU est le moteur de nombreuses technologies que nous utilisons quotidiennement, car il comble le fossé entre la communication humaine et la logique des machines. la logique de la machine.
Il est utile de distinguer le NLU des disciplines connexes de l'IA :
L'intégration de l'UAL avec la vision par ordinateur permet la "détection d'objets à vocabulaire ouvert". Au lieu d'être limité à une liste
à une liste fixe de classes (comme les 80 classes de COCO), un modèle peut detect objets sur la base d'un texte descriptif. Le modèle
Ultralytics YOLOWorld Le modèle de l'OCR illustre ce principe en utilisant un encodeur de texte embarqué pour "comprendre" les classes que vous souhaitez trouver.
les classes que vous souhaitez trouver.
L'exemple suivant montre comment le NLU permet à un modèle de vision de detect objets personnalisés définis uniquement par du texte :
from ultralytics import YOLOWorld
# Load a YOLO-World model (incorporates NLU for text-based class definition)
model = YOLOWorld("yolov8s-world.pt")
# Define custom classes using natural language
# The model's NLU component understands these terms without retraining
model.set_classes(["person reading a book", "red coffee mug"])
# Run inference on an image
results = model.predict("library.jpg")
# Display results
results[0].show()
Le domaine du NLU progresse rapidement, sous l'impulsion des recherches menées par des groupes tels que le Stanford NLP Group et l Association for Computational Linguistics (ACL). Les technologies évoluent de la simple correspondance de mots-clés à une compréhension contextuelle approfondie.
Pour les développeurs, la future plateformeUltralytics (lancement en 2026) rationalisera le cycle de vie des modèles d'IA. modèles d'IA, en facilitant la gestion des ensembles de données et le déploiement de systèmes multimodaux complexes qui exploitent à la fois la vision et la compréhension du langage. la compréhension du langage. Les tâches de vision de pointe actuelles peuvent être gérées par YOLO11tandis que la R&D se poursuit sur la prochaine génération YOLO26, qui vise une intégration encore plus étroite de la vitesse et de la précision. Les services en nuage tels que Google Cloud Natural Language fournissent également des API robustes pour d'ajouter des fonctionnalités NLU pures aux applications.