Glosario

Comprensión del lenguaje natural (NLU)

Descubra la comprensión del lenguaje natural (NLU), el gran avance de la inteligencia artificial que permite a las máquinas comprender, interpretar y responder al lenguaje humano.

La Comprensión del Lenguaje Natural (NLU) es un subcampo de la Inteligencia Artificial (IA) y el Procesamiento del Lenguaje Natural (PLN ) que se centra en capacitar a las máquinas para comprender el significado del lenguaje humano. A diferencia del simple procesamiento de palabras, el objetivo del NLU es interpretar la intención, el contexto y el sentimiento a partir del texto o el habla. Es la parte "comprensiva" de la ecuación de la interacción persona-ordenador, que permite al software entender lo que un usuario quiere decir realmente, incluso cuando el lenguaje es ambiguo, coloquial o desestructurado. Esta capacidad es fundamental para crear aplicaciones de IA más intuitivas y potentes que puedan interactuar con las personas en sus propios términos.

Componentes básicos de NLU

El NLU descompone la compleja tarea de comprender el lenguaje en varios componentes clave. Un sistema NLU suele realizar una combinación de las siguientes tareas para deconstruir e interpretar la entrada del usuario:

Reconocimiento de la intención: Es el proceso de identificar el objetivo o propósito del usuario. Por ejemplo, en la frase "Reservar un vuelo a Nueva York", la intención es "reservar un vuelo". Se trata de un primer paso fundamental para cualquier sistema orientado a tareas, como un chatbot o un asistente virtual. Puede obtener más información sobre cómo los servicios como Microsoft Azure LUIS gestionan las intenciones.
Reconocimiento de entidades con nombre (NER): Consiste en identificar y clasificar los datos clave del texto en categorías predefinidas como nombres, organizaciones, lugares, fechas y cantidades. En el ejemplo de la reserva de vuelos, "Nueva York" es una entidad de ubicación.
Análisis de sentimiento: Esta tarea determina el tono emocional de un texto y lo clasifica como positivo, negativo o neutro. Se utiliza mucho para medir los comentarios de los clientes, la reputación de la marca y la opinión pública.
Extracción de relaciones: Esta tarea avanzada identifica las relaciones semánticas entre distintas entidades del texto. Por ejemplo, identificar que "Elon Musk" es el "CEO" de "Tesla" a partir de un artículo de prensa. Esto ayuda a construir conocimiento estructurado a partir de datos no estructurados.

Tecnologías de NLU

El NLU moderno se basa en gran medida en los avances del aprendizaje automático (Machine Learning, ML), en particular del aprendizaje profundo (Deep Learning, DL). Las arquitecturas de redes neuronales como Transformers y los modelos preentrenados como BERT han revolucionado las capacidades de NLU al capturar con eficacia las complejas relaciones contextuales dentro del lenguaje. Estos avances son fundamentales para la potencia de los grandes modelos lingüísticos (LLM) actuales. Destacadas instituciones de investigación en Inteligencia Artificial, como el Stanford NLP Group, y bibliotecas y plataformas de código abierto, como spaCy y Hugging Face, contribuyen decisivamente al progreso de este campo, en el que organizaciones como la Association for Computational Linguistics (ACL) impulsan la investigación.

NLU frente a conceptos afines

Es importante distinguir NLU de términos estrechamente relacionados:

Procesamiento del Lenguaje Natural (PLN): El PLN es un subcampo especializado del PLN. Mientras que la PNL es un campo amplio que abarca todos los aspectos de la intersección entre los ordenadores y el lenguaje humano, el PLN se centra específicamente en la comprensión y la extracción de significado (la entrada). La PLN también incluye la Generación de Lenguaje Natural (GNL), que se ocupa de producir texto similar al humano (el resultado). En resumen, la NLU trata de la "lectura", mientras que la NLP abarca la "lectura, escritura y manipulación" del lenguaje.
Visión por ordenador (CV): NLU se ocupa de los datos lingüísticos, mientras que CV se centra en la interpretación de información procedente de entradas visuales como imágenes y vídeos. Los modelos de CV como Ultralytics YOLO se utilizan para tareas como la detección de objetos. Sin embargo, estos campos se entrecruzan cada vez más en modelos multimodales que procesan tanto texto como imágenes, permitiendo aplicaciones que tienden puentes entre la PLN y la CV. Aunque plataformas como Ultralytics HUB se centran principalmente en la IA de visión, los principios subyacentes del aprendizaje profundo a menudo se solapan. Para más información sobre aplicaciones de IA, puede consultar la documentación de Ultralytics.

Comprensión del lenguaje natural (NLU)

Solución flexible de licencias empresariales para impulsar su innovación

Entrene modelos de IA en segundos con Ultralytics YOLO

Entrene modelos YOLO de forma sencilla con Ultralytics HUB

Componentes básicos de NLU

Tecnologías de NLU

NLU frente a conceptos afines

Leer más en esta categoría

FastVLM: Apple presenta su nuevo modelo de lenguaje de visión rápida

Explicación del aprendizaje automático en bucle humano (HITL)

Automatización de la fabricación mediante IA de visión

Únase a la comunidad Ultralytics