Glosario

Procesamiento del lenguaje natural (PLN)

Descubra conceptos, técnicas y aplicaciones de Procesamiento del Lenguaje Natural (PLN) como chatbots, análisis de sentimientos y traducción automática.

El Procesamiento del Lenguaje Natural (PLN) es un campo dinámico dentro de la Inteligencia Artificial (IA) y el Aprendizaje Automático (AM) dedicado a capacitar a los ordenadores para comprender, procesar, interpretar y generar lenguaje humano, tanto texto como voz. Combina principios de lingüística computacional con modelos estadísticos, ML y Deep Learning (DL) para salvar la brecha entre la comunicación humana y la comprensión informática. El objetivo final es permitir a las máquinas interactuar con el lenguaje de una manera que sea significativa y útil, automatizando tareas que tradicionalmente requieren capacidades lingüísticas humanas.

Conceptos clave de la PNL

La PNL comprende varias tareas básicas que descomponen las complejidades del lenguaje en componentes que las máquinas pueden analizar y sobre los que pueden actuar:

  • Tokenización: El paso inicial de dividir el texto en unidades más pequeñas, como palabras o subpalabras (tokens).
  • Reconocimiento de entidades con nombre (NER): Identificación y categorización de entidades clave en el texto, como nombres de personas, organizaciones, lugares, fechas y valores monetarios.
  • Análisis de sentimiento: Determinar el tono emocional o la opinión subjetiva expresada en un texto (por ejemplo, positivo, negativo, neutro).
  • Traducción automática: Traducción automática de texto o voz de un idioma a otro, como en herramientas como Google Translate.
  • Modelado del lenguaje: Construcción de modelos que predicen la probabilidad de una secuencia de palabras, crucial para tareas como la generación de textos y el reconocimiento de voz.

Cómo funciona la PNL

Los sistemas de PLN suelen emplear un enfoque en cadena. En primer lugar, los datos de texto sin procesar se someten a un preprocesamiento que incluye tareas como la limpieza del texto (eliminación de caracteres o formatos irrelevantes), la tokenización y, en ocasiones, la normalización (conversión de palabras a una forma base). Tras el preprocesamiento, se extraen las características relevantes para la tarea. Estas características se introducen en los modelos ML o DL para su análisis o generación.

La PNL moderna depende en gran medida de las redes neuronales (NN), en particular de arquitecturas sofisticadas como las redes neuronales recurrentes (RNN) para datos secuenciales y, más recientemente, los transformadores. Los transformadores, que se distinguen por sus potentes mecanismos de atención, han demostrado ser excepcionalmente eficaces para captar las dependencias de largo alcance y el contexto dentro del lenguaje. Esta arquitectura es la base de muchos de los modelos más avanzados, incluidas variantes de BERT y modelos GPT como GPT-4. Plataformas de investigación como la Antología ACL albergan numerosos artículos que detallan estos avances.

Aplicaciones de la PNL

La PNL impulsa una amplia gama de aplicaciones que están transformando sectores y mejorando las interacciones cotidianas. He aquí dos ejemplos destacados:

  1. Asistentes virtuales y chatbots: Sistemas como Siri de Apple y Alexa de Amazon, junto con innumerables chatbots de atención al cliente, utilizan ampliamente la PNL. Emplean el reconocimiento de voz para convertir palabras habladas en texto, la comprensión del lenguaje natural (NLU ) para captar la intención del usuario y, a veces, la generación de texto para formular respuestas.
  2. Filtrado de spam por correo electrónico: Las técnicas de PNL analizan el contenido del correo electrónico para identificar patrones característicos de spam o intentos de phishing. Los algoritmos clasifican los correos en función de palabras clave, reputación del remitente y estructura lingüística, lo que ayuda a mantener las bandejas de entrada limpias y seguras.

Otras aplicaciones comunes son el resumen de textos para condensar documentos largos, los motores de búsqueda semántica que comprenden el significado de las consultas más allá de la simple coincidencia de palabras clave y las herramientas de corrección gramatical y de estilo como Grammarly. Muchos casos de uso innovadores de la IA dependen en gran medida de la PNL.

PNL frente a conceptos afines

Aunque está relacionada, la PNL difiere de algunos términos similares:

  • Comprensión del Lenguaje Natural (NLU): El NLU es un subconjunto de la PNL centrado específicamente en el aspecto de la comprensión: extraer el significado, la intención y el contexto del lenguaje. La PNL es más amplia y también abarca tareas como la generación de textos y la síntesis de voz.
  • Generación de texto: Se trata de una capacidad o tarea específica dentro de la PNL que se centra en la producción de texto similar al humano. Aunque es una parte esencial de muchas aplicaciones de PNL (como los chatbots o la traducción), no cubre los aspectos de comprensión o análisis de la PNL.
  • Visión por ordenador (CV): La CV se ocupa de interpretar y comprender la información procedente de entradas visuales como imágenes y vídeos, centrándose en tareas como la detección de objetos o la segmentación de imágenes. La PNL, en cambio, se centra en los datos lingüísticos. Sin embargo, ambos campos se entrecruzan cada vez más en modelos multimodales que procesan tanto texto como imágenes y permiten aplicaciones como el subtitulado automático de imágenes. Más información sobre el puente entre PNL y CV. Ultralytics se especializa en CV y ofrece modelos como Ultralytics YOLO11 para tareas que exigen gran precisión y velocidad.

Herramientas y plataformas

El desarrollo y la implantación de aplicaciones de PNL suelen implicar el uso de bibliotecas y plataformas especializadas:

  • Bibliotecas: Bibliotecas de código abierto como spaCy y NLTK ofrecen herramientas para tareas comunes de PLN como la tokenización, el análisis sintáctico y el reconocimiento de entidades.
  • Plataformas: Hugging Face ofrece un amplio repositorio de modelos preentrenados (especialmente Transformers), conjuntos de datos y herramientas que aceleran significativamente el desarrollo. Para gestionar el ciclo de vida completo de los modelos de ML, incluidos los utilizados en NLP o en canalizaciones combinadas de CV-NLP, plataformas como Ultralytics HUB ofrecen sólidas funciones de MLOps, que agilizan la formación, el despliegue y la supervisión. Explore la documentación de Ultralytics para obtener más recursos sobre desarrollo y despliegue de modelos.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles