Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Reconocimiento de Entidades Nombradas (NER)

Explora el reconocimiento de entidades nombradas (NER) en el procesamiento del lenguaje natural (NLP). Aprende a identificar y classify entidades classify , como nombres y fechas, para obtener información valiosa con IA y Ultralytics .

El reconocimiento de entidades nombradas (NER) es una subtarea fundamental del procesamiento del lenguaje natural (NLP) que consiste en identificar y clasificar información clave dentro de un texto no estructurado. En un flujo de trabajo típico, un modelo NER escanea un documento para localizar «entidades» (palabras o frases específicas que representan objetos del mundo real) y las asigna a categorías predefinidas, como nombres de personas, organizaciones, ubicaciones, fechas o códigos médicos. Este proceso es esencial para transformar datos sin procesar y no estructurados, como correos electrónicos, opiniones de clientes y artículos de noticias, en formatos estructurados que las máquinas puedan procesar y analizar. Al responder al «quién, qué y dónde» de un texto, el NER permite a los sistemas de inteligencia artificial (IA) extraer automáticamente información significativa de grandes cantidades de datos.

Cómo funciona NER

Los sistemas NER modernos aprovechan modelos estadísticos avanzados y técnicas de aprendizaje profundo (DL) para comprender el contexto que rodea a una palabra. El proceso comienza con la tokenización, en la que una frase se divide en unidades individuales llamadas tokens. A continuación, arquitecturas sofisticadas, como el Transformer, analizan las relaciones entre estos tokens para determinar su significado en función de su uso.

Por ejemplo, la palabra «Apple» podría referirse a una fruta o a una empresa tecnológica, dependiendo de la frase. A través de mecanismos como la autoatención, un modelo NER discerniría que «Apple lanzó un nuevo teléfono» se refiere a una organización, mientras que «Me comí una manzana» se refiere a un objeto genérico. El rendimiento de estos modelos depende en gran medida de datos de entrenamiento de alta calidad y de una anotación precisa de los datos . En aplicaciones multimodales, el NER a menudo se combina con el reconocimiento óptico de caracteres (OCR) para extraer texto de imágenes antes de procesarlo.

Aplicaciones en el mundo real

NER es una tecnología fundamental para muchas herramientas de automatización inteligente utilizadas en diversos sectores.

  • IA en la asistencia sanitaria: Las instituciones médicas utilizan NER para extraer datos críticos de los registros sanitarios electrónicos. Al extraer entidades como síntomas, nombres de medicamentos y dosis de las notas clínicas, los investigadores pueden acelerar el descubrimiento de fármacos y mejorar la atención al paciente.
  • Atención al cliente inteligente: Las empresas emplean chatbots equipados con NER para clas classify automáticamente las quejas de los clientes. Si un usuario envía un mensaje diciendo «La pantalla de mi portátil está rota», el sistema identifica «portátil» como un producto y «la pantalla está rota» como un defecto, y envía el ticket al equipo de asistencia técnica de inmediato.
  • Recomendación de contenidos: los servicios de streaming y los agregadores de noticias utilizan NER para etiquetar contenidos con entidades relevantes (por ejemplo, actores, géneros, ubicaciones). A continuación, los sistemas de recomendación utilizan estas etiquetas para sugerir nuevas películas o artículos que coincidan con los intereses del usuario.
  • Análisis financiero: Las empresas de inversión utilizan el NER para escanear miles de informes financieros y artículos de noticias diariamente. Al extraer los nombres de las empresas y los valores monetarios, pueden realizar modelos predictivos para pronosticar las tendencias del mercado .

Distinguir NER de conceptos relacionados

Es útil diferenciar la NER de otras tareas de interpretación para comprender su función específica en un proceso de IA.

  • Detección de objetos: Mientras que el NER identifica entidades en el texto, la detección de objetos identifica entidades en las imágenes. Por ejemplo, un modelo visual como YOLO26 detecta coches y peatones en las transmisiones de vídeo, mientras que el NER detecta «Ford» y «conductor» en los informes escritos. Ambas tareas tienen como objetivo localizar y classify de interés dentro de sus respectivas modalidades de datos.
  • Análisis de sentimientos: Esta tarea determina el tono emocional (positivo, negativo o neutro) de un texto. El NER extrae lo que se está discutiendo (por ejemplo, «El iPhone 16»), mientras que el análisis de sentimientos determina cómo se siente el usuario al respecto (por ejemplo, «es increíble»).
  • Comprensión del lenguaje natural (NLU): NLU es un término genérico más amplio que engloba la comprensión lectora automática. NER es un componente específico de NLU que a menudo funciona junto con la clasificación de intenciones para comprender plenamente el significado de la entrada de un usuario.
  • Extracción de palabras clave: A diferencia del NER, que clasifica las palabras en categorías semánticas (por ejemplo, persona, fecha), la extracción de palabras clave simplemente identifica los términos más frecuentes o relevantes en un documento sin comprender su tipo de entidad.

Combinación de NER con visión artificial

La convergencia entre texto e imagen es una tendencia al alza en el aprendizaje multimodal. Modelos como YOLO salvan esta brecha utilizando indicaciones de texto para guiar la detección de objetos. En este flujo de trabajo, el codificador de texto actúa de forma similar a un sistema NER, interpretando el significado semántico de los nombres de clase (entidades) proporcionados por el usuario para encontrar los objetos visuales correspondientes.

El siguiente ejemplo Python muestra cómo utilizar la función ultralytics Biblioteca para detect basándose en descripciones de texto personalizadas, vinculando eficazmente entidades de lenguaje natural con datos visuales.

from ultralytics import YOLOWorld

# Load a YOLO-World model capable of understanding text-based entities
model = YOLOWorld("yolov8s-world.pt")

# Define custom entities to search for in the image
# The model interprets these text strings to identify visual matches
model.set_classes(["red backpack", "person wearing hat", "dog"])

# Run inference on an image to localize these entities
results = model.predict("park_scene.jpg")

# Display the results with bounding boxes around detected entities
results[0].show()

Herramientas e implementación

Los desarrolladores tienen acceso a un sólido ecosistema de herramientas para implementar NER. Las populares bibliotecas de código abierto como spaCy y NLTK proporcionan canalizaciones preentrenadas para su uso inmediato. Para aplicaciones a escala empresarial, los servicios en la nube como Google Natural Language ofrecen API gestionadas que se adaptan a la demanda.

La gestión del ciclo de vida de estos modelos de IA, ya sea para texto o visión, requiere operaciones eficientes. Ultralytics simplifica estos procesos de MLOps, ofreciendo un entorno unificado para gestionar conjuntos de datos, entrenar modelos e implementar soluciones. Esto garantiza que los proyectos de IA sigan siendo escalables y estén listos para la producción, lo que favorece la mejora continua de modelos como YOLO26 para obtener un rendimiento de vanguardia.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora