Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Reconhecimento de Entidades Nomeadas (NER)

Explore o reconhecimento de entidades nomeadas (NER) em NLP. Aprenda a identificar e classify entidades classify , como nomes e datas, para obter insights com IA e Ultralytics .

O reconhecimento de entidades nomeadas (NER) é uma subtarefa central do processamento de linguagem natural (NLP) que envolve a identificação e classificação de informações importantes em textos não estruturados. Num fluxo de trabalho típico, um modelo NER analisa um documento para localizar «entidades» — palavras ou frases específicas que representam objetos do mundo real — e atribui-as a categorias predefinidas, como nomes de pessoas, organizações, locais, datas ou códigos médicos. Este processo é essencial para transformar dados brutos e não estruturados, como e-mails, avaliações de clientes e artigos de notícias, em formatos estruturados que as máquinas podem processar e analisar. Ao responder às perguntas "quem, o quê e onde" de um texto, o NER permite que os sistemas de Inteligência Artificial (IA) extraiam automaticamente insights significativos de grandes quantidades de informação.

Como funciona o NER

Os sistemas NER modernos utilizam modelos estatísticos avançados e técnicas de Deep Learning (DL) para compreender o contexto em torno de uma palavra. O processo começa com a tokenização, em que uma frase é dividida em unidades individuais chamadas tokens. Arquiteturas sofisticadas, como o Transformer, analisam então as relações entre esses tokens para determinar o seu significado com base no uso.

Por exemplo, a palavra «Apple» pode referir-se a uma fruta ou a uma empresa de tecnologia, dependendo da frase. Através de mecanismos como a autoatenção, um modelo NER discerne que «A Apple lançou um novo telemóvel» se refere a uma organização, enquanto «Eu comi uma maçã» se refere a um objeto genérico. O desempenho desses modelos depende muito de dados de treino de alta qualidade e de anotações de dados precisas . Em aplicações multimodais, o NER é frequentemente combinado com o Reconhecimento Ótico de Caracteres (OCR) para extrair texto de imagens antes de processá-lo.

Aplicações no Mundo Real

A NER é uma tecnologia fundamental para muitas ferramentas de automação inteligente utilizadas em vários setores.

  • IA na área da saúde: instituições médicas usam NER para extrair dados críticos de registos de saúde eletrónicos. Ao extrair entidades como sintomas, nomes de medicamentos e dosagens de notas clínicas, os investigadores podem acelerar a descoberta de medicamentos e melhorar o atendimento ao paciente.
  • Suporte ao cliente inteligente: as empresas empregam chatbots equipados com NER para classify automaticamente as reclamações dos clientes. Se um utilizador enviar a mensagem «O ecrã do meu portátil está partido», o sistema identifica «portátil» como um produto e «ecrã está partido» como um defeito, encaminhando o ticket para a equipa de suporte técnico imediatamente.
  • Recomendação de conteúdo: Serviços de streaming e agregadores de notícias utilizam NER para marcar conteúdo com entidades relevantes (por exemplo, atores, géneros, locais). Os sistemas de recomendação utilizam então essas marcas para sugerir novos filmes ou artigos que correspondam aos interesses do utilizador.
  • Análise financeira: As empresas de investimento utilizam o NER para analisar milhares de relatórios financeiros e artigos de notícias diariamente. Ao extrair nomes de empresas e valores monetários, elas podem realizar modelagem preditiva para prever tendências de mercado .

Distinguindo NER de conceitos relacionados

É útil diferenciar a NER de outras tarefas de interpretação para compreender o seu papel específico num pipeline de IA.

  • Detecção de objetos: enquanto o NER identifica entidades no texto, a detecção de objetos identifica entidades nas imagens. Por exemplo, um modelo visual como o YOLO26 detecta carros e pedestres em transmissões de vídeo, enquanto o NER detecta "Ford" e "motorista" em relatórios escritos. Ambas as tarefas têm como objetivo localizar e classify de interesse dentro de suas respectivas modalidades de dados.
  • Análise de sentimentos: esta tarefa determina o tom emocional (positivo, negativo ou neutro) de um texto. O NER extrai o que está a ser discutido (por exemplo, «O iPhone 16»), enquanto a análise de sentimentos determina como o utilizador se sente em relação a isso (por exemplo, «é incrível»).
  • Compreensão de linguagem natural (NLU): NLU é um termo abrangente para designar a compreensão de leitura por máquinas. NER é um componente específico da NLU que frequentemente funciona em conjunto com a classificação de intenções para compreender totalmente o significado da entrada do utilizador.
  • Extração de palavras-chave: Ao contrário do NER, que classifica palavras em categorias semânticas (por exemplo, Pessoa, Data), a extração de palavras-chave simplesmente identifica os termos mais frequentes ou relevantes num documento sem compreender o seu tipo de entidade.

Combinando NER com visão computacional

A convergência entre texto e visão é uma tendência crescente na aprendizagem multimodal. Modelos como o YOLO preenchem essa lacuna usando prompts de texto para orientar a deteção de objetos. Nesse fluxo de trabalho, o codificador de texto atua de forma semelhante a um sistema NER, interpretando o significado semântico dos nomes de classes (entidades) fornecidos pelo utilizador para encontrar os objetos visuais correspondentes.

O seguinte exemplo Python demonstra como usar o ultralytics biblioteca para detect com base em descrições de texto personalizadas, ligando eficazmente entidades de linguagem natural a dados visuais.

from ultralytics import YOLOWorld

# Load a YOLO-World model capable of understanding text-based entities
model = YOLOWorld("yolov8s-world.pt")

# Define custom entities to search for in the image
# The model interprets these text strings to identify visual matches
model.set_classes(["red backpack", "person wearing hat", "dog"])

# Run inference on an image to localize these entities
results = model.predict("park_scene.jpg")

# Display the results with bounding boxes around detected entities
results[0].show()

Ferramentas e Implementação

Os programadores têm acesso a um ecossistema robusto de ferramentas para implementar NER. Bibliotecas populares de código aberto, como spaCy e NLTK, fornecem pipelines pré-treinados para uso imediato. Para aplicações em escala empresarial, serviços em nuvem, como o Google Natural Language, oferecem APIs gerenciadas que se adaptam à demanda.

Gerenciar o ciclo de vida desses modelos de IA — seja para texto ou visão — requer operações eficientes. Ultralytics simplifica esses processos de MLOps, oferecendo um ambiente unificado para gerenciar conjuntos de dados, treinar modelos e implementar soluções. Isso garante que os projetos de IA permaneçam escaláveis e prontos para produção, apoiando a melhoria contínua de modelos como o YOLO26 para um desempenho de ponta.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora