Explore o reconhecimento de entidades nomeadas (NER) em NLP. Aprenda a identificar e classify entidades classify , como nomes e datas, para obter insights com IA e Ultralytics .
O reconhecimento de entidades nomeadas (NER) é uma subtarefa central do processamento de linguagem natural (NLP) que envolve a identificação e classificação de informações importantes em textos não estruturados. Num fluxo de trabalho típico, um modelo NER analisa um documento para localizar «entidades» — palavras ou frases específicas que representam objetos do mundo real — e atribui-as a categorias predefinidas, como nomes de pessoas, organizações, locais, datas ou códigos médicos. Este processo é essencial para transformar dados brutos e não estruturados, como e-mails, avaliações de clientes e artigos de notícias, em formatos estruturados que as máquinas podem processar e analisar. Ao responder às perguntas "quem, o quê e onde" de um texto, o NER permite que os sistemas de Inteligência Artificial (IA) extraiam automaticamente insights significativos de grandes quantidades de informação.
Os sistemas NER modernos utilizam modelos estatísticos avançados e técnicas de Deep Learning (DL) para compreender o contexto em torno de uma palavra. O processo começa com a tokenização, em que uma frase é dividida em unidades individuais chamadas tokens. Arquiteturas sofisticadas, como o Transformer, analisam então as relações entre esses tokens para determinar o seu significado com base no uso.
Por exemplo, a palavra «Apple» pode referir-se a uma fruta ou a uma empresa de tecnologia, dependendo da frase. Através de mecanismos como a autoatenção, um modelo NER discerne que «A Apple lançou um novo telemóvel» se refere a uma organização, enquanto «Eu comi uma maçã» se refere a um objeto genérico. O desempenho desses modelos depende muito de dados de treino de alta qualidade e de anotações de dados precisas . Em aplicações multimodais, o NER é frequentemente combinado com o Reconhecimento Ótico de Caracteres (OCR) para extrair texto de imagens antes de processá-lo.
A NER é uma tecnologia fundamental para muitas ferramentas de automação inteligente utilizadas em vários setores.
É útil diferenciar a NER de outras tarefas de interpretação para compreender o seu papel específico num pipeline de IA.
A convergência entre texto e visão é uma tendência crescente na aprendizagem multimodal. Modelos como o YOLO preenchem essa lacuna usando prompts de texto para orientar a deteção de objetos. Nesse fluxo de trabalho, o codificador de texto atua de forma semelhante a um sistema NER, interpretando o significado semântico dos nomes de classes (entidades) fornecidos pelo utilizador para encontrar os objetos visuais correspondentes.
O seguinte exemplo Python demonstra como usar o ultralytics biblioteca para detect com base em
descrições de texto personalizadas, ligando eficazmente entidades de linguagem natural a dados visuais.
from ultralytics import YOLOWorld
# Load a YOLO-World model capable of understanding text-based entities
model = YOLOWorld("yolov8s-world.pt")
# Define custom entities to search for in the image
# The model interprets these text strings to identify visual matches
model.set_classes(["red backpack", "person wearing hat", "dog"])
# Run inference on an image to localize these entities
results = model.predict("park_scene.jpg")
# Display the results with bounding boxes around detected entities
results[0].show()
Os programadores têm acesso a um ecossistema robusto de ferramentas para implementar NER. Bibliotecas populares de código aberto, como spaCy e NLTK, fornecem pipelines pré-treinados para uso imediato. Para aplicações em escala empresarial, serviços em nuvem, como o Google Natural Language, oferecem APIs gerenciadas que se adaptam à demanda.
Gerenciar o ciclo de vida desses modelos de IA — seja para texto ou visão — requer operações eficientes. Ultralytics simplifica esses processos de MLOps, oferecendo um ambiente unificado para gerenciar conjuntos de dados, treinar modelos e implementar soluções. Isso garante que os projetos de IA permaneçam escaláveis e prontos para produção, apoiando a melhoria contínua de modelos como o YOLO26 para um desempenho de ponta.