Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Named Entity Recognition (NER)

Esplora il riconoscimento delle entità denominate (NER) nell'NLP. Scopri come identificare e classify entità classify quali nomi e date per ottenere informazioni approfondite con l'AI e Ultralytics .

Il riconoscimento delle entità denominate (NER) è un'attività fondamentale dell' elaborazione del linguaggio naturale (NLP) che comporta l'identificazione e la classificazione delle informazioni chiave all'interno di un testo non strutturato. In un flusso di lavoro tipico, un modello NER scansiona un documento per individuare le "entità" (parole o frasi specifiche che rappresentano oggetti del mondo reale) e le assegna a categorie predefinite come nomi di persone, organizzazioni, luoghi, date o codici medici. Questo processo è essenziale per trasformare dati grezzi e non strutturati come e-mail, recensioni dei clienti e articoli di giornale in formati strutturati che le macchine possono elaborare e analizzare. Rispondendo alle domande "chi, cosa e dove" di un testo, il NER consente ai sistemi di intelligenza artificiale (AI) di estrarre automaticamente informazioni significative da grandi quantità di dati.

Come funziona NER

I moderni sistemi NER sfruttano modelli statistici avanzati e tecniche di Deep Learning (DL) per comprendere il contesto che circonda una parola. Il processo inizia con la tokenizzazione, in cui una frase viene suddivisa in singole unità chiamate token. Architetture sofisticate, come il Transformer, analizzano quindi le relazioni tra questi token per determinarne il significato in base al loro utilizzo.

Ad esempio, la parola "Apple" potrebbe riferirsi a un frutto o a un'azienda tecnologica a seconda della frase. Attraverso meccanismi come l'auto-attenzione, un modello NER discernere che "Apple ha rilasciato un nuovo telefono" si riferisce a un'organizzazione, mentre "Ho mangiato una mela" si riferisce a un oggetto generico. Le prestazioni di questi modelli dipendono in larga misura da dati di addestramento di alta qualità e da un'annotazione precisa dei dati . Nelle applicazioni multimodali, il NER è spesso abbinato al riconoscimento ottico dei caratteri (OCR) per estrarre il testo dalle immagini prima di elaborarlo.

Applicazioni nel mondo reale

NER è una tecnologia fondamentale per molti strumenti di automazione intelligente utilizzati in vari settori industriali.

  • AI nella sanità: le istituzioni mediche utilizzano il NER per estrarre dati critici dalle cartelle cliniche elettroniche. Estraendo entità quali sintomi, nomi di farmaci e dosaggi dalle note cliniche, i ricercatori possono accelerare la scoperta di farmaci e migliorare l'assistenza ai pazienti.
  • Assistenza clienti intelligente: le aziende utilizzano chatbot dotati di NER per classify automaticamente i reclami dei clienti. Se un utente invia un messaggio del tipo "Lo schermo del mio laptop è rotto", il sistema identifica "laptop" come un prodotto e "lo schermo è rotto" come un difetto, inoltrando immediatamente il ticket al team di assistenza tecnica .
  • Raccomandazione dei contenuti: i servizi di streaming e gli aggregatori di notizie utilizzano il NER per taggare i contenuti con entità rilevanti (ad esempio attori, generi, luoghi). I sistemi di raccomandazione utilizzano poi questi tag per suggerire nuovi film o articoli che corrispondono agli interessi dell'utente.
  • Analisi finanziaria: le società di investimento utilizzano il NER per analizzare quotidianamente migliaia di relazioni finanziarie e articoli di cronaca. Estraendo i nomi delle società e i valori monetari, possono eseguire modelli predittivi per prevedere le tendenze di mercato .

Distinguere il NER dai concetti correlati

È utile differenziare il NER dagli altri compiti di interpretazione per comprenderne il ruolo specifico in una pipeline di IA.

  • Rilevamento di oggetti: mentre il NER identifica le entità nel testo, il rilevamento di oggetti identifica le entità nelle immagini. Ad esempio, un modello visivo come YOLO26 rileva automobili e pedoni nei feed video, mentre il NER rileva "Ford" e "autista" nei rapporti scritti. Entrambe le attività mirano a localizzare e classify di interesse all'interno delle rispettive modalità di dati.
  • Analisi del sentiment: questo compito determina il tono emotivo (positivo, negativo o neutro) di un testo. Il NER estrae ciò di cui si sta parlando (ad esempio, "L'iPhone 16"), mentre l'analisi del sentiment determina come l'utente si sente al riguardo (ad esempio, "è fantastico").
  • Comprensione del linguaggio naturale (NLU): NLU è un termine generico più ampio che indica la comprensione della lettura automatica. NER è una componente specifica di NLU che spesso opera insieme alla classificazione dell'intento per cogliere appieno il significato dell'input di un utente.
  • Estrazione di parole chiave: a differenza del NER, che classifica le parole in categorie semantiche (ad esempio, Persona, Data), l'estrazione di parole chiave identifica semplicemente i termini più frequenti o rilevanti in un documento senza comprenderne il tipo di entità.

Combinazione di NER e visione artificiale

La convergenza tra testo e visione è una tendenza in crescita nell' apprendimento multimodale. Modelli come YOLO colmano questa lacuna utilizzando prompt di testo per guidare il rilevamento degli oggetti. In questo flusso di lavoro, il codificatore di testo agisce in modo simile a un sistema NER, interpretando il significato semantico dei nomi delle classi (entità) forniti dall'utente per trovare gli oggetti visivi corrispondenti.

Il seguente esempio Python mostra come utilizzare l'opzione ultralytics libreria per detect in base a descrizioni testuali personalizzate, collegando efficacemente entità del linguaggio naturale a dati visivi.

from ultralytics import YOLOWorld

# Load a YOLO-World model capable of understanding text-based entities
model = YOLOWorld("yolov8s-world.pt")

# Define custom entities to search for in the image
# The model interprets these text strings to identify visual matches
model.set_classes(["red backpack", "person wearing hat", "dog"])

# Run inference on an image to localize these entities
results = model.predict("park_scene.jpg")

# Display the results with bounding boxes around detected entities
results[0].show()

Strumenti e implementazione

Gli sviluppatori hanno accesso a un solido ecosistema di strumenti per l'implementazione del NER. Librerie open source popolari come spaCy e NLTK forniscono pipeline pre-addestrate per un utilizzo immediato. Per le applicazioni su scala aziendale, servizi cloud come Google Natural Language offrono API gestite che si adattano alla domanda.

La gestione del ciclo di vita di questi modelli di IA, sia per il testo che per la visione, richiede operazioni efficienti. Ultralytics semplifica questi processi MLOps, offrendo un ambiente unificato per gestire set di dati, addestrare modelli e implementare soluzioni. Ciò garantisce che i progetti di IA rimangano scalabili e pronti per la produzione, supportando il miglioramento continuo di modelli come YOLO26 per prestazioni all'avanguardia.

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora