Glossario

Riconoscimento di entità denominate (NER)

Sblocca le intuizioni con il Named Entity Recognition (NER). Scopri come l'intelligenza artificiale trasforma il testo non strutturato in dati utili per diverse applicazioni.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

Il riconoscimento delle entità nominate (NER) è un compito fondamentale dell'elaborazione del linguaggio naturale (NLP) e una componente chiave della moderna intelligenza artificiale (AI). Si tratta di identificare e classificare automaticamente specifiche informazioni - note come "entità denominate" - all'interno di un testo non strutturato. Queste entità rappresentano tipicamente oggetti del mondo reale come persone, organizzazioni, luoghi, date, nomi di prodotti, valori monetari e altro ancora. L'obiettivo principale della NER è quello di trasformare il testo grezzo in dati strutturati, rendendo più facile per le macchine la comprensione, l'elaborazione e l'estrazione di informazioni preziose per vari casi di utilizzo dell'intelligenza artificiale.

Come funziona il riconoscimento delle entità denominate

I sistemi NER analizzano la struttura linguistica e il contesto del testo per individuare e classificare le entità. Mentre i primi sistemi si basavano molto su regole grammaticali e dizionari (una forma di AI simbolica), gli approcci moderni sfruttano il Machine Learning (ML), in particolare il Deep Learning (DL). Modelli come Transformers, spesso presenti su piattaforme come Hugging Facesono in grado di comprendere il contesto e i modelli linguistici più sottili, garantendo un'accuratezza maggiore. Il processo generalmente prevede l'identificazione di potenziali entità (parole o frasi) utilizzando tecniche spesso legate alla tokenizzazione e classificandole poi in categorie predefinite (ad esempio, PERSONA, ORGANIZZAZIONE, LOCALITÀ, DATA, MISC). Questa classificazione si basa su caratteristiche apprese durante l'addestramento su grandi insiemi di dati, spesso annotati appositamente per i compiti NER.

Ad esempio, nella frase "Il 4 luglio Sarah Jones visitò la Torre Eiffel mentre rappresentava la Acme Corp", un sistema NER identificherebbe:

  • "4 luglio" come DATA
  • "Sarah Jones" come PERSONA
  • "Torre Eiffel" come LOCAZIONE
  • "Acme Corp" come ORGANIZZAZIONE

Questo risultato strutturato è molto più utile per le attività a valle, come l'analisi dei dati o il popolamento di un grafico di conoscenza, rispetto al solo testo originale. Puoi consultare un'indagine sulle tecniche NER per approfondire le conoscenze tecniche.

Rilevanza e applicazioni

Il NER è una tecnologia fondamentale che permette di realizzare numerose applicazioni in vari settori strutturando le informazioni testuali:

  • Estrazione di informazioni: Estrazione automatica di dettagli chiave da documenti come articoli di giornale, relazioni o e-mail. Ad esempio, estrarre i nomi delle aziende, i titoli dei dirigenti e le sedi dai feed di notizie finanziarie.
  • Categorizzazione e raccomandazione dei contenuti: Etichettare articoli o post con entità rilevanti per migliorare l'organizzazione e potenziare i sistemi di raccomandazione.
  • Assistenza clienti: Analizzare i feedback dei clienti o i ticket di assistenza per identificare i prodotti, le sedi o i problemi specifici menzionati, consentendo un'elaborazione e una risoluzione più rapida. Immagina un sistema che etichetta automaticamente le e-mail di assistenza che menzionano "iPhone 16" e "negozio di New York".
  • Assistenza sanitaria: Semplificare la gestione delle cartelle cliniche estraendo i nomi dei pazienti, le diagnosi, i farmaci e i dosaggi dalle note cliniche, contribuendo a campi come l'analisi delle immagini mediche se combinate con i report.
  • Ricerca semantica: Migliorare i motori di ricerca per comprendere il significato delle query riconoscendo le entità al loro interno (ad esempio, la ricerca di "ristoranti vicino al Louvre" richiede l'identificazione di "Louvre" come LOCAZIONE). Strumenti come Google Cloud Natural Language AI offrono funzionalità NER.
  • Analisi finanziaria: Estrazione di nomi di aziende, valori monetari e date da rapporti finanziari per analisi di mercato e modelli predittivi.
  • Conformità e sicurezza: Identificazione di informazioni sensibili come nomi o indirizzi nei documenti per garantire la privacy dei dati e la conformità a normative come il GDPR.

La gestione del ciclo di vita del ML per i modelli NER, compresa l'annotazione dei dati e la distribuzione dei modelli, può essere facilitata da piattaforme come Ultralytics HUB.

Differenze chiave rispetto ai concetti correlati

Il NER viene spesso utilizzato insieme ad altre attività di NLP, ma ha un obiettivo distinto:

  • Analisi del sentimento: Determina il tono emotivo (positivo, negativo, neutro) espresso nel testo. Il NER identifica l'argomento di cui si parla, mentre l'analisi del sentimento identifica i sentimenti dell'autore.
  • Riassunto del testo: Ha lo scopo di creare una versione più breve di un testo preservando le informazioni chiave. Il NER estrae le menzioni di entità specifiche, non una panoramica condensata dell'intero testo.
  • Rilevamento di oggetti: Un'attività di Computer Vision (CV) che identifica e localizza gli oggetti all'interno delle immagini utilizzando i riquadri di delimitazione. Il NER opera esclusivamente su dati testuali, non su dati visivi come quelli di un'immagine. Ultralytics YOLO di Ultralytics per le attività di rilevamento.
  • Comprensione del linguaggio naturale (NLU): Un campo più ampio che comprende la comprensione complessiva del significato di un testo, incluso il riconoscimento delle intenzioni, l'estrazione di relazioni e la risoluzione di coreferenze. La NER è una sottoattività specifica dell'NLU che si concentra esclusivamente sull'identificazione e la classificazione delle entità.
  • Estrazione di parole chiave: Identifica termini o frasi importanti in un testo, che possono essere o meno entità nominate. La NER cerca in particolare categorie predefinite come persone, luoghi e organizzazioni.

Comprendere queste distinzioni è fondamentale per selezionare la tecnica NLP più adatta a un determinato problema, come illustrato in guide come Steps of a Computer Vision Project (anche se incentrata sul CV, i principi si applicano).

Leggi tutto