Glossario

Elaborazione del linguaggio naturale (NLP)

Scoprite i concetti, le tecniche e le applicazioni di elaborazione del linguaggio naturale (NLP) come i chatbot, l'analisi del sentimento e la traduzione automatica.

L'elaborazione del linguaggio naturale (NLP) è un campo dinamico all'interno dell'intelligenza artificiale (AI) e dell'apprendimento automatico (ML) dedicato a consentire ai computer di comprendere, elaborare, interpretare e generare il linguaggio umano, sia il testo che il parlato. Combina i principi della linguistica computazionale con modelli statistici, di ML e di Deep Learning (DL) per colmare il divario tra la comunicazione umana e la comprensione del computer. L'obiettivo finale è consentire alle macchine di interagire con il linguaggio in modo significativo e utile, automatizzando compiti che tradizionalmente richiedono capacità linguistiche umane.

Concetti chiave della PNL

L'NLP comprende diversi compiti fondamentali che scompongono la complessità del linguaggio in componenti che le macchine possono analizzare e su cui agire:

  • Tokenizzazione: La fase iniziale di scomposizione del testo in unità più piccole, come parole o sottoparole (token).
  • Riconoscimento di entità denominate (NER): Identificazione e categorizzazione di entità chiave in un testo, come nomi di persone, organizzazioni, luoghi, date e valori monetari.
  • Sentiment Analysis: Determinazione del tono emotivo o dell'opinione soggettiva espressa in un testo (ad esempio, positivo, negativo, neutro).
  • Traduzione automatica: Traduzione automatica di un testo o di un discorso da una lingua all'altra, come avviene in strumenti come Google Translate.
  • Modellazione linguistica: Costruire modelli che prevedano la probabilità di una sequenza di parole, fondamentale per compiti come la generazione di testi e il riconoscimento vocale.

Come funziona la PNL

I sistemi NLP impiegano in genere un approccio di tipo pipeline. I dati di testo grezzi vengono prima sottoposti a una preelaborazione, che comprende attività come la pulizia del testo (rimozione di caratteri o formattazioni irrilevanti), la tokenizzazione e talvolta la normalizzazione (conversione delle parole in una forma base). Dopo la pre-elaborazione, vengono estratte le caratteristiche rilevanti per il compito. Queste caratteristiche vengono poi inserite nei modelli ML o DL per l'analisi o la generazione.

La PNL moderna si basa molto sulle reti neurali (NN), in particolare su architetture sofisticate come le reti neurali ricorrenti (RNN) per i dati sequenziali e, più recentemente, sui trasformatori. I trasformatori, caratterizzati da potenti meccanismi di attenzione, si sono dimostrati eccezionalmente efficaci nel catturare le dipendenze a lungo raggio e il contesto all'interno del linguaggio. Questa architettura è alla base di molti modelli all'avanguardia, tra cui le varianti di BERT e i modelli GPT, come GPT-4. Piattaforme di ricerca come l'Antologia ACL ospitano numerosi articoli che illustrano questi progressi.

Applicazioni della PNL

La PNL è alla base di una vasta gamma di applicazioni che stanno trasformando i settori e migliorando le interazioni quotidiane. Ecco due esempi importanti:

  1. Assistenti virtuali e chatbot: Sistemi come Siri di Apple e Alexa di Amazon, oltre a innumerevoli chatbot del servizio clienti, utilizzano ampiamente la PNL. Utilizzano il riconoscimento vocale per convertire le parole pronunciate in testo, la comprensione del linguaggio naturale (NLU) per cogliere l'intento dell'utente e talvolta la generazione di testo per formulare le risposte.
  2. Filtraggio dello spam via e-mail: Le tecniche NLP analizzano il contenuto delle e-mail per identificare gli schemi caratteristici dello spam o dei tentativi di phishing. Gli algoritmi classificano le e-mail in base a parole chiave, reputazione del mittente e struttura linguistica, contribuendo a mantenere le caselle di posta pulite e sicure.

Altre applicazioni comuni sono la sintesi del testo per condensare documenti lunghi, i motori di ricerca semantici che comprendono il significato della query al di là della semplice corrispondenza con le parole chiave e gli strumenti di correzione grammaticale/stilistica come Grammarly. Molti casi d'uso innovativi dell'intelligenza artificiale si basano fortemente sull'NLP.

PNL e concetti correlati

Pur essendo correlata, la PNL si differenzia da alcuni termini simili:

  • Comprensione del linguaggio naturale (NLU): NLU è un sottoinsieme di NLP che si concentra specificamente sull'aspetto della comprensione, ovvero sull'estrazione del significato, dell'intento e del contesto dal linguaggio. L'NLP è più ampio e comprende anche compiti come la generazione di testi e la sintesi vocale.
  • Generazione di testo: Si tratta di una capacità o di un compito specifico della PNL che si concentra sulla produzione di testo simile a quello umano. Pur essendo una parte fondamentale di molte applicazioni NLP (come i chatbot o la traduzione), non copre gli aspetti di comprensione o di analisi dell'NLP.
  • Visione artificiale (CV): La CV si occupa di interpretare e comprendere le informazioni provenienti da input visivi come immagini e video, concentrandosi su compiti come il rilevamento di oggetti o la segmentazione di immagini. La PNL, al contrario, si concentra sui dati linguistici. Tuttavia, i due campi si stanno sempre più intersecando in modelli multimodali che elaborano sia il testo che le immagini, consentendo applicazioni come la sottotitolazione automatica delle immagini. Per saperne di più sul collegamento tra NLP e CV. Ultralytics è specializzata in CV e offre modelli come Ultralytics YOLO11 per compiti che richiedono alta precisione e velocità.

Strumenti e piattaforme

Lo sviluppo e l'implementazione di applicazioni NLP spesso comporta l'utilizzo di librerie e piattaforme specializzate:

  • Librerie: Librerie open-source come spaCy e NLTK forniscono strumenti per attività NLP comuni come la tokenizzazione, il parsing e il riconoscimento di entità.
  • Piattaforme: Hugging Face offre un vasto repository di modelli pre-addestrati (soprattutto Transformers), dataset e strumenti che accelerano notevolmente lo sviluppo. Per la gestione del ciclo di vita end-to-end dei modelli di ML, compresi quelli utilizzati in pipeline NLP o CV-NLP combinate, piattaforme come Ultralytics HUB offrono solide funzionalità MLOps, semplificando l'addestramento, la distribuzione e il monitoraggio. Esplorate la documentazione di Ultralytics per ulteriori risorse sullo sviluppo e la distribuzione dei modelli.

Unitevi alla comunità di Ultralytics

Entrate a far parte del futuro dell'IA. Connettetevi, collaborate e crescete con gli innovatori globali.

Iscriviti ora
Link copiato negli appunti