Glossario

Modello di Markov nascosto (HMM)

Scoprite i modelli HMM (Hidden Markov Models), i loro principi, le applicazioni nel riconoscimento vocale, nella bioinformatica e nell'IA e come deducono gli stati nascosti.

Un modello di Markov nascosto (HMM) è un tipo di modello statistico di intelligenza artificiale utilizzato per analizzare dati sequenziali in cui si assume che il sistema sottostante sia un processo di Markov con stati non osservati (nascosti). L'idea di base è quella di fare inferenze su una sequenza di stati nascosti in base a una sequenza di output osservabili. Gli HMM si basano sulla proprietà di Markov, secondo la quale la probabilità di uno stato futuro dipende solo dallo stato corrente, non dall'intera storia degli stati. Ciò rende gli HMM uno strumento potente per attività come l'elaborazione del linguaggio naturale (NLP) e la bioinformatica.

Come funzionano i modelli di Markov nascosti

Un HMM è costituito da diversi componenti chiave che lavorano insieme per modellare dati sequenziali:

  • Stati nascosti: Sono gli stati non osservabili del sistema che il modello cerca di dedurre. Ad esempio, nelle previsioni del tempo, gli stati nascosti potrebbero essere "Soleggiato", "Nuvoloso" o "Piovoso".
  • Uscite osservabili (emissioni): Sono i dati visibili che ogni stato nascosto può produrre. Seguendo l'esempio del meteo, le osservazioni potrebbero essere "Alta temperatura", "Bassa temperatura" o "Alta umidità".
  • Probabilità di transizione: Queste probabilità regolano la probabilità di passare da uno stato nascosto a un altro. Ad esempio, esiste una certa probabilità che una giornata "soleggiata" sia seguita da una giornata "nuvolosa".
  • Probabilità di emissione: Queste probabilità rappresentano la probabilità di osservare una particolare uscita se il sistema si trova in uno specifico stato nascosto. Ad esempio, la probabilità di osservare "Umidità elevata" è probabilmente più alta se lo stato nascosto è "Pioggia".

Per fare previsioni, gli HMM utilizzano algoritmi consolidati. L'algoritmo di Viterbi è comunemente utilizzato per trovare la sequenza più probabile di stati nascosti data una sequenza di osservazioni. Per addestrare il modello e imparare le sue distribuzioni di probabilità dai dati di addestramento, viene spesso utilizzato l'algoritmo di Baum-Welch.

Applicazioni del mondo reale

Gli HMM sono stati applicati con successo in vari domini per decenni. Ecco un paio di esempi importanti:

  1. Riconoscimento del parlato: Nei sistemi classici di riconoscimento vocale, gli HMM erano strumentali. Gli stati nascosti corrispondono ai fonemi (le unità di base del suono in una lingua) e le uscite osservabili sono caratteristiche acustiche estratte dal parlato registrato. Il compito dell'HMM è quello di determinare la sequenza più probabile di fonemi dal segnale audio, che viene poi utilizzata per identificare le parole pronunciate.
  2. Bioinformatica: Gli HMM sono una pietra miliare della biologia computazionale, in particolare per la ricerca di geni. In questo contesto, gli stati nascosti possono rappresentare parti di un gene, come "esone" (regione codificante) o "introne" (regione non codificante), mentre le osservazioni sono la sequenza di basi del DNA (A, C, G, T). Analizzando una lunga sequenza di DNA, un HMM può identificare le posizioni più probabili dei geni. Il National Center for Biotechnology Information (NCBI) fornisce dettagli su questi metodi.

Confronto con concetti affini

È importante distinguere gli HMM da altri modelli di sequenza:

Sebbene i nuovi metodi di deep learning raggiungano spesso risultati all'avanguardia, gli HMM rimangono preziosi per la loro interpretabilità (stati e probabilità esplicite) ed efficacia, soprattutto quando i dati di addestramento sono limitati o la conoscenza del dominio può essere incorporata nella struttura del modello. La comprensione di concetti fondamentali come gli HMM fornisce un contesto prezioso nel più ampio panorama del ML, anche quando si utilizzano piattaforme come Ultralytics HUB che facilitano principalmente lo sviluppo e la distribuzione di modelli DL come YOLOv8 o YOLO11.

Unitevi alla comunità di Ultralytics

Entrate a far parte del futuro dell'IA. Connettetevi, collaborate e crescete con gli innovatori globali.

Iscriviti ora
Link copiato negli appunti