Glosario

Modelo de Markov oculto (HMM)

Descubra los modelos ocultos de Markov (HMM), sus principios, sus aplicaciones en el reconocimiento del habla, la bioinformática y la IA, y cómo infieren estados ocultos.

Un modelo de Markov oculto (HMM) es un tipo de modelo estadístico de IA utilizado para analizar datos secuenciales en el que se supone que el sistema subyacente es un proceso de Markov con estados (ocultos) no observados. La idea central es hacer inferencias sobre una secuencia de estados ocultos basándose en una secuencia de resultados observables. Los HMM se basan en la propiedad de Markov, según la cual la probabilidad de un estado futuro depende sólo del estado actual, no de todo el historial de estados. Esto convierte a los HMM en una potente herramienta para tareas en campos como el Procesamiento del Lenguaje Natural (PLN ) y la bioinformática.

Cómo funcionan los modelos de Markov ocultos

Un HMM consta de varios componentes clave que trabajan juntos para modelar datos secuenciales:

  • Estados ocultos: Son los estados no observables del sistema que el modelo intenta deducir. Por ejemplo, en la previsión meteorológica, los estados ocultos pueden ser "Soleado", "Nublado" o "Lluvioso".
  • Salidas observables (emisiones): Son los puntos de datos visibles que puede producir cada estado oculto. Siguiendo con el ejemplo meteorológico, las observaciones podrían ser "Temperatura alta", "Temperatura baja" o "Humedad alta".
  • Probabilidades de transición: Estas probabilidades rigen la probabilidad de pasar de un estado oculto a otro. Por ejemplo, existe cierta probabilidad de que a un día "Soleado" le siga un día "Nublado".
  • Probabilidades de emisión: Estas probabilidades representan la probabilidad de observar una salida concreta dado que el sistema se encuentra en un estado oculto específico. Por ejemplo, la probabilidad de observar "Humedad alta" es probablemente mayor si el estado oculto es "Lluvioso".

Para hacer predicciones, los HMM utilizan algoritmos establecidos. El algoritmo de Viterbi se utiliza habitualmente para encontrar la secuencia más probable de estados ocultos dada una secuencia de observaciones. Para entrenar el modelo y aprender sus distribuciones de probabilidad a partir de los datos de entrenamiento, se suele emplear el algoritmo de Baum-Welch.

Aplicaciones reales

Los HMM llevan décadas aplicándose con éxito en diversos ámbitos. He aquí un par de ejemplos destacados:

  1. Reconocimiento del habla: En los sistemas clásicos de reconocimiento del habla, los HMM eran instrumentales. Los estados ocultos corresponden a los fonemas (las unidades básicas del sonido en una lengua), y las salidas observables son características acústicas extraídas del habla grabada. La tarea del HMM consiste en determinar la secuencia más probable de fonemas a partir de la señal de audio, que luego se utiliza para identificar las palabras habladas.
  2. Bioinformática: Los HMM son una piedra angular de la biología computacional, sobre todo para la búsqueda de genes. En este contexto, los estados ocultos pueden representar partes de un gen, como "exón" (región codificante) o "intrón" (región no codificante), mientras que las observaciones son la secuencia de bases de ADN (A, C, G, T). Analizando una secuencia larga de ADN, un HMM puede identificar las localizaciones más probables de los genes. El Centro Nacional de Información Biotecnológica (NCBI) detalla estos métodos.

Comparación con conceptos afines

Es importante distinguir los HMM de otros modelos de secuencias:

Aunque los nuevos métodos de aprendizaje profundo a menudo logran resultados de vanguardia, los HMM siguen siendo valiosos por su interpretabilidad (estados y probabilidades explícitos) y eficacia, especialmente cuando los datos de entrenamiento son limitados o el conocimiento del dominio puede incorporarse a la estructura del modelo. La comprensión de conceptos fundamentales como los HMM proporciona un contexto valioso en el panorama más amplio del ML, incluso cuando se utilizan plataformas como Ultralytics HUB, que facilitan principalmente el desarrollo y la implementación de modelos de DL como YOLOv8 o YOLO11.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles