¡Sintonice YOLO Vision 2025!
25 de septiembre de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024
Glosario

Modelo oculto de Márkov (HMM)

Descubra los modelos ocultos de Markov (HMM), sus principios, aplicaciones en el reconocimiento de voz, la bioinformática y la IA, y cómo infieren estados ocultos.

Un Modelo Oculto de Márkov (HMM) es un tipo de modelo de IA estadística utilizado para analizar datos secuenciales donde se asume que el sistema subyacente es un proceso de Márkov con estados no observados (ocultos). La idea central es hacer inferencias sobre una secuencia de estados ocultos basándose en una secuencia de salidas observables. Los HMM se basan en la propiedad de Márkov, que establece que la probabilidad de un estado futuro depende solo del estado actual, no de toda la historia de los estados. Esto convierte a los HMM en una herramienta poderosa para tareas en campos como el Procesamiento del Lenguaje Natural (PNL) y la bioinformática.

Cómo funcionan los modelos ocultos de Márkov

Un HMM consta de varios componentes clave que trabajan juntos para modelar datos secuenciales:

  • Estados Ocultos: Estos son los estados no observables del sistema que el modelo intenta inferir. Por ejemplo, en la previsión meteorológica, los estados ocultos podrían ser "Soleado", "Nublado" o "Lluvioso".
  • Salidas observables (emisiones): Estos son los puntos de datos visibles que cada estado oculto puede producir. Siguiendo el ejemplo del clima, las observaciones podrían ser "Temperatura alta", "Temperatura baja" o "Humedad alta".
  • Probabilidades de transición: Estas probabilidades rigen la probabilidad de pasar de un estado oculto a otro. Por ejemplo, existe una cierta probabilidad de que a un día "Soleado" le siga un día "Nublado".
  • Probabilidades de Emisión: Estas probabilidades representan la verosimilitud de observar una salida particular dado que el sistema está en un estado oculto específico. Por ejemplo, la probabilidad de observar "Humedad Alta" es probablemente mayor si el estado oculto es "Lluvioso".

Para hacer predicciones, los HMM utilizan algoritmos establecidos. El algoritmo de Viterbi se utiliza comúnmente para encontrar la secuencia más probable de estados ocultos dada una secuencia de observaciones. Para entrenar el modelo y aprender sus distribuciones de probabilidad a partir de datos de entrenamiento, a menudo se emplea el algoritmo de Baum-Welch.

Aplicaciones en el mundo real

Los HMM se han aplicado con éxito en varios dominios durante décadas. Aquí hay un par de ejemplos destacados:

  1. Reconocimiento de voz: En los sistemas clásicos de reconocimiento de voz, los HMM fueron fundamentales. Los estados ocultos corresponden a fonemas (las unidades básicas de sonido en un idioma), y las salidas observables son características acústicas extraídas del habla grabada. La tarea del HMM es determinar la secuencia más probable de fonemas a partir de la señal de audio, que luego se utiliza para identificar las palabras habladas.
  2. Bioinformática: Los HMM son una piedra angular de la biología computacional, particularmente para la búsqueda de genes. En este contexto, los estados ocultos podrían representar partes de un gen, como "exón" (región codificante) o "intrón" (región no codificante), mientras que las observaciones son la secuencia de bases de ADN (A, C, G, T). Al analizar una secuencia de ADN larga, un HMM puede identificar las ubicaciones más probables de los genes. El Centro Nacional de Información Biotecnológica (NCBI) detalla estos métodos.

Comparación con conceptos relacionados

Es importante distinguir los HMM de otros modelos de secuencia:

Si bien los métodos de aprendizaje profundo más recientes a menudo logran resultados de última generación, los HMM siguen siendo valiosos por su interpretabilidad (estados y probabilidades explícitos) y eficacia, especialmente cuando los datos de entrenamiento son limitados o el conocimiento del dominio puede incorporarse a la estructura del modelo. La comprensión de conceptos fundamentales como los HMM proporciona un contexto valioso en el panorama más amplio del ML, incluso cuando se utilizan plataformas como Ultralytics HUB, que facilitan principalmente el desarrollo y el despliegue de modelos de DL como YOLOv8 o YOLO11.

Únete a la comunidad de Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora
Enlace copiado al portapapeles