敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

隐马尔可夫模型 (HMM)

探索隐马尔可夫模型 (HMM)、其原理、在语音识别、生物信息学和人工智能中的应用,以及它们如何推断隐藏状态。

隐马尔可夫模型 (HMM) 是一种统计 AI模型,用于分析序列数据,其中底层系统被假定为具有未观察到的(隐藏)状态的马尔可夫过程。核心思想是根据一系列可观察的输出来推断一系列隐藏状态。HMM 建立在马尔可夫性质之上,该性质指出未来状态的概率仅取决于当前状态,而不取决于状态的整个历史。这使得 HMM 成为自然语言处理 (NLP)和生物信息学等领域任务的强大工具。

隐马尔可夫模型的工作原理

HMM 由几个关键组件组成,这些组件协同工作以对顺序数据进行建模:

  • 隐状态: 这是系统不可观察的状态,模型会尝试推断这些状态。例如,在天气预报中,隐状态可能是“晴天”、“多云”或“下雨”。
  • 可观测输出(排放): 这些是每个隐藏状态可以产生的可见数据点。按照天气示例,观测结果可能是“高温”、“低温”或“高湿度”。
  • 转移概率: 这些概率决定了从一个隐藏状态转移到另一个隐藏状态的可能性。例如,“晴天”之后有一定的概率是“阴天”。
  • 发射概率: 这些概率表示在系统处于特定隐藏状态时观察到特定输出的可能性。例如,如果隐藏状态为“下雨”,则观察到“高湿度”的概率可能更高。

为了进行预测,HMM 使用既定算法。 Viterbi 算法通常用于查找给定一系列观察结果时最可能的隐藏状态序列。 为了训练模型并从训练数据中学习其概率分布,通常采用Baum-Welch 算法

实际应用

几十年来,隐马尔可夫模型 (HMM) 已成功应用于各个领域。以下是几个突出的例子:

  1. 语音识别: 在经典的语音识别系统中,HMM 发挥了重要作用。隐藏状态对应于音素(一种语言中声音的基本单位),可观察的输出是从录制的语音中提取的声学特征。HMM 的任务是从音频信号中确定最可能的音素序列,然后用于识别口语单词。
  2. 生物信息学: HMM 是计算生物学的基石,特别是对于基因查找。 在这种情况下,隐藏状态可能代表基因的各个部分,例如“外显子”(编码区)或“内含子”(非编码区),而观测值是 DNA 碱基的序列(A、C、G、T)。 通过分析长的 DNA 序列,HMM 可以识别基因最可能的位置。美国国家生物技术信息中心 (NCBI)详细介绍了这些方法。

与相关概念的比较

区分HMM与其他序列模型非常重要:

虽然较新的深度学习方法通常可以实现最先进的结果,但 HMM 仍然因其可解释性(显式状态和概率)和有效性而有价值,尤其是在训练数据有限或领域知识可以纳入模型结构时。即使在使用主要促进 DL 模型(如 YOLOv8YOLO11)的开发和部署Ultralytics HUB 等平台时,理解 HMM 等基本概念也可以在更广泛的 ML 领域中提供有价值的背景信息。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板