遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Hidden Markov Model (HMM)

探索用于统计 AI 的隐马尔可夫模型 (HMM)。了解 HMM 如何与 Ultralytics YOLO26 协作进行动作识别、序列分析和时序逻辑分析。

隐马尔可夫模型 (HMM) 是一种统计框架,用于对内部过程不可直接观察——因此称为“隐”——但可以通过一系列可观察事件来推断的系统进行建模。尽管现代深度学习已发展到能够处理复杂的序列,但 HMM 在 统计 AI 和概率论中仍然是一个基础概念。它在分析 时间序列分析 数据方面特别有效,因为在这些数据中,事件的顺序提供了关键的上下文,它依赖于这样一个核心原则:未来状态的概率仅取决于当前状态,而不取决于之前的历史。

Link to this sectionHMM 的核心机制#

要理解 HMM 的运作方式,必须区分该模型的两个不同层:不可见的隐状态和可见的输出。该模型假设系统根据特定概率在隐状态之间转换,并在每一步发出一个观测结果。

HMM 由一组控制这些转换和发射的参数定义:

  • 隐状态 这些代表了系统在特定时间的潜在现实。在语音模型中,隐状态可能代表特定的音素或单词。
  • 可观察事件 这些是由传感器或输入实际收集的数据点。在语音示例中,观测值将是音频波形或频谱图数据。
  • 转换概率 此矩阵描述了从一个隐状态移动到另一个隐状态的可能性。例如,天气从“多雨”变为“晴天”的概率。
  • 发射概率 这些定义了在给定当前隐状态的情况下观察到特定观测值的可能性。
  • 初始概率 确定系统最有可能从哪个状态开始的分布。

训练 HMM 通常涉及使用 Baum-Welch 算法训练数据 中估计这些参数。一旦训练完成,通常使用 Viterbi 算法 从一组新的观测值中解码出最可能的隐状态序列。

Link to this sectionHMM 与其他序列模型对比#

虽然 HMM 与其他序列处理工具有相似之处,但它们在架构和应用上存在显著差异:

  • HMM 与 循环神经网络 (RNN) 对比: RNN 和 长短期记忆 (LSTM) 网络是能够捕捉长期依赖关系和非线性模式的深度学习模型,而 HMM 是更简单、受马尔可夫假设限制(短期记忆)的概率模型。然而,HMM 所需的数据量显著更少,且可解释性要强得多。
  • HMM 与 卡尔曼滤波 (KF) 对比: 两者都用于状态估计。但是,卡尔曼滤波专为连续状态设计(例如跟踪移动汽车的精确位置),而 HMM 用于离散状态(例如确定汽车是处于“停放”、“行驶”还是“停止”状态)。

Link to this section实际应用#

尽管 深度学习 (DL) 兴起,但隐马尔可夫模型在需要对序列进行概率推理的场景中仍然被广泛使用。

Link to this section语音和手写识别#

从历史上看,HMM 是 语音识别 系统的支柱。在这种情况下,口述单词是“隐”状态,而麦克风录制的音频信号是观测值。HMM 有助于确定产生音频信号的最可能单词序列。同样,它们通过对字符笔画之间的转换进行建模,辅助识别连体手写体。

Link to this section生物序列分析#

生物信息学 领域,HMM 对于基因预测和蛋白质比对至关重要。它们分析 DNA 或氨基酸序列以识别功能区域,例如基因组内的基因。“隐”状态可能代表编码或非编码区域,而特定的核苷酸 (A, C, G, T) 则充当观测值。

Link to this section计算机视觉中的动作识别#

在现代计算机视觉中,HMM 可以与 YOLO26 等模型结合使用来进行 动作识别。虽然 YOLO 检测单个帧中的对象或姿态,但 HMM 可以随时间分析这些姿态的序列来分类动作,例如“行走”、“奔跑”或“跌倒”。

Link to this section整合视觉与状态分析#

对于使用 Ultralytics 平台 管理数据集和模型的开发者来说,理解序列逻辑至关重要。视觉模型提供原始观测结果(检测结果),然后可以将其馈送到 HMM 这样的状态空间模型中以推断时间上下文。

以下示例展示了如何使用 YOLO26 姿态估计生成观测序列。这些关键点可以作为下游 HMM 或类似逻辑的“可观察事件”输入,以随时间对行为进行分类。

from ultralytics import YOLO

# Load the YOLO26n-pose model for efficient keypoint detection
model = YOLO("yolo26n-pose.pt")

# Run inference on a video source (the 'observable' sequence)
# stream=True creates a generator for memory efficiency
results = model.predict(source="path/to/video.mp4", stream=True)

# Iterate through frames to extract observations
for result in results:
    # Each 'keypoints' object is an observation for a potential HMM
    keypoints = result.keypoints.xyn.cpu().numpy()

    if keypoints.size > 0:
        print(f"Observation (Normalized Keypoints): {keypoints[0][:5]}...")
        # In a full pipeline, these points would be fed into an HMM decoder

Link to this section在现代 AI 中的重要性#

尽管 Transformer 和大语言模型 (LLM) 在 自然语言处理 (NLP) 等任务上已经取代了 HMM,但 HMM 在 边缘计算 和低延迟环境中仍然具有相关性。它们的计算效率使其非常适合资源受限的系统,在这些系统中无法实现繁重的 GPU 使用。此外,由于它们基于透明的概率矩阵,与许多神经网络的“黑盒”特性相比,它们提供了更高的 可观测性

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅