深圳Yolo 视觉
深圳
立即加入
词汇表

姿势估计

探索姿势估计 :关键点模型(自上而下与自下而上)的工作原理,从医疗到体育的实际应用,以及关键优势和挑战。

姿势估计是一项专门的 计算机视觉 (CV)任务。 检测物体之外,还能识别物体的具体几何形状和方向。通过精确定位结构性 技术通过精确定位结构性地标(称为关键点)的坐标来创建物体的 骨骼表示法。在人体中,这些关键点通常映射到肩部、肘部、髋部和膝部等主要关节、 髋关节和膝关节。这种功能允许 机器学习 (ML)模型解释肢体语言、活动和姿势 语言、活动和姿势,弥补了简单像素检测与理解复杂物理行为之间的差距。 行为之间的桥梁。

核心机制和方法

现代姿势估计 估计在很大程度上依赖于 深度学习(DL)架构,特别是 卷积神经网络 (CNN) 以及越来越多的变形器。这一过程通常分为两种主要方法:

  • 自上而下法:这种方法首先采用 物体检测模型来定位边界框内的单个 例如人类)。一旦 裁剪后,系统会估算出单个人物的关键点。这种方法通常更为精确,但随着人数的增加 昂贵。
  • 自下而上法:另一种方法是,模型首先检测整个图像中所有潜在的关键点(例如每个左肘 例如每个左肘),然后将它们关联起来,形成不同的骨架。这种方法通常适用于 在拥挤的场景中进行实时推理,因为 处理时间与主体数量的关系较小。

对于高性能应用,如 Ultralytics YOLO11等模型整合了这些概念,以提供快速 姿势估计,适用于边缘设备。

区分相关概念

将 "姿势估计 "与类似的视觉任务区分开来至关重要:

  • 与物体检测对象检测能识别对象的位置和 类标签),而物体检测则将物体视为一个僵硬的盒子。而姿势估计则能揭示物体内部的结构和衔接。 结构和衔接。
  • 与实例分割相比: 实例分割提供了一个 对物体形状进行像素完美的遮蔽。虽然这能勾勒出边界,但不能明确识别关节或骨骼联系,而这对于分析运动动态或 骨骼联系,而这对于分析运动动力学或 运动学所必需的。

实际应用

姿势估计 的实用性遍及对运动分析至关重要的各个行业。

医疗保健和康复

医疗保健领域的人工智能领域,姿势估计 通过自动跟踪病人的运动来协助物理治疗。系统可以测量康复训练中的关节角度 以确保病人保持正确的姿势,降低再次受伤的风险。这使得 实现远程监控和远程医疗、 使优质护理更容易获得。

运动分析与生物力学

教练和运动员使用 运动分析 分析成绩。通过从视频中提取 生物力学数据 通过从视频中提取生物力学数据,人工智能可以分析高尔夫球手的挥杆平面或跑步者的步态效率,而无需传统运动捕捉中使用的侵入性标记服。 传统动作捕捉中使用的侵入性标记服。

代码示例:使用YOLO11估算姿势估计

以下是 Python 片段演示了如何加载预训练的YOLO11 模型,并对图像执行姿势估计。 并对图像执行姿势估计 。这需要 ultralytics 软件包,并将 骨骼输出。

from ultralytics import YOLO

# Load the official YOLO11 nano pose model
model = YOLO("yolo11n-pose.pt")

# Run inference on an image source
results = model("https://docs.ultralytics.com/usage/python/")

# Visualize the detected keypoints and skeleton
results[0].show()

挑战与数据

训练强大的姿势估计 模型需要大量的注释数据集COCO 姿势估计 数据集等标准基准提供了 数以千计的标注人体图像。然而,挑战依然存在,例如遮挡(当身体部位被隐藏时 被隐藏)和自我遮挡(当一个人遮挡住自己的肢体时)。解决这些问题需要 先进的数据增强技术和多样化的 训练数据,涵盖各种角度和光照条件。 条件。

此外,在边缘人工智能设备上部署这些模型 需要仔细优化,如 模型量化,以保持高精度 而不牺牲速度。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入