深圳Yolo 视觉
深圳
立即加入
词汇表

姿势估计

探索姿势估计 :关键点模型(自上而下与自下而上)的工作原理,从医疗到体育的实际应用,以及关键优势和挑战。

姿势估计 专业的计算机视觉任务,其不仅限于检测物体,更致力于识别物体的具体几何结构与方向。通过精确定位结构性特征点(即关键点)的坐标,该技术能够构建主体的骨架模型。 在人体中,这些关键点通常对应肩、肘、髋、膝等主要关节。该能力使机器学习模型能够解读肢体语言、活动状态及姿势,从而弥合了简单像素检测与理解复杂物理行为之间的鸿沟。

核心机制和方法

现代姿势估计 高度依赖深度学习架构,特别是卷积神经网络(CNNs),以及日益普及的Transformers模型。该过程通常分为两大主要方法:

  • 自上而下法:这种方法首先采用 物体检测模型来定位边界框内的单个 例如人类)。一旦 裁剪后,系统会估算出单个人物的关键点。这种方法通常更为精确,但随着人数的增加 昂贵。
  • 自下而上法:另一种方法是,模型首先检测整个图像中所有潜在的关键点(例如每个左肘 例如每个左肘),然后将它们关联起来,形成不同的骨架。这种方法通常适用于 在拥挤的场景中进行实时推理,因为 处理时间与主体数量的关系较小。

针对高性能应用场景,最新的YOLO26模型 融合了这些概念,实现了适用于边缘设备的 快速姿势估计

区分相关概念

将 "姿势估计 "与类似的视觉任务区分开来至关重要:

  • 与物体检测对象检测能识别对象的位置和 类标签),而物体检测则将物体视为一个僵硬的盒子。而姿势估计则能揭示物体内部的结构和衔接。 结构和衔接。
  • 与实例分割相比: 实例分割提供了一个 对物体形状进行像素完美的遮蔽。虽然这能勾勒出边界,但不能明确识别关节或骨骼联系,而这对于分析运动动态或 骨骼联系,而这对于分析运动动力学或 运动学所必需的。

实际应用

姿势估计 的实用性遍及对运动分析至关重要的各个行业。

医疗保健和康复

医疗保健领域的人工智能领域,姿势估计 通过自动跟踪病人的运动来协助物理治疗。系统可以测量康复训练中的关节角度 以确保病人保持正确的姿势,降低再次受伤的风险。这使得 实现远程监控和远程医疗、 使优质护理更容易获得。

运动分析与生物力学

教练和运动员使用 运动分析 分析成绩。通过从视频中提取 生物力学数据 通过从视频中提取生物力学数据,人工智能可以分析高尔夫球手的挥杆平面或跑步者的步态效率,而无需传统运动捕捉中使用的侵入性标记服。 传统动作捕捉中使用的侵入性标记服。

代码示例:姿势估计 (基于YOLO26的姿势估计 )

以下是 Python 该代码片段演示了如何加载预训练的YOLO26模型,并对图像执行姿势估计 。这需要... ultralytics 软件包,并将 骨骼输出。

from ultralytics import YOLO

# Load the official YOLO26 nano pose model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image source to detect keypoints
results = model("path/to/image.jpg")

# Visualize the detected keypoints and skeleton
results[0].show()

挑战与数据

训练强大的姿势估计 模型需要大量的注释数据集COCO 姿势估计 数据集等标准基准提供了 数以千计的标注人体图像。然而,挑战依然存在,例如遮挡(当身体部位被隐藏时 被隐藏)和自我遮挡(当一个人遮挡住自己的肢体时)。解决这些问题需要 先进的数据增强技术和多样化的 训练数据,涵盖各种角度和光照条件。 条件。

此外,在边缘AI设备上部署这些模型需要进行精细优化,例如模型量化,以在保持高精度的同时不牺牲运行速度。用户Ultralytics 简化此工作流程,该平台能有效简化训练与部署过程。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入