如何使用 Ultralytics YOLO11 进行姿态估计
学习如何使用 Ultralytics YOLO11 模型进行精准的姿态估计。我们将涵盖实时推理和针对各种应用的自定义模型训练。

与计算机视觉(人工智能 (AI) 的一个分支)相关的研究可以追溯到 20 世纪 60 年代。然而,直到 2010 年代,随着深度学习的兴起,我们才看到机器理解图像的方式取得了重大突破。计算机视觉领域的最新进展之一是尖端的 Ultralytics YOLO11 模型。YOLO11 模型首次在 Ultralytics 的年度混合活动、YOLO Vision 2024 (YV24) 上推出,支持包括姿态估计在内的多种计算机视觉任务。
Pose estimation can be used to detect key points on a person or object in an image or video to understand their position, posture, or movement. It’s widely used in applications like sports analytics, animal behavior monitoring, and robotics to help machines interpret physical actions in real time. Thanks to its improved accuracy, efficiency, and speed over earlier models in the YOLO (You Only Look Once) series, YOLO11 is well-suited for real-time pose estimation tasks.

图 1. 使用 Ultralytics YOLO11 进行姿态估计的示例。
在本文中,我们将探讨什么是姿态估计,讨论其部分应用,并逐步演示如何使用 YOLO11 和 Ultralytics Python 程序包进行姿态估计。我们还将了解如何通过Ultralytics HUB 仅需几次简单点击即可尝试 YOLO11 和姿态估计。让我们开始吧!
Link to this section什么是姿态估计?#
在我们深入了解如何使用新的 Ultralytics YOLO11 模型进行姿态估计之前,先让我们更好地理解一下姿态估计。
姿态估计是一种计算机视觉技术,用于分析图像或视频中人或物体的姿势。像 YOLO11 这样的深度学习模型可以识别、定位并跟踪给定物体或人身上的关键点。对于物体,这些关键点可能包括角落、边缘或明显的表面标记;而对于人类,这些关键点则代表肘部、膝盖或肩部等主要关节。
与其他计算机视觉任务(如目标检测)相比,姿态估计具有其独特性,也更复杂。目标检测通过在物体周围绘制边界框来定位图像中的物体,而姿态估计则更进一步,它能预测物体上关键点的精确位置。

图 2. 使用 YOLO11 检测并估计办公室中人员的姿态。
谈到姿态估计,主要有两种工作方式:自下而上 (bottom-up) 和自上而下 (top-down)。自下而上的方法检测单个关键点并将它们组合成骨架,而自上而下的方法则侧重于首先检测物体,然后在物体内部估计关键点。
YOLO11 结合了自上而下和自下而上两种方法的优势。与自下而上的方法一样,它保持了简洁和快速,无需手动对关键点进行分组。同时,它又利用了自上而下方法的准确性,能在单次步骤中检测人员并估计他们的姿态。
Link to this sectionYOLO11 的姿态估计用例#
YOLO11 在姿态估计方面的多功能性为许多行业的广泛应用打开了大门。让我们仔细看看 YOLO11 的一些姿态估计用例。
Link to this section使用 YOLO11 进行实时姿态估计:提高工人安全#
安全是任何建筑项目的一个重要方面。这一点尤为重要,因为从统计学上讲,建筑工地的工作相关伤害发生率更高。2021 年,约 20% 的工作相关致命伤害发生在建筑工地或其附近。面对重型设备和电力系统等日常风险,强大的安全措施对于保障工人安全至关重要。使用标志、路障和主管人工监控等传统方法并不总是有效,而且经常会占用主管处理更关键任务的时间。
AI 可以介入以提高安全性,通过使用基于姿态估计的工人监控系统,可以降低事故风险。Ultralytics YOLO11 模型可用于跟踪工人的动作和姿势。任何潜在的危险,例如工人离危险设备太近或操作不当,都可以被迅速发现。如果检测到风险,系统可以通知主管或触发警报来提醒工人。持续的监控系统可以通过随时观察危险并保护工人来使建筑工地更加安全。

图 3. 使用 YOLO11 在建筑工地上进行姿态估计的示例。
Link to this section使用 YOLO11 进行姿态估计以进行牲畜监测#
农民和研究人员可以使用 YOLO11 来研究牛等农场动物的运动和行为,以检测跛行等疾病的早期迹象。跛行是一种因腿部或脚部疼痛而导致动物难以正常移动的状况。在牛群中,像跛行这样的疾病不仅影响它们的健康和福利,还会导致奶牛场的生产问题。研究表明,在乳制品行业中,跛行在牧场放牧系统中的影响率为 8%,而在集约化系统中为 15% 到 30%。及早发现并解决跛行问题有助于改善动物福利,并减少与这种情况相关的生产损失。
YOLO11 的姿态估计功能可以帮助农民跟踪动物的步态模式,并快速识别出可能预示健康问题的异常情况,例如关节问题或感染。及早发现这些问题可以进行更快的治疗,减少动物的不适并帮助农民避免经济损失。
视觉 AI 赋能的监控系统还可以帮助分析休息行为、社交互动和进食模式。农民还可以利用姿态估计来观察压力或攻击性的迹象。这些见解可用于为动物营造更好的生活条件并提高它们的健康水平。

图 4. 牛只姿态估计可视化效果。
Link to this sectionYOLO11 在健身行业的用例#
姿态估计还可以帮助人们在锻炼时实时改善姿势。借助 YOLO11,健身房和瑜伽教练可以监控并跟踪锻炼者的身体动作,重点关注关节和四肢等关键点以评估他们的姿势。收集的数据可以与理想姿势和锻炼技巧进行对比,如果有人动作不规范,教练会收到警报,从而有助于防止受伤。

图 5. 使用姿态估计分析锻炼动作。
例如,在瑜伽课程中,姿态估计可以帮助监控所有学生是否保持正确的平衡和对齐。集成了计算机视觉和姿态估计的移动应用程序可以让在家锻炼或无法接触私人教练的人群更容易地进行健身。这种持续的实时反馈有助于用户改善技巧并实现健身目标,同时降低受伤风险。
Link to this section使用 YOLO11 模型尝试实时姿态估计#
现在我们已经探讨了什么是姿态估计并讨论了它的一些应用,让我们看看如何使用新的 YOLO11 模型来尝试姿态估计。为了开始使用,有两种便捷的方法:使用 Ultralytics Python 程序包或通过 Ultralytics HUB。让我们看看这两种选择。
Link to this section使用 YOLO11 运行推理#
运行推理涉及 YOLO11 模型处理其训练集之外的新数据,并利用其学到的模式根据该数据进行预测。你可以通过 Ultralytics Python 程序包通过代码运行推理。你只需使用 pip、conda 或 Docker 安装 Ultralytics 程序包即可开始使用。如果在安装过程中遇到任何困难,我们的常见问题指南提供了有用的故障排除建议。
成功安装程序包后,以下代码概述了如何加载模型并将其用于预测图像中物体的姿态。

图 6. 展示使用 YOLO11 运行推理的代码片段。
Link to this section训练自定义 YOLO11 模型#
假设你正在进行一个计算机视觉项目,并且拥有一个涉及姿态估计的特定应用的数据集。那么你可以微调并训练一个自定义 YOLO11 模型以适合你的应用。例如,你可以使用一个关键点数据集,通过识别四肢、头部和尾部位置等关键特征,来分析和理解图像中老虎的姿态。
你可以使用以下代码片段来加载和训练 YOLO11 姿态估计模型。该模型可以从 YAML 配置构建,或者你可以加载预训练模型进行训练。此脚本还允许你传输权重,并使用指定的数据集(例如用于姿态估计的 COCO 数据集)开始训练模型。

图 7. 自定义训练 YOLO11。
使用新训练的自定义模型,你可以在与你的计算机视觉解决方案相关的未见过图像上运行推理。训练好的模型还可以使用导出模式转换为其他格式。
Link to this section在 Ultralytics HUB 上尝试 YOLO11#
到目前为止,我们研究的方法都需要一些基本的编码知识才能使用 YOLO11。如果这并非你所追求的,或者你不熟悉编码,还有另一个选择:Ultralytics HUB。Ultralytics HUB 是一个用户友好的平台,旨在简化 YOLO 模型的训练和部署过程。HUB 让你能够轻松管理数据集、训练模型并进行部署,而无需技术专长。
要对图像运行推理,你可以创建一个账户,导航到“模型”部分,并选择你感兴趣的 YOLO11 姿态估计模型。在预览部分,你可以上传一张图片并查看预测结果,如下所示。

图 8. 在 Ultralytics HUB 上使用 YOLO11 进行姿态估计。
Link to this sectionYOLO11 在人体姿态检测方面的进展#
Ultralytics YOLO11 为姿态估计等任务提供了准确且灵活的解决方案,适用于广泛的应用场景。从提高建筑工地工人的安全性到监测牲畜健康,再到辅助健身日常中的姿势矫正,YOLO11 通过先进的计算机视觉技术带来了精度和实时反馈。
它的多功能性,配合多种模型变体以及针对特定用例进行自定义训练的能力,使其成为开发者和企业的宝贵工具。无论是通过使用 Ultralytics Python 程序包进行编码,还是使用 Ultralytics HUB 进行更简单的实现,YOLO11 都让姿态估计变得易于获取且影响深远。
要探索更多内容,请访问我们的 GitHub 仓库,并与我们的社区互动。在我们的解决方案页面上探索人工智能在制造业和农业领域的应用。🚀






