了解如何使用 Ultralytics YOLO11 模型进行精确的姿态估计。我们将介绍各种应用的实时推理和自定义模型训练。

了解如何使用 Ultralytics YOLO11 模型进行精确的姿态估计。我们将介绍各种应用的实时推理和自定义模型训练。
与计算机视觉(人工智能 (AI) 的一个分支)相关的研究可以追溯到 20 世纪 60 年代。然而,直到 2010 年代,随着深度学习的兴起,我们才在机器理解图像的方式上看到了重大突破。 计算机视觉领域的最新进展之一是前沿的 Ultralytics YOLO11 模型。YOLO11 模型 首次在 Ultralytics 的年度混合活动 YOLO Vision 2024 (YV24) 上推出,支持一系列计算机视觉任务,包括姿态估计。
姿态估计可用于检测图像或视频中人物或物体的关键点,以了解他们的位置、姿势或运动。它广泛应用于运动分析、动物行为监测和机器人技术等应用中,以帮助机器实时解读物理动作。由于 YOLO11 在 YOLO (You Only Look Once) 系列中,相比早期模型,在准确性、效率和速度上都有所提高,因此非常适合实时姿态估计任务。
在本文中,我们将探讨什么是姿态估计,讨论它的一些应用,并介绍如何将 YOLO11 与 Ultralytics Python 包结合使用来进行姿态估计。我们还将了解如何使用 Ultralytics HUB,只需点击几下即可试用 YOLO11 和姿态估计。让我们开始吧!
在我们深入研究如何使用新的 Ultralytics YOLO11 模型 进行姿态估计之前,让我们更好地了解姿态估计。
姿态估计是一种计算机视觉技术,用于分析图像或视频中人物或物体的姿势。诸如 YOLO11 之类的深度学习模型可以识别、定位和跟踪给定物体或人物的关键点。对于物体,这些关键点可能包括角、边缘或明显的表面标记,而对于人类,这些关键点代表主要的关节,如肘部、膝盖或肩部。
与其他计算机视觉任务(如目标检测)相比,姿态估计是独特且更复杂的。目标检测通过在图像中的物体周围绘制一个框来定位物体,而姿态估计则更进一步,预测物体上关键点的确切位置。
在姿态估计方面,主要有两种工作方式:自下而上和自上而下。自下而上的方法检测单个关键点并将它们分组到骨架中,而自上而下的方法侧重于首先检测物体,然后估计其中的关键点。
YOLO11 结合了自上而下和自下而上方法的优点。与自下而上的方法一样,它保持了简单和快速,无需手动对关键点进行分组。同时,它通过检测人和估计他们的姿势,一步到位,从而利用了自上而下方法的准确性。
YOLO11 在姿态估计方面的多功能性为许多行业开辟了广泛的潜在应用。让我们仔细看看 YOLO11 的一些姿态估计用例。
安全是任何建筑项目的重要方面。 尤其如此,因为从统计数据来看,建筑工地上的工伤事故发生率较高。 2021 年,约 20% 的与工作相关的致命伤害发生在建筑工地或其附近。 每天都面临着重型设备和电气系统等风险,因此强有力的安全措施对于确保工人安全至关重要。 传统的诸如使用标志、路障以及主管进行人工监控等方法并不总是有效,并且经常使主管无法执行更关键的任务。
AI 可以介入以提高安全性,并且可以通过使用基于姿态估计的工人监控系统来降低事故风险。 Ultralytics YOLO11 模型可用于跟踪工人的动作和姿势。 可以快速发现任何潜在的危险,例如工人站立在危险设备附近或不正确地执行任务。 如果检测到风险,可以通知主管,或者警报可以提醒工人。 连续监控系统可以通过始终关注危险并保护工人来使建筑工地更安全。
农民和研究人员可以使用 YOLO11 来研究农场动物(如牛)的运动和行为,以检测疾病(如跛足)的早期迹象。 跛足是一种动物因腿或脚疼痛而难以正常移动的疾病。 在牛中,跛足等疾病不仅会影响它们的健康和福利,还会导致奶牛场的生产问题。 研究表明,在全球乳制品行业中,跛足影响了牧场系统中 8% 的牛,以及封闭系统中 15% 到 30% 的牛。检测和及早解决跛足问题有助于改善动物福利并减少与此疾病相关的生产损失。
YOLO11 的姿态估计功能可以帮助农民跟踪动物的步态模式,并快速识别可能预示健康问题的任何异常情况,例如关节问题或感染。 及早发现这些问题可以更快地进行治疗,从而减轻动物的不适并帮助农民避免经济损失。
启用视觉 AI的监控系统还可以帮助分析休息行为、社交互动和进食模式。 农民还可以使用姿态估计来观察压力或攻击行为的迹象。 这些见解可用于改善动物的生活条件并提高它们的福祉。
姿势估计还可以帮助人们在锻炼时实时改善姿势。借助 YOLO11,健身房和瑜伽教练可以监控和跟踪锻炼者的身体动作,重点关注关节和四肢等关键点,以评估他们的姿势。收集的数据可以与理想的姿势和锻炼技巧进行比较,如果有人动作不正确,教练可以收到警报,从而帮助防止受伤。
例如,在瑜伽课上,姿势估计可以帮助监控所有学员是否保持适当的平衡和对齐。集成计算机视觉和姿势估计的移动应用程序可以使健身对于在家锻炼或无法获得私人教练指导的人来说更易于获得。这种持续的实时反馈有助于用户提高他们的技术水平并实现他们的健身目标,同时降低受伤的风险。
现在我们已经探讨了什么是姿势估计,并讨论了它的一些应用。让我们来看看如何使用新的 YOLO11 模型尝试姿势估计。要开始使用,有两种方便的方法:使用 Ultralytics Python 包或通过 Ultralytics HUB。让我们来看看这两种选择。
运行推理涉及 YOLO11 模型处理其训练集之外的新数据,并使用其学习的模式来基于该数据进行预测。您可以通过 Ultralytics Python 包通过代码运行推理。您只需使用 pip、conda 或 Docker 安装 Ultralytics 包即可开始使用。如果您在安装过程中遇到任何挑战,我们的常见问题解答指南提供了有用的故障排除提示。
成功安装该软件包后,以下代码概述了如何加载模型并使用它来预测图像中物体的姿势。
假设您正在进行一个计算机视觉项目,并且您有一个特定的数据集,用于涉及姿势估计的特定应用。然后,您可以微调和训练一个自定义 YOLO11 模型以适合您的应用。例如,您可以使用一个关键点数据集来分析和理解图像中老虎的姿势,方法是识别其四肢、头部和尾部的位置等关键特征。
您可以使用以下代码片段来加载和训练 YOLO11 姿势估计模型。该模型可以从 YAML 配置文件构建,也可以加载预训练模型进行训练。此脚本还允许您传输权重并使用指定的数据集(例如用于姿势估计的 COCO 数据集)开始训练模型。
使用新训练的自定义模型,您可以在与您的计算机视觉解决方案相关的未见图像上运行推理。训练后的模型也可以使用导出模式转换为其他格式。
到目前为止,我们研究了使用 YOLO11 的方法,这些方法需要一些基本的编码知识。如果这不是您想要的,或者您不熟悉编码,还有另一种选择:Ultralytics HUB。Ultralytics HUB 是一个用户友好的平台,旨在简化训练和部署 YOLO 模型的过程。HUB 使您可以轻松管理数据集、训练模型和部署它们,而无需技术专业知识。
要在图像上运行推理,您可以创建一个帐户,导航到“模型”部分,然后选择您感兴趣的 YOLO11 姿势估计模型。在预览部分,您可以上传图像并查看预测结果,如下所示。
Ultralytics YOLO11 为各种应用中的姿势估计等任务提供准确而灵活的解决方案。从提高建筑工地工人的安全性到监控牲畜健康以及辅助健身程序中的姿势矫正,YOLO11 通过先进的计算机视觉技术带来精确性和实时反馈。
它的多功能性,具有多种模型变体以及为特定用例进行自定义训练的能力,使其成为开发人员和企业的宝贵工具。无论是通过使用 Ultralytics Python 包进行编码还是使用 Ultralytics HUB 进行更简单的实施,YOLO11 都使姿势估计变得易于访问且具有影响力。
要了解更多信息,请访问我们的 GitHub 存储库,并与我们的 社区互动。在我们的解决方案页面上探索 制造业 和 农业 中的 AI 应用。🚀