指南

什么是 OpenPose？探索姿态估计的里程碑

探索 OpenPose 如何用于计算机视觉应用中的姿态估计。了解其功能以及在视觉 AI 中的重要性。

ABAbirami Vina

5 min readJune 17, 2025

如今，图像和摄像头无处不在——内置在我们的手机、家中，甚至公共空间中。我们不仅依靠它们来捕捉瞬间，还依靠它们来帮助我们理解和与周围的世界进行互动。

在幕后，计算机视觉（人工智能 (AI) 的一个子领域）通过使机器能够解析视觉数据，让这一切成为可能。它允许系统检测物体、识别人脸并追踪运动，在我们日常使用的许多技术中发挥着关键作用。

得益于 AI 最近的进步，计算机视觉模型现在可以分析并提取更复杂的数据和见解。这方面的一个例子是姿态估计，这是一种专注于理解人体运动的计算机视觉任务。

它的工作原理是识别图像或视频中身体的关键点，如肩膀、肘部和膝盖。这使得分析人们如何移动成为可能，从而在健身追踪、动画、医疗保健等领域实现各种应用。

在为姿态估计开发的众多工具中，OpenPose 脱颖而出，成为一项重大突破。它由卡内基梅隆大学感知计算实验室的研究人员创建，是首批能够使用单一摄像头实时检测多人全身姿态（包括手部、足部和面部关键点）的开源系统之一（每人最多可检测 135 个关键点）。

在本文中，我们将探索 OpenPose、它的工作原理，以及它作为计算机视觉里程碑的意义。

使用 OpenPose 进行多人姿态估计

图 1。使用 OpenPose 进行多人姿态估计。

Link to this section回顾姿态估计的历史#

在 AI 被广泛采用之前，追踪视频中的人体运动需要使用专业设备。在电影和动画等行业中，演员通常需要穿着带有反光标记的服装，以便摄像机能在受控的摄影棚环境中捕捉他们的动作。

虽然这些基于标记的动作捕捉技术很准确，但它们也很昂贵，且局限于特定的配置。随着计算机视觉的发展，研究人员开始寻求无需使用标记即可追踪身体运动的方法。他们使用边缘、轮廓和模板来查找图像中的人体形状。

这些早期系统在简单直接的情况下运作良好，但在现实场景中却显得力不从心。当人们以意想不到的方式移动，或者画面中出现超过一人时，它们的效果往往不尽如人意。

21 世纪 10 年代末，深度学习为姿态估计带来了重大变革。视觉 AI 模型可以在大型人体姿态数据集上进行训练。模型不再依赖边缘和模板，而是通过学习数以千计的标注图像来识别身体关节和结构。这使得姿态估计在更广泛的场景中变得更加准确、灵活且具有影响力。

2017 年至 2023 年人体姿态估计模型时间轴

图 2。2017 年至 2023 年人体姿态估计模型的演变。

Link to this sectionOpenPose：现代姿态估计的起飞之地#

OpenPose 于 2017 年首次发布，能够同时估计单张图像中多个人的姿态。与旧系统不同，OpenPose 不需要特殊的服装或标记。它适用于标准摄像机，并能实时处理图像和视频。这些特性使得开发者和研究人员更容易使用姿态估计技术。

OpenPose 为计算机视觉奠定的基础帮助其他人构建了用于各种其他应用的更新架构。如今，支持姿态估计任务的视觉 AI 模型，如Ultralytics YOLOv8 和 Ultralytics YOLO11，能够提供更快的速度和更低的延迟。

使用 Ultralytics YOLO11 进行姿态估计

图 3。使用 YOLO11 进行姿态估计。

不过，如果你对姿态估计是如何演变而来的感到好奇，OpenPose 是一个很好的切入点。它引入了许多更新系统至今仍在依赖的关键理念。

Link to this sectionOpenPose 的关键功能#

既然我们已经更好地理解了为什么 OpenPose 很重要，让我们仔细看看它到底能做什么。

OpenPose 功能的核心是所谓的关键点检测。关键点是人体上的特定地标，例如鼻尖、肩膀中心、肘部、手腕、臀部、膝盖和脚踝。OpenPose 每人最多可以检测 135 个这样的点，包括手指和面部特征等精细区域。

当这些点连接起来时，它们就形成了一个人体简化表示——你可以把它想象成一个数字骨架。这个骨骼轮廓不仅显示了一个人在哪里，还显示了他们的姿态：他们是坐着、站着、挥手、微笑还是行走。计算机可以利用这些骨架直观地解读人体运动，就像我们本能地理解某人的肢体语言一样。

骨骼追踪特别有用，因为它剔除了背景噪声和干扰，让系统能够纯粹专注于人体姿势和运动。OpenPose 不会分析每一个像素，而是专注于讲述一个人如何移动或互动的关键点。

通过从日常图像或视频中提取这种结构化信息，OpenPose 使得构建响应手势、监测身体活动、评估情绪暗示甚至为数字角色制作动画的应用程序成为可能。

Link to this sectionOpenPose 是如何工作的？#

以下是 OpenPose 如何从视觉输入中检测并连接人体关键点的概述：

从图像开始： OpenPose 从照片、视频或直播摄像头信号中获取单张图像。
定位重要身体部位： 系统会查找身体上的关键点，例如鼻子、肘部、手腕、膝盖和脚踝。只要系统确信某一部位位于此处，就会进行标记。
找出哪些部位属于一起： 接下来，OpenPose 会检查关键点是如何连接的。它使用数学计算来确定哪些关节属于同一个人——例如，将手腕与右肘和肩膀进行匹配。
为每个人绘制骨架： 在对关键点进行分组后，OpenPose 会将它们连接成一个显示每个人姿态的“火柴人”。即使画面中出现多人，这也能正常工作。
返回姿态数据： 最后，它会提供所有检测到的关键点的精确位置。这些数据可用于实时追踪运动、识别手势或构建交互式工具。

使用 OpenPose 进行人体关键点检测与追踪

图 4。使用 OpenPose 进行人体关键点检测和追踪。

Link to this section使用 OpenPose 的跨行业姿态估计应用#

OpenPose 是首批使姿态估计在各种现实用例中变得实用的先进工具之一。虽然它今天并不常用于实时的计算机视觉解决方案，但它在塑造体育、娱乐、教育和安全等领域的早期工作中发挥了重要作用。

让我们仔细看看它如何帮助在这些领域铺平道路。

Link to this section使用 OpenPose 进行健身和体育领域的姿态估计#

当你观看棒球比赛时，很容易理解正在发生的事情——你可以瞬间识别出投球、挥棒或盗垒。作为人类，我们直觉上可以轻松阅读并理解身体动作。但对于机器来说，识别这些动作要复杂得多。它们需要关于身体的每个部分如何在空间中移动的精确信息。

OpenPose 在计算机视觉的这一领域迈出了重要的一步。它是一种用于在各种环境中分析运动员动作姿态的实用工具。

许多研究项目使用 OpenPose 来分解挥棒和跳跃等动作，甚至根据运动员的移动方式对特定的棒球动作进行分类。因为它在开放环境中使用标准视频即可运行，所以研究人员得以测试此类系统如何在现实训练或教练场景中发挥作用。

这些早期的研究为如今在先进的体育技术中使用的性能追踪工具奠定了基础。

使用 OpenPose 的棒球动作分类流水线

图 5。查看使用 OpenPose 的棒球动作分类流水线。

Link to this section在安防系统中应用 OpenPose#

同样，研究人员也使用 OpenPose 来探索基于视频的姿态追踪如何支持安全监控。它已在检测行为方面进行了测试，例如公共区域内的跌倒、异常手势或移动模式。

由于它适用于标准摄像机，OpenPose 使得在医院和交通枢纽等环境中进行早期实验变得更加容易。这些研究推动了如今用于监控、跌倒检测和应急响应系统的更新模型的开发。

由 OpenPose 实现的跌倒检测

图 6。由 OpenPose 实现的跌倒检测。

Link to this sectionOpenPose 的优缺点#

以下是 OpenPose 提供的一些优势预览：

适用于研究和原型开发： 它已广泛应用于学术研究，特别是在人机交互、生物力学和行为分析等领域。
跨平台支持： 它可以在 Windows、Linux 和 macOS 上运行，并同时支持中央处理器 (CPU) 和图形处理器 (GPU)。
离线处理能力： 它可以在没有互联网连接的环境中运行，非常适合医疗保健或教育等对隐私敏感的场景。

虽然 OpenPose 迈出了重要的一步，但它也有一些需要注意的技术局限性。以下是与 OpenPose 相关的一些主要挑战：

高处理要求： 实时运行 OpenPose 需要强大的 GPU 和大量的计算资源。
对环境敏感： 在光线不足、拥挤的空间或摄像机角度不理想的情况下，性能可能会下降。
与较新的模型相比更笨重： 与较新的姿态估计模型相比，OpenPose 相对较大且速度较慢。它不适合部署在智能手机、平板电脑或嵌入式系统等资源受限的设备上。

Link to this section关键要点#

OpenPose 在提高姿态估计的可访问性方面发挥了重要作用。它表明，无需依赖专用服装或专业设备，仅用简单的摄像机即可完成人体运动追踪。

它为医疗保健、教育、娱乐和研究领域的许多实际应用奠定了基础。虽然较新的模型现在提供了更快的速度和更轻量化的性能，但 OpenPose 仍然是理解姿态估计演变的关键参考点。

加入我们的社区并访问我们的 GitHub 存储库以了解更多关于 AI 的知识。如果你想构建自己的计算机视觉解决方案，请探索我们的许可选项。此外，快来看看医疗保健中的计算机视觉和物流中的 AI 是如何产生影响的！

Explore solutions

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

什么是 OpenPose？探索姿态估计的里程碑

Link to this section回顾姿态估计的历史#

Link to this sectionOpenPose：现代姿态估计的起飞之地#

Link to this sectionOpenPose 的关键功能#

Link to this sectionOpenPose 是如何工作的？#

Link to this section使用 OpenPose 的跨行业姿态估计应用#

Link to this section使用 OpenPose 进行健身和体育领域的姿态估计#

Link to this section在安防系统中应用 OpenPose#

Link to this sectionOpenPose 的优缺点#

Link to this section关键要点#

Explore solutions

机器人技术中的 AI

物流中的 AI

零售业 AI

医疗保健中的 AI

制造业中的 AI

汽车中的 AI

农业中的 AI

机器人技术中的 AI

物流中的 AI

零售业 AI

医疗保健中的 AI

制造业中的 AI

汽车中的 AI

农业中的 AI

机器人技术中的 AI

物流中的 AI

零售业 AI

医疗保健中的 AI

制造业中的 AI

汽车中的 AI

农业中的 AI

让我们一起构建 AI 的未来！