敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

要点

探索计算机视觉中的关键点:使用 Ultralytics YOLO11 进行姿势估计,用于健身、手势识别和快速准确的跟踪。

在计算机视觉中,关键点是图像中具有独特性和可重复性的特定兴趣点。这些点作为结构紧凑的地标,代表着一个物体或一个场景,使机器能够更详细地理解和分析视觉内容。算法不需要处理每个像素,而是将注意力集中在这些关键点上,如角落、边缘或人体关节,从而执行复杂的任务,如跟踪运动、识别物体和重建 3D 场景。通过集中处理这些信息点,计算机视觉模型可以实现高效率和高精度。

关键点检测和姿态估计

关键点的主要应用是姿势估计,这是一项计算机视觉任务,重点是识别物体或人的位置和方向。在人体姿态估计中,关键点对应于人体的主要关节,如肩、肘、膝和腕。通过检测图像或视频中的这些点,一个模型就能构建出人体的骨骼表征。这种 "数字骨骼 "可以让人工智能系统分析姿势、手势和动作,而无需了解人的外表、衣着或周围环境。

先进的深度学习模型,如Ultralytics YOLO11,是在COCO这样的大型注释数据集上训练出来的,可以实时准确地预测这些关键点的位置。OpenPose等早期系统展示了同时检测多人的全身、手部和面部关键点的能力,从而铺平了道路。现代架构建立在这些基础之上,可为各种应用提供更快、更精确的结果。

关键点与其他计算机视觉概念的对比

必须将关键点检测与计算机视觉中的其他相关任务区分开来:

  • 边界框 物体检测通常使用边界框--一个简单的矩形--来显示物体的位置。关键点检测通过识别边界框内的特定结构点来描述物体的姿态和形状,从而提供更详细的了解。
  • 实例分割:关键点创建了一个骨架轮廓,而实例分割则更进一步,在像素级别上勾勒出对象的确切形状。分割提供了一个完整的边界,而关键点则提供了一个结构概要。
  • 特征描述符检测到关键点后,可以计算出特征描述符来描述其周围的图像斑块。SIFT 和 ORB等算法会生成这些描述符,它们可以作为数字 "指纹",用于匹配不同图像中的相应关键点。

实际应用

检测和跟踪关键点的能力使各行各业都取得了重大进步。以下是两个突出的例子:

  1. 智能健身和运动分析:在健身应用中,姿势估计模型可跟踪关键身体关节,监测用户在深蹲或瑜伽等运动中的姿势。系统可以计算重复次数,提供姿势方面的实时反馈以防止受伤,并对运动表现进行高精度分析。这项技术有助于创造个性化的互动式锻炼体验,只需一个标准摄像头即可实现。
  2. 手势识别:通过识别手部和手指上的关键点,人工智能系统可以解读复杂的手部动作。这对于开发增强现实和虚拟现实中的直观控件、创建手语翻译工具以及实现与智能设备的无触摸交互至关重要。根据手部关键点数据集训练的模型可以识别从简单的捏合到复杂的手势等各种手势。

其他应用包括用于情绪分析和 AR 滤波器的面部地标检测、用于野生动物保护行为研究的动物姿态估计,以及用于帮助机器导航和与环境互动的机器人技术

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板