遇见 YOLO26: 下一代视觉 AI。
Ultralytics
视觉 AI

AI 能检测人类行为吗?探索活动识别

从健身应用到患者监测,发现计算机视觉如何解决这个问题:AI 能在现实场景中检测人类行为吗?

ABAbirami Vina
6 min read
AI 通过活动识别检测人类行为

日常生活中充满了我们很少停下来思考的小动作。穿过房间、坐在桌子旁或向朋友挥手对我们来说可能轻而易举,但用 AI 来检测这些动作却复杂得多。人类觉得自然而然的事情,在机器试图理解时,就变得复杂得多了。

这种能力被称为人类行为识别 (HAR),它使计算机能够检测和解释人类行为中的模式。健身应用就是 HAR 在实践中的一个绝佳例子。通过跟踪步数和锻炼计划,它展示了 AI 如何监测日常活动。

鉴于 HAR 的潜力,许多行业已经开始采用这项技术。事实上,人类 行为识别市场 预计到 2033 年将达到超过 125.6 亿美元。

这种进步在很大程度上 由计算机视觉推动,这是 AI 的一个分支,使机器能够分析视觉数据,如图像和视频。借助计算机视觉和图像识别,HAR 已从一个研究概念演变为尖端 AI 应用中实用且令人兴奋的一部分。

在本文中,我们将探讨什么是 HAR、用于识别人类动作的不同方法,以及计算机视觉如何帮助回答这个问题:AI 能在实际应用中检测到人类动作吗?让我们开始吧!

Link to this section什么是人类行为识别?#

人类行为识别使计算机系统能够通过分析身体动作来理解人类的活动或行为。与仅仅 检测 图像中的人不同,HAR 可以辅助识别该人在做什么。例如,区分行走和跑步、识别挥手动作,或注意到某人跌倒。

HAR 的基础在于运动和姿势的模式。人体手臂或腿部位置的轻微变化就能预示各种动作。通过捕捉和解读这些微妙的细节,HAR 系统可以从身体动作中获得有意义的见解。

为了实现这一点,人类行为识别结合了多种技术,例如机器学习、深度学习模型、计算机视觉和 图像处理,它们协同工作以分析身体动作并以更高的准确度解读人类行为。

人类活动识别跨越了计算机科学的不同分支

图 1. 人类行为识别涉及计算机科学的不同分支 (来源: cell.com)

早期的 HAR 系统要有限得多。它们只能处理受控环境中少数几个简单、重复的动作,并且在现实世界的情况下经常遇到困难。

如今,得益于 AI 和海量的视频数据,HAR 在准确性和稳健性方面都有了显著提高。现代系统可以以更高的准确度识别广泛的活动,这使得该技术在医疗保健、安全和交互式设备等领域变得实用。

Link to this section检测人类动作的不同方法#

既然我们对什么是人类行为识别有了更好的了解,让我们来看看机器检测人类动作的不同方式。

以下是一些常见的方法:

  • 基于传感器的方法: 加速度计、可穿戴设备和智能手机等智能设备可以直接从人体捕获信号。它们可以显示行走、跑步甚至静止等运动模式。智能手表上的计步器就是这种方法的一个绝佳例子。
  • 基于视觉的方法: 与计算机视觉配对的摄像头会逐帧分析图像和视频,以跟踪身体的外观和移动方式。这使得识别更复杂的活动成为可能。手势控制电视或游戏系统依赖于这种方法。
  • 多模态方法: 这是传感器和摄像头的结合,创建了一个更可靠的系统,因为一个来源可以确认另一个检测到的内容。例如,可穿戴设备可以记录运动,而摄像头则验证姿势,这种设置常用于老年护理中的跌倒检测。

Link to this section数据集在人类行为识别中的作用#

对于任何 HAR 模型或系统来说,数据集 都是起点。HAR 数据集是示例(如视频剪辑、图像或传感器数据)的集合,这些示例捕获了行走、坐下或挥手等动作。这些示例用于训练 AI 模型以识别运动中的人类模式,然后将其应用于现实生活。

训练数据的质量直接影响模型的性能。干净、一致的数据使系统更容易准确识别动作。

这就是为什么数据集通常在训练前进行预处理。一个常见的步骤是归一化,它对数值进行一致缩放以减少错误并防止过拟合(即模型在训练数据上表现良好但在新数据上表现不佳)。

为了衡量模型在训练之外的表现,研究人员依靠评估指标和基准数据集来进行公平的测试和比较。像 UCF101、HMDB51 和 Kinetics 这样受欢迎的集合包含数千个用于人类行为检测的标注视频剪辑。在传感器方面,从智能手机和可穿戴设备收集的数据集提供了宝贵的运动信号,使识别模型在不同环境中更加稳健。

人类活动识别数据集一瞥

图 2. 人类行为识别数据集的一瞥。(来源)

Link to this section计算机视觉如何支持人类行为识别#

在检测人类动作的各种方法中,计算机视觉已迅速成为最受欢迎和研究最广泛的方法之一。它的关键优势在于可以直接从图像和视频中提取丰富的细节。通过逐帧查看像素并分析运动模式,它可以在不需要人们佩戴额外设备的情况下实时识别活动。

深度学习领域的最新进展,尤其是专门用于分析图像的卷积神经网络 (CNN),使得计算机视觉变得更快、更准确且更可靠。

例如,广泛使用的尖端计算机视觉模型,如 Ultralytics YOLO11,就是建立在这些进步基础上的。YOLO11 支持对象检测、实例分割、在视频帧中跟踪人员以及估计人体姿势等任务,使其成为人类行为识别的绝佳工具。

Link to this sectionUltralytics YOLO11 概览#

Ultralytics YOLO11 是一款专为速度和精度而设计的视觉 AI 模型。它支持诸如对象检测、对象跟踪和 姿势估计 等核心计算机视觉任务。这些功能对于人类行为识别特别有用。

对象检测用于识别和定位场景中的人,跟踪用于在视频帧中跟随他们的动作以识别动作序列,姿势估计则映射人体关键关节,以区分相似的活动或检测如跌倒之类的突发变化。

例如,来自模型的见解可用于区分某人安静地坐着、然后站起来,最后举起双臂欢呼。这些简单的日常动作乍一看可能很相似,但当按顺序分析时,其含义却大不相同。

使用 Ultralytics YOLO11 进行姿态估计

图 3. 使用 Ultralytics YOLO11 进行姿势估计。(来源)

Link to this section计算机视觉与 HAR 的实际应用#

接下来,让我们仔细看看由计算机视觉支持的人类行为识别是如何应用于影响我们日常生活的实际用例中的。

Link to this section医疗保健与健康#

医疗保健 领域,运动的微小变化可以为人的病情提供有用的见解。例如,老年患者的踉跄或康复期间肢体的角度可能揭示风险或进展。这些迹象通过检查等传统手段通常很容易被忽视。

YOLO11 可以通过使用姿势估计和图像分析实时监测患者来提供帮助。它可用于检测跌倒、跟踪康复锻炼以及观察日常活动,如行走或伸展。因为它通过视觉分析工作而不需要传感器或可穿戴设备,所以它提供了一种收集支持患者护理的准确信息的简单方法。

使用 YOLO11 姿态估计追踪身体动作

图 4. 跟踪身体动作,使用 YOLO11 的姿势估计支持。(来源)

Link to this section安全与监视#

安全系统依赖于快速检测异常的人类活动,例如有人徘徊、在限制区域奔跑或表现出突然的侵略性。在保安无法手动观察所有事物的繁忙环境中,这些迹象经常被错过。这就是计算机视觉和 YOLO11 的用武之地。

YOLO11 通过支持实时视频监控使 安全监控 变得更容易,该监控可以检测可疑动作并发送即时警报。它支持公共场所的人群安全,并加强了私人区域的入侵检测。

通过这种方法,保安人员可以与计算机视觉系统协同工作,建立一种人机交互和合作伙伴关系,从而能够更快、更及时地响应可疑活动。

Link to this section使用计算机视觉进行 HAR 的优缺点#

以下是使用计算机视觉进行人类行为识别的一些优点:

  • 可扩展性: 一旦设置好,同一个识别系统就可以同时自动监控多人,这使得它在医疗机构、工厂和公共场所的自动化中非常有用。
  • 实时处理: 视觉 AI 解决方案 可用于分析正在发生的视频流,从而实现更快的响应。
  • 非侵入式跟踪: 与可穿戴设备或传感器不同,它不需要人们携带设备,从而允许进行自然且轻松的行为分析。

虽然使用计算机视觉进行 HAR 有许多好处,但也存在需要考虑的局限性。以下是一些需要牢记的因素:

  • 隐私问题: 基于视频的监控会引发围绕数据保护和同意的问题,特别是在家庭或工作场所等敏感环境中。
  • 潜在偏差: 如果训练数据集缺乏多样性,算法可能会误解某些特定人群的动作,从而导致不公平或不准确的结果。
  • 环境敏感性: 由于光线较差、背景杂乱或人员部分被遮挡,准确性可能会下降,这意味着系统需要经过仔细设计。

Link to this section关键要点#

人工智能和计算机视觉使机器能够更准确地实时识别人类动作成为可能。通过分析视频帧和运动模式,这些系统可以识别日常手势和突发变化。随着技术的不断进步,人类行为识别正在超越研究实验室,成为医疗保健、安全和日常应用中实用的工具。

通过访问我们的 GitHub repository 并加入我们的 community 来探索更多关于 AI 的信息。查看我们的解决方案页面,了解 AI in roboticscomputer vision in manufacturing。了解 our licensing options 以开始使用视觉 AI。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅