遇见 YOLO26: 下一代视觉 AI。
Ultralytics
指南

探索计算机视觉如何应用于注视点检测

了解对象检测和姿态估计等视觉 AI 技术如何应用于各种应用中的眼动跟踪和注视点检测。

ABAbirami Vina
5 min read
用于注视点检测的眼动跟踪计算机视觉

计算机视觉是人工智能 (AI) 的一个分支,致力于使机器能够以类似于人类的方式分析和解释视觉数据。视觉 AI 的一个引人入胜的应用是注视点检测,它使机器能够跟踪并理解人正在看向何处。

作为人类,我们可以自然地跟随他人的视线并理解他们在关注什么。例如,如果你正在和朋友交谈,而他们突然看向门口,你可能会本能地转头去看是什么引起了他们的注意。相比之下,机器没有这种天生能力——它们需要使用计算机视觉技术进行训练,才能识别眼球运动并解释注视方向。

随着全球注视点检测市场预计到 2032 年达到 119 亿美元,许多行业正在将其用于不同的应用场景。例如,汽车中的注视点检测正被用于通过监测注意力水平以及检测困倦或分心迹象来提高驾驶员的安全性。

在本文中,我们将探索计算机视觉如何用于眼动跟踪和注视点检测。我们还将研究它在各个行业中的一些关键应用。让我们开始吧!

Link to this section什么是眼动跟踪和注视点检测?#

眼动跟踪和注视点检测是通过分析眼球运动和注视方向来确定一个人注意焦点的技术。得益于 AI 和传感器技术的进步,现在已经可以实时跟踪人的眼睛。

传统上,大多数眼动跟踪系统依赖于红外 (IR) 摄像机,它们通过近红外光照射眼睛并捕捉角膜反射来检测瞳孔运动。这些系统提供了高精度。然而,它们通常需要佩戴专门的头戴设备,这不仅佩戴不舒服,还容易出现校准问题。

With the rise of AI, researchers have been actively exploring computer vision-based eye tracking methods. Unlike traditional IR-based systems, these approaches rely on computer vision models like Ultralytics YOLO11 to detect facial features such as eyes and pupils, as well as perform head pose estimation. Beyond this, specialized deep learning models like NVIDIA's GazeNet are designed specifically for gaze estimation.

YOLO11检测人眼和瞳孔

图 1. 使用 YOLO11 检测人的眼睛和瞳孔的示例。

虽然这仍是一个不断发展的领域,但基于计算机视觉的注视跟踪有潜力使眼动跟踪更易于使用,从而降低成本并改善其在市场营销、心理学和神经科学等领域的应用。

Link to this section注视点检测和眼动跟踪的演变#

接下来,让我们探讨从传统的红外系统向更易于访问的软件驱动解决方案的转变。

你可能想知道如果没有 AI 是否可以进行眼动跟踪和注视点检测——那么为什么还在不断研究将 AI 和计算机视觉集成到这些技术中呢?虽然传统的眼动跟踪方法确实存在,但它们通常依赖于昂贵且笨重的专用红外摄像机和头戴式眼动仪,并且需要受控的照明条件。然而,人工智能驱动的解决方案使通过标准网络摄像头和智能手机摄像头进行眼动跟踪成为可能,从而降低了成本并提高了可访问性。

头戴式眼动追踪设备

图 2. 一款头戴式眼动仪设备。

以下是推动眼动跟踪和注视点检测技术演变的其他一些因素:

  • 应用:软件驱动的方法使这一领域能够从科研扩展到消费类设备以及游戏等领域。
  • 可扩展性:AI 可以介入,使注视点检测解决方案适用于更广泛的受众,从个人用户到大型行业。
  • 摄像机技术的进步:今天,我们能够使用更高分辨率的智能手机和网络摄像头来提高眼动跟踪的准确性——这在 20 年前是不可实现的。

Link to this section使用 Ultralytics YOLO11 进行注视点检测和眼动跟踪#

既然我们已经讨论了计算机视觉在眼动跟踪和注视点检测中的作用,让我们看看 YOLO11 如何在此发挥作用。

Ultralytics YOLO11 支持目标检测和姿态估计等任务。它在 COCO 数据集上经过预训练,在检测各种物体方面实现了高精度。具体而言,对于注视点检测解决方案,YOLO11 可以发挥辅助作用。

虽然它不能直接预测注视方向,但可以对其进行微调以检测面部、眼睛和瞳孔,这些是进行进一步分析的关键。一旦识别出这些特征,其他模型就可以处理眼球运动数据以估计注视方向。

例如,为了提高准确性,YOLO11 可以在 WIDER FACE 等数据集上进行自定义训练以进行人脸检测。此外,就 YOLO11 的姿态估计能力而言,它有助于跟踪头部方向,从而提高注视点检测的准确性。

YOLO11检测人脸

图 3。YOLO11 可用于检测人脸。

Link to this section注视点检测的实际应用#

由计算机视觉赋能的注视点检测在各行各业都有广泛的应用,从提高汽车行业的安全性到分析游戏中的专注度。让我们探索不同领域是如何利用这项技术的。

Link to this section游戏中的注视点跟踪#

眼动跟踪正被用于游戏中,以提供关于玩家注意力、决策制定和反应时间的实时见解。通过跟踪眼球运动,这项技术可以帮助玩家优化策略,增强训练计划,并通过直观地展示玩家在关键时刻看向哪里来提高观众参与度。

模拟赛车是一个有趣的例子,这是一种竞技性的虚拟赛车运动,玩家使用逼真的驾驶模拟进行比赛。眼动跟踪有助于分析驾驶员如何聚焦赛道、对对手做出反应以及如何通过急转弯。通过实时跟踪他们的视线,教练可以识别行为模式、发现分心因素并改进赛车策略。

用于监控和分析模拟赛车手的眼动追踪

图 4. 眼动跟踪可用于监测和分析模拟赛车手。

除了模拟赛车外,眼动跟踪还被用于快节奏的竞技游戏中,以分析玩家的反应速度、反应时间以及他们如何关注游戏内的关键元素。通过了解玩家在采取行动前看向哪里,这些数据有助于优化决策、提高精度并增强高水平游戏玩法的训练。

Link to this section心理学研究的注视点估计#

视觉 AI 在注视点估计方面有许多与研究相关的应用。一个很好的例子是它在心理学中用于研究注意力、认知负荷和社会行为。通过分析眼球运动,研究人员可以获得对感知、决策以及自闭症和 ADHD 等心理健康状况的洞察。

具体来说,使用计算机视觉的注视跟踪有助于识别眼球运动、注视持续时间和视觉注意力的模式,从而揭示认知和情绪状态。随着深度学习和 AI 驱动的注视点估计的进步,这些方法正变得越来越准确和易于使用,从而在神经学研究中实现了更广泛的应用。

Link to this section汽车安全#

多年来,研究人员使用不同的方法来研究驾驶员在不同交通状况下的注意力和专注度。在这些方法中,眼动跟踪至关重要,它可以深入了解驾驶员在驾驶时看向何处。

借助计算机视觉模型,注视点检测可以通过实时准确跟踪眼球运动进一步改善这种分析。这种分析可以让我们更好地理解驾驶员的行为,有助于识别分心、疲劳或注意力不集中的情况,从而提高道路安全并辅助开发高级驾驶辅助系统。

使用人脸检测和视线追踪监控驾驶员

图 5。使用人脸检测和注视跟踪监测驾驶员的示例。

例如,如果驾驶员经常看向路外检查手机或在十字路口反应缓慢,系统可以检测到这些行为并发出警报以重新集中注意力,从而可能预防事故。

Link to this section眼动跟踪和注视点检测的优缺点#

以下是眼动跟踪和注视点检测技术能为我们的日常生活带来的一些主要益处:

  • 提高意识:眼动跟踪提供了关于人们如何以视觉方式与周围环境交互的见解,有助于更好地理解注意力模式。
  • 更好的决策:从眼动跟踪收集的数据有助于研究人员和专业人士基于客观的注意力模式做出明智的决策。
  • 改善视觉人体工程学:分析注视行为有助于设计能够减少眼睛疲劳并提高舒适度的屏幕、工作空间和环境。

虽然这些好处突显了注视点检测如何对我们的生活产生积极影响,但考虑其实施过程中涉及的挑战也很重要。以下是要牢记的一些主要局限性:

  • 隐私问题:持续的眼动跟踪可能会引发隐私问题,让用户感到不适。确保透明度、用户同意以及本地数据处理有助于减轻这些担忧。

  • 高计算需求:实时注视跟踪可能需要强大的硬件,这限制了其在低功耗设备上的可访问性。然而,经过优化的模型正在帮助提高效率。

  • 准确性局限:由于照明变化、头部运动或眼镜和头发等障碍物,注视跟踪在现实环境中的可靠性可能会降低。摄像机角度也会影响性能。

Link to this section着眼未来#

在像 YOLO11 这样的计算机视觉模型的支持下,眼动跟踪和注视点检测正在改变我们与世界互动的方式。从提高道路安全到理解人类行为,这项技术在日常生活中正变得越来越有用。

尽管存在隐私问题和对强大计算机需求等挑战,但 AI 和计算机视觉的进步正在使眼动跟踪变得更加准确且更易于使用。随着它的不断改进,它可能会在各个行业中发挥更大的作用。

欲了解更多信息,请访问我们的 GitHub 仓库 并加入我们的社区。请在我们的解决方案页面上探索自动驾驶汽车 AI农业计算机视觉 等行业的创新成果。查看我们的许可选项,让你的视觉 AI 项目变为现实。🚀

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅