敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024

关于使用 Ultralytics YOLO 模型跟踪视频中移动物体的指南

Abirami Vina

5 分钟阅读

2025年4月15日

了解计算机视觉跟踪系统的工作原理,探索支持目标跟踪的流行模型(如 YOLO11),并发现它们的实际应用。

可以组装电气零件的机器人、可以捕捉超速行驶汽车的系统以及可以跟踪客户购物方式的智能零售解决方案——所有这些创新都依赖于计算机视觉。它是人工智能 (AI) 的一个分支,可帮助机器分析和理解图像和视频。

例如,机器人需要识别并遵循不同的零件才能正确地将它们组装在一起。同样,交通系统可以使用计算机视觉来识别汽车、读取车牌,并确定某人何时超速。同时,在商店中,视觉 AI 可以帮助跟踪顾客正在看或拿起的东西,甚至可以监控库存。

此类应用由 Ultralytics YOLO11 等计算机视觉模型提供支持,这些模型支持各种视觉任务。许多此类任务侧重于从单个图像中收集见解,但一项特别有趣的任务,目标跟踪,可用于跟踪对象在一系列图像或视频帧中的移动。

__wf_reserved_inherit
图 1. 检测和跟踪车辆的示例。

在本指南中,我们将更详细地了解对象跟踪的工作原理,并探讨它在现实世界中的应用案例。我们还将讨论像 Ultralytics YOLO11 这样的 Vision AI 模型如何支持对象跟踪。让我们开始吧!

计算机视觉跟踪系统详解

目标跟踪是一种 计算机视觉任务,用于跟踪物体在视频帧中的移动,帮助系统监控和理解事物如何随时间变化。这与人类如何自然地用眼睛跟随移动的人或物体非常相似,就像您在观看网球比赛时,您的眼睛会跟踪球在球场上来回移动一样。

同样,目标跟踪涉及使用摄像头和 AI 来实时跟踪球的运动。这项技术可以让家中的观众更好地了解比赛的流程,特别是通过速度、轨迹和球员位置等分析。

虽然这种视觉跟踪对人类来说似乎毫不费力,但对于机器视觉而言,它涉及一系列由视觉 AI 模型驱动的步骤。以下是对象跟踪工作原理的简单分解: 

  • 捕获视频: 摄像头记录视频素材,捕捉物体随时间推移在场景中的移动方式。
  • 检测物体:AI 驱动的计算机视觉模型(如 YOLO11)可以分析每个帧以识别和定位特定物体,例如人、车辆或产品。
  • 分配身份:一旦检测到对象,跟踪算法会为其分配一个唯一的 ID,以便在多个帧中跟踪它,从而确保系统知道即使对象移动,它也是同一个对象。
  • 监控运动: 该系统会随时间推移跟踪运动,并且此数据可用于收集速度、方向以及与其他对象的交互等数据。
  • 生成见解:此信息可用于实时提供分析、辅助决策或支持视觉叠加——具体取决于特定用例。

YOLO 在目标检测和跟踪方面的比较

YOLO11 支持的另一个计算机视觉任务是与目标跟踪密切相关的 目标检测。让我们探讨一下这两个任务之间的区别。 

目标检测涉及识别和定位单个图像或视频帧中感兴趣的目标。例如,自动驾驶汽车使用目标检测来识别车载摄像头在单个帧中捕获的停车标志或行人。它回答了问题:“这张图片里有什么,在哪里?”但是,它不提供有关目标接下来去哪里的任何信息。

目标跟踪建立在目标检测的基础上,增加了对随时间推移的运动的理解。两者之间的主要区别在于它们如何处理时间和运动。目标检测将每一帧视为一个独立的快照,而目标跟踪则连接帧之间的点,使用过去的数据来预测目标的未来位置。

通过将两者结合起来,我们可以构建强大的视觉 AI 系统,能够在动态环境中进行实时跟踪。例如,自动安全系统可以检测到进入空间的人员,并持续跟踪他们在画面中的移动

使用 Ultralytics YOLO 模型进行实时跟踪

既然我们已经了解了目标检测和目标跟踪之间的区别,接下来让我们看看 Ultralytics YOLO 模型(如 YOLO11)如何支持实时目标跟踪。

虽然 YOLO 模型本身不是跟踪算法,但它们通过检测每个视频帧中的对象来发挥重要作用。一旦检测到对象,就需要跟踪算法为它们分配唯一的 ID,从而使系统能够跟踪它们从一帧到另一帧的移动。 

为了满足这一需求,Ultralytics Python包 将目标检测与流行的跟踪算法(如BoT-SORT和ByteTrack)无缝集成。这种集成使用户能够以最少的设置一起运行检测和跟踪。

当使用YOLO模型进行目标跟踪时,您可以根据应用程序的需求选择要应用的跟踪算法。例如,BoT-SORT由于使用了运动预测和深度学习,因此是跟踪不可预测移动物体的理想选择。另一方面,ByteTrack在拥挤的场景中表现特别出色,即使物体模糊或部分隐藏,也能保持可靠的跟踪。

__wf_reserved_inherit
图 2.  Ultralytics Python 包无缝集成了 BoT-SORT 和 ByteTrack。

自定义 YOLO 模型训练与目标跟踪有何关系?

自定义训练是指在特定数据集上微调预训练的目标检测模型(如 YOLO11)的过程,使其能够识别标准数据集中未包含的对象。当你的跟踪系统需要跟踪自定义或不常见的对象时,这一点尤其重要。

跟踪系统依赖于检测模型首先识别对象。如果 YOLO 模型无法检测到特定项目(例如特定类型的机械或野生动物),则跟踪算法将无法跟踪它。

这就是自定义训练至关重要的原因:它可以确保检测模型能够准确识别您要跟踪的对象。

同样重要的是要记住,在此过程中只会对检测模型进行微调。诸如 BoT-SORT 或 ByteTrack 之类的跟踪算法不会进行自定义训练 - 它们只是使用 YOLO 模型的输出来跟踪跨帧检测到的对象。

使用 Ultralytics YOLO 进行目标跟踪的应用

现在我们对什么是目标跟踪以及它是如何工作的有了更好的理解,让我们探索一下这项技术正在产生影响的一些实际应用。

使用 Ultralytics YOLO 进行实时跟踪以进行速度估计

由计算机视觉支持的 速度估计系统依赖于对象检测和跟踪等任务。这些系统旨在计算物体的移动速度——无论是车辆、骑自行车的人,甚至是人。此信息对于从交通管理到安全监控和工业自动化的各种应用至关重要。

使用像 Ultralytics YOLO11 这样的模型,可以检测和跟踪视频帧中的物体。通过分析物体在特定时间段内移动的距离,系统可以估计其速度。 

__wf_reserved_inherit
图 3. 使用 YOLO11 对目标跟踪的支持进行速度估计。

探索制造业中的目标跟踪

制造过程可能节奏很快且高度复杂,因此很难手动跟踪生产的每个项目。对象跟踪提供了一个很好的解决方案,可以自动监控产品在生产的每个阶段的移动。它可以帮助工厂保持高水平的准确性和效率,而不会降低速度。

从计算传送带上的产品数量到发现缺陷或验证正确的装配,对象跟踪为原本耗时或容易出错的任务带来了可见性和控制力。这项技术在高产量行业(如食品加工、电子和包装)中尤其具有影响力,在这些行业中,速度和精度至关重要。

__wf_reserved_inherit
图 4. 使用 YOLO11 跟踪和计数装配线上食品产品的示例。

零售分析中的对象跟踪概述

每天都有无数顾客进出 零售店,了解他们的行为是改善客户体验和业务绩效的关键。通过物体追踪,零售商可以监测客流量、测量顾客停留时间并分析移动模式,而无需采用侵入式或人工方法。

通过跟踪顾客进入、离开并在整个商店中移动的情况,企业可以深入了解高峰时段、热门区域,甚至排队长度。这些见解可以为人员配置、商店布局和库存放置等方面的决策提供信息,最终提高运营效率并增加销售额。

__wf_reserved_inherit
图 5. 使用 YOLO11 的对象跟踪功能来监控进出商店的人员。

目标跟踪的利弊

从零售商店到工厂车间,物体追踪被应用于各行各业,以提高效率、安全性以及整体体验等因素。以下是物体追踪可以为各行业带来的主要优势:

  • 实现实时警报: 与对象跟踪集成的系统可以配置为在检测到异常情况时自动触发警报,例如人员进入限制区域或包裹在某个位置停留时间过长。
  • 与其他系统集成:对象跟踪数据可以与其他技术(如面部识别、热像仪或库存系统)结合使用,以获得更强大的洞察力。
  • 长期来看,具有成本效益:虽然初始设置可能需要投资,但自动化跟踪减少了对人工的需求,降低了错误率,并随着时间的推移降低了运营成本。

虽然这些优势突出了对象跟踪如何对不同的用例产生积极影响,但考虑其实现所涉及的挑战也很重要。让我们仔细看看对象跟踪的一些局限性:

  • 拥挤环境中的困难:在像音乐会、购物中心或城市街道这样繁忙的环境中,跟踪系统可能难以区分靠得很近的人或物体,从而导致混淆或不准确的结果。
  • 对环境条件敏感: 光线不足、雾、快速移动或相机抖动会影响系统准确跟踪对象的能力,尤其是在室外或不受控制的环境中。
  • 隐私和法律问题: 不当处理个人数据、缺乏用户同意或在公共场所进行监视可能会引发伦理问题,并导致不遵守隐私法。

主要要点

目标跟踪是一种计算机视觉任务,使机器能够跟踪物体随时间的移动。它被广泛应用于现实世界的各种场景中——从估计车速和计算装配线上的产品数量到分析体育运动中运动员的动作。

借助 YOLO11 等视觉 AI 模型以及 BoT-SORT 和 ByteTrack 等跟踪算法,物体跟踪在不同行业变得更快、更智能、更易于使用。随着物体跟踪技术的不断发展,它正在帮助系统变得更加智能、高效和响应迅速,逐帧提升性能。

想了解更多关于计算机视觉和人工智能的信息吗?请浏览我们的GitHub 仓库,与我们的社区互动,并查看我们的许可选项,以快速启动您的计算机视觉项目。如果您正在探索制造业中的人工智能汽车行业中的计算机视觉等创新应用,请访问我们的解决方案页面以了解更多信息。 

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始
链接已复制到剪贴板