了解计算机视觉跟踪系统的工作原理,探索支持目标跟踪的流行模型(如 YOLO11),并发现它们的实际应用。

了解计算机视觉跟踪系统的工作原理,探索支持目标跟踪的流行模型(如 YOLO11),并发现它们的实际应用。
可以组装电气零件的机器人、可以捕捉超速行驶汽车的系统以及可以跟踪客户购物方式的智能零售解决方案——所有这些创新都依赖于计算机视觉。它是人工智能 (AI) 的一个分支,可帮助机器分析和理解图像和视频。
例如,机器人需要识别并遵循不同的零件才能正确地将它们组装在一起。同样,交通系统可以使用计算机视觉来识别汽车、读取车牌,并确定某人何时超速。同时,在商店中,视觉 AI 可以帮助跟踪顾客正在看或拿起的东西,甚至可以监控库存。
此类应用由 Ultralytics YOLO11 等计算机视觉模型提供支持,这些模型支持各种视觉任务。许多此类任务侧重于从单个图像中收集见解,但一项特别有趣的任务,目标跟踪,可用于跟踪对象在一系列图像或视频帧中的移动。
在本指南中,我们将更详细地了解对象跟踪的工作原理,并探讨它在现实世界中的应用案例。我们还将讨论像 Ultralytics YOLO11 这样的 Vision AI 模型如何支持对象跟踪。让我们开始吧!
目标跟踪是一种 计算机视觉任务,用于跟踪物体在视频帧中的移动,帮助系统监控和理解事物如何随时间变化。这与人类如何自然地用眼睛跟随移动的人或物体非常相似,就像您在观看网球比赛时,您的眼睛会跟踪球在球场上来回移动一样。
同样,目标跟踪涉及使用摄像头和 AI 来实时跟踪球的运动。这项技术可以让家中的观众更好地了解比赛的流程,特别是通过速度、轨迹和球员位置等分析。
虽然这种视觉跟踪对人类来说似乎毫不费力,但对于机器视觉而言,它涉及一系列由视觉 AI 模型驱动的步骤。以下是对象跟踪工作原理的简单分解:
YOLO11 支持的另一个计算机视觉任务是与目标跟踪密切相关的 目标检测。让我们探讨一下这两个任务之间的区别。
目标检测涉及识别和定位单个图像或视频帧中感兴趣的目标。例如,自动驾驶汽车使用目标检测来识别车载摄像头在单个帧中捕获的停车标志或行人。它回答了问题:“这张图片里有什么,在哪里?”但是,它不提供有关目标接下来去哪里的任何信息。
目标跟踪建立在目标检测的基础上,增加了对随时间推移的运动的理解。两者之间的主要区别在于它们如何处理时间和运动。目标检测将每一帧视为一个独立的快照,而目标跟踪则连接帧之间的点,使用过去的数据来预测目标的未来位置。
通过将两者结合起来,我们可以构建强大的视觉 AI 系统,能够在动态环境中进行实时跟踪。例如,自动安全系统可以检测到进入空间的人员,并持续跟踪他们在画面中的移动。
既然我们已经了解了目标检测和目标跟踪之间的区别,接下来让我们看看 Ultralytics YOLO 模型(如 YOLO11)如何支持实时目标跟踪。
虽然 YOLO 模型本身不是跟踪算法,但它们通过检测每个视频帧中的对象来发挥重要作用。一旦检测到对象,就需要跟踪算法为它们分配唯一的 ID,从而使系统能够跟踪它们从一帧到另一帧的移动。
为了满足这一需求,Ultralytics Python包 将目标检测与流行的跟踪算法(如BoT-SORT和ByteTrack)无缝集成。这种集成使用户能够以最少的设置一起运行检测和跟踪。
当使用YOLO模型进行目标跟踪时,您可以根据应用程序的需求选择要应用的跟踪算法。例如,BoT-SORT由于使用了运动预测和深度学习,因此是跟踪不可预测移动物体的理想选择。另一方面,ByteTrack在拥挤的场景中表现特别出色,即使物体模糊或部分隐藏,也能保持可靠的跟踪。
自定义训练是指在特定数据集上微调预训练的目标检测模型(如 YOLO11)的过程,使其能够识别标准数据集中未包含的对象。当你的跟踪系统需要跟踪自定义或不常见的对象时,这一点尤其重要。
跟踪系统依赖于检测模型首先识别对象。如果 YOLO 模型无法检测到特定项目(例如特定类型的机械或野生动物),则跟踪算法将无法跟踪它。
这就是自定义训练至关重要的原因:它可以确保检测模型能够准确识别您要跟踪的对象。
同样重要的是要记住,在此过程中只会对检测模型进行微调。诸如 BoT-SORT 或 ByteTrack 之类的跟踪算法不会进行自定义训练 - 它们只是使用 YOLO 模型的输出来跟踪跨帧检测到的对象。
现在我们对什么是目标跟踪以及它是如何工作的有了更好的理解,让我们探索一下这项技术正在产生影响的一些实际应用。
由计算机视觉支持的 速度估计系统依赖于对象检测和跟踪等任务。这些系统旨在计算物体的移动速度——无论是车辆、骑自行车的人,甚至是人。此信息对于从交通管理到安全监控和工业自动化的各种应用至关重要。
使用像 Ultralytics YOLO11 这样的模型,可以检测和跟踪视频帧中的物体。通过分析物体在特定时间段内移动的距离,系统可以估计其速度。
制造过程可能节奏很快且高度复杂,因此很难手动跟踪生产的每个项目。对象跟踪提供了一个很好的解决方案,可以自动监控产品在生产的每个阶段的移动。它可以帮助工厂保持高水平的准确性和效率,而不会降低速度。
从计算传送带上的产品数量到发现缺陷或验证正确的装配,对象跟踪为原本耗时或容易出错的任务带来了可见性和控制力。这项技术在高产量行业(如食品加工、电子和包装)中尤其具有影响力,在这些行业中,速度和精度至关重要。
每天都有无数顾客进出 零售店,了解他们的行为是改善客户体验和业务绩效的关键。通过物体追踪,零售商可以监测客流量、测量顾客停留时间并分析移动模式,而无需采用侵入式或人工方法。
通过跟踪顾客进入、离开并在整个商店中移动的情况,企业可以深入了解高峰时段、热门区域,甚至排队长度。这些见解可以为人员配置、商店布局和库存放置等方面的决策提供信息,最终提高运营效率并增加销售额。
从零售商店到工厂车间,物体追踪被应用于各行各业,以提高效率、安全性以及整体体验等因素。以下是物体追踪可以为各行业带来的主要优势:
虽然这些优势突出了对象跟踪如何对不同的用例产生积极影响,但考虑其实现所涉及的挑战也很重要。让我们仔细看看对象跟踪的一些局限性:
目标跟踪是一种计算机视觉任务,使机器能够跟踪物体随时间的移动。它被广泛应用于现实世界的各种场景中——从估计车速和计算装配线上的产品数量到分析体育运动中运动员的动作。
借助 YOLO11 等视觉 AI 模型以及 BoT-SORT 和 ByteTrack 等跟踪算法,物体跟踪在不同行业变得更快、更智能、更易于使用。随着物体跟踪技术的不断发展,它正在帮助系统变得更加智能、高效和响应迅速,逐帧提升性能。
想了解更多关于计算机视觉和人工智能的信息吗?请浏览我们的GitHub 仓库,与我们的社区互动,并查看我们的许可选项,以快速启动您的计算机视觉项目。如果您正在探索制造业中的人工智能和汽车行业中的计算机视觉等创新应用,请访问我们的解决方案页面以了解更多信息。