词汇表

多目标跟踪 (MOT)

探索计算机视觉中的多目标跟踪（MOT）技术。学习如何Ultralytics 进行track detect track ，应用于自动驾驶、零售等领域。

多目标跟踪（MOT）是计算机视觉（CV）领域的一项动态任务，涉及在视频流中检测多个独立实体，并随时间推移维持其身份识别。与将每帧视为独立快照的标准目标检测不同，MOT为人工智能（AI）引入了时间维度。通过为每个检测到的实例（如人群中的特定行人或高速公路上的车辆）分配唯一标识号（ID），MOT算法使系统能够追踪轨迹、分析行为并理解交互关系。这种能力是现代视频理解的基础，使机器能够感知变化环境中的连续性。

MOT如何运作

大多数现代追踪系统采用"基于检测的追踪"范式。该方法将过程分为两个主要阶段：识别画面中的物体，然后将这些发现与过去已知的物体进行关联。

检测：在每个帧中，高性能模型（如YOLO26）扫描图像以定位物体，生成边界框和类别概率。
运动预测：为预判物体下一步移动方向，算法常采用卡尔曼滤波器。这种数学工具可估算动态系统的状态参数（如速度与位置），从而缩小后续帧的搜索范围。
数据关联：系统将新检测结果与现有轨迹进行匹配。优化方法如匈牙利算法通过最小化匹配成本来解决此分配问题，通常依赖于交并比（IoU）来衡量空间重叠程度。
重新识别（ReID）：当出现视觉障碍（即遮挡）时，先进的追踪器会利用视觉嵌入技术在目标物重新出现时识别其身份。这有助于防止"身份切换"现象，确保系统能够确认从隧道驶出的车辆与驶入时为同一辆车。

区分MOT与单目标跟踪

尽管术语相似，多目标跟踪（MOT）与单目标跟踪（SOT）存在显著差异。 SOT专注于追踪首个帧中初始化的特定目标，通常忽略其他所有实体。而MOT必须处理数量未知且不断变化的目标，这些目标可能随时进入或离开场景。这使得MOT在计算上要求更高，因为它需要强大的逻辑来处理track 、终止以及多个移动物体之间的复杂交互。

实际应用

同时track 实体的能力正推动多个主要行业的创新发展。

自动驾驶：无人驾驶汽车高度依赖运动目标检测（MOT）实现安全导航。通过追踪行人、骑行者及其他车辆，自动驾驶系统能够预测目标未来位置以规避碰撞。该过程通常融合摄像头与激光雷达传感器的数据，以确保最高可靠性。
零售分析：在实体店铺中，零售商运用零售人工智能技术绘制顾客旅程图。热力图算法生成客流热力图，帮助管理者优化店铺布局，并在高峰时段改善排队管理。
运动数据分析：职业球队运用运动轨迹追踪技术（MOT）分析球员跑动轨迹与阵型布局。通过追踪场上每位球员，教练可借助姿势估计提取关于速度、跑动距离及战术站位的详细数据指标。

使用Python实现MOT算法

Ultralytics 使用尖端模型实现追踪Ultralytics 简单明了。 track() 该方法无缝集成了检测与跟踪逻辑，支持诸如...等算法。字节跟踪和 BoT-SORT下面的示例演示了如何在视频中使用推荐的 YOLO26模型.

from ultralytics import YOLO

# Load the official YOLO26 small model
model = YOLO("yolo26s.pt")

# Track objects in a video file (or use '0' for webcam)
# The 'persist=True' argument keeps track IDs consistent between frames
results = model.track(source="traffic_analysis.mp4", show=True, persist=True)

# Print the IDs of objects tracked in the first frame
if results[0].boxes.id is not None:
    print(f"Tracked IDs: {results[0].boxes.id.int().tolist()}")

多目标跟踪中的挑战

尽管技术不断进步，物体追踪（MOT）仍是一项充满挑战的领域。遮挡是主要难题之一：当物体路径交叉或被障碍物遮挡时，维持物体身份识别变得极为复杂。拥挤场景（如繁忙的马拉松赛场或飞鸟群）将数据关联算法的极限推向极致。此外，在处理高分辨率视频流的同时保持实时推理速度，需要高效的模型架构，通常NVIDIA 专用硬件设备。

为应对这些挑战，研究人员正探索端到端深度学习方法，将检测与追踪功能整合到单一网络中，同时借助Ultralytics 对高难度数据集进行标注，并训练出稳健的定制模型。

多目标跟踪 (MOT)

培训Ultralytics YOLO 模型，以简化各行业的工作流程

灵活的企业许可解决方案，助力您的创新

使用Ultralytics YOLO在数秒内训练人工智能模型

MOT如何运作

区分MOT与单目标跟踪

实际应用

使用Python实现MOT算法

多目标跟踪中的挑战

阅读更多此类别的内容

12个基于计算机视觉的航拍影像应用场景

什么是单目深度估计？概述

Ultralytics YOLO 进行人工智能威胁检测

加入Ultralytics 社区