深圳Yolo 视觉
深圳
立即加入
词汇表

对象再识别(Re-ID)

发现物体再识别:利用外观嵌入技术匹配非重叠摄像机中的人员或车辆,以提高监控、零售分析和取证能力。

物体重新识别(Re-ID)是计算机视觉(CV)领域的一项专业技术,专注于在不同、非重叠的摄像机视图或较长时间段内关联特定物体或个体。 标准物体检测仅能识别单帧图像中物体的类别(如"人"或"车"),而Re-ID则判断特定检测到的物体是否与先前观察到的物体具有完全相同的身份。这种能力对于构建大规模环境中的运动关联理解至关重要——当单个摄像头无法覆盖整个区域时,它能有效串联分散的视觉观测点,形成连贯的运动轨迹认知。

重新识别如何运作

重新识别(Re-ID)的核心挑战在于:即使存在光照变化、姿势估计、摄像机角度及背景杂乱等因素,仍需实现身份匹配。为此,系统突破了简单边界框坐标的局限,转而分析目标的视觉内容。

  • 特征提取:当检测到物体时,深度学习(DL)模型会处理图像裁剪区域以生成特征向量,通常称为嵌入向量。该向量以数值形式表示高级视觉特征——例如服装的纹理或车辆的颜色。
  • 度量学习:系统采用度量学习确保同一对象的嵌入向量在数学上彼此接近,而不同对象的嵌入向量则相距甚远。为此通常会训练双胞胎神经网络等技术。
  • 相似度匹配:在推理过程中,系统会计算查询对象的嵌入向量与预先存储的身份库之间的余弦相似度 或欧几里得距离。若相似度得分超过特定阈值,则判定为匹配。

重新识别与目标跟踪

区分Re-ID与目标追踪至关重要, 因为它们在视觉管道中发挥着互补但 截然不同的作用。

  • 目标追踪:该过程通常由卡尔曼滤波等算法驱动,用于预测目标在相邻视频帧间的位置变化。其核心依赖于时间连续性与空间重叠特性,例如交并比(IoU)
  • 重新识别:当追踪失败时(例如物体被完全遮挡或离开一台摄像机视野进入另一台时),重新识别技术便发挥作用。它基于外观而非位置历史重建物体身份,从而实现分布式网络中稳健的多目标追踪(MOT)

实际应用

重新识别技术将孤立的检测结果转化为可操作的轨迹,从而在多个领域实现深度分析。

  • 智能城市安全: 在城市监控中,重新识别技术使操作员能够通过全市范围的交通摄像头网络track 特定track 或车辆。这对取证搜索至关重要,使当局无需人工审查数千小时的录像即可定位失踪儿童或嫌疑人。
  • 零售分析: 人工智能驱动的零售环境中,商店利用再识别技术 来理解顾客旅程通过在顾客穿梭于过道或楼层时重新识别其身份,零售商能够 生成热门路径的热力图并优化店铺 布局,同时通过分析数字嵌入而非生物特征数据来保障隐私。

基于再识别特征的追踪实现

现代模型如YOLO26YOLO11 可集成基于Re-ID概念的追踪器, 在复杂环境中维持目标身份识别。 UltralUltralytics 库中的BoT-SORT追踪器 融合运动特征与外观特征, 实现稳健性能。

以下示例演示了如何对视频文件应用此跟踪功能:

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Track objects in a video using BoT-SORT
# BoT-SORT uses appearance features to help re-identify objects after occlusions
results = model.track(source="path/to/video.mp4", tracker="botsort.yaml", persist=True)

# Process results
for result in results:
    if result.boxes.id is not None:
        print(f"Tracked IDs: {result.boxes.id.cpu().numpy()}")

要深入探索支撑这些功能的架构,建议回顾卷积神经网络(CNN) 和ResNet主干网络。理解这些基础知识有助于选择合适的训练数据,从而针对特定环境对定制化再识别模型进行微调。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入