敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

卡尔曼滤波器 (KF)

了解卡尔曼滤波器如何优化 AI、跟踪、传感器融合、机器人技术等领域的的状态估计,即使在嘈杂的数据下也是如此。

卡尔曼滤波器 (KF) 是一种强大的算法,用于根据一系列不完整和嘈杂的测量值来估计动态系统的状态。它由 Rudolf E. Kálmán 开发,最初的目的是用于航空航天导航,但后来已成为许多领域的基础,包括机器人技术、经济学,尤其是计算机视觉 (CV)。该滤波器以两步循环工作:它首先预测系统的未来状态以及该预测的不确定性,然后通过合并新的测量值来更新其估计。这个过程使其能够对物体的状态(例如其位置和速度)进行平滑而准确的估计,即使传感器数据不精确。

卡尔曼滤波器在人工智能和计算机视觉中的工作原理

在人工智能领域,卡尔曼滤波器最常用于目标跟踪。在像Ultralytics YOLO这样的目标检测模型识别出一个帧中的目标后,卡尔曼滤波器用于预测它们在下一帧中的位置。这种预测基于运动模型,该模型通常假设恒定速度或恒定加速度。

当下一帧到达时,检测模型提供新的测量值(即,新的边界框坐标)。 然后,卡尔曼滤波器执行其“更新”步骤,根据此新数据校正其初始预测。 此过程非常有效,原因如下:

  • 噪声消除:它可以消除抖动的检测结果,从而产生更稳定的跟踪路径。
  • 遮挡处理: 如果检测器在几帧内未能看到某个物体(例如,汽车行驶到树后),则滤波器可以继续预测其位置,从而使跟踪器能够在物体重新出现时重新识别该物体。
  • 状态估计:它提供了对物体状态的更全面的理解,而不仅仅是其当前位置,还包括其速度。您可以在这篇详细的卡尔曼滤波器可视化介绍中了解更多关于核心概念的信息。

该滤波器递归处理测量值的能力使其具有计算效率,非常适合实时推理。许多流行的跟踪算法,如 SORT(简单在线和实时跟踪)和 ByteTrack,都使用卡尔曼滤波器作为其核心运动预测组件。Ultralytics 模型(如 YOLO11)在其 track 模式 中利用此类跟踪器。

实际应用

卡尔曼滤波器是无数现代系统中不可或缺的一部分。以下是一些示例:

  1. 自动驾驶汽车:在自动驾驶汽车中,卡尔曼滤波器对于传感器融合至关重要。来自各种传感器(如摄像头、GPS、LiDAR 和 IMU)的数据都存在噪声并且具有不同的更新速率。该滤波器结合了这些数据,从而生成对车辆位置、速度以及道路上其他物体的轨迹的单一、高度准确且可靠的估计。这对于我们的 汽车解决方案中的 AI 的安全导航和决策至关重要。
  2. 智能监控的行人跟踪: 安全系统通常使用目标跟踪来监控公共场所。在 YOLO 模型检测到行人后,基于卡尔曼滤波器的跟踪器会为每个人分配一个唯一的 ID,并在摄像头的视野范围内跟踪他们。这支持诸如自动对象计数、异常检测和队列管理等应用。该滤波器的预测能力确保即使一个人被其他人或物体暂时遮挡,其轨迹也不会丢失,这是增强智能监控的关键特性。

相关概念和区别

区分卡尔曼滤波器和相关术语非常重要:

  • 扩展卡尔曼滤波器 (EKF): 标准卡尔曼滤波器假设系统动力学是线性的。然而,许多现实世界的系统(如转弯的汽车)是非线性的。EKF 通过在每个时间步线性化模型来扩展卡尔曼滤波器以处理 非线性系统
  • 无迹卡尔曼滤波器 (UKF): 对于 EKF 线性化不足的高度非线性系统,UKF 提供了一种更准确的替代方案,无需计算雅可比矩阵,如本无迹卡尔曼滤波器简介中所述。
  • 粒子滤波器: 这些是用于非线性、非高斯系统的另一种替代方案,通常用于机器人技术中的定位和建图。与卡尔曼滤波器不同,它们使用一组随机样本(粒子)来表示概率分布。

在 Ultralytics 框架中,您可以找到卡尔曼滤波器,它被实现为我们跟踪算法的实用程序。诸如OpenCV 之类的库也提供了它们自己的卡尔曼滤波器实现,该实现在计算机视觉项目中被广泛使用。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板