Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024
Bảng chú giải thuật ngữ

Bộ lọc Kalman (Kalman Filter - KF)

Khám phá cách Bộ lọc Kalman tối ưu hóa việc ước tính trạng thái trong AI, theo dõi, kết hợp cảm biến, robot học, v.v., ngay cả với dữ liệu nhiễu.

Bộ lọc Kalman (KF) là một thuật toán mạnh mẽ được sử dụng để ước tính trạng thái của một hệ thống động từ một loạt các phép đo không đầy đủ và nhiễu. Được phát triển bởi Rudolf E. Kálmán, mục đích ban đầu của nó là để điều hướng trong ngành hàng không vũ trụ, nhưng kể từ đó nó đã trở thành nền tảng trong nhiều lĩnh vực, bao gồm robot học, kinh tế học và đặc biệt là thị giác máy tính (CV). Bộ lọc hoạt động theo chu kỳ hai bước: đầu tiên nó dự đoán trạng thái tương lai của hệ thống và sự không chắc chắn của dự đoán đó, sau đó nó cập nhật ước tính của mình bằng cách kết hợp một phép đo mới. Quá trình này cho phép nó tạo ra một ước tính mượt mà và chính xác về trạng thái của một đối tượng, chẳng hạn như vị trí và vận tốc của nó, ngay cả khi dữ liệu cảm biến không chính xác.

Cách bộ lọc Kalman hoạt động trong AI và thị giác máy tính

Trong bối cảnh AI, Bộ lọc Kalman được sử dụng nổi bật nhất để theo dõi đối tượng. Sau khi một mô hình phát hiện đối tượng như Ultralytics YOLO xác định các đối tượng trong một khung hình, Bộ lọc Kalman được sử dụng để dự đoán vị trí của chúng trong khung hình tiếp theo. Dự đoán này dựa trên một mô hình chuyển động, thường giả định vận tốc không đổi hoặc gia tốc không đổi.

Khi khung hình tiếp theo đến, mô hình phát hiện cung cấp các phép đo mới (tức là tọa độ hộp giới hạn mới). Sau đó, Bộ lọc Kalman thực hiện bước "cập nhật" của nó, sửa chữa dự đoán ban đầu của nó dựa trên dữ liệu mới này. Quá trình này rất hiệu quả vì một số lý do:

  • Noise Reduction (Giảm Nhiễu): Nó làm mịn các phát hiện rung lắc, dẫn đến các đường dẫn theo dõi ổn định hơn.
  • Xử lý tắc nghẽn: Nếu một detector không nhìn thấy một đối tượng trong một vài khung hình (ví dụ: một chiếc xe hơi đi sau một cái cây), bộ lọc có thể tiếp tục dự đoán vị trí của nó, cho phép bộ theo dõi xác định lại đối tượng khi nó xuất hiện trở lại.
  • Ước tính Trạng thái: Nó cung cấp một sự hiểu biết toàn diện hơn về trạng thái của một đối tượng ngoài vị trí hiện tại của nó, bao gồm cả vận tốc của nó. Bạn có thể tìm hiểu thêm về các khái niệm cốt lõi trong giới thiệu trực quan chi tiết về Bộ lọc Kalman này.

Khả năng xử lý đệ quy các phép đo của bộ lọc giúp nó hiệu quả về mặt tính toán và lý tưởng cho suy luận theo thời gian thực. Nhiều thuật toán theo dõi phổ biến, chẳng hạn như SORT (Simple Online and Realtime Tracking) và ByteTrack, sử dụng Bộ lọc Kalman làm thành phần dự đoán chuyển động cốt lõi của chúng. Các mô hình Ultralytics như YOLO11 tận dụng các trình theo dõi như vậy trong chế độ theo dõi (track mode) của chúng.

Các Ứng dụng Thực tế

Bộ lọc Kalman (Kalman Filters) là không thể thiếu đối với vô số hệ thống hiện đại. Dưới đây là một vài ví dụ:

  1. Xe tự hành: Trong xe tự hành, Bộ lọc Kalman rất cần thiết cho kết hợp cảm biến (sensor fusion). Dữ liệu từ các cảm biến khác nhau như camera, GPS, LiDAR và IMU đều nhiễu và có tốc độ cập nhật khác nhau. Bộ lọc kết hợp dữ liệu này để tạo ra một ước tính duy nhất, có độ chính xác cao và đáng tin cậy về vị trí, vận tốc của xe và quỹ đạo của các vật thể khác trên đường. Điều này rất quan trọng để điều hướng an toàn và ra quyết định trong các giải pháp AI trong ngành ô tô của chúng tôi.
  2. Theo dõi người đi bộ cho giám sát thông minh: Các hệ thống an ninh thường sử dụng theo dõi đối tượng để giám sát các không gian công cộng. Sau khi mô hình YOLO phát hiện người đi bộ, một trình theo dõi dựa trên Bộ lọc Kalman sẽ gán cho mỗi người một ID duy nhất và theo dõi họ trong tầm nhìn của camera. Điều này cho phép các ứng dụng như đếm đối tượng tự động, phát hiện bất thường và quản lý hàng đợi. Khả năng dự đoán của bộ lọc đảm bảo rằng dấu vết của một người không bị mất ngay cả khi họ tạm thời bị che khuất bởi những người hoặc vật thể khác, một tính năng quan trọng để tăng cường giám sát thông minh.

Các khái niệm liên quan và sự khác biệt

Điều quan trọng là phải phân biệt Bộ lọc Kalman với các thuật ngữ liên quan:

  • Bộ lọc Kalman mở rộng (Extended Kalman Filter - EKF): Bộ lọc Kalman tiêu chuẩn giả định động lực học của hệ thống là tuyến tính. Tuy nhiên, nhiều hệ thống trong thế giới thực (như ô tô khi rẽ) là phi tuyến tính. EKF mở rộng Bộ lọc Kalman để xử lý các hệ thống phi tuyến tính bằng cách tuyến tính hóa mô hình ở mỗi bước thời gian.
  • Bộ lọc Kalman không mùi (UKF): Đối với các hệ thống phi tuyến tính cao mà việc tuyến tính hóa của EKF là không đủ, UKF cung cấp một giải pháp thay thế chính xác hơn mà không cần tính toán Jacobian, như được giải thích trong phần giới thiệu về Bộ lọc Kalman không mùi này.
  • Bộ lọc hạt (Particle Filters): Đây là một lựa chọn khác cho các hệ thống phi tuyến tính, phi Gaussian và thường được sử dụng trong robotics để định vị và lập bản đồ. Không giống như Bộ lọc Kalman, chúng biểu diễn phân phối xác suất bằng cách sử dụng một tập hợp các mẫu ngẫu nhiên (các hạt).

Trong framework Ultralytics, bạn có thể tìm thấy Bộ lọc Kalman được triển khai như một tiện ích cho các thuật toán theo dõi của chúng tôi. Các thư viện như OpenCV cũng cung cấp triển khai Bộ lọc Kalman của riêng chúng, được sử dụng rộng rãi trong các dự án thị giác máy tính.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard