Bảng chú giải thuật ngữ

Bộ lọc Kalman mở rộng (EKF)

Khám phá Bộ lọc Kalman mở rộng (EKF) để ước lượng trạng thái phi tuyến tính. Tìm hiểu cách nó cải thiện khả năng theo dõi đối tượng trong Ultralytics YOLO26 và các hệ thống tự động.

Bộ lọc Kalman mở rộng (EKF) là một thuật toán toán học mạnh mẽ được thiết kế để ước tính trạng thái của một hệ thống động hoạt động phi tuyến tính. Trong khi bộ lọc Kalman tiêu chuẩn (KF) cung cấp giải pháp tối ưu cho các hệ thống chuyển động theo đường thẳng hoặc tuân theo các phương trình tuyến tính đơn giản, vật lý thực tế hiếm khi có thể dự đoán được như vậy. Hầu hết các vật thể vật lý, chẳng hạn như máy bay không người lái chống lại sức cản của gió hoặc cánh tay robot quay trên nhiều trục, đều đi theo các đường cong hoặc phức tạp. EKF giải quyết sự phức tạp này bằng cách tạo ra một phép xấp xỉ tuyến tính của hệ thống tại một thời điểm cụ thể, cho phép các kỹ sư và nhà khoa học dữ liệu áp dụng các kỹ thuật lọc hiệu quả cho các nhiệm vụ mô hình hóa dự đoán ngay cả khi cơ chế cơ bản phức tạp.

Cơ chế và tuyến tính hóa

Để xử lý các động lực phức tạp, bộ lọc Kalman mở rộng (EKF) sử dụng một quy trình toán học gọi là tuyến tính hóa, về cơ bản ước tính độ dốc của một hàm tại điểm hoạt động hiện tại. Điều này thường liên quan đến việc tính toán ma trận Jacobian để xấp xỉ cách hệ thống thay đổi trong các khoảng thời gian ngắn. Thuật toán hoạt động trong một vòng lặp đệ quy gồm hai giai đoạn chính: dự đoán và cập nhật. Trong giai đoạn dự đoán, bộ lọc chiếu trạng thái hiện tại về phía trước bằng cách sử dụng mô hình vật lý về chuyển động. Trong giai đoạn cập nhật, nó hiệu chỉnh phép chiếu này bằng cách sử dụng dữ liệu mới, thường là dữ liệu nhiễu từ các cảm biến như con quay hồi chuyển hoặc gia tốc kế. Chu kỳ liên tục dự đoán và hiệu chỉnh này giúp giảm nhiễu dữ liệu và cung cấp ước tính mượt mà hơn, chính xác hơn về trạng thái thực so với bất kỳ cảm biến đơn lẻ nào có thể cung cấp.

Mức độ Liên quan trong Thị giác Máy tính

Trong lĩnh vực thị giác máy tính (CV) , bộ lọc Kalman mở rộng (EKF) đóng vai trò quan trọng trong việc duy trì nhận dạng của các vật thể chuyển động. Các mô hình tiên tiến như YOLO26 rất xuất sắc trong việc phát hiện đối tượng trong các khung hình đơn lẻ, nhưng chúng không tự hiểu được sự liên tục của chuyển động theo thời gian. Bằng cách tích hợp EKF hoặc logic tương tự, hệ thống theo dõi đối tượng có thể dự đoán vị trí xuất hiện của hộp giới hạn trong khung hình video tiếp theo dựa trên vận tốc và quỹ đạo trước đó của nó. Điều này đặc biệt hữu ích để xử lý các trường hợp che khuất, khi một đối tượng tạm thời bị che khuất khỏi tầm nhìn; bộ lọc giữ nguyên " track "Hoạt động bằng cách ước tính vị trí của vật thể cho đến khi nó hiển thị trở lại, một kỹ thuật thiết yếu cho việc theo dõi nhiều vật thể (MOT) mạnh mẽ."

Các Ứng dụng Thực tế

Tính linh hoạt của EKF khiến nó trở thành một công nghệ nền tảng trong nhiều ngành công nghệ cao, nơi mà học máy (ML) giao thoa với phần cứng vật lý:

Xe tự hành : Xe tự lái dựa vào sự kết hợp các cảm biến để di chuyển an toàn. Bộ lọc Kalman mở rộng (EKF) kết hợp các luồng dữ liệu riêng biệt từ Hệ thống Định vị Toàn cầu (GPS), LiDAR và radar để tính toán vị trí và hướng chính xác của xe trên đường, bù đắp cho sự gián đoạn tín hiệu hoặc nhiễu môi trường.
Robot học : Robot hoạt động trong môi trường không có cấu trúc sử dụng thuật toán Định vị và Lập bản đồ đồng thời (SLAM) . Bộ lọc Kalman mở rộng (EKF) giúp robot xây dựng bản đồ của một căn phòng đồng thời xác định vị trí của chính nó trong bản đồ đó, hiệu chỉnh hiện tượng trượt bánh xe hoặc trôi cảm biến để đảm bảo chuyển động chính xác.
Ước lượng tư thế : Trong các ứng dụng như thực tế ảo hoặc phân tích thể thao, việc theo dõi các khớp của con người đòi hỏi phải làm mượt các điểm mấu chốt bị rung lắc. Thuật toán EKF tinh chỉnh đầu ra của các mô hình học sâu để tạo ra các hoạt ảnh chuyển động mượt mà, tự nhiên cho các hệ thống nhận dạng hành động .

So sánh với các khái niệm liên quan

Việc phân biệt Bộ lọc Kalman mở rộng với các phương pháp lọc liên quan sẽ giúp hiểu rõ hơn về công dụng cụ thể của nó:

So sánh EKF và bộ lọc Kalman (KF) : Bộ lọc Kalman tiêu chuẩn tối ưu về mặt toán học và tiết kiệm chi phí tính toán hơn, nhưng lại không hiệu quả khi hệ thống có tính phi tuyến cao. EKF mở rộng KF để hoạt động với các hệ thống phi tuyến thông qua phương pháp xấp xỉ.
So sánh EKF và bộ lọc hạt : Bộ lọc hạt xử lý rất tốt hiện tượng phi tuyến tính và nhiễu phi Gauss bằng cách sử dụng nhiều mẫu ngẫu nhiên (hạt) để biểu diễn xác suất. Tuy nhiên, nó đòi hỏi sức mạnh tính toán lớn hơn đáng kể, khiến EKF trở thành lựa chọn ưu tiên cho các hệ thống nhúng có tài nguyên hạn chế.
So sánh EKF và Bộ lọc Kalman không mùi (UKF): Bộ lọc Kalman không mùi cung cấp một giải pháp trung gian, sử dụng các điểm lấy mẫu xác định để xử lý tính phi tuyến tính mà không cần đến các phép tính phức tạp như trong EKF, mặc dù EKF vẫn là tiêu chuẩn công nghiệp cho nhiều hệ thống điều khiển.

Ví dụ triển khai

In the ultralytics Gói phần mềm này sử dụng các thuật toán theo dõi dựa trên khái niệm lọc Kalman (EKF) để làm mượt quỹ đạo và liên kết các phát hiện giữa các khung hình. Mặc dù bạn không cần tự viết mã toán học ma trận EKF khi sử dụng các công cụ cấp cao, nhưng việc hiểu rằng nó là nền tảng của trình theo dõi sẽ giúp bạn cấu hình các tham số cho trình theo dõi. Ultralytics Nền tảng.

Dưới đây là cách khởi tạo một trình theo dõi với mô hình YOLO , sử dụng các kỹ thuật lọc này để ước tính trạng thái:

from ultralytics import YOLO

# Load the latest YOLO26 model (nano version for speed)
model = YOLO("yolo26n.pt")

# Track objects in a video source
# Trackers like BoT-SORT or ByteTrack use Kalman filtering logic internally
results = model.track(source="https://ultralytics.com/images/bus.jpg", tracker="botsort.yaml")

# Print the ID of the tracked objects
for r in results:
    if r.boxes.id is not None:
        print(f"Track IDs: {r.boxes.id.numpy()}")

Bộ lọc Kalman mở rộng (EKF)

Xe lửa Ultralytics YOLO các mô hình để hợp lý hóa quy trình làm việc trên khắp các ngành công nghiệp

Giải pháp cấp phép doanh nghiệp linh hoạt để thúc đẩy sự đổi mới của bạn

Đào tạo các mô hình AI trong vài giây với Ultralytics YOLO

Cơ chế và tuyến tính hóa

Mức độ Liên quan trong Thị giác Máy tính

Các Ứng dụng Thực tế

So sánh với các khái niệm liên quan

Ví dụ triển khai

Đọc thêm trong danh mục này

12 trường hợp sử dụng ảnh chụp từ trên không được hỗ trợ bởi thị giác máy tính

Ước lượng độ sâu đơn ảnh là gì? Tổng quan

Một cái nhìn về việc sử dụng Ultralytics YOLO các mô hình để phát hiện mối đe dọa AI

Tham gia Ultralytics cộng đồng