Theo dõi đối tượng
Khám phá tính năng theo dõi đối tượng với Ultralytics! Tìm hiểu cách theo dõi chuyển động, hành vi và tương tác trong video bằng mô hình YOLO cho các ứng dụng thời gian thực.
Theo dõi đối tượng là một nhiệm vụ cơ bản trong thị giác máy tính (CV) , bao gồm việc xác định và theo dõi một hoặc nhiều đối tượng chuyển động trên một chuỗi khung hình video. Không giống như phát hiện đối tượng , vốn chỉ định vị các đối tượng trong một hình ảnh duy nhất, theo dõi đối tượng bổ sung một chiều thời gian bằng cách gán một ID duy nhất cho mỗi đối tượng và duy trì danh tính của nó khi nó di chuyển, thay đổi diện mạo hoặc bị che khuất tạm thời. Khả năng này cho phép hiểu sâu hơn về hành vi, tương tác và các mẫu chuyển động của đối tượng theo thời gian, khiến nó trở thành nền tảng của nhiều ứng dụng phân tích video động.
Theo dõi đối tượng hoạt động như thế nào
Quá trình theo dõi đối tượng thường bắt đầu bằng việc sử dụng mô hình phát hiện đối tượng để xác định và định vị các đối tượng trong khung hình đầu tiên của video. Mỗi đối tượng được phát hiện sẽ được gán một ID theo dõi duy nhất. Trong các khung hình tiếp theo, thuật toán theo dõi sẽ dự đoán vị trí mới của các đối tượng này và cố gắng khớp chúng với các đối tượng mới được phát hiện. Quá trình này dựa trên các kỹ thuật khác nhau:
- Dự đoán chuyển động : Các thuật toán như Bộ lọc Kalman (KF) được sử dụng để ước tính vị trí tương lai của một vật thể dựa trên trạng thái trước đó (vị trí, vận tốc). Điều này giúp thu hẹp phạm vi tìm kiếm vật thể trong khung hình tiếp theo.
- So khớp ngoại hình : Phương pháp này bao gồm việc trích xuất các đặc điểm riêng biệt từ một đối tượng, chẳng hạn như biểu đồ màu hoặc nhúng dựa trên học sâu. Các đặc điểm này tạo ra một dấu hiệu duy nhất giúp nhận dạng lại đối tượng ngay cả sau khi bị che khuất hoặc thay đổi đáng kể về ngoại hình.
- Liên kết Dữ liệu : Đây là bước quan trọng để so khớp các dấu vết hiện có với các phát hiện mới. Các thuật toán như thuật toán Hungary hoặc các phương pháp tiên tiến hơn như ByteTrack và BoT-SORT xử lý việc liên kết này, ngay cả trong các tình huống phức tạp với nhiều đối tượng.
Theo dõi đối tượng so với Phát hiện đối tượng
Mặc dù có liên quan chặt chẽ, nhưng theo dõi đối tượng và phát hiện đối tượng phục vụ những mục đích khác nhau.
- Phát hiện Đối tượng : Đây là quá trình xác định và phân loại các đối tượng trong một hình ảnh hoặc khung hình video duy nhất. Đầu ra là một tập hợp các hộp giới hạn , nhãn lớp và điểm tin cậy cho từng đối tượng. Quá trình này trả lời câu hỏi "Những đối tượng nào trong khung hình này?"
- Theo dõi Đối tượng : Tính năng này được xây dựng dựa trên việc phát hiện đối tượng. Nó lấy dữ liệu phát hiện từ mỗi khung hình và liên kết chúng trên toàn bộ chuỗi video, gán một ID cố định cho mỗi đối tượng. Nó trả lời câu hỏi: "Đối tượng cụ thể này đang đi đâu?"
Về bản chất, bạn có thể hình dung việc phát hiện đối tượng như chụp ảnh nhanh, trong khi theo dõi đối tượng tạo ra một câu chuyện liên tục về hành trình của từng đối tượng thông qua video. Các mô hình YOLO của Ultralytics tích hợp liền mạch cả hai, cho phép người dùng thực hiện theo dõi nhiều đối tượng với hiệu suất và độ chính xác cao.
Ứng dụng trong thế giới thực
Theo dõi đối tượng là một công nghệ mang tính đột phá với nhiều ứng dụng trong nhiều ngành công nghiệp khác nhau.
- Giám sát và An ninh Thông minh : Trong an ninh, theo dõi đối tượng được sử dụng để giám sát người và phương tiện theo thời gian thực. Một hệ thống có thể được cấu hình để tự động theo dõi người vào khu vực hạn chế, theo dõi phương tiện khả nghi trong bãi đậu xe, hoặc đếm số người ra vào tòa nhà. Điều này cho phép tự động cảnh báo và phân tích pháp y mà không cần sự giám sát liên tục của con người. Ví dụ, hệ thống báo động an ninh có thể được thiết kế để kích hoạt khi có người bị theo dõi di chuyển vào khu vực được xác định trước sau giờ làm việc.
- Xe tự hành : Đối với xe tự lái, việc theo dõi các phương tiện khác, người đi bộ và người đi xe đạp là rất quan trọng để đảm bảo an toàn khi điều hướng. Bằng cách theo dõi các vật thể xung quanh, xe có thể dự đoán quỹ đạo, hiểu ý định của chúng (ví dụ: người đi bộ sắp băng qua đường) và đưa ra quyết định sáng suốt để tránh va chạm. Việc theo dõi liên tục này mang lại khả năng hiểu biết sâu sắc hơn nhiều về môi trường xung quanh so với chỉ phát hiện từng khung hình đơn lẻ.
- Phân tích Thể thao : Huấn luyện viên và nhà phân tích sử dụng công nghệ theo dõi đối tượng để theo dõi chuyển động của cầu thủ trên sân. Bằng cách theo dõi từng cầu thủ, họ có thể phân tích đội hình, đo lường các chỉ số hiệu suất như quãng đường di chuyển và tốc độ, đồng thời phát triển chiến thuật thi đấu tốt hơn. Công nghệ này có thể được kết hợp với ước tính tư thế để phân tích kỹ thuật của cầu thủ một cách chi tiết.
- Phân tích Bán lẻ : Các nhà bán lẻ sử dụng công nghệ theo dõi để hiểu hành vi khách hàng tại cửa hàng. Bằng cách phân tích lưu lượng khách hàng, thời gian dừng chân tại các lối đi khác nhau và tương tác với sản phẩm, doanh nghiệp có thể tối ưu hóa bố cục cửa hàng và cải thiện trải nghiệm của khách hàng. Công nghệ này cũng có thể được sử dụng để quản lý hàng đợi , giảm thời gian chờ đợi tại quầy thanh toán.
Công cụ và triển khai
Việc triển khai các giải pháp theo dõi đối tượng mạnh mẽ dễ dàng hơn bao giờ hết nhờ các công cụ và khuôn khổ hiện đại.
- Thư viện và Khung công tác : Các thư viện như OpenCV cung cấp các công cụ nền tảng cho xử lý video và bao gồm một số thuật toán theo dõi cổ điển. Các khung công tác học sâu hiện đại như PyTorch và TensorFlow được sử dụng để xây dựng các mô hình phát hiện mạnh mẽ, đóng vai trò là xương sống cho việc theo dõi.
- Mô hình YOLO của Ultralytics : Ultralytics đơn giản hóa việc triển khai theo dõi hiệu suất cao. Các mô hình như YOLO11 được tích hợp sẵn các tính năng theo dõi được tối ưu hóa cao, có thể được kích hoạt chỉ bằng một lệnh đơn giản. Sự tích hợp này cho phép các nhà phát triển tận dụng công nghệ phát hiện tiên tiến nhất cho các tác vụ như phân đoạn đối tượng, phân đoạn thể hiện và theo dõi tư thế. Bạn có thể bắt đầu nhanh chóng bằng cách làm theo hướng dẫn Theo dõi Đối tượng của YOLO11 .
- Nền tảng đầu cuối : Để quản lý toàn bộ vòng đời học máy , từ chú thích dữ liệu đến triển khai mô hình , các nền tảng như Ultralytics HUB cung cấp một bộ công cụ toàn diện. Điều này giúp hợp lý hóa quy trình đào tạo các mô hình tùy chỉnh và triển khai chúng vào môi trường sản xuất.