Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Cách sử dụng Ultralytics YOLO11 để theo dõi đối tượng

Abirami Vina

4 phút đọc

20 tháng 11, 2024

Hãy cùng chúng tôi xem xét kỹ hơn cách sử dụng Ultralytics YOLO11 để theo dõi đối tượng trong các ứng dụng thời gian thực như giám sát, nông nghiệp và sản xuất.

Giả sử bạn muốn giám sát và theo dõi sự di chuyển của các bộ phận trên dây chuyền lắp ráp trong một nhà máy sản xuất để đảm bảo kiểm soát chất lượng và cải thiện hiệu quả quy trình làm việc. Thông thường, việc này bao gồm kiểm tra thủ công hoặc sử dụng các cảm biến cơ bản để theo dõi các vật phẩm, điều này có thể tốn thời gian và dễ xảy ra lỗi. Tuy nhiên, thị giác máy tínhtheo dõi đối tượng có thể được sử dụng để tự động hóa và nâng cao quy trình này. 

Theo dõi đối tượng là một tác vụ thị giác máy tính giúp phát hiện, xác định và theo dõi các đối tượng trong một video. Nó có thể được sử dụng cho nhiều ứng dụng khác nhau, từ giám sát động vật trong các trang trại đến an ninhgiám sát trong các cửa hàng bán lẻ. Các đối tượng được theo dõi trong video thường được trực quan hóa bằng cách sử dụng khung giới hạn (bounding box) để giúp người dùng thấy chính xác vị trí của chúng và được phát hiện ở đâu trong khung hình video.

Được ra mắt trong sự kiện hybrid thường niên của Ultralytics, YOLO Vision 2024 (YV24), Ultralytics YOLO11 là một mô hình thị giác máy tính có thể xử lý nhiều tác vụ Vision AI khác nhau, bao gồm cả theo dõi đối tượng. Trong bài viết này, chúng ta sẽ khám phá cách theo dõi đối tượng hoạt động và thảo luận về các ứng dụng thực tế. Chúng ta cũng sẽ xem xét cách bạn có thể thử theo dõi đối tượng bằng YOLO11. Hãy bắt đầu nào!

__wf_reserved_inherit
Hình 1. Một ví dụ về việc sử dụng YOLO11 để theo dõi đối tượng trong một cửa hàng bán lẻ.

Theo dõi đối tượng bằng AI với YOLO11

Theo dõi đối tượng là một kỹ thuật thị giác máy tính thiết yếu. Nó giúp cho các đối tượng trong một video có thể được xác định và theo dõi theo thời gian. Theo dõi đối tượng có vẻ rất giống với một tác vụ thị giác máy tính khác - phát hiện đối tượng. Sự khác biệt chính giữa hai tác vụ này nằm ở cách chúng xử lý các khung hình video. Phát hiện đối tượng xem xét từng khung hình riêng lẻ, xác định và phân loại các đối tượng mà không cần xem xét các khung hình trước đó hoặc tương lai. Mặt khác, Theo dõi đối tượng kết nối các điểm giữa các khung hình, theo dõi cùng một đối tượng theo thời gian và theo dõi chuyển động của chúng.

Dưới đây là hướng dẫn chi tiết hơn về cách theo dõi đối tượng hoạt động:

  • Phát hiện đối tượng: Quá trình bắt đầu bằng cách phát hiện các đối tượng trong một khung hình duy nhất của video. YOLO11 có thể được sử dụng để xác định nhiều đối tượng và vị trí của chúng một cách chính xác.
  • Gán ID duy nhất: Mỗi đối tượng được phát hiện được gán một ID duy nhất để phân biệt nó với những đối tượng khác và giúp theo dõi dễ dàng hơn.
  • Theo dõi chuyển động giữa các khung hình: Một thuật toán theo dõi theo dõi các đối tượng trên các khung hình tiếp theo, cập nhật vị trí của chúng đồng thời duy trì liên kết với ID duy nhất của chúng.
  • Xử lý che khuất: Nếu một đối tượng tạm thời biến mất khỏi tầm nhìn (ví dụ: bị chặn bởi một đối tượng khác), hệ thống đảm bảo việc theo dõi tiếp tục khi đối tượng xuất hiện trở lại.
  • Cập nhật thông tin đối tượng: Khi các đối tượng di chuyển, vị trí và thuộc tính của chúng (như tốc độ hoặc hướng) được liên tục cập nhật để phản ánh những thay đổi theo thời gian.

Ultralytics hỗ trợ theo dõi đối tượng theo thời gian thực bằng cách tận dụng các thuật toán theo dõi tiên tiến như BoT-SORTByteTrack. Nó cũng hoạt động liền mạch với phân đoạn (segmentation)ước tính tư thế (pose estimation) các mô hình YOLO11, làm cho nó trở thành một công cụ linh hoạt cho nhiều tác vụ theo dõi.

Các ứng dụng của theo dõi đối tượng YOLO11

Các khả năng linh hoạt của mô hình Ultralytics YOLO11 mở ra một loạt các ứng dụng khả thi trong nhiều ngành công nghiệp. Hãy xem xét kỹ hơn một số trường hợp sử dụng theo dõi đối tượng YOLO11.

YOLO11 để theo dõi xe tự hành

Theo dõi đối tượng là rất quan trọng để giúp xe tự lái hoạt động an toàn và hiệu quả. Những chiếc xe này cần liên tục hiểu môi trường xung quanh để đưa ra các quyết định theo thời gian thực, như dừng lại, rẽ hoặc chuyển làn đường. Phát hiện đối tượng cho phép xe xác định các yếu tố chính trong môi trường của nó, chẳng hạn như người đi bộ, người đi xe đạp, các phương tiện khác và biển báo giao thông. Tuy nhiên, việc phát hiện các đối tượng này trong một khoảnh khắc duy nhất là không đủ để điều hướng an toàn.

Đó là lúc theo dõi đối tượng phát huy tác dụng. Nó cho phép xe theo dõi các đối tượng này theo thời gian, theo dõi chuyển động của chúng trên nhiều khung hình. Ví dụ: nó giúp xe tự hành dự đoán hướng đi của người đi bộ, theo dõi tốc độ và hướng của các phương tiện gần đó hoặc nhận ra rằng đèn giao thông chưa thay đổi. Bằng cách kết hợp phát hiện và theo dõi, xe tự lái có thể dự đoán chuyển động của các đối tượng xung quanh chúng, phản ứng chủ động và lái xe an toàn và trơn tru.

__wf_reserved_inherit
Hình 2. YOLO11 có thể được sử dụng để phát hiện và theo dõi ô tô.

Sử dụng theo dõi đối tượng YOLO11 để giám sát động vật

Theo dõi động vật trong một trang trại, như gia súc, là rất quan trọng để quản lý hiệu quả, nhưng nó có thể là một nhiệm vụ tẻ nhạt và tốn thời gian. Các phương pháp truyền thống, chẳng hạn như sử dụng cảm biến hoặc thẻ, thường có những nhược điểm. Các thiết bị này có thể gây căng thẳng cho động vật khi gắn vào và dễ bị rơi ra hoặc bị hư hỏng, điều này làm gián đoạn việc theo dõi.

Thị giác máy tính cung cấp một giải pháp tốt hơn cho nông dân để giám sát và theo dõi động vật mà không cần thẻ vật lý. Theo dõi đối tượng có thể cung cấp cho nông dân những hiểu biết giá trị về hành vi và sức khỏe của động vật. Ví dụ: nó có thể giúp phát hiện các tình trạng như què ảnh hưởng đến cách một con vật đi lại. Bằng cách sử dụng theo dõi đối tượng, nông dân có thể phát hiện những thay đổi nhỏ trong chuyển động và giải quyết các vấn đề sức khỏe sớm.

Ngoài việc theo dõi sức khỏe, thị giác máy tính cũng có thể giúp nông dân hiểu các hành vi khác, chẳng hạn như tương tác xã hội, thói quen ăn uống và kiểu di chuyển. Những hiểu biết này có thể cải thiện việc quản lý đàn, tối ưu hóa lịch trình cho ăn và thúc đẩy sức khỏe tổng thể của động vật. Bằng cách giảm lao động thủ công và giảm thiểu căng thẳng cho động vật, theo dõi dựa trên thị giác máy tính là một công cụ thiết thực và hiệu quả cho nông nghiệp hiện đại.

__wf_reserved_inherit
Hình 3. Sử dụng YOLO11 để theo dõi nông dân và bò.

Theo dõi đối tượng trong sản xuất bằng YOLO11

Theo dõi đối tượng có nhiều ứng dụng trong lĩnh vực sản xuất. Ví dụ, hệ thống phát hiện và theo dõi đối tượng có thể giám sát dây chuyền sản xuất. Sản phẩm hoặc nguyên liệu thô có thể dễ dàng được theo dõi và đếm khi chúng di chuyển trên băng chuyền. Các hệ thống này cũng có thể được tích hợp với các hệ thống computer vision khác để thực hiện các tác vụ bổ sung. Ví dụ: một sản phẩm bị lỗi có thể được xác định bằng hệ thống phát hiện lỗi và được theo dõi bằng tính năng theo dõi đối tượng để đảm bảo nó được xử lý đúng cách.

Một ứng dụng quan trọng khác của việc theo dõi đối tượng trong sản xuất liên quan đến an toàn. Các hệ thống theo dõi đối tượng có thể được sử dụng để phát hiện và theo dõi công nhân trong môi trường sản xuất có khả năng gây nguy hiểm. Các khu vực nguy hiểm có thể được đánh dấu và theo dõi liên tục bằng các hệ thống computer vision, và người giám sát có thể được thông báo nếu công nhân (đang được theo dõi) đến gần các khu vực đó. Các hệ thống an toàn như vậy cũng có thể được sử dụng để phát hiện và theo dõi thiết bị, ngăn chặn khả năng trộm cắp. 

__wf_reserved_inherit
Hình 4. Một ví dụ về phát hiện đối tượng bằng YOLO11 được sử dụng để phát hiện công nhân.

Theo dõi đối tượng và giám sát bằng YOLO11

Theo dõi đối tượng theo thời gian thực được sử dụng rộng rãi trong các hệ thống an ninh và giám sát. Các hệ thống này có thể được sử dụng để giám sát các địa điểm công cộng, trung tâm giao thông vận tải và các môi trường bán lẻ lớn như trung tâm mua sắm. Các khu vực rộng lớn, đông đúc có thể sử dụng công nghệ này để theo dõi những cá nhân đáng ngờ hoặc hành vi đám đông, cung cấp một giải pháp giám sát liền mạch. Ví dụ, trong thời kỳ đại dịch, các hệ thống theo dõi đối tượng đã được sử dụng để theo dõi các khu vực đông đúc và đảm bảo rằng mọi người duy trì khoảng cách xã hội.

Theo dõi đối tượng cũng có thể được sử dụng trong giám sát giao thông. Theo dõi đối tượng giúp theo dõi và phân tích hành vi của xe, phát hiện các hành động bất thường hoặc đáng ngờ trong thời gian thực để giúp ngăn ngừa tai nạn hoặc tội phạm. Một ví dụ điển hình là hệ thống ước tính tốc độ. Chúng có thể phát hiện và theo dõi một chiếc xe để xác định tốc độ của nó.

__wf_reserved_inherit
Hình 5. Ước tính tốc độ có thể được thực hiện bằng cách sử dụng theo dõi đối tượng.

Dùng thử theo dõi đối tượng với Ultralytics YOLO11

Bây giờ chúng ta đã khám phá một số ứng dụng theo dõi đối tượng, hãy thảo luận về cách bạn có thể dùng thử bằng mô hình Ultralytics YOLO11

Để bắt đầu, hãy cài đặt gói Ultralytics Python bằng pip, conda hoặc Docker. Nếu bạn gặp bất kỳ khó khăn nào trong quá trình cài đặt, Hướng dẫn về các vấn đề thường gặp của chúng tôi cung cấp các mẹo khắc phục sự cố hữu ích. 

Sau khi bạn đã cài đặt gói thành công, hãy chạy đoạn mã sau. Nó phác thảo cách tải mô hình Ultralytics YOLO11 và sử dụng nó để theo dõi các đối tượng trong một tệp video. Mô hình được sử dụng trong mã là “yolo11n.pt”. Chữ ‘n’ là viết tắt của Nano - biến thể nhỏ nhất của mô hình YOLO11. Ngoài ra còn có các biến thể mô hình khác để lựa chọn - nhỏ, vừa, lớn và cực lớn.

__wf_reserved_inherit
Hình 6. Một đoạn mã thể hiện khả năng theo dõi đối tượng bằng mô hình YOLO11.

Bạn cũng có thể chọn sử dụng mô hình được huấn luyện tùy chỉnh thay vì mô hình được huấn luyện sẵn. Huấn luyện tùy chỉnh bao gồm tinh chỉnh mô hình được huấn luyện sẵn để phù hợp với ứng dụng cụ thể của bạn. 

Như đã đề cập trước đó, tính năng theo dõi đối tượng được hỗ trợ cho các mô hình YOLO11 sau: phát hiện đối tượng, ước tính tư thếphân vùng thể hiện. Nếu bạn có một ứng dụng cụ thể liên quan đến theo dõi, bạn có thể huấn luyện tùy chỉnh bất kỳ mô hình nào trong số này tùy thuộc vào ứng dụng của bạn. Bạn có thể huấn luyện tùy chỉnh một mô hình bằng gói Ultralytics Python hoặc nền tảng không cần mã, Ultralytics HUB

Những điều cần nhớ

Ultralytics YOLO11 là một công cụ tuyệt vời để theo dõi các đối tượng trong video và nó có thể được sử dụng trong nhiều lĩnh vực khác nhau, chẳng hạn như xe tự lái, nông nghiệp, sản xuất và an ninh. Nó có thể phát hiện và theo dõi các đối tượng trong thời gian thực, giúp các doanh nghiệp và ngành công nghiệp theo dõi công nhân và thiết bị của họ. Mô hình này rất dễ sử dụng và có thể được tùy chỉnh cho các nhu cầu cụ thể, khiến nó trở thành một lựa chọn tốt cho bất kỳ ai quan tâm đến việc áp dụng các khả năng computer vision một cách liền mạch. 

Để tìm hiểu thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia với cộng đồng của chúng tôi. Khám phá các ứng dụng AI trong xe tự láinông nghiệp trên các trang giải pháp của chúng tôi. 🚀

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard