Hãy cùng chúng tôi xem xét kỹ hơn cách sử dụng Ultralytics YOLO11 để theo dõi đối tượng trong các ứng dụng thời gian thực như giám sát, nông nghiệp và sản xuất.

Hãy cùng chúng tôi xem xét kỹ hơn cách sử dụng Ultralytics YOLO11 để theo dõi đối tượng trong các ứng dụng thời gian thực như giám sát, nông nghiệp và sản xuất.
Giả sử bạn muốn giám sát và theo dõi sự di chuyển của các bộ phận trên dây chuyền lắp ráp trong một nhà máy sản xuất để đảm bảo kiểm soát chất lượng và cải thiện hiệu quả quy trình làm việc. Thông thường, việc này bao gồm kiểm tra thủ công hoặc sử dụng các cảm biến cơ bản để theo dõi các vật phẩm, điều này có thể tốn thời gian và dễ xảy ra lỗi. Tuy nhiên, thị giác máy tính và theo dõi đối tượng có thể được sử dụng để tự động hóa và nâng cao quy trình này.
Theo dõi đối tượng là một tác vụ thị giác máy tính giúp phát hiện, xác định và theo dõi các đối tượng trong một video. Nó có thể được sử dụng cho nhiều ứng dụng khác nhau, từ giám sát động vật trong các trang trại đến an ninh và giám sát trong các cửa hàng bán lẻ. Các đối tượng được theo dõi trong video thường được trực quan hóa bằng cách sử dụng khung giới hạn (bounding box) để giúp người dùng thấy chính xác vị trí của chúng và được phát hiện ở đâu trong khung hình video.
Được ra mắt trong sự kiện hybrid thường niên của Ultralytics, YOLO Vision 2024 (YV24), Ultralytics YOLO11 là một mô hình thị giác máy tính có thể xử lý nhiều tác vụ Vision AI khác nhau, bao gồm cả theo dõi đối tượng. Trong bài viết này, chúng ta sẽ khám phá cách theo dõi đối tượng hoạt động và thảo luận về các ứng dụng thực tế. Chúng ta cũng sẽ xem xét cách bạn có thể thử theo dõi đối tượng bằng YOLO11. Hãy bắt đầu nào!
Theo dõi đối tượng là một kỹ thuật thị giác máy tính thiết yếu. Nó giúp cho các đối tượng trong một video có thể được xác định và theo dõi theo thời gian. Theo dõi đối tượng có vẻ rất giống với một tác vụ thị giác máy tính khác - phát hiện đối tượng. Sự khác biệt chính giữa hai tác vụ này nằm ở cách chúng xử lý các khung hình video. Phát hiện đối tượng xem xét từng khung hình riêng lẻ, xác định và phân loại các đối tượng mà không cần xem xét các khung hình trước đó hoặc tương lai. Mặt khác, Theo dõi đối tượng kết nối các điểm giữa các khung hình, theo dõi cùng một đối tượng theo thời gian và theo dõi chuyển động của chúng.
Dưới đây là hướng dẫn chi tiết hơn về cách theo dõi đối tượng hoạt động:
Ultralytics hỗ trợ theo dõi đối tượng theo thời gian thực bằng cách tận dụng các thuật toán theo dõi tiên tiến như BoT-SORT và ByteTrack. Nó cũng hoạt động liền mạch với phân đoạn (segmentation) và ước tính tư thế (pose estimation) các mô hình YOLO11, làm cho nó trở thành một công cụ linh hoạt cho nhiều tác vụ theo dõi.
Các khả năng linh hoạt của mô hình Ultralytics YOLO11 mở ra một loạt các ứng dụng khả thi trong nhiều ngành công nghiệp. Hãy xem xét kỹ hơn một số trường hợp sử dụng theo dõi đối tượng YOLO11.
Theo dõi đối tượng là rất quan trọng để giúp xe tự lái hoạt động an toàn và hiệu quả. Những chiếc xe này cần liên tục hiểu môi trường xung quanh để đưa ra các quyết định theo thời gian thực, như dừng lại, rẽ hoặc chuyển làn đường. Phát hiện đối tượng cho phép xe xác định các yếu tố chính trong môi trường của nó, chẳng hạn như người đi bộ, người đi xe đạp, các phương tiện khác và biển báo giao thông. Tuy nhiên, việc phát hiện các đối tượng này trong một khoảnh khắc duy nhất là không đủ để điều hướng an toàn.
Đó là lúc theo dõi đối tượng phát huy tác dụng. Nó cho phép xe theo dõi các đối tượng này theo thời gian, theo dõi chuyển động của chúng trên nhiều khung hình. Ví dụ: nó giúp xe tự hành dự đoán hướng đi của người đi bộ, theo dõi tốc độ và hướng của các phương tiện gần đó hoặc nhận ra rằng đèn giao thông chưa thay đổi. Bằng cách kết hợp phát hiện và theo dõi, xe tự lái có thể dự đoán chuyển động của các đối tượng xung quanh chúng, phản ứng chủ động và lái xe an toàn và trơn tru.
Theo dõi động vật trong một trang trại, như gia súc, là rất quan trọng để quản lý hiệu quả, nhưng nó có thể là một nhiệm vụ tẻ nhạt và tốn thời gian. Các phương pháp truyền thống, chẳng hạn như sử dụng cảm biến hoặc thẻ, thường có những nhược điểm. Các thiết bị này có thể gây căng thẳng cho động vật khi gắn vào và dễ bị rơi ra hoặc bị hư hỏng, điều này làm gián đoạn việc theo dõi.
Thị giác máy tính cung cấp một giải pháp tốt hơn cho nông dân để giám sát và theo dõi động vật mà không cần thẻ vật lý. Theo dõi đối tượng có thể cung cấp cho nông dân những hiểu biết giá trị về hành vi và sức khỏe của động vật. Ví dụ: nó có thể giúp phát hiện các tình trạng như què ảnh hưởng đến cách một con vật đi lại. Bằng cách sử dụng theo dõi đối tượng, nông dân có thể phát hiện những thay đổi nhỏ trong chuyển động và giải quyết các vấn đề sức khỏe sớm.
Ngoài việc theo dõi sức khỏe, thị giác máy tính cũng có thể giúp nông dân hiểu các hành vi khác, chẳng hạn như tương tác xã hội, thói quen ăn uống và kiểu di chuyển. Những hiểu biết này có thể cải thiện việc quản lý đàn, tối ưu hóa lịch trình cho ăn và thúc đẩy sức khỏe tổng thể của động vật. Bằng cách giảm lao động thủ công và giảm thiểu căng thẳng cho động vật, theo dõi dựa trên thị giác máy tính là một công cụ thiết thực và hiệu quả cho nông nghiệp hiện đại.
Theo dõi đối tượng có nhiều ứng dụng trong lĩnh vực sản xuất. Ví dụ, hệ thống phát hiện và theo dõi đối tượng có thể giám sát dây chuyền sản xuất. Sản phẩm hoặc nguyên liệu thô có thể dễ dàng được theo dõi và đếm khi chúng di chuyển trên băng chuyền. Các hệ thống này cũng có thể được tích hợp với các hệ thống computer vision khác để thực hiện các tác vụ bổ sung. Ví dụ: một sản phẩm bị lỗi có thể được xác định bằng hệ thống phát hiện lỗi và được theo dõi bằng tính năng theo dõi đối tượng để đảm bảo nó được xử lý đúng cách.
Một ứng dụng quan trọng khác của việc theo dõi đối tượng trong sản xuất liên quan đến an toàn. Các hệ thống theo dõi đối tượng có thể được sử dụng để phát hiện và theo dõi công nhân trong môi trường sản xuất có khả năng gây nguy hiểm. Các khu vực nguy hiểm có thể được đánh dấu và theo dõi liên tục bằng các hệ thống computer vision, và người giám sát có thể được thông báo nếu công nhân (đang được theo dõi) đến gần các khu vực đó. Các hệ thống an toàn như vậy cũng có thể được sử dụng để phát hiện và theo dõi thiết bị, ngăn chặn khả năng trộm cắp.
Theo dõi đối tượng theo thời gian thực được sử dụng rộng rãi trong các hệ thống an ninh và giám sát. Các hệ thống này có thể được sử dụng để giám sát các địa điểm công cộng, trung tâm giao thông vận tải và các môi trường bán lẻ lớn như trung tâm mua sắm. Các khu vực rộng lớn, đông đúc có thể sử dụng công nghệ này để theo dõi những cá nhân đáng ngờ hoặc hành vi đám đông, cung cấp một giải pháp giám sát liền mạch. Ví dụ, trong thời kỳ đại dịch, các hệ thống theo dõi đối tượng đã được sử dụng để theo dõi các khu vực đông đúc và đảm bảo rằng mọi người duy trì khoảng cách xã hội.
Theo dõi đối tượng cũng có thể được sử dụng trong giám sát giao thông. Theo dõi đối tượng giúp theo dõi và phân tích hành vi của xe, phát hiện các hành động bất thường hoặc đáng ngờ trong thời gian thực để giúp ngăn ngừa tai nạn hoặc tội phạm. Một ví dụ điển hình là hệ thống ước tính tốc độ. Chúng có thể phát hiện và theo dõi một chiếc xe để xác định tốc độ của nó.
Bây giờ chúng ta đã khám phá một số ứng dụng theo dõi đối tượng, hãy thảo luận về cách bạn có thể dùng thử bằng mô hình Ultralytics YOLO11.
Để bắt đầu, hãy cài đặt gói Ultralytics Python bằng pip, conda hoặc Docker. Nếu bạn gặp bất kỳ khó khăn nào trong quá trình cài đặt, Hướng dẫn về các vấn đề thường gặp của chúng tôi cung cấp các mẹo khắc phục sự cố hữu ích.
Sau khi bạn đã cài đặt gói thành công, hãy chạy đoạn mã sau. Nó phác thảo cách tải mô hình Ultralytics YOLO11 và sử dụng nó để theo dõi các đối tượng trong một tệp video. Mô hình được sử dụng trong mã là “yolo11n.pt”. Chữ ‘n’ là viết tắt của Nano - biến thể nhỏ nhất của mô hình YOLO11. Ngoài ra còn có các biến thể mô hình khác để lựa chọn - nhỏ, vừa, lớn và cực lớn.
Bạn cũng có thể chọn sử dụng mô hình được huấn luyện tùy chỉnh thay vì mô hình được huấn luyện sẵn. Huấn luyện tùy chỉnh bao gồm tinh chỉnh mô hình được huấn luyện sẵn để phù hợp với ứng dụng cụ thể của bạn.
Như đã đề cập trước đó, tính năng theo dõi đối tượng được hỗ trợ cho các mô hình YOLO11 sau: phát hiện đối tượng, ước tính tư thế và phân vùng thể hiện. Nếu bạn có một ứng dụng cụ thể liên quan đến theo dõi, bạn có thể huấn luyện tùy chỉnh bất kỳ mô hình nào trong số này tùy thuộc vào ứng dụng của bạn. Bạn có thể huấn luyện tùy chỉnh một mô hình bằng gói Ultralytics Python hoặc nền tảng không cần mã, Ultralytics HUB.
Ultralytics YOLO11 là một công cụ tuyệt vời để theo dõi các đối tượng trong video và nó có thể được sử dụng trong nhiều lĩnh vực khác nhau, chẳng hạn như xe tự lái, nông nghiệp, sản xuất và an ninh. Nó có thể phát hiện và theo dõi các đối tượng trong thời gian thực, giúp các doanh nghiệp và ngành công nghiệp theo dõi công nhân và thiết bị của họ. Mô hình này rất dễ sử dụng và có thể được tùy chỉnh cho các nhu cầu cụ thể, khiến nó trở thành một lựa chọn tốt cho bất kỳ ai quan tâm đến việc áp dụng các khả năng computer vision một cách liền mạch.
Để tìm hiểu thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia với cộng đồng của chúng tôi. Khám phá các ứng dụng AI trong xe tự lái và nông nghiệp trên các trang giải pháp của chúng tôi. 🚀