Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Cách sử dụng Ultralytics YOLO11 để ước tính tư thế

Abirami Vina

3 phút đọc

Ngày 14 tháng 10 năm 2024

Tìm hiểu cách sử dụng mô hình Ultralytics YOLO11 để ước tính tư thế chính xác. Chúng ta sẽ đề cập đến suy luận thời gian thực và huấn luyện mô hình tùy chỉnh cho các ứng dụng khác nhau.

Nghiên cứu liên quan đến thị giác máy tính, một nhánh của trí tuệ nhân tạo (AI), có thể bắt nguồn từ những năm 1960. Tuy nhiên, phải đến những năm 2010, với sự trỗi dậy của học sâu, chúng ta mới thấy những đột phá lớn trong cách máy móc hiểu hình ảnh. Một trong những tiến bộ mới nhất trong thị giác máy tính là các mô hình Ultralytics YOLO11 tiên tiến. Các mô hình YOLO11, lần đầu tiên được giới thiệu tại sự kiện kết hợp thường niên của Ultralytics, YOLO Vision 2024 (YV24), hỗ trợ một loạt các tác vụ thị giác máy tính, bao gồm ước tính tư thế.

Ước tính tư thế (Pose estimation) có thể được sử dụng để phát hiện các điểm chính (detect key points) trên một người hoặc đối tượng trong một hình ảnh hoặc video để hiểu vị trí, tư thế hoặc chuyển động của họ. Nó được sử dụng rộng rãi trong các ứng dụng như phân tích thể thao (sports analytics), giám sát hành vi động vật (animal behavior monitoring)robotics để giúp máy móc giải thích các hành động vật lý trong thời gian thực. Nhờ độ chính xác, hiệu quả và tốc độ được cải thiện so với các mô hình trước đó (earlier models) trong chuỗi YOLO (You Only Look Once), YOLO11 rất phù hợp cho các nhiệm vụ ước tính tư thế theo thời gian thực (real-time pose estimation tasks).

__wf_reserved_inherit
Hình 1. Một ví dụ về việc sử dụng Ultralytics YOLO11 để ước tính tư thế (pose estimation).

Trong bài viết này, chúng ta sẽ khám phá ước tính tư thế là gì, thảo luận về một số ứng dụng của nó và hướng dẫn bạn cách sử dụng YOLO11 với gói Ultralytics Python để ước tính tư thế. Chúng ta cũng sẽ xem xét cách bạn có thể sử dụng Ultralytics HUB để dùng thử YOLO11 và ước tính tư thế chỉ với một vài cú nhấp chuột. Hãy cùng bắt đầu!

Ước tính tư thế là gì?

Trước khi đi sâu vào cách sử dụng mô hình Ultralytics YOLO11 mới cho pose estimation, hãy hiểu rõ hơn về pose estimation.

Ước tính tư thế là một kỹ thuật computer vision được sử dụng để phân tích tư thế của một người hoặc vật thể trong một hình ảnh hoặc video. Các mô hình deep learning như YOLO11 có thể xác định, định vị và theo dõi các điểm chính trên một đối tượng hoặc người nhất định. Đối với các đối tượng, những điểm chính này có thể bao gồm các góc, cạnh hoặc các dấu hiệu bề mặt riêng biệt, trong khi đối với con người, những điểm chính này đại diện cho các khớp chính như khuỷu tay, đầu gối hoặc vai. 

Ước tính tư thế là duy nhất và phức tạp hơn so với các tác vụ computer vision khác như object detection. Trong khi object detection định vị các đối tượng trong một hình ảnh bằng cách vẽ một hộp xung quanh chúng, thì ước tính tư thế tiến xa hơn bằng cách dự đoán vị trí chính xác của các điểm chính trên đối tượng.

__wf_reserved_inherit
Hình 2. Sử dụng YOLO11 để phát hiện và ước tính tư thế của mọi người trong văn phòng.

Khi nói đến ước tính tư thế, có hai phương pháp chính: từ dưới lên và từ trên xuống. Phương pháp từ dưới lên phát hiện các điểm chính riêng lẻ và nhóm chúng thành bộ xương, trong khi phương pháp từ trên xuống tập trung vào việc phát hiện đối tượng trước, sau đó ước tính các điểm chính bên trong chúng. 

YOLO11 kết hợp sức mạnh của cả phương pháp từ trên xuống và từ dưới lên. Giống như phương pháp từ dưới lên, nó giữ cho mọi thứ đơn giản và nhanh chóng mà không cần nhóm các điểm chính theo cách thủ công. Đồng thời, nó sử dụng độ chính xác của phương pháp từ trên xuống bằng cách phát hiện người và ước tính tư thế của họ trong một bước duy nhất.

Các trường hợp sử dụng ước tính tư thế cho YOLO11 

Khả năng linh hoạt của YOLO11 trong việc ước tính tư thế mở ra một loạt các ứng dụng tiềm năng trong nhiều ngành công nghiệp. Hãy xem xét kỹ hơn một số trường hợp sử dụng ước tính tư thế của YOLO11.

Ước tính tư thế theo thời gian thực với YOLO11: Cải thiện an toàn cho người lao động

An toàn là một khía cạnh quan trọng của bất kỳ dự án xây dựng nào. Điều này đặc biệt đúng, vì theo thống kê, các công trường xây dựng có số lượng thương tích liên quan đến công việc cao hơn. Vào năm 2021, khoảng 20% tổng số thương tích gây tử vong liên quan đến công việc xảy ra trên hoặc gần các công trường xây dựng. Với những rủi ro hàng ngày như thiết bị hạng nặng và hệ thống điện, các biện pháp an toàn mạnh mẽ là rất cần thiết để giữ an toàn cho người lao động. Các phương pháp truyền thống như sử dụng biển báo, rào chắn và giám sát thủ công bởi người giám sát không phải lúc nào cũng hiệu quả và thường khiến người giám sát rời xa các nhiệm vụ quan trọng hơn.

AI có thể can thiệp để cải thiện an toàn và nguy cơ tai nạn có thể được giảm thiểu bằng cách sử dụng hệ thống giám sát người lao động dựa trên ước tính tư thế. Các mô hình Ultralytics YOLO11 có thể được sử dụng để theo dõi các chuyển động và tư thế của người lao động. Bất kỳ mối nguy tiềm ẩn nào như công nhân đứng quá gần thiết bị nguy hiểm hoặc thực hiện các công việc không chính xác đều có thể được phát hiện nhanh chóng. Nếu phát hiện thấy rủi ro, người giám sát có thể được thông báo hoặc báo động có thể cảnh báo cho công nhân. Một hệ thống giám sát liên tục có thể làm cho các công trường xây dựng an toàn hơn bằng cách luôn cảnh giác với các mối nguy hiểm và bảo vệ người lao động

__wf_reserved_inherit
Hình 3. Một ví dụ về ước tính tư thế trên công trường xây dựng bằng YOLO11.

Ước tính tư thế với YOLO11 để theo dõi vật nuôi

Nông dânnhà nghiên cứu có thể sử dụng YOLO11 để nghiên cứu sự di chuyển và hành vi của vật nuôi, chẳng hạn như gia súc, để phát hiện sớm các dấu hiệu của bệnh tật như què. Què là tình trạng một con vật gặp khó khăn trong việc di chuyển đúng cách do đau ở chân. Ở gia súc, các bệnh như què không chỉ ảnh hưởng đến sức khỏe và phúc lợi của chúng mà còn dẫn đến các vấn đề sản xuất tại các trang trại bò sữa. Các nghiên cứu cho thấy chứng què ảnh hưởng đến khoảng 8% số gia súc trong các hệ thống chăn thả và 15% đến 30% trong các hệ thống nuôi nhốt trên toàn ngành công nghiệp sữa toàn cầu. Phát hiện và giải quyết chứng què sớm có thể giúp cải thiện phúc lợi động vật và giảm tổn thất sản xuất liên quan đến tình trạng này.

Các tính năng ước tính tư thế của YOLO11 có thể giúp nông dân theo dõi kiểu dáng đi của động vật và nhanh chóng xác định bất kỳ bất thường nào có thể báo hiệu các vấn đề về sức khỏe, chẳng hạn như các vấn đề về khớp hoặc nhiễm trùng. Việc phát hiện sớm những vấn đề này cho phép điều trị nhanh hơn, giảm bớt sự khó chịu cho động vật và giúp nông dân tránh được thiệt hại kinh tế.

AI thị giác hỗ trợ các hệ thống giám sát cũng có thể giúp phân tích hành vi nghỉ ngơi, tương tác xã hội và thói quen ăn uống. Nông dân cũng có thể sử dụng ước tính tư thế để có được các quan sát về các dấu hiệu căng thẳng hoặc hung hăng. Những thông tin chi tiết này có thể được sử dụng để cải thiện điều kiện sống cho động vật và tăng cường phúc lợi của chúng.

__wf_reserved_inherit
Hình 4. Một hình ảnh trực quan về Ước tính tư thế con bò.

Các trường hợp sử dụng YOLO11 trong ngành thể hình

Ước tính tư thế cũng có thể giúp mọi người cải thiện tư thế của họ trong thời gian thực trong khi tập luyện. Với YOLO11, các huấn luyện viên phòng tập và yoga có thể theo dõi và theo dõi các chuyển động cơ thể của những người tập luyện, tập trung vào các điểm chính như khớp và chi để đánh giá tư thế của họ. Dữ liệu thu thập được có thể được so sánh với các tư thế lý tưởng và kỹ thuật tập luyện, và các huấn luyện viên có thể nhận được cảnh báo nếu ai đó thực hiện một động tác không chính xác, giúp ngăn ngừa chấn thương.

__wf_reserved_inherit
Hình 5. Sử dụng Ước tính Tư thế để Phân tích Bài tập.

Ví dụ: trong một lớp học yoga, ước tính tư thế có thể giúp theo dõi xem tất cả học viên có duy trì sự cân bằng và căn chỉnh thích hợp hay không. Các ứng dụng di động được tích hợp với thị giác máy tính và ước tính tư thế có thể giúp việc tập thể dục dễ tiếp cận hơn cho những người tập luyện tại nhà hoặc những người không có huấn luyện viên cá nhân. Phản hồi liên tục theo thời gian thực này giúp người dùng cải thiện kỹ thuật và đạt được mục tiêu tập thể dục của họ đồng thời giảm nguy cơ chấn thương.

Thử ước tính tư thế theo thời gian thực với mô hình YOLO11

Bây giờ chúng ta đã tìm hiểu về ước tính tư thế và thảo luận về một số ứng dụng của nó. Hãy xem cách bạn có thể thử ước tính tư thế với mô hình YOLO11 mới. Để bắt đầu, có hai cách thuận tiện để thực hiện việc này: sử dụng gói Ultralytics Python hoặc thông qua Ultralytics HUB. Hãy xem xét cả hai tùy chọn.

Chạy suy luận bằng YOLO11

Chạy suy luận liên quan đến việc mô hình YOLO11 xử lý dữ liệu mới bên ngoài bộ dữ liệu huấn luyện và sử dụng các mẫu đã học để đưa ra dự đoán dựa trên dữ liệu đó. Bạn có thể chạy suy luận thông qua mã bằng gói Ultralytics Python. Tất cả những gì bạn cần để bắt đầu là cài đặt gói Ultralytics bằng pip, conda hoặc Docker. Nếu bạn gặp bất kỳ khó khăn nào trong quá trình cài đặt, Hướng dẫn về các vấn đề thường gặp của chúng tôi cung cấp các mẹo khắc phục sự cố hữu ích. 

Sau khi bạn đã cài đặt thành công gói, đoạn mã sau đây sẽ trình bày cách tải mô hình và sử dụng nó để dự đoán tư thế của các đối tượng trong ảnh.

__wf_reserved_inherit
Hình 6. Đoạn mã thể hiện việc chạy suy luận bằng YOLO11.

Huấn luyện một mô hình YOLO11 tùy chỉnh

Giả sử bạn đang làm việc trên một dự án thị giác máy tính và bạn có một tập dữ liệu cụ thể cho một ứng dụng cụ thể liên quan đến ước tính tư thế. Sau đó, bạn có thể tinh chỉnh và huấn luyện một mô hình YOLO11 tùy chỉnh cho phù hợp với ứng dụng của bạn. Ví dụ: bạn có thể sử dụng một tập dữ liệu các điểm chính (keypoints) để phân tích và hiểu tư thế của một con hổ trong ảnh bằng cách xác định các đặc điểm chính như vị trí của các chi, đầu và đuôi của nó.

Bạn có thể sử dụng đoạn mã sau để tải và huấn luyện mô hình ước tính tư thế YOLO11. Mô hình có thể được xây dựng từ cấu hình YAML, hoặc bạn có thể tải một mô hình đã được huấn luyện trước để huấn luyện. Tập lệnh này cũng cho phép bạn chuyển trọng số và bắt đầu huấn luyện mô hình bằng một bộ dữ liệu được chỉ định, chẳng hạn như bộ dữ liệu COCO để ước tính tư thế.

__wf_reserved_inherit
Hình 7. Tự huấn luyện YOLO11.

Sử dụng mô hình tùy chỉnh mới được huấn luyện, bạn có thể chạy suy luận trên các hình ảnh chưa thấy liên quan đến giải pháp thị giác máy tính của bạn. Mô hình đã huấn luyện cũng có thể được chuyển đổi sang các định dạng khác bằng cách sử dụng chế độ xuất.

Dùng thử YOLO11 trên Ultralytics HUB

Cho đến nay, chúng ta đã xem xét các phương pháp sử dụng YOLO11 đòi hỏi một số kiến thức mã hóa cơ bản. Nếu đó không phải là những gì bạn đang tìm kiếm hoặc bạn không quen thuộc với việc viết mã, thì có một tùy chọn khác: Ultralytics HUB. Ultralytics HUB là một nền tảng thân thiện với người dùng được thiết kế để đơn giản hóa quy trình huấn luyện và triển khai các mô hình YOLO. HUB cho phép bạn dễ dàng quản lý bộ dữ liệu, huấn luyện mô hình và triển khai chúng mà không cần chuyên môn kỹ thuật.

Để chạy suy luận trên hình ảnh, bạn có thể tạo một tài khoản, điều hướng đến phần 'Mô hình' và chọn mô hình ước tính tư thế YOLO11 mà bạn quan tâm. Trong phần xem trước, bạn có thể tải lên một hình ảnh và xem kết quả dự đoán như hình bên dưới. 

__wf_reserved_inherit
Hình 8. Ước tính tư thế trên Ultralytics HUB với YOLO11.

Những tiến bộ của YOLO11 trong phát hiện dáng người

Ultralytics YOLO11 cung cấp các giải pháp chính xác và linh hoạt cho các tác vụ như ước tính tư thế (pose estimation) trên nhiều ứng dụng khác nhau. Từ việc cải thiện sự an toàn của công nhân tại các công trường xây dựng đến giám sát sức khỏe vật nuôi và hỗ trợ điều chỉnh tư thế trong các bài tập thể dục, YOLO11 mang lại độ chính xác và phản hồi theo thời gian thực thông qua công nghệ thị giác máy tính tiên tiến. 

Tính linh hoạt của nó, với nhiều biến thể mô hình và khả năng tùy chỉnh huấn luyện cho các trường hợp sử dụng cụ thể, làm cho nó trở thành một công cụ rất có giá trị cho các nhà phát triển và doanh nghiệp. Cho dù thông qua việc viết code bằng gói Ultralytics Python hoặc sử dụng Ultralytics HUB để triển khai dễ dàng hơn, YOLO11 giúp cho việc ước tính tư thế (pose estimation) trở nên dễ tiếp cận và hiệu quả.

Để khám phá thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia với cộng đồng của chúng tôi. Khám phá các ứng dụng AI trong sản xuấtnông nghiệp trên các trang giải pháp của chúng tôi. 🚀

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard