Bằng cách nhấp vào “Chấp nhận tất cả Cookie”, bạn đồng ý với việc lưu trữ cookie trên thiết bị của mình để tăng cường khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thêm thông tin
Cài đặt Cookie
Bằng cách nhấp vào “Chấp nhận tất cả Cookie”, bạn đồng ý với việc lưu trữ cookie trên thiết bị của mình để tăng cường khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thêm thông tin
Tìm hiểu cách sử dụng mô hình Ultralytics YOLO11 để ước tính tư thế chính xác. Chúng ta sẽ đề cập đến suy luận thời gian thực và huấn luyện mô hình tùy chỉnh cho các ứng dụng khác nhau.
Hình 1. Một ví dụ về việc sử dụng Ultralytics YOLO11 để ước tính tư thế (pose estimation).
Trong bài viết này, chúng ta sẽ khám phá ước tính tư thế là gì, thảo luận về một số ứng dụng của nó và hướng dẫn bạn cách sử dụng YOLO11 với gói Ultralytics Python để ước tính tư thế. Chúng ta cũng sẽ xem xét cách bạn có thể sử dụng Ultralytics HUB để dùng thử YOLO11 và ước tính tư thế chỉ với một vài cú nhấp chuột. Hãy cùng bắt đầu!
Ước tính tư thế là gì?
Trước khi đi sâu vào cách sử dụng mô hình Ultralytics YOLO11 mới cho pose estimation, hãy hiểu rõ hơn về pose estimation.
Ước tính tư thế là một kỹ thuật computer vision được sử dụng để phân tích tư thế của một người hoặc vật thể trong một hình ảnh hoặc video. Các mô hình deep learning như YOLO11 có thể xác định, định vị và theo dõi các điểm chính trên một đối tượng hoặc người nhất định. Đối với các đối tượng, những điểm chính này có thể bao gồm các góc, cạnh hoặc các dấu hiệu bề mặt riêng biệt, trong khi đối với con người, những điểm chính này đại diện cho các khớp chính như khuỷu tay, đầu gối hoặc vai.
Ước tính tư thế là duy nhất và phức tạp hơn so với các tác vụ computer vision khác như object detection. Trong khi object detection định vị các đối tượng trong một hình ảnh bằng cách vẽ một hộp xung quanh chúng, thì ước tính tư thế tiến xa hơn bằng cách dự đoán vị trí chính xác của các điểm chính trên đối tượng.
Hình 2. Sử dụng YOLO11 để phát hiện và ước tính tư thế của mọi người trong văn phòng.
Khi nói đến ước tính tư thế, có hai phương pháp chính: từ dưới lên và từ trên xuống. Phương pháp từ dưới lên phát hiện các điểm chính riêng lẻ và nhóm chúng thành bộ xương, trong khi phương pháp từ trên xuống tập trung vào việc phát hiện đối tượng trước, sau đó ước tính các điểm chính bên trong chúng.
YOLO11 kết hợp sức mạnh của cả phương pháp từ trên xuống và từ dưới lên. Giống như phương pháp từ dưới lên, nó giữ cho mọi thứ đơn giản và nhanh chóng mà không cần nhóm các điểm chính theo cách thủ công. Đồng thời, nó sử dụng độ chính xác của phương pháp từ trên xuống bằng cách phát hiện người và ước tính tư thế của họ trong một bước duy nhất.
Các trường hợp sử dụng ước tính tư thế cho YOLO11
Khả năng linh hoạt của YOLO11 trong việc ước tính tư thế mở ra một loạt các ứng dụng tiềm năng trong nhiều ngành công nghiệp. Hãy xem xét kỹ hơn một số trường hợp sử dụng ước tính tư thế của YOLO11.
Ước tính tư thế theo thời gian thực với YOLO11: Cải thiện an toàn cho người lao động
An toàn là một khía cạnh quan trọng của bất kỳ dự án xây dựng nào. Điều này đặc biệt đúng, vì theo thống kê, các công trường xây dựng có số lượng thương tích liên quan đến công việc cao hơn. Vào năm 2021, khoảng 20% tổng số thương tích gây tử vong liên quan đến công việc xảy ra trên hoặc gần các công trường xây dựng. Với những rủi ro hàng ngày như thiết bị hạng nặng và hệ thống điện, các biện pháp an toàn mạnh mẽ là rất cần thiết để giữ an toàn cho người lao động. Các phương pháp truyền thống như sử dụng biển báo, rào chắn và giám sát thủ công bởi người giám sát không phải lúc nào cũng hiệu quả và thường khiến người giám sát rời xa các nhiệm vụ quan trọng hơn.
AI có thể can thiệp để cải thiện an toàn và nguy cơ tai nạn có thể được giảm thiểu bằng cách sử dụng hệ thống giám sát người lao động dựa trên ước tính tư thế. Các mô hình Ultralytics YOLO11 có thể được sử dụng để theo dõi các chuyển động và tư thế của người lao động. Bất kỳ mối nguy tiềm ẩn nào như công nhân đứng quá gần thiết bị nguy hiểm hoặc thực hiện các công việc không chính xác đều có thể được phát hiện nhanh chóng. Nếu phát hiện thấy rủi ro, người giám sát có thể được thông báo hoặc báo động có thể cảnh báo cho công nhân. Một hệ thống giám sát liên tục có thể làm cho các công trường xây dựng an toàn hơn bằng cách luôn cảnh giác với các mối nguy hiểm và bảo vệ người lao động.
Hình 3. Một ví dụ về ước tính tư thế trên công trường xây dựng bằng YOLO11.
Ước tính tư thế với YOLO11 để theo dõi vật nuôi
Nông dân và nhà nghiên cứu có thể sử dụng YOLO11 để nghiên cứu sự di chuyển và hành vi của vật nuôi, chẳng hạn như gia súc, để phát hiện sớm các dấu hiệu của bệnh tật như què. Què là tình trạng một con vật gặp khó khăn trong việc di chuyển đúng cách do đau ở chân. Ở gia súc, các bệnh như què không chỉ ảnh hưởng đến sức khỏe và phúc lợi của chúng mà còn dẫn đến các vấn đề sản xuất tại các trang trại bò sữa. Các nghiên cứu cho thấy chứng què ảnh hưởng đến khoảng 8% số gia súc trong các hệ thống chăn thả và 15% đến 30% trong các hệ thống nuôi nhốt trên toàn ngành công nghiệp sữa toàn cầu. Phát hiện và giải quyết chứng què sớm có thể giúp cải thiện phúc lợi động vật và giảm tổn thất sản xuất liên quan đến tình trạng này.
Các tính năng ước tính tư thế của YOLO11 có thể giúp nông dân theo dõi kiểu dáng đi của động vật và nhanh chóng xác định bất kỳ bất thường nào có thể báo hiệu các vấn đề về sức khỏe, chẳng hạn như các vấn đề về khớp hoặc nhiễm trùng. Việc phát hiện sớm những vấn đề này cho phép điều trị nhanh hơn, giảm bớt sự khó chịu cho động vật và giúp nông dân tránh được thiệt hại kinh tế.
AI thị giác hỗ trợ các hệ thống giám sát cũng có thể giúp phân tích hành vi nghỉ ngơi, tương tác xã hội và thói quen ăn uống. Nông dân cũng có thể sử dụng ước tính tư thế để có được các quan sát về các dấu hiệu căng thẳng hoặc hung hăng. Những thông tin chi tiết này có thể được sử dụng để cải thiện điều kiện sống cho động vật và tăng cường phúc lợi của chúng.
Hình 4. Một hình ảnh trực quan về Ước tính tư thế con bò.
Các trường hợp sử dụng YOLO11 trong ngành thể hình
Ước tính tư thế cũng có thể giúp mọi người cải thiện tư thế của họ trong thời gian thực trong khi tập luyện. Với YOLO11, các huấn luyện viên phòng tập và yoga có thể theo dõi và theo dõi các chuyển động cơ thể của những người tập luyện, tập trung vào các điểm chính như khớp và chi để đánh giá tư thế của họ. Dữ liệu thu thập được có thể được so sánh với các tư thế lý tưởng và kỹ thuật tập luyện, và các huấn luyện viên có thể nhận được cảnh báo nếu ai đó thực hiện một động tác không chính xác, giúp ngăn ngừa chấn thương.
Hình 5. Sử dụng Ước tính Tư thế để Phân tích Bài tập.
Ví dụ: trong một lớp học yoga, ước tính tư thế có thể giúp theo dõi xem tất cả học viên có duy trì sự cân bằng và căn chỉnh thích hợp hay không. Các ứng dụng di động được tích hợp với thị giác máy tính và ước tính tư thế có thể giúp việc tập thể dục dễ tiếp cận hơn cho những người tập luyện tại nhà hoặc những người không có huấn luyện viên cá nhân. Phản hồi liên tục theo thời gian thực này giúp người dùng cải thiện kỹ thuật và đạt được mục tiêu tập thể dục của họ đồng thời giảm nguy cơ chấn thương.
Thử ước tính tư thế theo thời gian thực với mô hình YOLO11
Bây giờ chúng ta đã tìm hiểu về ước tính tư thế và thảo luận về một số ứng dụng của nó. Hãy xem cách bạn có thể thử ước tính tư thế với mô hình YOLO11 mới. Để bắt đầu, có hai cách thuận tiện để thực hiện việc này: sử dụng gói Ultralytics Python hoặc thông qua Ultralytics HUB. Hãy xem xét cả hai tùy chọn.
Chạy suy luận bằng YOLO11
Chạy suy luận liên quan đến việc mô hình YOLO11 xử lý dữ liệu mới bên ngoài bộ dữ liệu huấn luyện và sử dụng các mẫu đã học để đưa ra dự đoán dựa trên dữ liệu đó. Bạn có thể chạy suy luận thông qua mã bằng gói Ultralytics Python. Tất cả những gì bạn cần để bắt đầu là cài đặt gói Ultralytics bằng pip, conda hoặc Docker. Nếu bạn gặp bất kỳ khó khăn nào trong quá trình cài đặt, Hướng dẫn về các vấn đề thường gặp của chúng tôi cung cấp các mẹo khắc phục sự cố hữu ích.
Sau khi bạn đã cài đặt thành công gói, đoạn mã sau đây sẽ trình bày cách tải mô hình và sử dụng nó để dự đoán tư thế của các đối tượng trong ảnh.
Hình 6. Đoạn mã thể hiện việc chạy suy luận bằng YOLO11.
Bạn có thể sử dụng đoạn mã sau để tải và huấn luyện mô hình ước tính tư thế YOLO11. Mô hình có thể được xây dựng từ cấu hình YAML, hoặc bạn có thể tải một mô hình đã được huấn luyện trước để huấn luyện. Tập lệnh này cũng cho phép bạn chuyển trọng số và bắt đầu huấn luyện mô hình bằng một bộ dữ liệu được chỉ định, chẳng hạn như bộ dữ liệu COCO để ước tính tư thế.
Hình 7. Tự huấn luyện YOLO11.
Sử dụng mô hình tùy chỉnh mới được huấn luyện, bạn có thể chạy suy luận trên các hình ảnh chưa thấy liên quan đến giải pháp thị giác máy tính của bạn. Mô hình đã huấn luyện cũng có thể được chuyển đổi sang các định dạng khác bằng cách sử dụng chế độ xuất.
Dùng thử YOLO11 trên Ultralytics HUB
Cho đến nay, chúng ta đã xem xét các phương pháp sử dụng YOLO11 đòi hỏi một số kiến thức mã hóa cơ bản. Nếu đó không phải là những gì bạn đang tìm kiếm hoặc bạn không quen thuộc với việc viết mã, thì có một tùy chọn khác: Ultralytics HUB. Ultralytics HUB là một nền tảng thân thiện với người dùng được thiết kế để đơn giản hóa quy trình huấn luyện và triển khai các mô hình YOLO. HUB cho phép bạn dễ dàng quản lý bộ dữ liệu, huấn luyện mô hình và triển khai chúng mà không cần chuyên môn kỹ thuật.
Để chạy suy luận trên hình ảnh, bạn có thể tạo một tài khoản, điều hướng đến phần 'Mô hình' và chọn mô hình ước tính tư thế YOLO11 mà bạn quan tâm. Trong phần xem trước, bạn có thể tải lên một hình ảnh và xem kết quả dự đoán như hình bên dưới.
Hình 8. Ước tính tư thế trên Ultralytics HUB với YOLO11.
Những tiến bộ của YOLO11 trong phát hiện dáng người
Ultralytics YOLO11 cung cấp các giải pháp chính xác và linh hoạt cho các tác vụ như ước tính tư thế (pose estimation) trên nhiều ứng dụng khác nhau. Từ việc cải thiện sự an toàn của công nhân tại các công trường xây dựng đến giám sát sức khỏe vật nuôi và hỗ trợ điều chỉnh tư thế trong các bài tập thể dục, YOLO11 mang lại độ chính xác và phản hồi theo thời gian thực thông qua công nghệ thị giác máy tính tiên tiến.
Tính linh hoạt của nó, với nhiều biến thể mô hình và khả năng tùy chỉnh huấn luyện cho các trường hợp sử dụng cụ thể, làm cho nó trở thành một công cụ rất có giá trị cho các nhà phát triển và doanh nghiệp. Cho dù thông qua việc viết code bằng gói Ultralytics Python hoặc sử dụng Ultralytics HUB để triển khai dễ dàng hơn, YOLO11 giúp cho việc ước tính tư thế (pose estimation) trở nên dễ tiếp cận và hiệu quả.
Để khám phá thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia với cộng đồng của chúng tôi. Khám phá các ứng dụng AI trong sản xuất và nông nghiệp trên các trang giải pháp của chúng tôi. 🚀