Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Ultralytics YOLO

Cách sử dụng Ultralytics YOLO11 để ước tính tư thế

Tìm hiểu cách sử dụng mô hình Ultralytics YOLO11 để ước tính tư thế (pose estimation) chính xác. Chúng ta sẽ đề cập đến suy luận thời gian thực và huấn luyện mô hình tùy chỉnh cho các ứng dụng khác nhau.

ABAbirami Vina
3 min read
Ultralytics YOLO11 ước tính các điểm chính trên cơ thể người

Nghiên cứu liên quan đến computer vision, một nhánh của trí tuệ nhân tạo (AI), đã bắt đầu từ những năm 1960. Tuy nhiên, phải đến những năm 2010, với sự trỗi dậy của deep learning, chúng ta mới chứng kiến những bước đột phá lớn trong cách máy móc hiểu hình ảnh. Một trong những tiến bộ mới nhất trong computer vision chính là các model Ultralytics YOLO11 tiên tiến. Các model YOLO11, lần đầu được giới thiệu tại sự kiện hybrid thường niên của Ultralytics, YOLO Vision 2024 (YV24), hỗ trợ một loạt các tác vụ computer vision, bao gồm ước tính tư thế.

Pose estimation có thể được sử dụng để phát hiện các điểm mấu chốt (key points) trên người hoặc vật thể trong hình ảnh hoặc video để hiểu vị trí, tư thế hoặc chuyển động của chúng. Kỹ thuật này được ứng dụng rộng rãi trong các lĩnh vực như phân tích thể thao, giám sát hành vi động vậtrobotics nhằm giúp máy móc diễn giải các hành động vật lý theo thời gian thực. Nhờ độ chính xác, hiệu quả và tốc độ được cải thiện so với các model trước đó trong series YOLO (You Only Look Once), YOLO11 rất phù hợp cho các tác vụ ước tính tư thế theo thời gian thực.

Sử dụng Ultralytics YOLO11 để ước tính tư thế

Hình 1. Ví dụ về việc sử dụng Ultralytics YOLO11 để ước tính tư thế.

Trong bài viết này, chúng ta sẽ khám phá pose estimation là gì, thảo luận về một số ứng dụng và hướng dẫn cách bạn có thể sử dụng YOLO11 với package Python Ultralytics để ước tính tư thế. Chúng ta cũng sẽ xem xét cách bạn có thể sử dụng Ultralytics HUB để trải nghiệm YOLO11 và pose estimation chỉ với vài cú nhấp chuột đơn giản. Hãy bắt đầu thôi!

Link to this sectionPose estimation là gì?#

Trước khi đi sâu vào cách sử dụng model Ultralytics YOLO11 mới để ước tính tư thế, hãy cùng tìm hiểu kỹ hơn về pose estimation.

Pose estimation là một kỹ thuật computer vision được sử dụng để phân tích tư thế của con người hoặc vật thể trong hình ảnh hoặc video. Các model deep learning như YOLO11 có thể xác định, định vị và theo dõi các điểm mấu chốt (key points) trên một vật thể hoặc con người. Đối với vật thể, các key points này có thể bao gồm các góc, cạnh hoặc các dấu hiệu bề mặt đặc biệt, trong khi đối với con người, các key points này đại diện cho các khớp chính như khuỷu tay, đầu gối hoặc vai.

Pose estimation là một kỹ thuật độc đáo và phức tạp hơn so với các tác vụ computer vision khác như object detection. Trong khi object detection định vị vật thể trong hình ảnh bằng cách vẽ một khung bao quanh chúng, thì pose estimation tiến xa hơn bằng cách dự đoán vị trí chính xác của các điểm mấu chốt trên vật thể đó.

YOLO11 ước tính tư thế của con người trong văn phòng

Hình 2. Sử dụng YOLO11 để phát hiện và ước tính tư thế của con người trong văn phòng.

Khi nói đến pose estimation, có hai phương pháp chính: bottom-up và top-down. Phương pháp bottom-up phát hiện các điểm mấu chốt riêng lẻ và nhóm chúng thành bộ khung xương, trong khi phương pháp top-down tập trung vào việc trước tiên phát hiện vật thể và sau đó ước tính các điểm mấu chốt bên trong chúng.

YOLO11 kết hợp thế mạnh của cả phương pháp top-down và bottom-up. Giống như phương pháp bottom-up, nó giữ mọi thứ đơn giản và nhanh chóng mà không cần phải nhóm các điểm mấu chốt theo cách thủ công. Đồng thời, nó tận dụng độ chính xác của phương pháp top-down bằng cách phát hiện con người và ước tính tư thế của họ trong một bước duy nhất.

Link to this sectionCác trường hợp sử dụng pose estimation cho YOLO11#

Khả năng linh hoạt của YOLO11 trong pose estimation mở ra nhiều trường hợp ứng dụng tiềm năng trong nhiều ngành công nghiệp. Hãy cùng xem xét kỹ hơn một số trường hợp sử dụng pose estimation của YOLO11.

Link to this sectionPose estimation thời gian thực với YOLO11: Cải thiện an toàn lao động#

An toàn là một khía cạnh quan trọng của bất kỳ dự án xây dựng nào. Điều này đặc biệt đúng vì theo thống kê, các công trường xây dựng có tỷ lệ chấn thương liên quan đến công việc cao hơn. Năm 2021, khoảng 20% tổng số thương vong gây tử vong liên quan đến công việc xảy ra tại hoặc gần các công trường xây dựng. Với những rủi ro hàng ngày như thiết bị hạng nặng và hệ thống điện, các biện pháp an toàn nghiêm ngặt là điều cần thiết để bảo vệ người lao động. Các phương pháp truyền thống như sử dụng biển báo, rào chắn và giám sát thủ công bởi người quản lý không phải lúc nào cũng hiệu quả và thường khiến người quản lý xao nhãng các nhiệm vụ quan trọng hơn.

AI có thể can thiệp để cải thiện sự an toàn, và nguy cơ tai nạn có thể được giảm thiểu bằng cách sử dụng hệ thống giám sát người lao động dựa trên pose estimation. Các model Ultralytics YOLO11 có thể được sử dụng để theo dõi chuyển động và tư thế của người lao động. Mọi mối nguy hiểm tiềm ẩn như người lao động đứng quá gần các thiết bị nguy hiểm hoặc thực hiện công việc sai quy trình có thể được phát hiện nhanh chóng. Nếu phát hiện rủi ro, người quản lý có thể được thông báo hoặc hệ thống báo động có thể cảnh báo người lao động. Một hệ thống giám sát liên tục có thể làm cho công trường xây dựng an toàn hơn bằng cách luôn theo dõi các mối nguy hiểm và bảo vệ người lao động.

Ước tính tư thế tại công trường xây dựng sử dụng YOLO11

Hình 3. Ví dụ về pose estimation trên công trường xây dựng sử dụng YOLO11.

Link to this sectionPose estimation với YOLO11 để giám sát chăn nuôi#

Nông dâncác nhà nghiên cứu có thể sử dụng YOLO11 để nghiên cứu chuyển động và hành vi của vật nuôi, như gia súc, nhằm phát hiện sớm các dấu hiệu bệnh tật như chứng khập khiễng (lameness). Chứng khập khiễng là tình trạng con vật gặp khó khăn khi di chuyển do đau chân hoặc đau móng. Ở gia súc, các bệnh như khập khiễng không chỉ ảnh hưởng đến sức khỏe và phúc lợi của chúng mà còn dẫn đến các vấn đề về sản lượng tại các trang trại bò sữa. Các nghiên cứu cho thấy chứng khập khiễng ảnh hưởng từ 8% gia súc trong hệ thống chăn thả đến 15% - 30% trong các hệ thống nuôi nhốt trên toàn ngành sữa toàn cầu. Việc phát hiện và giải quyết sớm chứng khập khiễng có thể giúp cải thiện phúc lợi động vật và giảm thiểu thiệt hại sản xuất liên quan đến tình trạng này.

Các tính năng pose estimation của YOLO11 có thể giúp nông dân theo dõi kiểu dáng đi của con vật và nhanh chóng xác định bất kỳ sự bất thường nào có thể báo hiệu các vấn đề sức khỏe, chẳng hạn như vấn đề về khớp hoặc nhiễm trùng. Việc phát hiện sớm các vấn đề này cho phép điều trị nhanh hơn, giảm bớt sự khó chịu cho vật nuôi và giúp nông dân tránh được những tổn thất kinh tế.

Các hệ thống giám sát dựa trên vision AI cũng có thể giúp phân tích hành vi nghỉ ngơi, tương tác xã hội và mô hình ăn uống. Nông dân cũng có thể sử dụng pose estimation để quan sát các dấu hiệu căng thẳng hoặc hung dữ. Những thông tin chi tiết này có thể được sử dụng để tạo điều kiện sống tốt hơn cho động vật và nâng cao phúc lợi của chúng.

Trực quan hóa ước tính tư thế bò

Hình 4. Hình ảnh minh họa về ước tính tư thế bò.

Link to this sectionCác trường hợp sử dụng YOLO11 trong ngành thể hình#

Pose estimation cũng có thể giúp mọi người cải thiện tư thế theo thời gian thực trong khi tập luyện. Với YOLO11, huấn luyện viên thể hình và yoga có thể giám sát và theo dõi chuyển động cơ thể của người tập, tập trung vào các điểm mấu chốt như khớp và chi để đánh giá tư thế. Dữ liệu thu thập được có thể được so sánh với các tư thế và kỹ thuật tập luyện lý tưởng, và huấn luyện viên có thể nhận được cảnh báo nếu ai đó đang thực hiện sai động tác, giúp ngăn ngừa chấn thương.

Sử dụng ước tính tư thế để phân tích bài tập thể dục

Hình 5. Sử dụng Pose Estimation để phân tích bài tập.

Ví dụ, trong một lớp học yoga, pose estimation có thể giúp theo dõi xem tất cả học viên có đang duy trì sự cân bằng và căn chỉnh đúng cách hay không. Các ứng dụng di động được tích hợp computer vision và pose estimation có thể làm cho việc tập luyện dễ tiếp cận hơn đối với những người tập luyện tại nhà hoặc những người không có điều kiện thuê huấn luyện viên cá nhân. Phản hồi thời gian thực liên tục này giúp người dùng cải thiện kỹ thuật và đạt được mục tiêu thể hình của mình đồng thời giảm nguy cơ chấn thương.

Link to this sectionThử nghiệm pose estimation thời gian thực với model YOLO11#

Bây giờ chúng ta đã khám phá pose estimation là gì và thảo luận về một số ứng dụng của nó, hãy cùng xem cách bạn có thể thử nghiệm pose estimation với model YOLO11 mới. Để bắt đầu, có hai cách thuận tiện: sử dụng package Python Ultralytics hoặc thông qua Ultralytics HUB. Hãy cùng xem qua cả hai tùy chọn này.

Link to this sectionChạy suy luận sử dụng YOLO11#

Chạy inference liên quan đến việc model YOLO11 xử lý dữ liệu mới ngoài các tập training của nó và sử dụng các mô hình (patterns) mà nó đã học được để đưa ra dự đoán dựa trên dữ liệu đó. Bạn có thể chạy inference thông qua mã code với package Python Ultralytics. Tất cả những gì bạn cần làm để bắt đầu là cài đặt package Ultralytics bằng pip, conda hoặc Docker. Nếu bạn gặp bất kỳ thách thức nào trong quá trình cài đặt, Hướng dẫn về các vấn đề phổ biến của chúng tôi cung cấp các mẹo khắc phục sự cố hữu ích.

Sau khi cài đặt thành công package, đoạn code dưới đây sẽ phác thảo cách tải model và sử dụng nó để dự đoán tư thế của các vật thể trong hình ảnh.

Đoạn mã chạy suy luận sử dụng YOLO11

Hình 6. Đoạn code minh họa việc chạy inference sử dụng YOLO11.

Link to this sectionHuấn luyện một mô hình YOLO11 tùy chỉnh#

Giả sử bạn đang thực hiện một dự án computer vision và bạn có một dataset cụ thể cho một ứng dụng liên quan đến pose estimation. Sau đó, bạn có thể fine-tune và huấn luyện một model YOLO11 tùy chỉnh để phù hợp với ứng dụng của bạn. Ví dụ, bạn có thể sử dụng dataset chứa các điểm mấu chốt để phân tích và hiểu tư thế của một con hổ trong hình ảnh bằng cách xác định các đặc điểm chính như vị trí của các chi, đầu và đuôi.

Bạn có thể sử dụng đoạn code sau để tải và huấn luyện model pose estimation YOLO11. Model có thể được xây dựng từ cấu hình YAML, hoặc bạn có thể tải một model đã được huấn luyện sẵn để tiếp tục huấn luyện. Script này cũng cho phép bạn chuyển đổi weights và bắt đầu huấn luyện model bằng một dataset chỉ định, chẳng hạn như dataset COCO cho pose estimation.

Mã nguồn để huấn luyện tùy chỉnh một model YOLO11

Hình 7. Huấn luyện tùy chỉnh YOLO11.

Sử dụng model tùy chỉnh mới được huấn luyện, bạn có thể chạy inference trên các hình ảnh chưa từng thấy liên quan đến giải pháp computer vision của bạn. Model đã huấn luyện cũng có thể được chuyển đổi sang các định dạng khác bằng chế độ export.

Link to this sectionTrải nghiệm YOLO11 trên Ultralytics HUB#

Cho đến nay, chúng ta đã xem xét các phương pháp sử dụng YOLO11 đòi hỏi một số kiến thức lập trình cơ bản. Nếu đó không phải là điều bạn đang tìm kiếm, hoặc bạn không quen với việc viết code, còn một lựa chọn khác: Ultralytics HUB. Ultralytics HUB là một nền tảng thân thiện với người dùng được thiết kế để đơn giản hóa quy trình huấn luyện và triển khai các model YOLO. HUB cho phép bạn dễ dàng quản lý dataset, huấn luyện model và triển khai chúng mà không cần chuyên môn kỹ thuật.

Để chạy inference trên hình ảnh, bạn có thể tạo tài khoản, điều hướng đến phần ‘Models’ và chọn model YOLO11 pose estimation mà bạn quan tâm. Trong phần xem trước, bạn có thể tải lên một hình ảnh và xem kết quả dự đoán như hiển thị bên dưới.

Ước tính tư thế trên Ultralytics HUB với YOLO11

Hình 8. Pose Estimation trên Ultralytics HUB với YOLO11.

Link to this sectionNhững tiến bộ của YOLO11 trong phát hiện tư thế người#

Ultralytics YOLO11 cung cấp các giải pháp chính xác và linh hoạt cho các tác vụ như pose estimation trên nhiều ứng dụng. Từ việc cải thiện an toàn cho người lao động tại công trường xây dựng đến giám sát sức khỏe gia súc và hỗ trợ điều chỉnh tư thế trong các bài tập thể hình, YOLO11 mang lại sự chính xác và phản hồi theo thời gian thực thông qua công nghệ computer vision tiên tiến.

Sự linh hoạt của nó, với nhiều biến thể model và khả năng huấn luyện tùy chỉnh cho các trường hợp sử dụng cụ thể, làm cho nó trở thành một công cụ rất giá trị cho cả các nhà phát triển và doanh nghiệp. Dù là thông qua việc viết code với package Python Ultralytics hay sử dụng Ultralytics HUB để triển khai dễ dàng hơn, YOLO11 đều làm cho việc ước tính tư thế trở nên dễ tiếp cận và đầy tác động.

Để khám phá thêm, hãy truy cập GitHub repository của chúng tôi và tham gia cùng cộng đồng của chúng tôi. Khám phá các ứng dụng AI trong sản xuấtnông nghiệp trên các trang giải pháp của chúng tôi. 🚀

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning