Bằng cách nhấp vào “Chấp nhận tất cả Cookie”, bạn đồng ý với việc lưu trữ cookie trên thiết bị của mình để tăng cường khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thêm thông tin
Cài đặt Cookie
Bằng cách nhấp vào “Chấp nhận tất cả Cookie”, bạn đồng ý với việc lưu trữ cookie trên thiết bị của mình để tăng cường khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thêm thông tin
Khám phá cách thức Ultralytics YOLO26 cải thiện khả năng ước lượng tư thế với khả năng hỗ trợ điểm mấu chốt phi con người tốt hơn, tốc độ hội tụ nhanh hơn, khả năng xử lý che khuất được cải thiện và triển khai thời gian thực hiệu quả.
Mở rộng quy mô các dự án thị giác máy tính của bạn với Ultralytics
Khi quan sát tư thế của ai đó, bạn dễ dàng nhận thấy họ đang khom lưng, nghiêng người về phía trước hay đứng thẳng. Con người có thể nhanh chóng hiểu được mối liên hệ giữa các bộ phận khác nhau của cơ thể.
Đó là một phần vốn có trong cách chúng ta diễn giải chuyển động và ngôn ngữ cơ thể trong cuộc sống hàng ngày. Tuy nhiên, đối với máy móc, loại hiểu biết thị giác này không phải là tự động. Việc dạy một hệ thống nhận biết chuyển động và cấu trúc đòi hỏi các kỹ thuật học sâu và thị giác máy tính tiên tiến cho phép nó diễn giải hình ảnh một cách có ý nghĩa.
Cụ thể, ước lượng tư thế là một kỹ thuật trí tuệ nhân tạo thị giác cho phép mô hình thị giác máy tính xây dựng sự hiểu biết tương tự. Thay vì chỉ đơn thuần phát hiện một đối tượng trong hình ảnh, mô hình dự đoán các điểm mấu chốt đại diện cho các mốc cấu trúc quan trọng.
Những điểm mốc này có thể tương ứng với các khớp xương trong cơ thể, chi của động vật, các bộ phận máy móc, hoặc thậm chí là các điểm cố định như góc sân. Bằng cách xác định và theo dõi các điểm này, hệ thống có thể hiểu được vị trí, sự thẳng hàng và chuyển động một cách có cấu trúc và có thể đo lường được.
Khi việc ước lượng tư thế được áp dụng vào nhiều tình huống thực tế hơn, các mô hình phải xử lý hiệu quả hơn các điểm mấu chốt không phải của con người, các cảnh phức tạp và các tập dữ liệu tùy chỉnh. Ví dụ, các mô hình tiên tiến như Ultralytics YOLO26 hỗ trợ các tác vụ thị giác máy tính như ước lượng tư thế và được xây dựng dựa trên các mô hình trước đó. YOLO Các mô hình trình bày được cải tiến về kiến trúc và đào tạo nhằm nâng cao tính linh hoạt và hiệu suất tổng thể.
Hình 1. Một ví dụ về ước lượng tư thế được thực hiện bởi YOLO ( Nguồn )
Trong bài viết này, chúng ta sẽ so sánh YOLO26-pose với các phiên bản trước đó. Ultralytics YOLO Hãy thử tạo mô hình và khám phá cách nó cải thiện tính linh hoạt, tốc độ hội tụ và hiệu suất trong các cảnh phức tạp. Bắt đầu nào!
Ước tính tư thế là gì?
Trước khi đi sâu vào so sánh các mô hình tư thế YOLO Ultralytics , chúng ta hãy cùng xem xét kỹ hơn ý nghĩa thực sự của việc ước lượng tư thế trong bối cảnh thị giác máy tính.
Ước tính tư thế là một kỹ thuật được sử dụng để detect Và track Các điểm mấu chốt cụ thể trong một hình ảnh hoặc khung hình video. Những điểm mấu chốt này có thể đại diện cho các mốc cấu trúc quan trọng, chẳng hạn như các khớp trên cơ thể người, chi của động vật, các bộ phận của máy móc hoặc các điểm tham chiếu cố định trong một cảnh.
Hình 2. Ước tính tư thế của người lao động bằng phương pháp ước tính tư thế người ( Nguồn )
Bằng cách xác định tọa độ của các điểm này, mô hình có thể hiểu được vị trí của một đối tượng và cách nó di chuyển theo thời gian. Không giống như phân loại hình ảnh, chỉ gán một nhãn duy nhất cho toàn bộ hình ảnh, hoặc các mô hình phát hiện đối tượng, tập trung vào việc vẽ các khung bao quanh đối tượng, ước lượng tư thế cung cấp thông tin không gian chi tiết hơn về cấu trúc và chuyển động.
Tổng quan về tư thế YOLO26
Màn hình YOLO26-pose có nhiều biến thể hoặc kích thước khác nhau, bao gồm các tùy chọn nhẹ như YOLO26n-pose và các mẫu lớn hơn như YOLO26m-pose, YOLO26l-pose và YOLO26x-pose. Điều này cho phép các nhóm lựa chọn sự cân bằng phù hợp giữa tốc độ và độ chính xác tùy thuộc vào phần cứng và nhu cầu hiệu năng của họ.
Ultralytics Ngoài ra, nó còn cung cấp các mô hình tư thế được huấn luyện trước trên các tập dữ liệu lớn và tổng quát như... COCO tập dữ liệu, cụ thể là COCO -Tư thế ( COCO (Điểm mấu chốt) chú thích cho việc ước tính tư thế người, vì vậy bạn không cần phải bắt đầu từ đầu. Trong hầu hết các trường hợp, các nhóm sẽ tinh chỉnh các mô hình này trên tập dữ liệu của riêng họ để điều chỉnh chúng cho phù hợp với các điểm mấu chốt, bố cục hoặc môi trường cụ thể.
Quá trình này thường bao gồm việc chuẩn bị các tệp chú thích tùy chỉnh xác định tọa độ điểm đặc trưng và nhãn lớp theo định dạng có cấu trúc. Các chú thích này ánh xạ các điểm đặc trưng đến tọa độ pixel cụ thể trong mỗi hình ảnh, cho phép mô hình học được các mối quan hệ không gian chính xác trong quá trình huấn luyện.
Việc sử dụng các mô hình được huấn luyện trước giúp tăng tốc quá trình huấn luyện, giảm yêu cầu về dữ liệu và giúp đưa các dự án vào sản xuất hiệu quả hơn.
Ứng dụng thực tiễn của ước lượng tư thế người
Dưới đây là một vài ví dụ thực tế về những trường hợp mà việc ước lượng tư thế đóng vai trò quan trọng:
Chăm sóc sức khỏe và phục hồi chức năng: Các chuyên gia lâm sàng có thể sử dụng mô hình tư thế để đánh giá tư thế, theo dõi tiến trình phục hồi và phân tích các kiểu chuyển động trong quá trình vật lý trị liệu.
Hệ thống tự hành: Máy bay không người lái và camera thông minh có thể sử dụng thông tin về tư thế để hiểu rõ hơn về hướng và chuyển động của vật thể trong các cảnh động.
An toàn nơi làm việc: Các tổ chức có thể theo dõi tư thế cơ thể và các chuyển động lặp đi lặp lại để giúp xác định các rủi ro an toàn tiềm ẩn.
Thể dục và huấn luyện cá nhân:Các ứng dụng thể dục sử dụng ước lượng tư thế để track Hướng dẫn tập luyện, đếm số lần lặp lại và cung cấp phản hồi theo thời gian thực về tư thế và chuyển động được duy trì trong suốt các bài hướng dẫn thể dục.
Hình 3. Ước tính tư thế có thể giúp ích track Các điểm quan trọng trên cơ thể trong quá trình vận động thể thao. ( Nguồn )
Khám phá Ultralytics YOLO26 hỗ trợ ước lượng tư thế
Ultralytics YOLO26 được xây dựng dựa trên các phiên bản trước đó. Ultralytics YOLO các mô hình được cập nhật nhằm mục đích giúp việc huấn luyện và triển khai trở nên thiết thực hơn.
Giống như các phiên bản trước, nó hỗ trợ ước tính tư thế như một phần của khung thống nhất. Sự khác biệt chính là YOLO26 được xây dựng để linh hoạt và ổn định hơn trên nhiều trường hợp sử dụng thực tế.
Trước đó Ultralytics YOLO Các mô hình tư thế phần lớn bị ảnh hưởng bởi các bộ dữ liệu tư thế của con người, điều đó có nghĩa là một số phần của các phương pháp cũ được tối ưu hóa dựa trên cấu trúc khớp của con người. YOLO26 loại bỏ những giả định đặc thù của con người đó.
Do đó, nó phù hợp hơn cho việc nhận diện các điểm đặc trưng không phải con người, chẳng hạn như phát hiện các góc của sân tennis hoặc các mốc cấu trúc tùy chỉnh khác. Điều này rất quan trọng vì các mô hình YOLO26-pose được huấn luyện sẵn thường được đào tạo trên các tập dữ liệu như... COCO - Tạo dáng và dự đoán các điểm mấu chốt của con người được xác định trong phần chú thích của tập dữ liệu.
Tuy nhiên, khi các đội muốn detect Đối với các loại mốc khác nhau, chẳng hạn như các bộ phận máy móc, vạch kẻ sân thể thao hoặc các điểm cơ sở hạ tầng, mô hình thường cần được tinh chỉnh trên một tập dữ liệu tùy chỉnh, nơi các điểm mấu chốt cụ thể đó được chú thích.
Vì YOLO26 không bị ràng buộc bởi các giả định về cấu trúc khớp của con người, nó có thể thích nghi hiệu quả hơn trong quá trình tinh chỉnh. Tính linh hoạt này cho phép mô hình học các bố cục điểm mấu chốt tùy chỉnh một cách đáng tin cậy hơn, dẫn đến các chỉ số đánh giá được cải thiện khi xác thực trên các tập dữ liệu có cấu hình điểm mấu chốt độc đáo.
YOLO26-pose cũng được thiết kế để cải thiện khả năng định vị điểm mấu chốt khi các phần của đối tượng bị che khuất một phần hoặc xuất hiện ở kích thước rất nhỏ. Trong các cảnh thực tế liên quan đến các đối tượng ở xa, cảnh quay từ máy bay không người lái hoặc các tình huống vật thể nhỏ, điều này có thể dẫn đến dự đoán điểm mấu chốt chính xác hơn so với các mô hình tư thế trước đó.
Một cập nhật quan trọng khác là công thức tính toán tổn thất được cải tiến được sử dụng trong quá trình huấn luyện. Hàm tổn thất xác định cách mô hình sửa chữa các lỗi của nó trong quá trình học.
Đối với YOLO26-pose, quy trình này hiệu quả hơn, giúp mô hình học nhanh hơn và đạt độ chính xác cao hơn trong ít epoch hơn (trong đó epoch là một lần chạy đầy đủ qua tập dữ liệu huấn luyện).
Nhìn chung, YOLO26-pose được xây dựng dựa trên các phiên bản trước đó. Ultralytics YOLO Tạo ra các mô hình với những cải tiến rõ rệt hơn về hỗ trợ điểm mấu chốt phi con người và sự hội tụ huấn luyện, đồng thời vẫn duy trì quy trình làm việc quen thuộc.
So sánh YOLO26-pose với Ultralytics YOLOv5
Phiên bản sớm nhất của Ultralytics YOLO Mô hình Ultralytics YOLOv5 được xây dựng chủ yếu để phát hiện đối tượng. Trong khi đó, YOLOv5 Sau này được mở rộng để hỗ trợ phân đoạn đối tượng, nó không bao gồm đầu ước lượng tư thế chuyên dụng tích hợp sẵn trong phiên bản chính thức. Ultralytics khung.
Các nhóm cần phát hiện điểm mấu chốt thường dựa vào các triển khai riêng biệt hoặc các sửa đổi tùy chỉnh. Ultralytics YOLO26 tích hợp chức năng ước lượng tư thế, với một đầu robot chuyên dụng được thiết kế đặc biệt để dự đoán các điểm mấu chốt.
Điều này có nghĩa là các mô hình YOLO26-pose có thể được huấn luyện, xác thực và triển khai trong cùng một quy trình làm việc thống nhất như phát hiện và phân đoạn. Đối với các dự án tập trung vào phát hiện điểm mấu chốt có cấu trúc, YOLO26 cung cấp hỗ trợ tư thế gốc và kiến trúc chuyên biệt cho từng nhiệm vụ. YOLOv5 Không cung cấp sẵn các tính năng ngay từ đầu.
Những điểm khác biệt chính: Tư thế YOLO26 so với Ultralytics YOLOv8 -tư thế
Ultralytics YOLOv8 đã giới thiệu tính năng ước lượng tư thế gốc trong hệ thống thống nhất. Ultralytics Khung này giúp dễ dàng huấn luyện và triển khai các mô hình điểm mấu chốt bằng cách sử dụng quy trình làm việc tương tự như phát hiện và phân đoạn. Nó dựa trên quy trình xử lý hậu kỳ truyền thống với phương pháp loại bỏ cực đại cục bộ (non-maximum suppression). NMS ) và sử dụng các công thức tính tổn thất trước đó cho hồi quy và huấn luyện hộp giới hạn.
YOLO26 được xây dựng trên nền tảng này với các cập nhật về kiến trúc và huấn luyện, tác động trực tiếp đến việc ước tính tư thế. Một điểm khác biệt lớn là thiết kế từ đầu đến cuối. YOLO26 loại bỏ nhu cầu sử dụng các thành phần bên ngoài. NMS trong quá trình suy luận, điều này giúp đơn giản hóa việc triển khai và cải thiện tính nhất quán về độ trễ, đặc biệt là trên CPU và các thiết bị biên.
Một cải tiến quan trọng khác nằm ở phương pháp huấn luyện. YOLO26 giới thiệu trình tối ưu hóa MuSGD cùng với các chiến lược hàm mất mát được cập nhật. Đối với các tác vụ nhận dạng tư thế, nó tích hợp ước lượng logarit khả năng dư (Residual Log-Likelihood Estimation), giúp cải thiện cách mô hình hóa sự không chắc chắn của điểm mấu chốt. Nhìn chung, những thay đổi này có thể dẫn đến sự hội tụ nhanh hơn và dự đoán điểm mấu chốt ổn định hơn, đặc biệt là trong các cảnh phức tạp hoặc bị che khuất một phần.
Tóm lại, YOLOv8 -pose đã thiết lập một nền tảng mạnh mẽ và linh hoạt. YOLO26-pose tinh chỉnh nền tảng đó với hiệu quả huấn luyện được cải thiện, khả năng xử lý che khuất tốt hơn và tính linh hoạt cao hơn cho các ứng dụng tạo dáng thực tế, không phải con người.
YOLO26-Pose vs Ultralytics YOLO11 - Câu hỏi: Điều gì đã được cải thiện?
Ultralytics YOLO11 được xây dựng dựa trên... Ultralytics YOLOv8 Bằng cách tinh chỉnh các lớp xương sống và trích xuất đặc trưng, phương pháp này đã giảm số phép tính FLOPs, cải thiện hiệu quả tham số và mang lại hiệu suất cao hơn. mAP trong khi vẫn duy trì hiệu năng mạnh mẽ theo thời gian thực. Đối với các tác vụ xác định tư thế, điều này có nghĩa là độ chính xác điểm mấu chốt tốt hơn với kiến trúc nhẹ hơn.
YOLO26-pose tiếp tục sự phát triển đó với một sự thay đổi kiến trúc cơ bản hơn. Nói một cách đơn giản, YOLO11 đã nâng cao hiệu quả và độ chính xác của YOLOv8 Và YOLO26 được xây dựng trên nền tảng đó với các bản cập nhật về kiến trúc và huấn luyện nhằm mục đích hội tụ nhanh hơn, suy luận ổn định hơn và cải thiện độ chính xác tư thế trong các tình huống phức tạp.
Tại sao bạn nên bắt đầu sử dụng mô hình YOLO26 để ước tính tư thế?
Khi bạn khám phá những điểm khác biệt giữa Ultralytics YOLO Các bạn là người mẫu, có lẽ các bạn đang tự hỏi liệu có nên chuyển sang tư thế YOLO26 hay không.
Câu trả lời ngắn gọn là đây là một bản nâng cấp dễ dàng. Nếu bạn đã sử dụng Ultralytics YOLOv8 - tư thế hoặc Ultralytics YOLO11 -pose, việc chuyển sang YOLO26-pose thường chỉ có nghĩa là thay đổi phiên bản mô hình, chứ không phải xây dựng lại toàn bộ quy trình.
Bạn có thể hưởng lợi từ khả năng hỗ trợ tốt hơn cho các điểm đặc trưng không phải con người, tốc độ hội tụ nhanh hơn trong quá trình huấn luyện và khả năng xử lý các điểm bị che khuất được cải thiện, tất cả đều trong cùng một môi trường. Ultralytics Khung sườn. Đối với hầu hết các dự án tạo dáng mới và hiện có, việc chuyển sang YOLO26-pose là một cách đơn giản để đạt được những cải tiến đó với sự cản trở tối thiểu.
Ngoài ra, YOLO26-pose được hỗ trợ đầy đủ trong gói Ultralytics Python , được xây dựng trên... PyTorch và giúp đơn giản hóa việc huấn luyện, xác thực và triển khai. Mô hình có thể được xuất sang các định dạng như... ONNX , TensorRT , OpenVINO , CoreML , Và TFLite , giúp việc triển khai trên GPU, CPU và các thiết bị biên trở nên dễ dàng hơn mà không cần thay đổi quy trình làm việc tổng thể của bạn.
Những điều cần nhớ
Ultralytics YOLO26-pose giúp ước tính tư thế trở nên linh hoạt và đáng tin cậy hơn, đặc biệt khi làm việc với các điểm mấu chốt không phải của con người hoặc các cảnh phức tạp. Nó huấn luyện nhanh hơn, xử lý hiện tượng che khuất tốt hơn và mang lại kết quả nhất quán hơn trên các tập dữ liệu khác nhau. Dành cho các nhóm đã và đang sử dụng Ultralytics YOLO YOLO26 mang đến những cải tiến rõ rệt cho các mô hình tạo dáng mà không cần thay đổi quy trình làm việc hiện có.