Khám phá những điểm chính trong thị giác máy tính: ước tính tư thế với Ultralytics YOLO11 để theo dõi thể lực, nhận dạng cử chỉ và theo dõi nhanh chóng, chính xác.
Trong thị giác máy tính, điểm chính là những điểm quan tâm cụ thể trong hình ảnh, mang tính đặc trưng và có thể lặp lại. Những điểm này đóng vai trò như những điểm mốc cấu trúc nhỏ gọn, đại diện cho một vật thể hoặc một cảnh, cho phép máy móc hiểu và phân tích nội dung hình ảnh chi tiết hơn. Thay vì xử lý từng pixel, các thuật toán tập trung vào những điểm chính này—chẳng hạn như góc, cạnh hoặc khớp trên cơ thể người—để thực hiện các tác vụ phức tạp như theo dõi chuyển động, nhận dạng vật thể và tái tạo cảnh 3D. Bằng cách tập trung vào những điểm thông tin này, các mô hình thị giác máy tính có thể đạt được hiệu quả và độ chính xác cao.
Ứng dụng chính của điểm chính là trong ước lượng tư thế , một nhiệm vụ thị giác máy tính tập trung vào việc xác định vị trí và hướng của một vật thể hoặc người. Trong ước lượng tư thế con người, điểm chính tương ứng với các khớp chính của cơ thể như vai, khuỷu tay, đầu gối và cổ tay. Bằng cách phát hiện những điểm này trong hình ảnh hoặc video, mô hình có thể xây dựng biểu diễn xương của cơ thể người. "Bộ xương kỹ thuật số" này cho phép hệ thống AI phân tích tư thế, cử chỉ và chuyển động mà không cần phải hiểu ngoại hình, trang phục hoặc môi trường xung quanh của người đó.
Các mô hình học sâu tiên tiến, chẳng hạn như Ultralytics YOLO11 , được đào tạo trên các tập dữ liệu lớn, có chú thích như COCO để dự đoán chính xác vị trí của các điểm chính này theo thời gian thực. Các hệ thống ban đầu như OpenPose đã mở đường bằng cách chứng minh khả năng phát hiện các điểm chính toàn thân, bàn tay và khuôn mặt cho nhiều người cùng lúc. Các kiến trúc hiện đại đã được xây dựng dựa trên nền tảng này để mang lại kết quả nhanh hơn và chính xác hơn cho nhiều ứng dụng.
Điều quan trọng là phải phân biệt phát hiện điểm chính với các nhiệm vụ liên quan khác trong thị giác máy tính :
Khả năng phát hiện và theo dõi các điểm chính đã mang lại những tiến bộ đáng kể trong nhiều ngành công nghiệp. Dưới đây là hai ví dụ nổi bật:
Các ứng dụng khác bao gồm phát hiện điểm mốc trên khuôn mặt để phân tích cảm xúc và bộ lọc AR, ước tính tư thế động vật để nghiên cứu hành vi trong bảo tồn động vật hoang dã và robot giúp máy móc định hướng và tương tác với môi trường xung quanh.