Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024
Bảng chú giải thuật ngữ

Điểm chính

Khám phá những điểm chính trong thị giác máy tính: ước tính tư thế với Ultralytics YOLO11 để theo dõi thể lực, nhận dạng cử chỉ và theo dõi nhanh chóng, chính xác.

Trong thị giác máy tính, điểm chính là những điểm quan tâm cụ thể trong hình ảnh, mang tính đặc trưng và có thể lặp lại. Những điểm này đóng vai trò như những điểm mốc cấu trúc nhỏ gọn, đại diện cho một vật thể hoặc một cảnh, cho phép máy móc hiểu và phân tích nội dung hình ảnh chi tiết hơn. Thay vì xử lý từng pixel, các thuật toán tập trung vào những điểm chính này—chẳng hạn như góc, cạnh hoặc khớp trên cơ thể người—để thực hiện các tác vụ phức tạp như theo dõi chuyển động, nhận dạng vật thể và tái tạo cảnh 3D. Bằng cách tập trung vào những điểm thông tin này, các mô hình thị giác máy tính có thể đạt được hiệu quả và độ chính xác cao.

Phát hiện điểm chính và ước tính tư thế

Ứng dụng chính của điểm chính là trong ước lượng tư thế , một nhiệm vụ thị giác máy tính tập trung vào việc xác định vị trí và hướng của một vật thể hoặc người. Trong ước lượng tư thế con người, điểm chính tương ứng với các khớp chính của cơ thể như vai, khuỷu tay, đầu gối và cổ tay. Bằng cách phát hiện những điểm này trong hình ảnh hoặc video, mô hình có thể xây dựng biểu diễn xương của cơ thể người. "Bộ xương kỹ thuật số" này cho phép hệ thống AI phân tích tư thế, cử chỉ và chuyển động mà không cần phải hiểu ngoại hình, trang phục hoặc môi trường xung quanh của người đó.

Các mô hình học sâu tiên tiến, chẳng hạn như Ultralytics YOLO11 , được đào tạo trên các tập dữ liệu lớn, có chú thích như COCO để dự đoán chính xác vị trí của các điểm chính này theo thời gian thực. Các hệ thống ban đầu như OpenPose đã mở đường bằng cách chứng minh khả năng phát hiện các điểm chính toàn thân, bàn tay và khuôn mặt cho nhiều người cùng lúc. Các kiến trúc hiện đại đã được xây dựng dựa trên nền tảng này để mang lại kết quả nhanh hơn và chính xác hơn cho nhiều ứng dụng.

Điểm chính so với các khái niệm thị giác máy tính khác

Điều quan trọng là phải phân biệt phát hiện điểm chính với các nhiệm vụ liên quan khác trong thị giác máy tính :

  • Hộp giới hạn : Phát hiện đối tượng thường sử dụng hộp giới hạn —một hình chữ nhật đơn giản—để hiển thị vị trí của đối tượng. Phát hiện điểm chính cung cấp thông tin chi tiết hơn bằng cách xác định các điểm cấu trúc cụ thể trong hộp đó, mô tả tư thế và hình dạng của đối tượng.
  • Phân đoạn thể hiện : Trong khi điểm chính tạo ra một phác thảo khung xương, phân đoạn thể hiện tiến xa hơn một bước bằng cách phác thảo hình dạng chính xác của đối tượng ở cấp độ pixel. Phân đoạn cung cấp một ranh giới hoàn chỉnh, trong khi điểm chính cung cấp một bản tóm tắt về cấu trúc.
  • Bộ mô tả tính năng : Sau khi phát hiện một điểm chính, một bộ mô tả tính năng có thể được tính toán để mô tả vùng ảnh xung quanh điểm chính đó. Các thuật toán như SIFT và ORB tạo ra các bộ mô tả này, hoạt động như một "dấu vân tay" số dùng để so khớp các điểm chính tương ứng giữa các ảnh khác nhau.

Các Ứng dụng Thực tế

Khả năng phát hiện và theo dõi các điểm chính đã mang lại những tiến bộ đáng kể trong nhiều ngành công nghiệp. Dưới đây là hai ví dụ nổi bật:

  1. Phân tích Thể dục và Thể thao Thông minh : Trong các ứng dụng thể dục , các mô hình ước tính tư thế theo dõi các khớp chính của cơ thể để theo dõi dáng người trong các bài tập như squat hoặc yoga. Hệ thống có thể đếm số lần lặp lại, cung cấp phản hồi theo thời gian thực về tư thế để ngăn ngừa chấn thương và phân tích hiệu suất thể thao với độ chính xác cao. Công nghệ này giúp tạo ra trải nghiệm tập luyện tương tác và được cá nhân hóa, có thể truy cập thông qua camera tiêu chuẩn.
  2. Nhận dạng cử chỉ tay : Bằng cách xác định các điểm chính trên bàn tay và ngón tay, hệ thống AI có thể diễn giải các chuyển động phức tạp của bàn tay. Điều này rất quan trọng để phát triển các điều khiển trực quan trong thực tế tăng cường và thực tế ảo , tạo ra các công cụ dịch ngôn ngữ ký hiệu và cho phép tương tác không chạm với các thiết bị thông minh. Các mô hình được đào tạo trên bộ dữ liệu điểm chính của bàn tay có thể nhận dạng các cử chỉ từ một cái véo đơn giản đến các ký hiệu phức tạp.

Các ứng dụng khác bao gồm phát hiện điểm mốc trên khuôn mặt để phân tích cảm xúc và bộ lọc AR, ước tính tư thế động vật để nghiên cứu hành vi trong bảo tồn động vật hoang dã và robot giúp máy móc định hướng và tương tác với môi trường xung quanh.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard