Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Điểm chính

Khám phá những điểm chính trong tầm nhìn máy tính: ước tính tư thế với Ultralytics YOLO11 để theo dõi sức khỏe, nhận dạng cử chỉ và theo dõi nhanh chóng, chính xác.

Điểm chính là các vị trí không gian chính xác, giàu thông tin trong một hình ảnh, xác định các đặc điểm riêng biệt của một vật thể hoặc cảnh. Trong lĩnh vực thị giác máy tính , các tọa độ này—thường được biểu diễn bằng giá trị X và Y—đánh dấu các điểm quan trọng, chẳng hạn như góc của một tòa nhà, tâm mắt hoặc các khớp trên cơ thể người. Không giống như việc xử lý từng pixel trong ảnh, việc tập trung vào các điểm thưa thớt nhưng giàu ngữ nghĩa này cho phép các mô hình trí tuệ nhân tạo (AI) hiểu hình học, phân tích hình dạng và... track chuyển động với độ chính xác cao. Khái niệm này là nền tảng cho các nhiệm vụ nâng cao đòi hỏi sự hiểu biết về cấu trúc của đối tượng, chứ không chỉ là sự hiện diện hoặc vị trí của nó.

Vai trò của các điểm chính trong AI thị giác

Điểm chính đóng vai trò là nền tảng cơ bản để lập bản đồ cấu trúc của các vật thể động. Khi nhiều điểm chính được phát hiện và kết nối, chúng sẽ tạo thành một đồ thị xương hoặc khung dây biểu diễn tư thế của vật thể. Điều này thường được áp dụng trong ước lượng tư thế , trong đó các thuật toán dự đoán vị trí của các khớp giải phẫu—vai, khuỷu tay, hông và đầu gối—để tái tạo tư thế con người.

Bằng cách tận dụng các kiến trúc học sâu như YOLO11 , hệ thống có thể hồi quy các tọa độ này trực tiếp từ hình ảnh đầu vào. Quá trình này bao gồm việc trích xuất các đặc điểm phức tạp, trong đó mạng học cách xác định các mẫu cục bộ bất biến với ánh sáng, góc quay và tỷ lệ. Dữ liệu thu được có trọng lượng nhẹ và hiệu quả tính toán cao, lý tưởng cho việc suy luận thời gian thực trên các thiết bị biên.

Phân biệt các điểm chính với các khái niệm liên quan

Để hiểu được tiện ích cụ thể của các điểm chính, sẽ hữu ích khi so sánh chúng với các tác vụ thị giác máy tính chính khác:

  • Điểm chính so với Phát hiện Đối tượng : Phát hiện tiêu chuẩn xác định đối tượng là gìở đâu bằng cách bao quanh nó trong một khung giới hạn . Tuy nhiên, khung này coi đối tượng như một hình chữ nhật cứng. Điểm chính nhìn vào bên trong khung để xác định khớp nối bên trong và tư thế.
  • Điểm chính so với Phân đoạn thực thể : Phân đoạn tạo ra mặt nạ hoàn hảo đến từng pixel của hình bóng đối tượng. Mặc dù phân đoạn cung cấp chi tiết ranh giới tối ưu, nhưng nó thường đòi hỏi tính toán phức tạp hơn. Điểm chính cung cấp một bản tóm tắt cấu trúc đơn giản, thường được ưu tiên khi phân tích động học hoặc động lực học chuyển động.
  • Điểm chính so với Chú thích dữ liệu : Chú thích là quá trình con người gắn nhãn dữ liệu, trong khi phát hiện điểm chính là dự đoán của mô hình. Việc tạo tập dữ liệu bao gồm việc nhấp thủ công vào các điểm cụ thể (ví dụ: "cổ tay trái") để huấn luyện mô hình.

Các Ứng dụng Thực tế

Khả năng để track những điểm cụ thể về một chủ đề mở ra cánh cửa cho nhiều ứng dụng đa dạng trong nhiều ngành công nghiệp khác nhau:

  • Phân tích Thể thao : Huấn luyện viên và vận động viên sử dụng công nghệ phát hiện điểm then chốt để phân tích cơ sinh học. Bằng cách theo dõi góc giữa các khớp trong cú đánh golf hoặc chạy nước rút, hệ thống có thể cung cấp phản hồi tự động để tối ưu hóa hiệu suất và ngăn ngừa chấn thương. Điều này thường liên quan đến việc tính toán bậc tự do để hiểu phạm vi chuyển động.
  • Trí tuệ nhân tạo trong Robot : Robot dựa vào các điểm chính để nắm bắt và thao tác vật thể. Việc xác định các điểm nắm bắt cụ thể trên một vật thể cho phép cánh tay robot tính toán động học nghịch đảo và định vị chính xác đầu cuối của nó.
  • AI trong Chăm sóc Sức khỏe : Các ứng dụng vật lý trị liệu theo dõi các bài tập của bệnh nhân từ xa. Bằng cách theo dõi các điểm mốc trên cơ thể, hệ thống đảm bảo các bài tập được thực hiện đúng tư thế, hỗ trợ phục hồi chức năng hiệu quả.
  • Thực tế tăng cường (AR) : Trong các bộ lọc mạng xã hội và ứng dụng thử đồ ảo, các điểm chính trên khuôn mặt (điểm mốc trên khuôn mặt) cho phép mặt nạ hoặc kính kỹ thuật số căn chỉnh hoàn hảo với chuyển động của người dùng.

Triển khai phát hiện điểm chính

Các thư viện hiện đại giúp việc triển khai phát hiện điểm chính trở nên dễ dàng bằng cách sử dụng các mô hình được đào tạo trước. ultralytics gói cung cấp quyền truy cập tức thì vào YOLO11 các mô hình được đào tạo trên các tập dữ liệu lớn như COCO để xác định khớp của con người.

Ví dụ sau đây minh họa cách tải mô hình ước tính tư thế và trực quan hóa các điểm chính đã phát hiện:

from ultralytics import YOLO

# Load a pretrained YOLO11n-pose model
model = YOLO("yolo11n-pose.pt")

# Run inference on a local image or URL
results = model("https://docs.ultralytics.com/tasks/detect/")

# Visualize the results, showing the skeletal keypoints
results[0].show()

Trong quy trình làm việc này, mô hình đưa ra một Keypoints đối tượng chứa tọa độ và một điểm tự tin cho mỗi điểm được phát hiện. Các nhà phát triển có thể trích xuất các dữ liệu thô này x, y các giá trị để xây dựng logic tùy chỉnh, chẳng hạn như đếm số lần lặp lại trong ứng dụng phòng tập thể dục hoặc điều khiển nhân vật trò chơi thông qua tương tác giữa người và máy tính.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay