Khám phá những điểm chính trong tầm nhìn máy tính: ước tính tư thế với Ultralytics YOLO11 để theo dõi sức khỏe, nhận dạng cử chỉ và theo dõi nhanh chóng, chính xác.
Các điểm đặc trưng là những vị trí không gian cụ thể, chứa thông tin trong một hình ảnh, xác định các đặc điểm riêng biệt của một đối tượng hoặc cảnh. Trong lĩnh vực thị giác máy tính (CV) , những điểm này—thường được biểu diễn bằng tọa độ X và Y—đánh dấu các khu vực quan trọng cần quan tâm, chẳng hạn như các góc của một tòa nhà, các đặc điểm trên khuôn mặt như mắt và mũi, hoặc các khớp giải phẫu của cơ thể người. Không giống như việc xử lý từng pixel trong một lưới dày đặc, việc tập trung vào các điểm thưa thớt, giàu ngữ nghĩa này cho phép các mô hình trí tuệ nhân tạo (AI) hiểu hình học một cách hiệu quả, phân tích hình dạng và... track Di chuyển với độ chính xác cao. Khái niệm này là nền tảng cho các nhiệm vụ nâng cao đòi hỏi sự hiểu biết về cấu trúc của đối tượng chứ không chỉ đơn thuần là sự hiện diện hoặc vị trí của nó.
Các điểm mấu chốt đóng vai trò là khối xây dựng cơ bản để lập bản đồ cấu trúc của các đối tượng động. Khi nhiều điểm mấu chốt được phát hiện và kết nối, chúng tạo thành một đồ thị khung xương hoặc khung dây biểu thị tư thế của đối tượng. Điều này thường được áp dụng nhất trong ước lượng tư thế , nơi các thuật toán học sâu (DL) dự đoán vị trí của các khớp—vai, khuỷu tay, hông và đầu gối—để tái tạo tư thế của người hoặc động vật.
Bằng cách tận dụng các kiến trúc tiên tiến như mô hình Ultralytics YOLO26 , các hệ thống có thể suy luận trực tiếp các tọa độ này từ hình ảnh đầu vào với tốc độ đáng kinh ngạc. Quá trình này bao gồm việc trích xuất đặc trưng phức tạp, trong đó mạng nơ-ron học cách xác định các mẫu cục bộ không thay đổi theo ánh sáng, xoay và tỷ lệ. Vì các điểm mấu chốt đại diện cho một bản tóm tắt cô đọng về trạng thái của đối tượng, chúng có hiệu quả tính toán cao, khiến chúng trở nên lý tưởng cho suy luận thời gian thực trên các thiết bị điện toán biên .
Để hiểu rõ hơn về công dụng cụ thể của các điểm đặc trưng, việc so sánh chúng với các tác vụ thị giác máy tính cơ bản khác có trong nền tảng Ultralytics sẽ rất hữu ích:
Khả năng để track những điểm cụ thể về một chủ đề mở ra cánh cửa cho nhiều ứng dụng đa dạng trong nhiều ngành công nghiệp khác nhau:
Các thư viện hiện đại giúp việc triển khai phát hiện điểm chính trở nên dễ dàng bằng cách sử dụng các mô hình được đào tạo trước.
ultralytics Gói này cung cấp quyền truy cập tức thì vào các mẫu máy hiện đại như YOLO26 và
YOLO11, có thể được huấn luyện trên các tập dữ liệu như
COCO hoặc
Tư thế hổ.
Ví dụ sau đây minh họa cách tải mô hình ước lượng tư thế và trực quan hóa các điểm mấu chốt được phát hiện bằng cách sử dụng Python :
from ultralytics import YOLO
# Load a pretrained YOLO26n-pose model
model = YOLO("yolo26n-pose.pt")
# Run inference on a local image
results = model("path/to/runner.jpg")
# Visualize the results, showing the skeletal keypoints
results[0].show()
Trong quy trình này, mô hình sẽ xuất ra một đối tượng kết quả chứa tọa độ và một
điểm tự tin cho mỗi điểm được phát hiện. Các nhà phát triển có thể trích xuất các dữ liệu thô này x, y các giá trị để xây dựng logic tùy chỉnh, chẳng hạn như đếm số lần lặp lại trong ứng dụng phòng tập thể dục hoặc điều khiển nhân vật trò chơi thông qua ghi hình chuyển động.