Tìm hiểu cách các điểm mấu chốt xác định hình học và tư thế của đối tượng trong AI. Khám phá ước lượng tư thế với Ultralytics Đăng ký YOLO26 và bắt đầu sử dụng ứng dụng dễ dùng của chúng tôi. Python Bộ công cụ phát triển phần mềm (SDK).
Điểm đặc trưng (keypoint) là những vị trí không gian riêng biệt hoặc các mốc quan trọng trong một hình ảnh, xác định các đặc điểm nổi bật của một đối tượng hoặc chủ thể. Trong bối cảnh thị giác máy tính và học máy, một điểm đặc trưng thường được biểu diễn bằng một tập hợp các tọa độ (X, Y) xác định chính xác một phần cụ thể của đối tượng, chẳng hạn như khuỷu tay của một người, góc của một tòa nhà hoặc tâm của bánh xe ô tô. Không giống như các nhiệm vụ đơn giản hơn chỉ xác định sự hiện diện của một đối tượng, việc xác định các điểm đặc trưng cho phép các mô hình trí tuệ nhân tạo (AI) hiểu được hình học, tư thế và cấu trúc sắp xếp của đối tượng. Khả năng này là nền tảng cho phân tích hình ảnh nâng cao, cho phép máy móc diễn giải ngôn ngữ cơ thể. track Thực hiện các chuyển động chính xác và căn chỉnh các lớp phủ kỹ thuật số với các vật thể trong thế giới thực.
Các điểm mấu chốt đóng vai trò là dữ liệu nền tảng cho việc ước lượng tư thế , một kỹ thuật lập bản đồ cấu trúc xương của người hoặc động vật. Bằng cách phát hiện một tập hợp các điểm được xác định trước—chẳng hạn như vai, đầu gối và mắt cá chân—các thuật toán có thể tái tạo toàn bộ tư thế của đối tượng trong thời gian thực. Quá trình này vượt xa khả năng phát hiện đối tượng tiêu chuẩn, vốn thường chỉ xuất ra một khung bao quanh đối tượng mà không hiểu hình dạng bên trong của nó.
Các kiến trúc hiện đại, chẳng hạn như Ultralytics YOLO26 tiên tiến, đã phát triển để dự đoán các điểm mấu chốt này với độ chính xác và tốc độ cao. Các mô hình này sử dụng mạng học sâu (DL) được huấn luyện trên các tập dữ liệu được chú thích khổng lồ, chẳng hạn như COCO Keypoints , để học các mẫu hình ảnh liên quan đến khớp và đặc điểm khuôn mặt. Trong quá trình suy luận, mô hình hồi quy tọa độ cho mỗi điểm mấu chốt, thường bao gồm điểm tin cậy để chỉ ra độ tin cậy của dự đoán.
Việc phân biệt các điểm mấu chốt với các kết quả đầu ra thông thường khác của thị giác máy tính sẽ giúp hiểu được tiện ích độc đáo của chúng:
Khả năng track Các bộ phận cơ thể cụ thể hoặc đặc điểm của vật thể mở ra nhiều ứng dụng đa dạng trong nhiều ngành công nghiệp:
Sử dụng Nền tảng Ultralytics hoặc Python Với SDK, các nhà phát triển có thể dễ dàng triển khai tính năng phát hiện điểm mấu chốt. Ví dụ sau đây minh họa cách tải mô hình YOLO26-pose đã được huấn luyện trước và chạy suy luận trên một hình ảnh. detect Bộ xương người.
from ultralytics import YOLO
# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results showing detected keypoints and skeletons
for result in results:
result.show() # Display the image with keypoints drawn
# Access keypoint coordinates (x, y, confidence)
keypoints = result.keypoints.data
print(f"Detected keypoints shape: {keypoints.shape}")
Quy trình làm việc đơn giản này cho phép triển khai nhanh chóng các ứng dụng thị giác máy tính (CV) phức tạp. Đối với người dùng muốn huấn luyện các mô hình điểm đặc trưng tùy chỉnh của riêng họ—ví dụ, để detect Với các điểm cụ thể trên máy móc công nghiệp hoặc các loài động vật, nền tảng Ultralytics đơn giản hóa quá trình chú thích dữ liệu và huấn luyện mô hình trên đám mây.
Việc triển khai thành công tính năng phát hiện điểm mấu chốt đòi hỏi phải xử lý các thách thức như che khuất (khi một bộ phận cơ thể bị che khuất) và điều kiện ánh sáng đa dạng. Các mô hình hiện đại giải quyết vấn đề này thông qua việc tăng cường dữ liệu mạnh mẽ trong quá trình huấn luyện, giúp mạng lưới tiếp xúc với nhiều tình huống khác nhau. Hơn nữa, việc tích hợp các điểm mấu chốt với các thuật toán theo dõi đối tượng cho phép nhận dạng cá nhân một cách nhất quán theo thời gian trong các luồng video, điều cần thiết cho các ứng dụng như an ninh hoặc phân tích hành vi.