Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Điểm chính

Tìm hiểu cách các điểm mấu chốt xác định hình học và tư thế của đối tượng trong AI. Khám phá ước lượng tư thế với Ultralytics Đăng ký YOLO26 và bắt đầu sử dụng ứng dụng dễ dùng của chúng tôi. Python Bộ công cụ phát triển phần mềm (SDK).

Điểm đặc trưng (keypoint) là những vị trí không gian riêng biệt hoặc các mốc quan trọng trong một hình ảnh, xác định các đặc điểm nổi bật của một đối tượng hoặc chủ thể. Trong bối cảnh thị giác máy tính và học máy, một điểm đặc trưng thường được biểu diễn bằng một tập hợp các tọa độ (X, Y) xác định chính xác một phần cụ thể của đối tượng, chẳng hạn như khuỷu tay của một người, góc của một tòa nhà hoặc tâm của bánh xe ô tô. Không giống như các nhiệm vụ đơn giản hơn chỉ xác định sự hiện diện của một đối tượng, việc xác định các điểm đặc trưng cho phép các mô hình trí tuệ nhân tạo (AI) hiểu được hình học, tư thế và cấu trúc sắp xếp của đối tượng. Khả năng này là nền tảng cho phân tích hình ảnh nâng cao, cho phép máy móc diễn giải ngôn ngữ cơ thể. track Thực hiện các chuyển động chính xác và căn chỉnh các lớp phủ kỹ thuật số với các vật thể trong thế giới thực.

Vai trò của các điểm mấu chốt trong mô hình AI

Các điểm mấu chốt đóng vai trò là dữ liệu nền tảng cho việc ước lượng tư thế , một kỹ thuật lập bản đồ cấu trúc xương của người hoặc động vật. Bằng cách phát hiện một tập hợp các điểm được xác định trước—chẳng hạn như vai, đầu gối và mắt cá chân—các thuật toán có thể tái tạo toàn bộ tư thế của đối tượng trong thời gian thực. Quá trình này vượt xa khả năng phát hiện đối tượng tiêu chuẩn, vốn thường chỉ xuất ra một khung bao quanh đối tượng mà không hiểu hình dạng bên trong của nó.

Các kiến ​​trúc hiện đại, chẳng hạn như Ultralytics YOLO26 tiên tiến, đã phát triển để dự đoán các điểm mấu chốt này với độ chính xác và tốc độ cao. Các mô hình này sử dụng mạng học sâu (DL) được huấn luyện trên các tập dữ liệu được chú thích khổng lồ, chẳng hạn như COCO Keypoints , để học các mẫu hình ảnh liên quan đến khớp và đặc điểm khuôn mặt. Trong quá trình suy luận, mô hình hồi quy tọa độ cho mỗi điểm mấu chốt, thường bao gồm điểm tin cậy để chỉ ra độ tin cậy của dự đoán.

Các điểm chính so với các khái niệm liên quan

Việc phân biệt các điểm mấu chốt với các kết quả đầu ra thông thường khác của thị giác máy tính sẽ giúp hiểu được tiện ích độc đáo của chúng:

  • Điểm mấu chốt so với hộp giới hạn: Hộp giới hạn cung cấp khả năng định vị thô, bao quanh toàn bộ đối tượng trong một hình chữ nhật. Điểm mấu chốt cung cấp khả năng định vị chi tiết hơn các phần cụ thể bên trong đối tượng đó.
  • So sánh điểm đặc trưng và phân đoạn ảnh: Phân đoạn ảnh phân loại từng pixel để tạo ra một mặt nạ chính xác về hình dạng của đối tượng. Trong khi phân đoạn cung cấp thông tin chi tiết về ranh giới, điểm đặc trưng cung cấp một bản tóm tắt cấu trúc (một "khung xương") thường hiệu quả hơn trong việc phân tích chuyển động và động học .
  • Điểm mấu chốt so với mô tả đặc trưng: Trong xử lý ảnh truyền thống như SIFT (Scale-Invariant Feature Transform) , điểm mấu chốt là các điểm quan tâm (góc, vùng) được sử dụng để so khớp ảnh. Trong ước lượng tư thế học sâu hiện đại, điểm mấu chốt là các nhãn ngữ nghĩa (ví dụ: "cổ tay trái") được mạng nơ-ron học được.

Các Ứng dụng Thực tế

Khả năng track Các bộ phận cơ thể cụ thể hoặc đặc điểm của vật thể mở ra nhiều ứng dụng đa dạng trong nhiều ngành công nghiệp:

  • Phân tích thể thao: Huấn luyện viên và vận động viên sử dụng ước lượng tư thế để phân tích cơ sinh học. Bằng cách theo dõi các điểm mấu chốt trên khớp, hệ thống có thể tính toán góc và vận tốc để cải thiện kỹ thuật trong các môn thể thao như golf, tennis hoặc chạy nước rút. Xem cách các mô hình YOLO Ultralytics track cú đánh golf để cung cấp phản hồi hữu ích.
  • Chăm sóc sức khỏe và phục hồi chức năng: Các nền tảng vật lý trị liệu tận dụng các điểm mấu chốt để theo dõi các bài tập của bệnh nhân từ xa. Hệ thống đảm bảo bệnh nhân duy trì đúng tư thế trong suốt quá trình phục hồi chức năng, giảm nguy cơ chấn thương và theo dõi tiến trình hồi phục.
  • Thực tế tăng cường (AR): Các bộ lọc trên mạng xã hội và ứng dụng thử đồ ảo dựa vào các điểm mốc trên khuôn mặt (mắt, mũi, đường viền miệng) để cố định mặt nạ hoặc kính kỹ thuật số vào khuôn mặt người dùng một cách chắc chắn, duy trì sự thẳng hàng ngay cả khi họ di chuyển.
  • Giám sát người lái: Hệ thống an toàn ô tô track các điểm mốc trên khuôn mặt detect Các dấu hiệu buồn ngủ hoặc mất tập trung, cảnh báo người lái xe nếu mắt họ nhắm lại hoặc tư thế đầu cho thấy sự thiếu chú ý.

Triển khai tính năng phát hiện điểm đặc trưng với YOLO26

Sử dụng Nền tảng Ultralytics hoặc Python Với SDK, các nhà phát triển có thể dễ dàng triển khai tính năng phát hiện điểm mấu chốt. Ví dụ sau đây minh họa cách tải mô hình YOLO26-pose đã được huấn luyện trước và chạy suy luận trên một hình ảnh. detect Bộ xương người.

from ultralytics import YOLO

# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results showing detected keypoints and skeletons
for result in results:
    result.show()  # Display the image with keypoints drawn

    # Access keypoint coordinates (x, y, confidence)
    keypoints = result.keypoints.data
    print(f"Detected keypoints shape: {keypoints.shape}")

Quy trình làm việc đơn giản này cho phép triển khai nhanh chóng các ứng dụng thị giác máy tính (CV) phức tạp. Đối với người dùng muốn huấn luyện các mô hình điểm đặc trưng tùy chỉnh của riêng họ—ví dụ, để detect Với các điểm cụ thể trên máy móc công nghiệp hoặc các loài động vật, nền tảng Ultralytics đơn giản hóa quá trình chú thích dữ liệu và huấn luyện mô hình trên đám mây.

Những cân nhắc nâng cao

Việc triển khai thành công tính năng phát hiện điểm mấu chốt đòi hỏi phải xử lý các thách thức như che khuất (khi một bộ phận cơ thể bị che khuất) và điều kiện ánh sáng đa dạng. Các mô hình hiện đại giải quyết vấn đề này thông qua việc tăng cường dữ liệu mạnh mẽ trong quá trình huấn luyện, giúp mạng lưới tiếp xúc với nhiều tình huống khác nhau. Hơn nữa, việc tích hợp các điểm mấu chốt với các thuật toán theo dõi đối tượng cho phép nhận dạng cá nhân một cách nhất quán theo thời gian trong các luồng video, điều cần thiết cho các ứng dụng như an ninh hoặc phân tích hành vi.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay