Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Điểm chính

Khám phá những điểm chính trong tầm nhìn máy tính: ước tính tư thế với Ultralytics YOLO11 để theo dõi sức khỏe, nhận dạng cử chỉ và theo dõi nhanh chóng, chính xác.

Các điểm đặc trưng là những vị trí không gian cụ thể, chứa thông tin trong một hình ảnh, xác định các đặc điểm riêng biệt của một đối tượng hoặc cảnh. Trong lĩnh vực thị giác máy tính (CV) , những điểm này—thường được biểu diễn bằng tọa độ X và Y—đánh dấu các khu vực quan trọng cần quan tâm, chẳng hạn như các góc của một tòa nhà, các đặc điểm trên khuôn mặt như mắt và mũi, hoặc các khớp giải phẫu của cơ thể người. Không giống như việc xử lý từng pixel trong một lưới dày đặc, việc tập trung vào các điểm thưa thớt, giàu ngữ nghĩa này cho phép các mô hình trí tuệ nhân tạo (AI) hiểu hình học một cách hiệu quả, phân tích hình dạng và... track Di chuyển với độ chính xác cao. Khái niệm này là nền tảng cho các nhiệm vụ nâng cao đòi hỏi sự hiểu biết về cấu trúc của đối tượng chứ không chỉ đơn thuần là sự hiện diện hoặc vị trí của nó.

Vai trò của các điểm chính trong AI thị giác

Các điểm mấu chốt đóng vai trò là khối xây dựng cơ bản để lập bản đồ cấu trúc của các đối tượng động. Khi nhiều điểm mấu chốt được phát hiện và kết nối, chúng tạo thành một đồ thị khung xương hoặc khung dây biểu thị tư thế của đối tượng. Điều này thường được áp dụng nhất trong ước lượng tư thế , nơi các thuật toán học sâu (DL) dự đoán vị trí của các khớp—vai, khuỷu tay, hông và đầu gối—để tái tạo tư thế của người hoặc động vật.

Bằng cách tận dụng các kiến trúc tiên tiến như mô hình Ultralytics YOLO26 , các hệ thống có thể suy luận trực tiếp các tọa độ này từ hình ảnh đầu vào với tốc độ đáng kinh ngạc. Quá trình này bao gồm việc trích xuất đặc trưng phức tạp, trong đó mạng nơ-ron học cách xác định các mẫu cục bộ không thay đổi theo ánh sáng, xoay và tỷ lệ. Vì các điểm mấu chốt đại diện cho một bản tóm tắt cô đọng về trạng thái của đối tượng, chúng có hiệu quả tính toán cao, khiến chúng trở nên lý tưởng cho suy luận thời gian thực trên các thiết bị điện toán biên .

Phân biệt các điểm chính với các khái niệm liên quan

Để hiểu rõ hơn về công dụng cụ thể của các điểm đặc trưng, việc so sánh chúng với các tác vụ thị giác máy tính cơ bản khác có trong nền tảng Ultralytics sẽ rất hữu ích:

  • So sánh điểm mấu chốt và phát hiện đối tượng : Phương pháp phát hiện tiêu chuẩn xác định đối tượng là gìở đâu bằng cách bao quanh nó trong một hộp giới hạn . Tuy nhiên, hộp này coi đối tượng như một hình chữ nhật cứng nhắc. Điểm mấu chốt xem xét bên trong hộp để xác định các khớp nối bên trong, tư thế và cấu trúc linh hoạt.
  • Điểm chính so với Phân đoạn thực thể : Phân đoạn tạo ra mặt nạ hoàn hảo đến từng pixel của hình bóng đối tượng. Mặc dù phân đoạn cung cấp chi tiết ranh giới tối ưu, nhưng nó thường đòi hỏi tính toán phức tạp hơn. Điểm chính cung cấp một bản tóm tắt cấu trúc đơn giản, thường được ưu tiên khi phân tích động học hoặc động lực học chuyển động.
  • Điểm mấu chốt so với Chú thích dữ liệu : Chú thích là quá trình con người gắn nhãn dữ liệu, trong khi phát hiện điểm mấu chốt là dự đoán của mô hình. Việc tạo tập dữ liệu huấn luyện bao gồm việc nhấp chuột thủ công vào các điểm cụ thể (ví dụ: "cổ tay trái") để huấn luyện mô hình thông qua học có giám sát .

Các Ứng dụng Thực tế

Khả năng để track những điểm cụ thể về một chủ đề mở ra cánh cửa cho nhiều ứng dụng đa dạng trong nhiều ngành công nghiệp khác nhau:

  • Trí tuệ nhân tạo trong chăm sóc sức khỏe và phục hồi chức năng: Các ứng dụng vật lý trị liệu theo dõi các bài tập của bệnh nhân từ xa. Bằng cách theo dõi các điểm mốc trên cơ thể, hệ thống đảm bảo các bài tập được thực hiện đúng tư thế, hỗ trợ phục hồi chức năng hiệu quả. Điều này thường bao gồm việc tính toán mức độ tự do để hiểu phạm vi chuyển động của bệnh nhân.
  • Phân tích thể thao : Huấn luyện viên và vận động viên sử dụng phương pháp phát hiện điểm mấu chốt để phân tích cơ sinh học. Bằng cách theo dõi góc giữa các khớp trong cú đánh golf hoặc chạy nước rút, hệ thống có thể cung cấp phản hồi tự động để tối ưu hóa hiệu suất và ngăn ngừa chấn thương.
  • Hệ thống giám sát người lái: Trong ngành công nghiệp ô tô, hệ thống nhận diện khuôn mặt. track các điểm mốc trên khuôn mặt (mắt, miệng) đến detect Các dấu hiệu mệt mỏi hoặc mất tập trung, cảnh báo người lái xe để ngăn ngừa tai nạn.
  • Thực tế tăng cường (AR) : Trong các bộ lọc trên mạng xã hội và ứng dụng thử đồ ảo, các điểm mấu chốt trên khuôn mặt cho phép mặt nạ hoặc kính kỹ thuật số khớp hoàn hảo với chuyển động của người dùng, đòi hỏi sự tương tác chính xác giữa người và máy tính .

Triển khai phát hiện điểm chính

Các thư viện hiện đại giúp việc triển khai phát hiện điểm chính trở nên dễ dàng bằng cách sử dụng các mô hình được đào tạo trước. ultralytics Gói này cung cấp quyền truy cập tức thì vào các mẫu máy hiện đại như YOLO26 và YOLO11, có thể được huấn luyện trên các tập dữ liệu như COCO hoặc Tư thế hổ.

Ví dụ sau đây minh họa cách tải mô hình ước lượng tư thế và trực quan hóa các điểm mấu chốt được phát hiện bằng cách sử dụng Python :

from ultralytics import YOLO

# Load a pretrained YOLO26n-pose model
model = YOLO("yolo26n-pose.pt")

# Run inference on a local image
results = model("path/to/runner.jpg")

# Visualize the results, showing the skeletal keypoints
results[0].show()

Trong quy trình này, mô hình sẽ xuất ra một đối tượng kết quả chứa tọa độ và một điểm tự tin cho mỗi điểm được phát hiện. Các nhà phát triển có thể trích xuất các dữ liệu thô này x, y các giá trị để xây dựng logic tùy chỉnh, chẳng hạn như đếm số lần lặp lại trong ứng dụng phòng tập thể dục hoặc điều khiển nhân vật trò chơi thông qua ghi hình chuyển động.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay