Yolo 비전 선전
선전
지금 참여하기
용어집

키포인트

AI에서 키포인트가 객체의 기하학적 구조와 자세를 어떻게 정의하는지 알아보세요. Ultralytics 활용한 자세 추정 Python 탐구하고, 사용하기 쉬운 Python 시작해 보세요.

키포인트는 이미지 내에서 객체나 피사체의 중요한 특징을 정의하는 뚜렷한 공간적 위치 또는 랜드마크입니다. 컴퓨터 비전 및 기계 학습의 맥락에서 키포인트는 일반적으로 특정 객체의 일부(예: 사람의 팔꿈치, 건물의 모서리, 자동차 바퀴의 중심)를 정확히 가리키는 좌표 (X, Y) 집합으로 표현됩니다. 단순히 객체의 존재 여부만 식별하는 작업과 달리, 키포인트 식별은 인공지능(AI) 모델이 주제의 기하학적 구조, 자세, 구조적 배열을 이해할 수 있게 합니다. 이 능력은 고급 시각 분석의 기초가 되어 기계가 신체 언어를 해석하고, track 움직임을 track , 디지털 오버레이를 실제 세계의 객체와 정렬할 수 있게 합니다.

AI 모델에서 키포인트의 역할

키포인트는 인간이나 동물의 골격 구조를 매핑하는 기술인 자세 추정의 기초 데이터 역할을 합니다. 어깨, 무릎, 발목과 같은 미리 정의된 점 집합을 감지함으로써 알고리즘은 대상의 전체 자세를 실시간으로 재구성할 수 있습니다. 이 과정은 일반적으로 물체의 내부 형태를 이해하지 못한 채 경계 상자만 출력하는 표준 객체 탐지를 뛰어넘습니다.

최첨단 기술 Ultralytics 같은 현대적 아키텍처는 이러한 키포인트를 높은 정확도와 속도로 예측하도록 진화했습니다. 이 모델들은 COCO 같은 방대한 주석 데이터셋으로 훈련된 딥러닝(DL) 네트워크를 활용하여 관절 및 얼굴 특징과 연관된 시각적 패턴을 학습합니다. 추론 과정에서 모델은 각 키포인트의 좌표를 회귀 분석하며, 예측의 신뢰도를 나타내기 위해 종종 신뢰도 점수를 포함합니다.

핵심 포인트 대 관련 개념

주요 지점을 다른 일반적인 컴퓨터 비전 출력과 구분하는 것은 그 고유한 유용성을 이해하는 데 도움이 됩니다:

  • 키포인트 대 바운딩 박스: 바운딩 박스는 거친 위치 정보를 제공하며, 전체 객체를 직사각형으로 둘러싼다. 키포인트는 해당 객체 특정 부분에 대한 세밀한 위치 정보를 제공한다.
  • 키포인트 대 이미지 분할: 이미지 분할은 모든 픽셀을 분류하여 객체 형상의 정밀한 마스크를 생성합니다. 분할이 상세한 경계 정보를 제공하는 반면, 키포인트는 구조적 요약(‘골격’)을 제공하며, 이는 운동 및 운동학 분석에 종종 더 효율적입니다.
  • 키포인트 대 특징 설명자: SIFT(규모 불변 특징 변환)과 같은 전통적인 이미지 처리에서는 키포인트가 이미지 매칭에 사용되는 관심 지점(모서리, 블롭)입니다. 현대적인 딥러닝 자세 추정에서는 키포인트가 네트워크가 학습한 의미론적 레이블(예: "왼쪽 손목")입니다.

실제 애플리케이션

track 신체 부위나 물체 특징을 track 능력은 다양한 산업 분야에서 다채로운 응용 분야를 열어줍니다:

  • 스포츠 분석: 코치와 선수들은 자세 추정 기술을 활용해 생체역학을 분석합니다. 관절의 주요 지점을 추적함으로써 시스템은 각도와 속도를 계산하여 골프, 테니스, 단거리 달리기 같은 스포츠에서 기술을 향상시킬 수 있습니다. Ultralytics YOLO track 스윙을 track 실행 가능한 피드백을 제공하는 방식을 확인해 보세요.
  • 의료 및 재활: 물리치료 플랫폼은 키포인트를 활용해 환자의 운동을 원격으로 모니터링합니다. 이 시스템은 재활 운동 중 환자가 올바른 자세를 유지하도록 보장하여 부상 위험을 줄이고 회복 진행 상황을 추적합니다.
  • 증강 현실(AR): 소셜 미디어 필터와 가상 착용 애플리케이션은 사용자의 얼굴에 디지털 마스크나 안경을 안정적으로 고정시키기 위해 얼굴 주요 지점(눈, 코, 입 윤곽)을 활용합니다. 이를 통해 사용자가 움직여도 정렬 상태를 유지합니다.
  • 운전자 모니터링: 자동차 안전 시스템은 track 지점을 track 졸음이나 주의 산만 detect , 운전자의 눈이 감기거나 머리 위치가 주의력 결핍을 나타낼 경우 경고를 발령합니다.

YOLO26을 이용한 키포인트 탐지 구현

Ultralytics 또는 Python 사용하면 개발자가 키포인트 감지를 쉽게 구현할 수 있습니다. 다음 예시는 사전 훈련된 YOLO26-pose 모델을 로드하고 이미지에서 추론을 실행하여 detect 골격을 detect 방법을 보여줍니다.

from ultralytics import YOLO

# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results showing detected keypoints and skeletons
for result in results:
    result.show()  # Display the image with keypoints drawn

    # Access keypoint coordinates (x, y, confidence)
    keypoints = result.keypoints.data
    print(f"Detected keypoints shape: {keypoints.shape}")

이 간단한 워크플로는 정교한 컴퓨터 비전(CV) 애플리케이션의 신속한 배포를 가능하게 합니다. 사용자가 자체 맞춤형 키포인트 모델을 훈련하려는 경우—예를 들어 산업 기계의 detect 지점이나 동물 종을 detect 위한 모델— Ultralytics 클라우드 환경에서 데이터 주석 작업과 모델 훈련 과정을 간소화합니다.

고급 고려 사항

키포인트 감지를 성공적으로 배포하려면 신체 일부가 가려지는 오클루전(occlusion)과 다양한 조명 조건 같은 과제들을 처리해야 합니다. 현대 모델들은 훈련 중 강력한 데이터 증강을 통해 이를 해결하며, 네트워크가 다양한 시나리오에 노출되도록 합니다. 또한 키포인트를 객체 추적 알고리즘과 통합하면 영상 스트림에서 시간에 따른 개인의 일관된 식별이 가능해지며, 이는 보안이나 행동 분석 같은 응용 분야에 필수적입니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기