Pose Estimation
포즈 추정이 키포인트를 사용하여 움직임을 어떻게 추적하는지 배우십시오. 실제 사례를 살펴보고 빠르고 정확한 결과를 위해 Ultralytics YOLO26을 시작해 보십시오.
포즈 추정은 단순히 객체의 존재 여부를 탐지하는 것을 넘어, 객체의 기하학적 구조와 물리적 방향을 이해하는 전문적인 컴퓨터 비전 기술입니다. 표준 객체 탐지가 대상 주위에 단순히 직사각형 박스를 그리는 반면, 포즈 추정은 인체 관절(팔꿈치, 무릎, 어깨)이나 차량의 구조적 모서리와 같이 키포인트라고 알려진 특정 의미론적 지점을 식별합니다. 이러한 랜드마크를 매핑함으로써 머신러닝 모델은 대상의 골격 표현을 재구성할 수 있으며, 이를 통해 시스템은 바디 랭귀지, 움직임 역학, 2D 또는 3D 공간에서의 정밀한 위치를 해석할 수 있습니다.
Link to this section핵심 메커니즘: 하향식(Top-Down) vs. 상향식(Bottom-Up)#
현대의 포즈 추정은 정교한 딥러닝 아키텍처에 크게 의존하며, 시각 데이터를 처리하기 위해 합성곱 신경망(CNN)을 자주 활용합니다. 알고리즘은 일반적으로 키포인트를 식별하기 위해 다음 두 가지 주요 전략 중 하나를 따릅니다.
- 하향식(Top-Down) 접근 방식: 이 방법은 먼저 객체 탐지 모델을 사용하여 바운딩 박스 내의 개별 인스턴스를 찾습니다. 사람이나 객체가 더 큰 이미지에서 잘려 나오면, 포즈 추정기는 해당 특정 영역 내의 키포인트를 예측합니다. 이 방식은 매우 정확한 경우가 많지만, 프레임 내의 대상 수가 증가함에 따라 더 높은 추론 지연 시간(inference latency)이 발생할 수 있습니다.
- 상향식(Bottom-Up) 접근 방식: 반대로, 이 전략은 전체 이미지에서 모든 잠재적인 키포인트를 동시에 탐지(예: 군중 속의 모든 '왼쪽 무릎' 찾기)한 다음, 연관 알고리즘을 사용하여 이를 개별 골격으로 그룹화합니다. 이 방법은 계산 비용이 인원수에 관계없이 비교적 일정하게 유지되기 때문에 혼잡한 장면에서의 실시간 추론에 일반적으로 선호됩니다.
YOLO26과 같은 최신 모델은 이러한 요구 사항의 균형을 맞추는 고급 엔드 투 엔드 아키텍처를 활용하여, 엣지 AI 장치 및 모바일 플랫폼 배포에 적합한 고속 포즈 추정을 제공합니다.
Link to this section관련 컴퓨터 비전 용어 구별하기#
컴퓨터 비전 워크플로에서 포즈 추정의 고유한 가치를 이해하기 위해 다른 시각적 인식 작업과 구별하는 것이 도움이 됩니다.
- 객체 탐지: 객체가 무엇인지, 어디에 있는지 식별하는 데 초점을 맞추며, 직사각형 박스를 출력합니다. 이는 대상을 내부 관절 구조를 이해하지 못하는 고정된 객체로 취급합니다.
- 인스턴스 세그멘테이션: 객체의 정확한 모양을 나타내는 픽셀 단위의 마스크를 생성합니다. 세그멘테이션은 경계를 제공하지만, 운동학적 분석에 필요한 관절이나 골격 연결을 명시적으로 식별하지는 않습니다.
- 포즈 추정: 내부 구조를 구체적으로 타겟팅하여 미리 정의된 랜드마크(예: 골반에서 무릎까지) 간의 연결을 매핑하고 자세와 동작을 분석합니다.
Link to this section실제 애플리케이션 사례#
사람과 객체의 움직임을 디지털화하는 능력은 다양한 산업 전반에 걸쳐 혁신적인 응용 사례를 창출했으며, 이러한 사례는 종종 주석이 달린 키포인트의 대규모 데이터셋을 관리하기 위해 Ultralytics Platform과 같은 도구를 사용하여 학습됩니다.
Link to this section의료 및 재활#
의료 분야에서 헬스케어 AI는 환자의 재활을 원격으로 모니터링하기 위해 포즈 추정을 활용합니다. 자동화된 시스템은 관절 각도와 가동 범위를 추적하여 환자가 집에서 물리 치료 운동을 올바르게 수행하도록 보장할 수 있습니다. 이는 재부상 위험을 줄이고 임상의가 값비싼 실험실 장비 없이도 회복 진행 상황을 정량화할 수 있게 합니다.
Link to this section스포츠 분석#
코치와 선수는 성과를 최적화하기 위해 스포츠 분석을 활용합니다. 포즈 추정 모델은 전통적인 모션 캡처에 사용되는 번거로운 마커 수트 없이도 골퍼의 스윙 궤도, 러너의 보폭 또는 투수의 생체 역학을 분석할 수 있습니다. 이를 통해 기술을 향상하고 과사용 부상을 예방할 수 있는 즉각적인 데이터 기반 피드백을 제공합니다.
Link to this section소매 및 행동 분석#
상업 환경에서 소매 AI 시스템은 높은 선반의 제품을 잡거나 특정 통로에 머무는 것과 같은 고객 행동을 이해하기 위해 포즈 탐지를 사용합니다. 이 데이터는 신체 활동과 구매 결정을 연관 지어 매장 레이아웃을 최적화하고 재고 관리를 개선하는 데 도움을 줍니다.
Link to this section코드 예시: YOLO26을 사용한 포즈 추정#
포즈 추정을 구현하는 것은 최신 Python 프레임워크를 사용하면 간단합니다. 다음 예시는 ultralytics 패키지를 사용하여 사전 학습된 YOLO26 모델(YOLO11의 후속 모델)을 로드하고 이미지에서 인체 키포인트를 탐지하는 방법을 보여줍니다.
from ultralytics import YOLO
# Load the YOLO26 pose model (nano version for speed)
model = YOLO("yolo26n-pose.pt")
# Perform inference on an image source
# The model identifies bounding boxes and specific keypoints (joints)
results = model("https://ultralytics.com/images/bus.jpg")
# Print the xy coordinates of detected keypoints
print(results[0].keypoints.xy)
# Visualize the skeletal results directly
results[0].show()





