Yolo 비전 선전
선전
지금 참여하기
용어집

포즈 추정

포즈 추정: 키포인트 모델(하향식 대 상향식)의 작동 방식, 의료부터 스포츠까지 실제 사용 사례, 주요 장점과 과제에 대해 알아보세요.

포즈 추정은 전문화된 컴퓨터 비전(CV) 작업으로 물체의 특정 형상과 방향을 식별하는 것입니다. 이 기술은 키포인트라고 하는 구조적 키포인트라고하는 기술은 피사체의 골격적 표현을 피사체의 골격적 표현을 생성합니다. 사람의 경우 이러한 키포인트는 일반적으로 어깨, 팔꿈치, 엉덩이, 무릎과 같은 주요 관절에 매핑됩니다, 엉덩이, 무릎과 같은 주요 관절에 매핑됩니다. 이 기능을 사용하면 머신 러닝(ML) 모델이 신체 해석 언어, 활동, 자세를 해석하여 단순한 픽셀 감지와 복잡한 신체 동작 이해 사이의 간극을 메울 수 있습니다. 간극을 좁힐 수 있습니다.

핵심 메커니즘 및 접근 방식

최신 포즈 추정은 특히 딥러닝(DL) 아키텍처, 특히 컨볼루션 신경망(CNN) 그리고 점점 더 많은 트랜스포머를 사용하고 있습니다. 이 프로세스는 일반적으로 두 가지 주요 방법론으로 나뉩니다:

  • 하향식 접근 방식: 이 방법은 먼저 객체 감지 모델을 사용하여 경계 상자 내에서 개별 인스턴스(예: 사람)를 찾습니다. 일단 자르기가 완료되면 시스템은 해당 한 사람의 키포인트를 추정합니다. 이는 종종 더 정확하지만 사람 수가 증가함에 따라 계산적으로 더 정확하지만 사람 수가 증가함에 따라 비용이 많이 듭니다.
  • 상향식 접근 방식: 또는 모델이 전체 이미지에서 모든 잠재적 키포인트를 감지하여 (예: 모든 왼쪽 팔꿈치)을 먼저 감지한 다음 이를 연결하여 뚜렷한 골격을 형성합니다. 이 방법은 종종 다음과 같은 경우에 선호됩니다. 혼잡한 장면에서 실시간 추론에 선호되는 경우가 많습니다. 처리 시간이 피사체 수에 덜 의존하기 때문입니다.

고성능 애플리케이션의 경우 다음과 같은 모델이 적합합니다. Ultralytics YOLO11 와 같은 모델은 이러한 개념을 통합하여 엣지 디바이스에 적합한 신속한 포즈 추정을 제공합니다.

관련 개념 구분하기

포즈 추정을 유사한 비전 작업과 구별하는 것이 중요합니다:

  • 물체 감지 비교: 반면 객체 감지는 객체의 위치와 객체가 무엇인지(클래스 레이블)를 식별하는 반면 무엇인지 (클래스 레이블)를 식별하는 반면, 객체 감지는 객체를 리지드 박스로 취급합니다. 포즈 추정은 해당 상자 내부의 구조와 관절을 보여줍니다.
  • 인스턴스 세분화 비교: 인스턴스 세분화는 오브젝트 모양의 픽셀 단위의 완벽한 마스크를 제공합니다. 이는 경계의 윤곽을 나타내지만, 관절이나 골격 연결을 명시적으로 식별하지는 않습니다. 관절이나 골격 연결은 명시적으로 식별하지 않습니다. 운동학.

실제 애플리케이션

포즈 추정의 유용성은 움직임 분석이 중요한 다양한 산업 분야에서 활용되고 있습니다.

의료 및 재활

의료 분야의 AI 분야에서는 자세 추정 은 환자의 움직임을 자동으로 추적하여 물리 치료를 지원합니다. 시스템은 재활 운동 중 관절의 각도를 측정하여 관절의 각도를 측정하여 환자가 올바른 자세를 유지하여 재부상의 위험을 줄일 수 있습니다. 이를 통해 원격 모니터링 및 원격 의료 발전, 양질의 치료에 더 쉽게 접근할 수 있습니다.

스포츠 분석 및 생체 역학

코치와 운동선수는 스포츠 분석 을 사용하여 성과를 분석합니다. 비디오에서 생체역학 데이터를 추출함으로써 영상에서 생체역학 데이터를 추출하여 기존의 모션 캡처에 사용되는 마커 슈트 없이도 골퍼의 스윙 플레인이나 러너의 걸음걸이 효율을 분석할 수 있습니다. 없이도 스윙 평면이나 러너의 보행 효율을 분석할 수 있습니다.

코드 예제: YOLO11 사용한 포즈 추정

다음 사항 Python 스니펫은 사전 학습된 YOLO11 모델을 로드하고 을 로드하고 이미지에서 포즈 추정을 수행하는 방법을 보여줍니다. 이를 위해서는 ultralytics 패키지와 시각화하여 스켈레탈 출력을 시각화합니다.

from ultralytics import YOLO

# Load the official YOLO11 nano pose model
model = YOLO("yolo11n-pose.pt")

# Run inference on an image source
results = model("https://docs.ultralytics.com/usage/python/")

# Visualize the detected keypoints and skeleton
results[0].show()

도전 과제와 데이터

강력한 포즈 모델을 훈련하려면 방대한 주석이 달린 데이터 세트가 필요합니다. COCO 포즈 데이터 세트와 같은 표준 벤치마크는 다음과 같은 기능을 제공합니다. 수천 개의 라벨이 붙은 사람 형상을 제공합니다. 하지만 오클루전 (신체 부위가 숨겨져 있을 때 가 가려지는 경우) 및 자기 폐쇄 (사람이 자신의 팔다리를 가리는 경우)와 같은 문제가 남아 있습니다. 이러한 문제를 해결하려면 고급 데이터 증강 기술과 다양한 각도와 다양한 각도와 조명 조건이 필요합니다.

또한 이러한 모델을 엣지 AI 디바이스에 배포하려면 배포하려면 높은 정확도를 유지하기 위해 모델 정량화와 같은 신중한 최적화가 필요합니다. 높은 정확도를 유지하기 위해서는 모델 정량화와 같은 신중한 최적화가 필요합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기