OpenPose란 무엇인가? 포즈 추정의 이정표 살펴보기

아비라미 비나

5분 읽기

2025년 6월 17일

컴퓨터 비전 애플리케이션에서 OpenPose를 사용하여 자세 추정을 수행하는 방법을 살펴보세요. OpenPose의 기능과 Vision AI에서의 중요성에 대해 알아보세요.

요즘에는 이미지와 카메라가 어디에나 있습니다. 휴대폰, 집, 심지어 공공장소에도 내장되어 있죠. 우리는 이미지와 카메라를 통해 순간을 포착할 뿐만 아니라, 주변 세상을 이해하고 소통하는 데에도 도움을 받습니다. 

이러한 현상은 인공지능(AI)의 하위 분야인 컴퓨터 비전을 통해 기계가 시각 데이터를 해석할 수 있도록 함으로써 가능해집니다. 컴퓨터 비전은 시스템이 물체를 감지하고, 얼굴을 인식하고, 움직임을 추적할 수 있도록 지원하며, 우리가 매일 사용하는 여러 기술에서 핵심적인 역할을 합니다. 

최근 AI의 발전 덕분에 컴퓨터 비전 모델은 이제 더욱 복잡한 데이터와 통찰력을 분석하고 추출할 수 있습니다. 이러한 예 중 하나는 사람의 움직임을 이해하는 데 중점을 둔 컴퓨터 비전 작업인 자세 추정 입니다. 

이 기술은 이미지나 비디오에서 어깨, 팔꿈치, 무릎과 같은 신체의 주요 지점을 식별하여 작동합니다. 이를 통해 사람들의 움직임을 분석하고, 피트니스 추적, 애니메이션, 헬스케어 등 다양한 분야에 적용할 수 있습니다.

자세 추정을 위해 개발된 수많은 도구 중 OpenPose는 획기적인 기술로 손꼽힙니다. 카네기 멜론 대학교 지각 컴퓨팅 랩 연구진이 개발한 OpenPose는 카메라 한 대(사람당 최대 135개의 키포인트)만으로 여러 사람의 손, 발, 얼굴의 키포인트를 포함한 전신 자세를 실시간으로 감지할 수 있는 최초의 오픈 소스 시스템 중 하나였습니다.

이 글에서는 OpenPose의 작동 원리와 컴퓨터 비전 분야의 획기적인 발전으로서의 중요성에 대해 알아보겠습니다.

그림 1. OpenPose를 사용한 다중인 포즈 추정.

포즈 추정의 역사 살펴보기

AI가 널리 도입되기 전에는 영상 속 사람의 움직임을 추적하는 데 특수 장비를 사용해야 했습니다. 영화나 애니메이션 같은 업계에서는 배우들이 통제된 스튜디오 환경에서 카메라가 움직임을 포착할 수 있도록 반사 마커가 있는 슈트를 입는 경우가 많았습니다. 

이러한 마커 기반 모션 캡처 기술은 정확했지만, 비용이 많이 들고 특정 설정에만 국한되었습니다. 컴퓨터 비전이 발전함에 따라 연구자들은 마커를 사용하지 않고 신체 움직임을 추적하는 방법을 모색했습니다. 그들은 이미지에서 사람의 형태를 찾기 위해 가장자리, 윤곽선, 템플릿을 사용했습니다.

이러한 초기 시스템은 간단하고 직관적인 상황에서는 잘 작동했지만, 실제 상황에서는 어려움을 겪었습니다. 사람들이 예상치 못한 방식으로 움직이거나 한 프레임에 두 명 이상의 사람이 나타나는 경우, 종종 결과가 좋지 않았습니다.

2010년대 후반, 딥러닝은 자세 추정에 큰 변화를 가져왔습니다. 비전 AI 모델은 방대한 인간 자세 데이터 세트를 기반으로 학습될 수 있었습니다. 에지와 템플릿에 의존하는 대신, 모델은 수천 개의 레이블이 지정된 이미지를 분석하여 신체 관절과 구조를 인식하는 법을 학습했습니다. 이를 통해 자세 추정은 더욱 정확하고 유연하며, 더욱 광범위한 환경에서 큰 효과를 발휘할 수 있게 되었습니다.

그림 2. 2017년부터 2023년까지 인간 자세 추정 모델의 발전.

OpenPose: 현대 포즈 추정이 시작된 곳

OpenPose는 2017년에 처음 출시되었으며, 단일 이미지에서 여러 사람의 포즈를 동시에 추정할 수 있습니다. 기존 시스템과 달리 OpenPose는 특수 슈트나 마커가 필요하지 않습니다. 표준 카메라와 호환되며 이미지와 비디오를 실시간으로 처리할 수 있습니다. 이러한 기능 덕분에 개발자와 연구자들이 포즈 추정을 더욱 쉽게 활용할 수 있게 되었습니다.

OpenPose가 컴퓨터 비전을 위해 마련한 기반은 다른 기업들이 다양한 애플리케이션을 위한 새로운 아키텍처를 구축하는 데 도움이 되었습니다. 오늘날 Ultralytics YOLO8Ultralytics YOLO11 과 같은 Vision AI 모델은 자세 추정 작업을 지원하며, 더 빠른 결과와 더 낮은 지연 시간을 제공합니다. 

그림 3. YOLO11을 사용한 포즈 추정.

하지만 자세 추정이 어떻게 발전해 왔는지 궁금하다면 OpenPose가 좋은 출발점이 될 수 있습니다. OpenPose는 오늘날에도 여전히 많은 최신 시스템들이 의존하고 있는 핵심 아이디어들을 제시했습니다. 

OpenPose의 주요 기능

이제 OpenPose가 왜 중요한지 더 잘 이해했으니, 실제로 무엇을 할 수 있는지 자세히 살펴보겠습니다.

OpenPose 기능의 핵심은 키포인트 감지 입니다. 키포인트는 코끝, 어깨 중앙, 팔꿈치, 손목, 엉덩이, 무릎, 발목과 같이 인체의 특정 랜드마크를 의미합니다. OpenPose는 손가락이나 얼굴 특징과 같은 세부 영역을 포함하여 한 사람당 최대 135개의 키포인트를 감지할 수 있습니다.

이 점들이 연결되면 인체의 단순화된 표현이 형성됩니다. 디지털 골격이라고 생각하면 됩니다. 이 골격 윤곽은 사람의 위치뿐만 아니라 어떤 자세를 취하고 있는지, 앉아 있는지, 서 있는지, 손을 흔들고 있는지, 웃고 있는지, 걷고 있는지까지 보여줍니다. 컴퓨터는 이러한 골격을 사용하여 사람의 움직임을 시각적으로 해석할 수 있는데, 이는 우리가 본능적으로 누군가의 바디 랭귀지를 이해하는 것과 비슷합니다.

골격 추적은 배경 소음과 방해 요소를 제거하여 시스템이 사람의 자세와 동작에만 집중할 수 있도록 해주기 때문에 특히 유용합니다. OpenPose는 모든 픽셀을 분석하는 대신, 사람이 어떻게 움직이거나 상호작용하는지 보여주는 의미 있는 지점에 집중합니다.

OpenPose를 사용하면 일상적인 이미지나 비디오에서 구조화된 정보를 추출하여 제스처에 반응하고, 신체 활동을 모니터링하고, 감정적 신호를 평가하거나 심지어 디지털 캐릭터를 애니메이션화하는 애플리케이션을 구축할 수 있습니다.

OpenPose는 어떻게 작동하나요? 

OpenPose가 시각적 입력을 통해 인체의 주요 지점을 감지하고 연결하는 방법에 대한 개요는 다음과 같습니다.

  • 이미지로 시작합니다. OpenPose는 사진, 비디오 또는 라이브 카메라 피드에서 단일 이미지를 가져옵니다.
  • 중요 신체 부위 감지: 시스템은 코, 팔꿈치, 손목, 무릎, 발목 등 신체의 주요 부위를 찾습니다. 신체 부위가 있다고 확신하는 모든 부위에 표시됩니다.
  • 어떤 부분이 서로 연결되는지 파악합니다. 다음으로, OpenPose는 핵심 포인트들이 어떻게 연결되어 있는지 확인합니다. 수학적 계산을 사용하여 어떤 관절이 같은 사람에 속하는지 판단합니다. 예를 들어, 손목을 오른쪽 팔꿈치와 어깨에 연결하는 것과 같습니다.
  • 각 인물의 골격을 그립니다. 핵심 포인트를 그룹화한 후, OpenPose는 이를 연결하여 각 인물의 포즈를 보여주는 "막대 인물"을 만듭니다. 이 기능은 여러 사람이 같은 프레임에 나타나는 경우에도 작동합니다.
  • 포즈 데이터를 반환합니다. 마지막으로, 감지된 모든 키포인트의 정확한 위치를 제공합니다. 이는 움직임 추적, 제스처 인식 또는 대화형 도구 구축에 실시간으로 사용될 수 있습니다.
그림 4. OpenPose를 사용한 인간의 주요 포인트 감지 및 추적.

OpenPose를 사용한 산업 전반의 포즈 추정 애플리케이션 

OpenPose는 다양한 실제 사용 사례에서 포즈 추정을 실용적으로 구현한 최초의 고급 도구 중 하나였습니다. 오늘날 실시간 컴퓨터 비전 솔루션 에서 널리 사용되지는 않지만, 스포츠, 엔터테인먼트, 교육, 안전 등 다양한 분야의 초기 연구에 중요한 역할을 했습니다. 

이러한 분야에서 길을 닦는 데 어떻게 도움이 되었는지 자세히 살펴보겠습니다.

OpenPose를 활용한 피트니스 및 스포츠 포즈 추정

야구를 볼 때 무슨 일이 일어나고 있는지 이해하기는 쉽습니다. 투구, 스윙, 도루를 즉시 알아차릴 수 있죠. 인간은 직관적으로 몸의 움직임을 읽고 큰 노력 없이 이해합니다. 하지만 기계에게 이러한 동작을 인식하는 것은 훨씬 더 복잡합니다. 각 신체 부위가 공간을 어떻게 움직이는지에 대한 정확한 정보가 필요합니다.

OpenPose는 컴퓨터 비전 분야에서 상당한 진전을 이루었습니다. 다양한 환경에서 운동 자세를 분석하는 데 유용한 도구였습니다.

많은 연구 프로젝트에서 OpenPose를 사용하여 스윙이나 점프와 같은 동작을 분석하고, 선수의 움직임에 따라 특정 야구 동작을 분류하기도 했습니다. OpenPose는 표준 비디오가 있는 개방된 환경에서 작동했기 때문에 연구자들은 이러한 시스템이 실제 훈련이나 코칭 상황에서 어떻게 작동하는지 시험해 볼 수 있었습니다.

이러한 초기 연구는 현재 첨단 스포츠 기술 에 사용되는 성과 추적 도구의 기초를 마련하는 데 도움이 되었습니다.

그림 5. OpenPose를 사용한 야구 동작 분류 파이프라인 살펴보기.

보안 및 안전 시스템에서 OpenPose 사용

마찬가지로, 연구원들은 OpenPose를 사용하여 비디오 기반 포즈 추적이 안전 모니터링을 어떻게 지원할 수 있는지 탐구했습니다. OpenPose는 공공장소에서 넘어짐, 예상치 못한 몸짓, 움직임 패턴과 같은 행동을 감지하는 데 테스트되었습니다.

OpenPose는 표준 카메라와 호환되었기 때문에 병원이나 교통 허브와 같은 환경에서 초기 실험을 더욱 쉽게 수행할 수 있도록 했습니다. 이러한 연구는 현재 감시, 낙상 감지, 응급 대응 시스템에 사용되는 새로운 모델 개발에 기여했습니다.

그림 6. OpenPose를 이용한 낙상 감지.

OpenPose의 장단점

OpenPose가 제공하는 몇 가지 장점을 살펴보겠습니다.

  • 연구 및 프로토타입 제작에 유용함: 학술 연구, 특히 인간-컴퓨터 상호작용, 생체역학, 행동 분석 분야에서 널리 사용되었습니다.
  • 크로스 플랫폼 지원: Windows, Linux, macOS에서 실행할 수 있으며, 중앙 처리 장치(CPU)와 그래픽 처리 장치(GPU)를 모두 지원합니다.
  • 오프라인 처리 기능 : 인터넷 접속이 없는 환경에서도 실행할 수 있으므로 의료나 교육과 같이 개인 정보가 민감한 환경에 이상적입니다.

OpenPose는 큰 진전이었지만, 반드시 염두에 두어야 할 기술적 한계도 있습니다. OpenPose와 관련된 몇 가지 주요 과제는 다음과 같습니다. 

  • 높은 처리 요구 사항: OpenPose를 실시간으로 실행하려면 강력한 GPU와 상당한 컴퓨팅 리소스가 필요합니다.
  • 환경에 민감함: 조명이 어둡거나, 사람이 많은 곳이나 카메라 각도가 좋지 않은 경우 성능이 저하될 수 있습니다.
  • 최신 모델에 비해 무거움: 최신 포즈 추정 모델에 비해 OpenPose는 상대적으로 크고 느립니다. 스마트폰, 태블릿 또는 임베디드 시스템과 같이 리소스가 제한된 기기에 배포하기에는 적합하지 않습니다.

주요 요점

OpenPose는 자세 추정의 접근성을 높이는 데 중요한 역할을 했습니다. OpenPose는 슈트나 특수 장비에 의존하지 않고도 간단한 카메라만으로도 신체 움직임을 추적할 수 있음을 보여주었습니다.

OpenPose는 의료, 교육, 엔터테인먼트, 연구 등 다양한 분야에서 다양한 실용적인 응용 분야의 토대를 마련했습니다. 최신 모델들이 더 빠른 속도와 더 가벼운 성능을 제공하지만, OpenPose는 자세 추정의 발전을 이해하는 데 중요한 참고 자료로 남아 있습니다. 

저희 커뮤니티 에 가입하고 GitHub 저장소를 방문하여 AI에 대해 자세히 알아보세요. 직접 컴퓨터 비전 솔루션을 구축하고 싶으시다면 라이선스 옵션을 살펴보세요. 또한, 의료 분야의 컴퓨터 비전물류 분야의 AI가 어떤 영향을 미치고 있는지도 확인해 보세요!

인공지능의 미래
를 함께 만들어 갑시다!

머신 러닝의 미래와 함께하는 여정 시작하기

무료로 시작하기
링크가 클립보드에 복사됨