포즈 추정을 위한 Ultralytics YOLO26 대 기타 Ultralytics YOLO 모델
더 나은 비인간 키포인트 지원, 더 빠른 수렴, 개선된 폐색 처리 및 효율적인 실시간 배포를 통해 Ultralytics YOLO26이 어떻게 포즈 추정을 향상시키는지 알아보십시오.
사람의 자세를 보면 그 사람이 구부정하게 있는지, 앞으로 기울어져 있는지, 똑바로 서 있는지 쉽게 알아챌 수 있습니다. 인간은 신체의 여러 부위가 서로 어떻게 관련되어 있는지 빠르게 이해할 수 있습니다.
이는 일상생활에서 움직임과 신체 언어를 해석하는 방식의 본질적인 부분입니다. 하지만 기계에게는 이러한 종류의 시각적 이해가 자동으로 이루어지지 않습니다. 시스템이 움직임과 구조를 인식하도록 가르치려면 시스템이 이미지를 의미 있는 방식으로 해석할 수 있게 해주는 고급 딥러닝 및 컴퓨터 비전 기술이 필요합니다.
특히 포즈 추정은 컴퓨터 비전 모델이 유사한 이해를 구축할 수 있게 해주는 비전 AI 기술입니다. 모델은 이미지에서 단순히 객체를 감지하는 대신, 중요한 구조적 랜드마크를 나타내는 키포인트를 예측합니다.
이러한 키포인트는 신체 관절, 동물의 사지, 기계 구성 요소 또는 경기장 모서리와 같은 고정 지점에 해당할 수 있습니다. 이러한 지점을 식별하고 추적함으로써 시스템은 구조적이고 측정 가능한 방식으로 위치, 정렬 및 움직임을 이해할 수 있습니다.
포즈 추정이 더 많은 실제 시나리오에 적용됨에 따라 모델은 비인간 키포인트, 복잡한 장면 및 사용자 지정 데이터 세트를 더 효과적으로 처리해야 합니다. 예를 들어, Ultralytics YOLO26과 같은 최첨단 모델은 포즈 추정과 같은 컴퓨터 비전 작업을 지원하며 유연성과 전반적인 성능을 향상하도록 설계된 아키텍처 및 학습 개선을 통해 이전 YOLO 포즈 모델을 기반으로 구축되었습니다.

그림 1. YOLO로 구현된 포즈 추정의 예 (출처)
이 기사에서는 YOLO26-pose를 이전 Ultralytics YOLO 포즈 모델과 비교하고, 이것이 복잡한 장면에서 유연성, 수렴 속도 및 성능을 어떻게 향상하는지 살펴보겠습니다. 시작해 봅시다!
Link to this section포즈 추정이란 무엇인가요?#
Ultralytics YOLO 포즈 모델 비교에 들어가기 전에, 컴퓨터 비전 맥락에서 포즈 추정이 실제로 무엇을 의미하는지 자세히 살펴보겠습니다.
포즈 추정은 이미지나 비디오 프레임에서 특정 키포인트를 감지하고 추적하는 데 사용되는 기술입니다. 이러한 키포인트는 사람 신체의 관절, 동물의 사지, 기계의 구성 요소 또는 장면의 고정된 참조 지점과 같은 중요한 구조적 랜드마크를 나타낼 수 있습니다.

그림 2. 인간 포즈 추정을 사용하여 작업자의 포즈 추정 (출처)
이러한 지점의 좌표를 식별함으로써 모델은 객체가 어떻게 위치하고 시간이 지남에 따라 어떻게 움직이는지 이해할 수 있습니다. 전체 이미지에 단일 레이블을 할당하는 이미지 분류나 객체 주위에 경계 상자를 그리는 데 중점을 두는 객체 감지 모델과 달리, 포즈 추정은 구조와 움직임에 대한 더 상세한 공간 정보를 제공합니다.
Link to this sectionYOLO26-pose 개요#
YOLO26-pose는 YOLO26n-pose와 같은 경량 옵션과 YOLO26m-pose, YOLO26l-pose, YOLO26x-pose와 같은 대형 모델을 포함하여 여러 모델 변형 또는 모델 크기로 제공됩니다. 이를 통해 팀은 하드웨어 및 성능 요구 사항에 따라 속도와 정확성 사이에서 적절한 균형을 선택할 수 있습니다.
Ultralytics는 또한 처음부터 시작할 필요가 없도록 COCO 데이터 세트, 특히 인간 포즈 추정을 위한 COCO-Pose(COCO 키포인트) 주석과 같은 대규모 일반 데이터 세트로 학습된 사전 학습된 포즈 모델을 제공합니다. 대부분의 경우 팀은 자체 데이터 세트에서 이러한 모델을 미세 조정하여 특정 키포인트, 레이아웃 또는 환경에 맞게 조정합니다.
이는 일반적으로 구조화된 형식으로 키포인트 좌표와 클래스 레이블을 정의하는 사용자 지정 주석 파일을 준비하는 과정을 포함합니다. 이러한 주석은 키포인트를 각 이미지 내의 특정 픽셀 좌표에 매핑하여 모델이 학습 중에 정확한 공간 관계를 학습할 수 있도록 합니다.
사전 학습된 모델을 사용하면 학습 속도가 빨라지고 데이터 요구 사항이 줄어들며 프로젝트를 더 효율적으로 프로덕션 단계로 전환할 수 있습니다.
Link to this section인간 포즈 추정의 실제 응용 분야#
다음은 포즈 추정이 중요한 역할을 하는 몇 가지 실제 사용 사례입니다.
- 의료 및 재활: 임상의는 포즈 모델을 사용하여 자세를 평가하고, 회복 진행 상황을 모니터링하며, 물리 치료 중 움직임 패턴을 분석할 수 있습니다.
- 자율 시스템: 드론과 스마트 카메라는 포즈 정보를 사용하여 역동적인 장면에서 객체의 방향과 움직임을 더 잘 이해할 수 있습니다.
- 작업장 안전: 조직은 신체 위치와 반복적인 움직임을 모니터링하여 잠재적인 안전 위험을 식별하는 데 도움을 받을 수 있습니다.
- 피트니스 및 개인 트레이닝: 피트니스 앱은 포즈 추정을 사용하여 운동 자세를 추적하고, 반복 횟수를 계산하며, 피트니스 튜토리얼 중에 유지되는 자세와 움직임에 대한 실시간 피드백을 제공합니다.

그림 3. 포즈 추정은 운동 중 주요 신체 부위를 추적하는 데 도움을 줄 수 있습니다. (출처)
Link to this sectionUltralytics YOLO26의 포즈 추정 지원 살펴보기#
Ultralytics YOLO26은 학습 및 배포를 더 실용적으로 만들기 위해 설계된 업데이트를 통해 이전 Ultralytics YOLO 모델을 기반으로 구축되었습니다.
이전 버전과 마찬가지로 통합 프레임워크의 일부로서 포즈 추정을 지원합니다. 주요 차이점은 YOLO26이 더 광범위한 실제 사용 사례에서 더 유연하고 안정적으로 설계되었다는 점입니다.

그림 4. YOLO26 벤치마킹 (출처)
이전 Ultralytics YOLO 포즈 모델은 대부분 인간 포즈 데이터 세트의 영향을 받았으며, 이는 이전 방법의 일부가 인간 관절 구조를 중심으로 최적화되었음을 의미했습니다. YOLO26은 이러한 인간 중심 가정을 제거합니다.
결과적으로 테니스 코트의 모서리를 감지하거나 기타 사용자 지정 구조적 랜드마크를 감지하는 것과 같은 비인간 키포인트에 더 적합합니다. 사전 학습된 YOLO26-pose 모델은 기본적으로 COCO-pose와 같은 데이터 세트에서 학습되며 데이터 세트 주석에 정의된 인간 키포인트를 예측하기 때문에 이는 중요합니다.
그러나 팀이 기계 구성 요소, 스포츠 경기장 표시 또는 인프라 지점과 같은 다른 유형의 랜드마크를 감지하려는 경우, 일반적으로 해당 특정 키포인트가 주석으로 지정된 사용자 지정 데이터 세트에서 모델을 미세 조정해야 합니다.
YOLO26은 인간 관절 구조에 대한 가정에 얽매이지 않으므로 미세 조정 중에 더 효과적으로 적응할 수 있습니다. 이러한 유연성을 통해 모델은 사용자 지정 키포인트 레이아웃을 더 안정적으로 학습할 수 있으며, 이는 고유한 키포인트 구성을 가진 데이터 세트에서 검증할 때 평가 지표 개선으로 이어집니다.
YOLO26-pose는 객체의 일부가 부분적으로 가려져 있거나 매우 작은 규모로 나타날 때 키포인트 국소화를 개선하도록 설계되었습니다. 먼 거리에 있는 피사체, 드론 영상 또는 작은 객체 시나리오가 포함된 실제 장면에서 이는 이전 포즈 모델에 비해 더 정확한 키포인트 예측으로 이어질 수 있습니다.
또 다른 중요한 업데이트는 학습 중에 사용되는 향상된 손실 공식입니다. 손실 함수는 학습 중에 모델이 실수를 어떻게 수정할지 결정합니다.
YOLO26-pose의 경우 이 프로세스가 더 효과적이어서 모델이 더 빨리 학습하고 더 적은 에포크(에포크는 학습 데이터 세트를 한 번 완전히 통과하는 것을 의미) 내에서 강력한 정확도에 도달하도록 돕습니다.
전반적으로 YOLO26-pose는 비인간 키포인트 지원 및 학습 수렴에서의 확실한 개선을 통해 이전 Ultralytics YOLO 포즈 모델을 기반으로 하며, 동일한 익숙한 워크플로우를 유지합니다.
Link to this sectionYOLO26-pose와 Ultralytics YOLOv5 비교#
가장 초기 버전의 Ultralytics YOLO 모델인 Ultralytics YOLOv5는 주로 객체 감지를 위해 구축되었습니다. YOLOv5는 나중에 인스턴스 세그멘테이션을 지원하도록 확장되었지만, 공식 Ultralytics 프레임워크 내에 기본적이고 전문화된 포즈 추정 헤드를 포함하지는 않습니다.
키포인트 감지가 필요한 팀은 일반적으로 별도의 구현이나 사용자 지정 수정에 의존했습니다. Ultralytics YOLO26은 키포인트 예측을 위해 특별히 설계된 전용 아키텍처 헤드와 함께 기본 작업으로 포즈 추정을 포함합니다.
즉, YOLO26-pose 모델은 감지 및 세그멘테이션과 동일한 통합 워크플로우 내에서 학습, 검증 및 배포할 수 있습니다. 구조화된 키포인트 감지에 중점을 둔 프로젝트의 경우 YOLO26은 YOLOv5가 기본적으로 제공하지 않는 기본 포즈 지원과 작업별 아키텍처를 제공합니다.
Link to this section주요 차이점: YOLO26-pose 대 Ultralytics YOLOv8-pose#
Ultralytics YOLOv8은 통합 Ultralytics 프레임워크 내에서 기본 포즈 추정을 도입하여 감지 및 세그멘테이션과 동일한 워크플로우를 사용하여 키포인트 모델을 쉽게 학습하고 배포할 수 있게 했습니다. 이는 NMS(비최대 억제)를 포함하는 기존 후처리 파이프라인에 의존하며 경계 상자 회귀 및 학습을 위해 이전의 손실 공식을 사용합니다.
YOLO26은 포즈 추정에 직접적인 영향을 미치는 아키텍처 및 학습 업데이트를 통해 이 기반을 구축합니다. 한 가지 주요 차이점은 종단 간 설계입니다. YOLO26은 추론 중에 외부 NMS가 필요하지 않으므로 배포가 단순화되고 특히 CPU 및 에지 장치에서 대기 시간 일관성이 향상됩니다.
또 다른 주요 개선 사항은 학습 방법론에 있습니다. YOLO26은 업데이트된 손실 전략과 함께 MuSGD 옵티마이저를 도입합니다. 포즈 작업의 경우 키포인트 불확실성을 모델링하는 방법을 개선하는 잔차 로그 우도 추정(Residual Log-Likelihood Estimation)을 통합합니다. 이러한 변경 사항은 함께 작동하여 특히 복잡하거나 부분적으로 가려진 장면에서 더 빠른 수렴과 더 안정적인 키포인트 예측으로 이어질 수 있습니다.
요약하자면, YOLOv8-pose는 강력하고 다재다능한 기준을 확립했습니다. YOLO26-pose는 개선된 학습 효율성, 더 나은 폐색 처리 및 실제 비인간 포즈 응용 분야에 대한 더 큰 유연성을 통해 해당 기준을 다듬었습니다.
Link to this sectionYOLO26-pose 대 Ultralytics YOLO11-pose: 무엇이 개선되었나?#
Ultralytics YOLO11은 백본과 특징 추출 계층을 개선하여 Ultralytics YOLOv8을 기반으로 구축되었습니다. 이는 FLOP를 줄이고 매개변수 효율성을 개선하며 강력한 실시간 성능을 유지하면서 더 높은 mAP를 제공했습니다. 포즈 작업의 경우, 이는 더 가벼운 아키텍처로 더 나은 키포인트 정확도를 의미했습니다.
YOLO26-pose는 더 근본적인 아키텍처 변화와 함께 이러한 발전을 이어갑니다. 간단히 말해서, YOLO11은 YOLOv8의 효율성과 정확도를 개선했으며, YOLO26은 더 빠른 수렴, 더 안정적인 추론 및 복잡한 시나리오에서의 개선된 포즈 정확도를 목표로 하는 아키텍처 및 학습 업데이트를 통해 해당 기반을 다집니다.
Link to this section포즈 추정을 위해 YOLO26 모델 사용을 시작해야 하는 이유는 무엇입니까?#
Ultralytics YOLO 모델 간의 차이점을 탐색하면서 YOLO26-pose로 전환해야 할지 고민하고 계실 수 있습니다.
간단한 답변은 쉽게 업그레이드할 수 있다는 것입니다. 이미 Ultralytics YOLOv8-pose 또는 Ultralytics YOLO11-pose를 사용하고 있다면 YOLO26-pose로 전환하는 것은 일반적으로 파이프라인을 재구축하는 것이 아니라 모델 버전을 변경하는 것을 의미합니다.
동일한 Ultralytics 프레임워크 내에 머물면서 비인간 키포인트에 대한 더 나은 지원, 학습 중 더 빠른 수렴 및 가려진 지점에 대한 개선된 처리의 이점을 누릴 수 있습니다. 대부분의 신규 및 기존 포즈 프로젝트의 경우 YOLO26-pose로 이동하는 것은 최소한의 마찰로 이러한 개선 사항을 얻을 수 있는 간단한 방법입니다.
게다가 YOLO26-pose는 PyTorch 기반으로 구축되어 학습, 검증 및 배포를 단순하게 만드는 Ultralytics Python 패키지 내에서 완전히 지원됩니다. 모델을 ONNX, TensorRT, OpenVINO, CoreML 및 TFLite와 같은 형식으로 내보낼 수 있어 전반적인 워크플로우를 변경하지 않고도 GPU, CPU 및 에지 장치 전반에 걸쳐 더 쉽게 배포할 수 있습니다.
Link to this section핵심 요약#
Ultralytics YOLO26-pose는 특히 비인간 키포인트나 복잡한 장면에서 작업할 때 포즈 추정을 더 유연하고 안정적으로 만듭니다. 학습 속도가 더 빠르고, 폐색을 더 잘 처리하며, 데이터 세트 전반에 걸쳐 더 일관된 결과를 제공합니다. 이미 Ultralytics YOLO 포즈 모델을 사용 중인 팀에게 YOLO26은 기존 워크플로우를 변경하지 않고도 명확한 개선 사항을 제공합니다.
AI에 대해 더 알고 싶으신가요? 저희 community와 GitHub repository를 확인해 보세요. AI in robotics와 computer vision in agriculture에 대해 알아보기 위해 솔루션 페이지를 탐색해 보세요. our licensing 옵션을 발견하고 오늘 바로 컴퓨터 비전 개발을 시작하세요!






