Ultralytics YOLO11과 이전 YOLO 모델 비교
Ultralytics YOLOv8, YOLOv9, YOLOv10 및 Ultralytics YOLO11을 비교하여 2023년부터 2025년까지 이러한 모델들이 어떻게 발전하고 개선되었는지 알아보십시오.

일상적인 작업 자동화부터 실시간으로 정보에 입각한 의사결정을 돕는 것까지, 인공지능(AI)은 다양한 산업의 미래를 재편하고 있습니다. AI에서 특히 흥미로운 분야는 비전 AI라고도 알려진 computer vision입니다. 이는 기계가 인간처럼 시각 데이터를 분석하고 해석할 수 있도록 하는 데 중점을 둡니다.
구체적으로, computer vision models은 안전성과 효율성을 모두 향상하는 혁신을 주도하고 있습니다. 예를 들어, 이러한 모델은 자율주행 자동차에서 보행자를 감지하거나 보안 카메라에서 24시간 내내 시설을 모니터링하는 데 사용됩니다.
가장 잘 알려진 computer vision 모델 중 일부는 실시간 객체 감지 기능으로 유명한 YOLO(You Only Look Once) 모델입니다. 시간이 지남에 따라 YOLO 모델은 개선되어 왔으며, 각 새 버전은 더 나은 성능과 유연성을 제공합니다.
Ultralytics YOLO11과 같은 최신 버전은 인스턴스 세그멘테이션, 이미지 분류, 포즈 추정 및 다중 객체 추적과 같은 다양한 작업을 이전보다 더 높은 정확도, 속도 및 정밀도로 처리할 수 있습니다.
이 문서에서는 Ultralytics YOLOv8, YOLOv9, YOLOv10 및 Ultralytics YOLO11을 비교하여 이러한 모델이 어떻게 발전했는지 더 잘 이해해 보고자 합니다. 핵심 기능, 벤치마크 결과 및 성능 차이를 분석하겠습니다. 시작해 보겠습니다!
Link to this sectionUltralytics YOLOv8 개요#
2023년 1월 10일 Ultralytics에서 출시한 YOLOv8은 이전 YOLO 모델들에 비해 획기적인 도약을 이뤘습니다. 이는 실시간 정밀 감지를 위해 최적화되었으며, 잘 테스트된 접근 방식과 혁신적인 업데이트를 결합하여 더 나은 결과를 제공합니다.
object detection을 넘어, 인스턴스 세그멘테이션, 포즈 추정, 방향성 BBox(OBB) 객체 감지 및 이미지 분류와 같은 computer vision 작업도 지원합니다. YOLOv8의 또 다른 중요한 특징은 Nano, Small, Medium, Large, X라는 5가지 서로 다른 모델 변형으로 제공되므로 필요에 따라 속도와 정확도의 올바른 균형을 선택할 수 있다는 점입니다.
범용성과 강력한 성능 덕분에 YOLOv8은 보안 시스템, 스마트 시티, 의료, 산업 자동화 등 많은 실제 애플리케이션에서 사용될 수 있습니다.

Fig 1. YOLOv8을 이용한 스마트 시티의 주차 관리.
Link to this sectionYOLOv8의 주요 특징#
YOLOv8의 다른 주요 특징들을 더 자세히 살펴보겠습니다.
- 향상된 감지 아키텍처: YOLOv8은 개선된 CSPDarknet 백본을 사용합니다. 이 백본은 피처 추출, 즉 모델이 정확한 예측을 할 수 있도록 입력 이미지에서 중요한 패턴이나 세부 정보를 식별하고 캡처하는 과정에 최적화되어 있습니다.
- 감지 헤드(Detection head): anchor-free의 분리형 설계를 사용하여 미리 설정된 bbox 모양(anchor)에 의존하지 않고 객체 위치를 직접 예측하는 방법을 학습합니다. 분리형 구조 덕분에 객체가 무엇인지 분류하는 작업과 위치를 예측하는 작업(회귀)이 별도로 처리되어 정확도를 높이고 학습 속도를 향상하는 데 도움이 됩니다.
- 정확도와 속도의 균형: 이 모델은 빠른 추론 속도를 유지하면서 인상적인 정확도를 달성하여 클라우드 및 에지 환경 모두에 적합합니다.
- 사용자 친화적: YOLOv8은 쉽게 시작할 수 있도록 설계되었습니다. Ultralytics Python package를 사용하여 단 몇 분 만에 예측을 시작하고 결과를 확인할 수 있습니다.
Link to this section연산 효율성에 집중한 YOLOv9#
YOLOv9는 2024년 2월 21일 대만 중앙연구원 정보과학연구소의 Chien-Yao Wang과 Hong-Yuan Mark Liao에 의해 출시되었습니다. 이는 객체 감지 및 instance segmentation과 같은 작업을 지원합니다.
이 모델은 Ultralytics YOLOv5를 기반으로 하며 PGI(Programmable Gradient Information)와 GELAN(Generalized Efficient Layer Aggregation Network)이라는 두 가지 주요 혁신을 도입했습니다.
PGI는 YOLOv9가 계층을 통해 데이터를 처리할 때 중요한 정보를 유지하도록 도와주어 더 정확한 결과를 얻을 수 있게 합니다. 한편, GELAN은 모델의 계층 활용 방식을 개선하여 성능과 연산 효율성을 높입니다. 이러한 업그레이드 덕분에 YOLOv9는 컴퓨팅 자원이 제한적인 에지 기기와 모바일 앱에서 실시간 작업을 처리할 수 있습니다.

Fig 2. GELAN이 YOLOv9의 정확도를 어떻게 개선하는지 이해하기.
Link to this sectionYOLOv9의 주요 특징#
YOLOv9의 다른 주요 특징들을 간략히 살펴보겠습니다.
- 효율성을 동반한 높은 정밀도: YOLOv9는 많은 컴퓨팅 자원을 소비하지 않고도 높은 감지 정확도를 제공하므로 자원이 제한된 경우 훌륭한 선택이 됩니다.
- 경량 모델: YOLOv9의 경량 모델 변형은 에지 및 모바일 배포에 최적화되어 있습니다.
- 사용 편의성: YOLOv9는 Ultralytics Python package에서 지원되므로, 코드를 사용하든 CLI를 사용하든 다양한 환경에서 쉽게 설정하고 실행할 수 있습니다.
Link to this sectionNMS-free 객체 감지를 지원하는 YOLOv10#
YOLOv10은 2024년 5월 23일 칭화대학교 연구원들이 도입했으며, 실시간 객체 감지에 중점을 둡니다. 이는 중복 감지를 제거하기 위한 후처리 단계인 NMS(non-maximum suppression)의 필요성을 없애고 전체적인 모델 설계를 개선함으로써 이전 YOLO 버전의 한계를 해결합니다. 그 결과, 최첨단 정확도를 유지하면서도 더 빠르고 효율적인 객체 감지가 가능해졌습니다.
이를 가능하게 하는 중요한 부분은 일관된 이중 레이블 할당(consistent dual-label assignments)이라고 하는 학습 방식입니다. 이는 두 가지 전략을 결합합니다. 하나는 여러 예측이 동일한 객체로부터 학습할 수 있도록 하는 것이고(one-to-many), 다른 하나는 가장 좋은 단일 예측을 선택하는 데 집중하는 것입니다(one-to-one). 두 전략이 동일한 매칭 규칙을 따르므로 모델은 스스로 중복을 피하는 법을 학습하여 NMS가 필요하지 않게 됩니다.

Fig 3. YOLOv10은 NMS-free 학습을 위해 일관된 이중 레이블 할당을 사용합니다.
YOLOv10의 아키텍처는 또한 특징을 더 효과적으로 학습하기 위해 개선된 CSPNet 백본과 서로 다른 계층의 정보를 결합하는 PAN(Path Aggregation Network) 넥을 사용하여 작고 큰 객체를 모두 더 잘 감지합니다. 이러한 개선 사항으로 인해 YOLOv10은 제조, 소매 및 자율주행 분야의 실제 애플리케이션에 사용할 수 있게 되었습니다.
Link to this sectionYOLOv10의 주요 특징#
다음은 YOLOv10의 돋보이는 몇 가지 다른 기능입니다.
-
대형 커널 컨볼루션(Large-kernel convolutions): 이 모델은 대형 커널 컨볼루션을 사용하여 이미지의 더 넓은 영역에서 컨텍스트를 캡처함으로써 전체 장면을 더 잘 이해할 수 있도록 합니다.
-
부분 셀프 어텐션 모듈: 이 모델은 부분 셀프 어텐션 모듈을 통합하여 너무 많은 컴퓨팅 자원을 사용하지 않고도 이미지의 가장 중요한 부분에 집중함으로써 성능을 효율적으로 향상합니다.
-
독특한 모델 변형: 일반적인 YOLOv10 크기(Nano, Small, Medium, Large, X)와 함께 YOLOv10b(Balanced)라는 특별한 버전이 있습니다. 이것은 더 넓은 모델로, 각 계층에서 더 많은 특징을 처리하므로 속도와 크기 사이의 균형을 유지하면서 정확도를 개선하는 데 도움이 됩니다.
-
사용 친화적: YOLOv10은 Ultralytics Python package와 호환되어 사용하기 쉽습니다.
Link to this sectionUltralytics YOLO11: 향상된 속도와 정확도#
올해 9월 30일, Ultralytics는 연례 하이브리드 이벤트인 YOLO Vision 2024 (YV24)에서 YOLO 시리즈의 최신 모델 중 하나인 YOLO11을 공식 출시했습니다.
이번 릴리스는 이전 버전에 비해 상당한 개선을 가져왔습니다. YOLO11은 더 빠르고 더 정확하며 매우 효율적입니다. YOLOv8 사용자가 익숙한 객체 감지, 인스턴스 세그멘테이션, 이미지 분류를 포함한 모든 computer vision tasks를 지원합니다. 또한 YOLOv8 워크플로우와의 호환성을 유지하여 사용자가 새 버전으로 원활하게 전환할 수 있도록 합니다.
더 나아가, YOLO11은 경량 에지 기기부터 강력한 클라우드 시스템까지 다양한 컴퓨팅 요구 사항을 충족하도록 설계되었습니다. 이 모델은 오픈 소스 및 엔터프라이즈 버전으로 제공되어 다양한 사용 사례에 적응할 수 있습니다.
의료 영상 및 위성 감지와 같은 정밀 작업은 물론, 자율주행 차량, 농업 및 의료 분야의 더 광범위한 애플리케이션에 훌륭한 옵션입니다.

Fig 4. Ultralytics YOLO11을 사용하여 교통량을 감지, 계수 및 추적.
Link to this sectionYOLO11의 주요 특징#
YOLO11의 다른 고유한 특징들은 다음과 같습니다.
- 빠르고 효율적인 감지: YOLO11은 성능을 저하하지 않으면서 최종 예측 계층의 속도에 초점을 맞춰 최소한의 레이턴시를 구현하도록 설계된 감지 헤드를 특징으로 합니다.
- 개선된 특징 추출: 최적화된 백본 및 넥 아키텍처가 특징 추출을 향상하여 더 정밀한 예측을 가능하게 합니다.
- 플랫폼 전반의 원활한 배포: YOLO11은 에지 기기, 클라우드 플랫폼 및 NVIDIA GPU에서 효율적으로 실행되도록 최적화되어 다양한 환경에 걸쳐 적응성을 보장합니다.
Link to this sectionCOCO 데이터셋에서의 YOLO 모델 벤치마킹#
다양한 모델을 탐색할 때 특징만 보고 compare하는 것은 항상 쉽지 않습니다. 바로 이때 벤치마킹이 필요합니다. 모든 모델을 동일한 데이터셋에서 실행함으로써 성능을 객관적으로 측정하고 비교할 수 있습니다. COCO dataset에서 각 모델이 어떻게 수행되는지 살펴보겠습니다.
YOLO 모델을 비교할 때 각 새 버전은 정확도, 속도 및 유연성 측면에서 주목할 만한 개선을 가져옵니다. 특히 YOLO11m은 YOLOv8m보다 파라미터 수가 22% 적어 더 가볍고 실행 속도가 빠르다는 점에서 큰 도약을 이뤘습니다. 또한 크기가 작음에도 불구하고 COCO 데이터셋에서 더 높은 mAP(mean average precision)를 달성합니다. 이 지표는 모델이 객체를 얼마나 잘 감지하고 위치를 파악하는지 측정하므로, mAP가 높을수록 더 정확한 예측을 의미합니다.

Fig 5. COCO 데이터셋에서 YOLO11 및 기타 YOLO 모델 벤치마킹.
Link to this section비디오에서 YOLO 모델 테스트 및 비교#
이 모델들이 실제 상황에서 어떻게 작동하는지 살펴보겠습니다.
YOLOv8, YOLOv9, YOLOv10 및 YOLO11을 비교하기 위해 네 가지 모델 모두 동일한 교통 비디오에서 공정한 평가를 위해 0.3의 신뢰도 점수(모델이 객체를 올바르게 식별했다고 최소 30% 확신할 때만 감지 결과를 표시함)와 640의 이미지 크기로 실행되었습니다. 객체 감지 및 추적 결과는 감지 정확도, 속도 및 정밀도에서의 주요 차이점을 강조했습니다.
첫 번째 프레임부터 YOLO11은 YOLOv10이 놓친 트럭과 같은 대형 차량을 포착했습니다. YOLOv8과 YOLOv9는 괜찮은 성능을 보였지만 조명 조건과 객체 크기에 따라 차이가 있었습니다. 작고 멀리 있는 차량은 모든 모델에서 여전히 도전적인 과제였으나, YOLO11은 해당 감지에서도 눈에 띄는 개선을 보였습니다.

Fig 6. YOLOv8, YOLOv9, YOLOv10 및 YOLO11 비교.
속도 측면에서 모든 모델은 프레임당 10~20밀리초 사이에서 작동하여 50 FPS 이상에서 실시간 작업을 처리하기에 충분히 빨랐습니다. 한편, YOLOv8과 YOLOv9는 비디오 전체에서 안정적이고 신뢰할 수 있는 감지를 제공했습니다. 흥미롭게도 더 낮은 레이턴시를 위해 설계된 YOLOv10은 더 빨랐지만 특정 유형의 객체를 감지하는 데 있어 약간의 불일치를 보였습니다.
반면, YOLO11은 정밀도 면에서 돋보였으며 속도와 accuracy 사이의 강력한 균형을 제공했습니다. 어떤 모델도 모든 프레임에서 완벽하게 작동하지는 않았지만, 나란히 비교한 결과 YOLO11이 전반적으로 가장 우수한 성능을 보였다는 것이 분명히 드러났습니다.
Link to this section어떤 YOLO 모델이 computer vision 작업에 가장 적합할까요?#
프로젝트를 위한 모델 선택은 해당 프로젝트의 특정 요구 사항에 달려 있습니다. 예를 들어, 어떤 애플리케이션은 속도를 우선시할 수 있고, 다른 애플리케이션은 더 높은 정확도를 요구하거나 결정에 영향을 미치는 배포 제약 사항에 직면할 수 있습니다.
또 다른 중요한 요소는 해결해야 할 computer vision 작업 유형입니다. 다양한 작업 전반에 걸쳐 더 넓은 유연성을 찾고 있다면 YOLOv8과 YOLO11이 좋은 선택입니다.
YOLOv8과 YOLO11 중 무엇을 선택할지는 실제 필요에 달려 있습니다. computer vision을 처음 접하고 더 큰 커뮤니티, 더 많은 튜토리얼 및 광범위한 third-party integrations를 중요하게 생각한다면 YOLOv8이 확실한 선택입니다.
반면, 더 나은 정확도와 속도를 갖춘 최첨단 성능을 찾고 있다면 YOLO11이 더 나은 선택이지만, 최신 릴리스이기 때문에 커뮤니티가 더 작고 통합 사례가 적습니다.
Link to this section핵심 요약#
Ultralytics YOLOv8에서 Ultralytics YOLO11에 이르기까지, YOLO 모델 시리즈의 진화는 더 지능적인 computer vision 모델을 향한 일관된 노력을 반영합니다. YOLO의 각 버전은 속도, 정확도 및 정밀도 측면에서 의미 있는 업그레이드를 가져옵니다.
computer vision이 계속 발전함에 따라 이러한 모델은 객체 감지부터 자율 시스템에 이르기까지 실제 과제에 신뢰할 수 있는 솔루션을 제공합니다. YOLO 모델의 지속적인 개발은 이 분야가 얼마나 발전했는지, 그리고 앞으로 얼마나 더 많은 것을 기대할 수 있는지를 보여줍니다.
AI에 대해 더 알아보려면 GitHub repository를 방문하여 우리 커뮤니티와 소통하세요. 제조업의 비전 AI부터 의료 분야의 computer vision까지 다양한 산업 전반의 발전을 확인해 보세요. 라이선스 옵션을 확인하고 오늘 비전 AI 프로젝트를 시작하세요.






