YOLO 모델 비교: YOLOv11과 이전 버전

일상적인 작업 자동화에서 실시간으로 정보에 입각한 의사 결정을 돕는 데 이르기까지 인공 지능(AI)은 다양한 산업의 미래를 재편하고 있습니다. AI의 특히 매혹적인 영역 중 하나는 컴퓨터 비전이며, 비전 AI라고도 합니다. 이는 기계가 인간처럼 시각적 데이터를 분석하고 해석할 수 있도록 하는 데 중점을 둡니다.

특히 컴퓨터 비전 모델은 안전과 효율성을 모두 향상시키는 혁신을 주도하고 있습니다. 예를 들어, 이러한 모델은 자율 주행 차량에서 보행자를 detect 보안 카메라에서 24시간 건물을 모니터링하는 데 사용됩니다.

가장 잘 알려진 컴퓨터 비전 모델 중 하나는 실시간 객체 감지 기능으로 유명한 YOLO (You Only Look Once) 모델입니다. 시간이 지남에 따라 YOLO 모델은 새로운 버전이 나올 때마다 더 나은 성능과 유연성을 제공하면서 개선되었습니다.

다음과 같은 최신 버전 Ultralytics YOLO11 는 인스턴스 분할, 이미지 분류, 포즈 추정, 다중 객체 추적과 같은 다양한 작업을 이전보다 더 나은 정확도, 속도, 정밀도로 처리할 수 있습니다.

이 문서에서는 다음을 비교합니다. Ultralytics YOLOv8, YOLOv9, YOLOv10 및 Ultralytics YOLO11 비교하여 이러한 모델이 어떻게 발전했는지 더 잘 파악할 수 있습니다. 주요 기능, 벤치마크 결과 및 성능 차이를 분석해 보겠습니다. 지금 바로 시작하세요!

Ultralytics YOLOv8 개요

2023년 1월 10일에 출시된 YOLOv8 이전 YOLO 모델에 비해 크게 발전한 버전입니다. 실시간 정확한 탐지에 최적화되어 있으며, 더 나은 결과를 위해 잘 테스트된 접근 방식과 혁신적인 업데이트를 결합했습니다.

물체 감지를 넘어 인스턴스 분할, 포즈 추정, 방향성 경계 상자(OBB) 물체 감지, 이미지 분류와 같은 컴퓨터 비전 작업도 지원합니다. YOLOv8 또 다른 중요한 특징은 필요에 따라 속도와 정확도의 적절한 균형을 맞출 수 있도록 나노, 소형, 중형, 대형, X의 다섯 가지 모델로 제공된다는 점입니다.

다재다능하고 강력한 성능을 갖춘 YOLOv8 보안 시스템, 스마트 시티, 헬스케어, 산업 자동화 등 다양한 실제 애플리케이션에서 사용할 수 있습니다.

__wf_reserved_inherit — 그림 1. YOLOv8 통한 스마트 시티의 주차 관리.

‍

YOLOv8 주요 기능

YOLOv8 다른 주요 기능 몇 가지를 자세히 살펴보세요:

향상된 탐지 아키텍처: YOLOv8 개선된 CSPDarknet 백본을 사용합니다. 이 백본은 모델의 정확한 예측을 돕는 입력 이미지에서 중요한 패턴이나 세부 사항을 식별하고 캡처하는 프로세스인 특징 추출에 최적화되어 있습니다.
탐지 헤드: 앵커 프리 분리형 설계를 사용합니다. 즉, 미리 설정된 경계 상자 모양(앵커)에 의존하지 않고 객체 위치를 직접 예측하는 방법을 학습합니다. 분리형 설정으로 인해 객체가 무엇인지 분류하는 작업과 위치를 예측하는 작업(회귀)이 별도로 처리되어 정확도를 높이고 훈련 속도를 높이는 데 도움이 됩니다.
정확도와 속도의 균형: 이 모델은 빠른 추론 시간을 유지하면서 인상적인 정확도를 달성하여 클라우드 및 에지 환경 모두에 적합합니다.
사용자 친화적: YOLOv8 쉽게 시작할 수 있도록 설계되었으며, Ultralytics Python 패키지를 사용하여 단 몇 분 만에 예측을 시작하고 결과를 확인할 수 있습니다.

계산 효율성에 중점을 둔 YOLOv9

2024년 2월 21일, 대만 아카데미아 시니카 정보과학연구소의 왕치엔야오와 홍위안 마크 리아오가 YOLOv9 출시했습니다. 객체 감지 및 인스턴스 세분화와 같은 작업을 지원합니다.

이 모델은 다음을 기반으로 합니다. Ultralytics YOLOv5 를 기반으로 하며 두 가지 주요 혁신이 도입되었습니다: 프로그래밍 가능한 그라데이션 정보(PGI)와 일반화된 효율적인 레이어 집계 네트워크(GELAN)입니다.

PGI는 YOLOv9 레이어를 통해 데이터를 처리할 때 중요한 정보를 유지하여 보다 정확한 결과를 도출할 수 있도록 도와줍니다. 한편, GELAN은 모델이 레이어를 사용하는 방식을 개선하여 성능과 계산 효율성을 높입니다. 이러한 업그레이드 덕분에 YOLOv9 컴퓨팅 리소스가 제한적인 엣지 디바이스 및 모바일 앱에서 실시간 작업을 처리할 수 있게 되었습니다.

‍

YOLOv9 주요 기능

다음은 YOLOv8 다른 주요 기능 몇 가지를 간략히 소개합니다:

높은 정밀도와 효율성: YOLOv9 많은 컴퓨팅 성능을 소비하지 않고도 높은 탐지 정확도를 제공하므로 리소스가 제한되어 있는 경우 탁월한 선택입니다.
↪cf_200D↩
경량 모델: YOLOv9경량 모델 변형은 엣지 및 모바일 배포에 최적화되어 있습니다.
‍
간편한 사용: YOLOv9 Ultralytics Python 패키지에서 지원되므로 코드를 사용하든 명령줄을 사용하든 다양한 환경에서 간단하게 설정하고 실행할 수 있습니다.

YOLOv10 NMS 물체 감지 가능

2024년 5월 23일 칭화대학교 연구진에 의해 출시된 YOLOv10 실시간 객체 감지에 중점을 두고 있습니다. 이 버전은 중복 감지를 제거하는 데 사용되는 후처리 단계인 비최대 억제NMS의 필요성을 없애고 전반적인 모델 설계를 개선함으로써 이전 YOLO 버전의 한계를 해결합니다. 그 결과 물체를 더 빠르고 효율적으로 감지하는 동시에 최첨단 정확도를 달성할 수 있게 되었습니다.

이를 가능하게 하는 핵심적인 부분은 일관된 이중 레이블 할당으로 알려진 학습 접근 방식입니다. 이는 동일한 객체에서 여러 예측을 학습할 수 있는 전략(일대다)과 최상의 단일 예측을 선택하는 데 중점을 두는 전략(일대일)의 두 가지 전략을 결합한 것입니다. 두 전략 모두 동일한 매칭 규칙을 따르기 때문에 모델이 스스로 중복을 피하는 방법을 학습하므로 NMS 필요하지 않습니다.

‍

또한 YOLOv10아키텍처는 개선된 CSPNet 백본을 사용하여 기능을 더 효과적으로 학습하고, 여러 계층의 정보를 결합하는 PAN(경로 집계 네트워크) 넥을 사용하여 작은 물체와 큰 물체를 모두 더 잘 감지할 수 있도록 합니다. 이러한 개선 사항 덕분에 제조, 소매업, 자율 주행 등의 실제 애플리케이션에 YOLOv10 사용할 수 있게 되었습니다.

YOLOv10 주요 기능

다음은 YOLOv10 다른 뛰어난 기능 중 일부입니다:

Large-kernel 컨볼루션: 이 모델은 large-kernel 컨볼루션을 사용하여 이미지의 더 넓은 영역에서 더 많은 컨텍스트를 캡처하여 전체 장면을 더 잘 이해하도록 돕습니다.
‍
부분적 self-attention 모듈: 이 모델은 너무 많은 컴퓨팅 성능을 사용하지 않고 이미지에서 가장 중요한 부분에 집중하기 위해 부분적 self-attention 모듈을 통합하여 성능을 효율적으로 향상시킵니다.

독특한 모델 변형: 나노, 스몰, 미디엄, 라지, X 등 일반적인 YOLOv10 사이즈와 함께 YOLOv10b(밸런스드)라는 특별 버전도 있습니다. 이 모델은 더 넓은 모델로, 각 레이어에서 더 많은 기능을 처리하므로 속도와 크기의 균형을 유지하면서 정확도를 높이는 데 도움이 됩니다.
‍
사용자 친화적: YOLOv10 Ultralytics Python 패키지와 호환되므로 쉽게 사용할 수 있습니다.

Ultralytics YOLO11: 향상된 속도와 정확성

올해 9월 30일, Ultralytics 연례 하이브리드 행사인 YOLO 비전 2024(YV24)에서 YOLO 시리즈의 최신 모델 중 하나인 YOLO11 공식 출시했습니다.

이번 릴리스에는 이전 버전에 비해 크게 개선된 기능이 도입되었습니다. YOLO11 더 빠르고 정확하며 매우 효율적입니다. 물체 감지, 인스턴스 분할, 이미지 분류 등 YOLOv8 사용자에게 익숙한 컴퓨터 비전 작업의 모든 범위를 지원합니다. 또한 YOLOv8 워크플로우와의 호환성을 유지하므로 사용자가 새 버전으로 원활하게 전환할 수 있습니다.

또한 YOLO11 경량 엣지 디바이스에서 강력한 클라우드 시스템에 이르기까지 다양한 컴퓨팅 요구사항을 충족하도록 설계되었습니다. 이 모델은 오픈 소스 버전과 엔터프라이즈 버전으로 제공되므로 다양한 사용 사례에 맞게 조정할 수 있습니다.

의료 영상 및 위성 감지와 같은 정밀 작업은 물론 자율 주행 차량, 농업 및 의료 분야의 광범위한 애플리케이션에 적합합니다.

‍

YOLO11 주요 기능

다음은 YOLO11 다른 고유 기능입니다:

빠르고 효율적인 탐지: YOLO11 지연 시간을 최소화하도록 설계된 탐지 헤드를 탑재하여 성능 저하 없이 최종 예측 레이어의 속도에 집중합니다.
↪cf_200D↩
향상된 특징 추출: 최적화된 백본 및 넥 아키텍처는 특징 추출을 향상시켜 더욱 정확한 예측을 가능하게 합니다.
‍
플랫폼 간 원활한 배포: YOLO11 엣지 디바이스, 클라우드 플랫폼, NVIDIA GPU에서 효율적으로 실행되도록 최적화되어 다양한 환경에서 적응성을 보장합니다.

COCO 데이터 세트에서 YOLO 모델 벤치마킹하기

다양한 모델을 살펴볼 때 기능만 보고 비교하기는 쉽지 않습니다. 이때 벤치마킹이 필요합니다. 동일한 데이터 세트에서 모든 모델을 실행하면 객관적으로 성능을 측정하고 비교할 수 있습니다. COCO 데이터 세트에서 각 모델이 어떻게 작동하는지 살펴보겠습니다.

각 새 버전은 정확도, 속도, 유연성 측면에서 눈에 띄게 개선되었습니다. 특히 YOLO11m은 YOLOv8m 22% 적은 수의 파라미터를 사용하므로 더 가볍고 빠르게 실행할 수 있다는 점에서 비약적인 발전을 이루었습니다. 또한 더 작은 크기에도 불구하고 COCO 데이터 세트에서 더 높은 평균 정밀도mAP를 달성합니다. 이 지표는 모델이 객체를 얼마나 잘 감지하고 위치를 파악하는지를 측정하므로, mAP 높을수록 예측이 더 정확하다는 것을 의미합니다.

‍

동영상에서 YOLO 모델 테스트 및 비교하기

이러한 모델이 실제 상황에서 어떻게 작동하는지 살펴보겠습니다.

신뢰도 점수 0.3(모델은 물체를 정확하게 식별했다고 30% 이상 확신하는 경우에만 탐지 결과를 표시함)과 이미지 크기 640을 사용하여 동일한 교통 영상에서 YOLOv8, YOLOv9, YOLOv10, YOLO11 모두 실행하여 공정한 평가를 진행했습니다. 물체 감지 및 추적 결과는 감지 정확도, 속도 및 정밀도에서 주요 차이점을 강조했습니다.

첫 번째 프레임부터 YOLOv10 트럭과 같은 대형 차량을 포착했는데, 이는 YOLOv10 놓친 것입니다. YOLOv8 YOLOv9 괜찮은 성능을 보였지만 조명 조건과 물체 크기에 따라 차이가 있었습니다. 작고 멀리 있는 차량은 모든 모델에서 여전히 어려운 문제였지만, YOLO11 이러한 감지 성능도 눈에 띄게 향상되었습니다.

‍

속도 측면에서는 모든 모델이 프레임당 10~20밀리초로 작동하여 50FPS 이상의 실시간 작업을 처리할 수 있을 만큼 충분히 빨랐습니다. 한편으로 YOLOv8 YOLOv9 비디오 전체에서 안정적이고 신뢰할 수 있는 감지 성능을 제공했습니다. 흥미롭게도 지연 시간을 줄이기 위해 설계된 YOLOv10 더 빨랐지만 특정 물체 유형을 감지하는 데 약간의 불일치를 보였습니다.

반면에 YOLO11 속도와 정확도 사이의 강력한 균형을 제공하는 정밀도가 돋보였습니다. 모든 프레임에서 완벽한 성능을 보인 모델은 없었지만, 나란히 비교한 결과 YOLO11 전반적으로 가장 우수한 성능을 제공한다는 것을 분명히 알 수 있었습니다.

컴퓨터 비전 작업에 가장 적합한 YOLO 모델은 무엇인가요?

프로젝트에 적합한 모델을 선택하는 것은 프로젝트의 특정 요구 사항에 따라 달라집니다. 예를 들어, 어떤 애플리케이션은 속도를 우선시할 수 있고, 어떤 애플리케이션은 더 높은 정확도를 요구하거나 의사 결정에 영향을 미치는 배포 제약 조건이 있을 수 있습니다.

또 다른 중요한 요소는 해결해야 하는 컴퓨터 비전 작업의 유형입니다. 다양한 작업에 걸쳐 보다 폭넓은 유연성을 원하신다면 YOLOv8 YOLO11 좋은 옵션입니다.

YOLOv8 YOLO11 중 어떤 것을 선택할지는 여러분의 필요에 따라 달라집니다. 컴퓨터 비전을 처음 접하고 더 큰 커뮤니티, 더 많은 튜토리얼, 광범위한 타사 통합을 중요하게 생각한다면 YOLOv8 선택하는 것이 좋습니다.

반면, 더 나은 정확도와 속도를 갖춘 최첨단 성능을 원한다면 최신 릴리스이기 때문에 커뮤니티가 더 작고 통합 기능이 적지만 YOLO11 더 나은 선택입니다.

주요 내용

Ultralytics YOLOv8 Ultralytics YOLO11 이르기까지, YOLO 모델 시리즈의 진화는 보다 지능적인 컴퓨터 비전 모델을 향한 지속적인 노력을 반영합니다. YOLO 각 버전은 속도, 정확도, 정밀도 측면에서 의미 있는 업그레이드를 제공합니다.

컴퓨터 비전이 계속 발전함에 따라 이러한 모델은 물체 감지부터 자율 시스템에 이르기까지 현실 세계의 과제에 대한 신뢰할 수 있는 솔루션을 제공합니다. YOLO 모델의 지속적인 개발은 이 분야가 얼마나 발전했으며 앞으로 얼마나 더 많은 것을 기대할 수 있는지를 보여줍니다.

AI에 대해 자세히 알아보려면 GitHub 리포지토리를 방문하여 커뮤니티에 참여하십시오. 제조 분야의 Vision AI에서 의료 분야의 컴퓨터 비전에 이르기까지 산업 전반의 발전을 알아보십시오. 지금 바로 Vision AI 프로젝트를 시작하려면 라이선스 옵션을 확인하십시오.

Ultralytics YOLO11 이전 YOLO 모델 비교