YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

평균 정밀도(mAP)

자율 주행 및 의료와 같은 AI 애플리케이션을 위한 객체 감지 모델을 평가할 때 평균 정밀도(mAP)가 갖는 중요성을 알아보세요.

평균 정밀도(mAP)는 특히 객체 감지 작업과 같은 컴퓨터 비전 분야에서 널리 사용되는 중요한 평가 지표입니다. 이는 모든 객체 범주에 걸쳐 모델 예측의 정확도를 측정하여 모델의 성능을 요약하는 단일하고 포괄적인 점수를 제공합니다. mAP 점수는 분류의 정확성(객체가 모델이 말하는 것과 일치하는가?)과 위치 정확도(예측된 바운딩 박스가 실제 객체의 위치와 얼마나 잘 일치하는가?)를 모두 고려합니다. 균형 잡힌 평가를 제공하기 때문에 mAP는 Ultralytics YOLO와 같은 다양한 객체 감지 모델의 성능을 비교하는 표준 지표가 되었습니다.

mAP 작동 방식

mAP를 이해하려면 먼저 정밀도, 재현율 및 IoU(Intersection over Union)와 같은 핵심 구성 요소를 파악하는 것이 도움이 됩니다.

  • 정밀도: 모델 예측이 얼마나 정확한지 측정합니다. 이는 "모델이 감지한 모든 객체 중에서 올바른 비율은 얼마입니까?"라는 질문에 답합니다.
  • 재현율(Recall): 모델이 모든 실제 객체를 얼마나 잘 찾는지 측정합니다. "이미지에 있는 모든 실제 객체 중에서 모델이 얼마나 성공적으로 감지했습니까?"라는 질문에 답합니다.
  • Intersection over Union (IoU): 예측된 경계 상자가 실제(수동으로 레이블이 지정된) 경계 상자와 얼마나 겹치는지를 정량화하는 메트릭입니다. IoU가 특정 임계값(예: 0.5) 이상이면 일반적으로 감지가 참 긍정으로 간주됩니다.

mAP 계산은 이러한 개념을 종합합니다. 각 객체 클래스에 대해 다양한 신뢰도 점수 임계값에서 정밀도를 재현율에 대해 플로팅하여 정밀도-재현율 곡선이 생성됩니다. 해당 클래스에 대한 평균 정밀도(AP)는 이 곡선 아래 영역이며, 해당 특정 클래스에 대한 모델의 성능을 나타내는 단일 숫자를 제공합니다. 마지막으로, mAP는 모든 객체 클래스에서 AP 점수의 평균을 취하여 계산됩니다. 널리 사용되는 COCO 데이터 세트에 대한 것과 같은 일부 평가 체계는 여러 IoU 임계값에서 mAP를 평균화하여 더욱 강력한 평가를 제공함으로써 한 단계 더 나아갑니다.

다른 지표와의 mAP 구별

mAP는 다른 평가 지표와 관련이 있지만, 뚜렷한 목적을 가지고 있습니다.

  • 정확도: 정확도는 전체 예측 수에 대한 올바른 예측 비율을 측정합니다. 일반적으로 분류 작업에 사용되며 예측이 올바르게 분류되고 위치가 파악되어야 하는 객체 탐지에는 적합하지 않습니다.
  • F1-점수(F1-Score): F1-점수는 정밀도와 재현율의 조화 평균입니다. 유용하지만 일반적으로 단일 신뢰도 임계값에서 계산됩니다. 대조적으로 mAP는 모든 임계값에서 성능을 평균화하여 보다 포괄적인 평가를 제공합니다.
  • 신뢰도: 이는 모델 전체에 대한 평가 지표가 아니라 각 개별 예측에 할당된 점수로, 모델이 해당 탐지에 대해 얼마나 확신하는지 나타냅니다. mAP 계산은 이러한 신뢰도 점수를 사용하여 Precision-Recall 곡선을 만듭니다.

도구 및 벤치마크

표준화된 벤치마크 데이터 세트는 객체 감지 분야를 발전시키는 데 매우 중요합니다. PASCAL VOC 및 COCO와 같은 데이터 세트는 mAP를 공개 리더보드에서 제출 순위를 매기는 주요 지표로 사용합니다. 이를 통해 연구원과 실무자는 YOLOv8YOLO11과 같은 다양한 모델을 객관적으로 비교할 수 있습니다.

Ultralytics HUB와 같은 플랫폼은 사용자가 모델 훈련검증 중에 성능을 추적하는 데 도움이 되도록 mAP를 두드러지게 표시합니다. PyTorchTensorFlow와 같은 이러한 모델을 구동하는 기본 딥 러닝 프레임워크는 궁극적으로 mAP를 사용하여 평가되는 모델을 구축하고 훈련하는 데 필요한 도구를 제공합니다.

실제 애플리케이션

mAP 메트릭은 신뢰할 수 있는 AI 시스템을 개발하는 데 기본입니다.

  1. 자율 주행 차량: 자율 주행 자동차용 AI에서 인식 모델은 자동차, 보행자, 자전거 운전자 및 교통 표지판과 같은 다양한 객체를 정확하게 감지해야 합니다. Argoverse와 같은 까다로운 데이터 세트에서 높은 mAP 점수는 모델이 모든 중요한 클래스에서 강력하고 안정적임을 나타내며 이는 안전을 보장하는 데 필수적입니다. Waymo와 같은 이 분야의 선도 기업은 mAP와 같은 지표를 사용한 엄격한 평가에 크게 의존합니다.
  2. 의료 영상 분석: 뇌종양 데이터 세트와 같은 데이터 세트를 사용하여 스캔에서 종양이나 병변과 같은 이상 징후를 감지하도록 모델을 훈련할 때 mAP는 전체 진단 정확도를 평가하는 데 사용됩니다. 높은 mAP는 모델이 가장 흔한 유형의 이상 징후를 감지하는 데 능숙할 뿐만 아니라 더 드물지만 똑같이 중요한 조건을 식별하는 데 효과적임을 보장합니다. 이 포괄적인 평가는 모델이 의료 환경에 배포되기 전에 고려할 수 있는 중요한 단계입니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.