자율 주행 및 의료와 같은 AI 애플리케이션을 위한 객체 감지 모델을 평가할 때 평균 정밀도(mAP)가 갖는 중요성을 알아보세요.
평균 정밀도(mAP)는 특히 객체 감지 작업과 같은 컴퓨터 비전 분야에서 널리 사용되는 중요한 평가 지표입니다. 이는 모든 객체 범주에 걸쳐 모델 예측의 정확도를 측정하여 모델의 성능을 요약하는 단일하고 포괄적인 점수를 제공합니다. mAP 점수는 분류의 정확성(객체가 모델이 말하는 것과 일치하는가?)과 위치 정확도(예측된 바운딩 박스가 실제 객체의 위치와 얼마나 잘 일치하는가?)를 모두 고려합니다. 균형 잡힌 평가를 제공하기 때문에 mAP는 Ultralytics YOLO와 같은 다양한 객체 감지 모델의 성능을 비교하는 표준 지표가 되었습니다.
mAP를 이해하려면 먼저 정밀도, 재현율 및 IoU(Intersection over Union)와 같은 핵심 구성 요소를 파악하는 것이 도움이 됩니다.
mAP 계산은 이러한 개념을 종합합니다. 각 객체 클래스에 대해 다양한 신뢰도 점수 임계값에서 정밀도를 재현율에 대해 플로팅하여 정밀도-재현율 곡선이 생성됩니다. 해당 클래스에 대한 평균 정밀도(AP)는 이 곡선 아래 영역이며, 해당 특정 클래스에 대한 모델의 성능을 나타내는 단일 숫자를 제공합니다. 마지막으로, mAP는 모든 객체 클래스에서 AP 점수의 평균을 취하여 계산됩니다. 널리 사용되는 COCO 데이터 세트에 대한 것과 같은 일부 평가 체계는 여러 IoU 임계값에서 mAP를 평균화하여 더욱 강력한 평가를 제공함으로써 한 단계 더 나아갑니다.
mAP는 다른 평가 지표와 관련이 있지만, 뚜렷한 목적을 가지고 있습니다.
표준화된 벤치마크 데이터 세트는 객체 감지 분야를 발전시키는 데 매우 중요합니다. PASCAL VOC 및 COCO와 같은 데이터 세트는 mAP를 공개 리더보드에서 제출 순위를 매기는 주요 지표로 사용합니다. 이를 통해 연구원과 실무자는 YOLOv8 및 YOLO11과 같은 다양한 모델을 객관적으로 비교할 수 있습니다.
Ultralytics HUB와 같은 플랫폼은 사용자가 모델 훈련 및 검증 중에 성능을 추적하는 데 도움이 되도록 mAP를 두드러지게 표시합니다. PyTorch 및 TensorFlow와 같은 이러한 모델을 구동하는 기본 딥 러닝 프레임워크는 궁극적으로 mAP를 사용하여 평가되는 모델을 구축하고 훈련하는 데 필요한 도구를 제공합니다.
mAP 메트릭은 신뢰할 수 있는 AI 시스템을 개발하는 데 기본입니다.