용어집

곡선 아래 영역(AUC)

ML 모델 평가에서 곡선 아래 면적(AUC)의 중요성에 대해 알아보세요. 이점, ROC 곡선 인사이트 및 실제 적용 사례에 대해 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

곡선 아래 면적(AUC)은 주로 머신 러닝(ML) 에서 이진 분류 모델을 평가하는 데 사용되는 기본적인 성능 지표입니다. 이는 가능한 모든 분류 임계값에 걸쳐 긍정적인 분류와 부정적인 분류를 구별하는 모델의 능력을 정량화합니다. AUC 점수는 0에서 1 사이의 범위이며, 값이 높을수록 모델 성능이 우수함을 나타냅니다. 0.5점인 모델은 무작위 확률보다 성능이 좋지 않은 반면, 클래스를 완벽하게 구분하는 완벽한 모델은 1.0의 AUC를 달성합니다. 이 메트릭은 특정 임계값 선택과 무관하게 분류 성능에 대한 단일의 종합적인 측정값을 제공합니다.

ROC 곡선 이해하기

AUC 값은 수신기 작동 특성(ROC) 곡선에서 직접 도출됩니다. ROC 곡선은 판별 임계값이 달라질 때 이진 분류기의 진단 능력을 보여주는 그래픽 플롯입니다. 이 그래프는 다양한 임계값 설정에서 민감도 또는 리콜이라고도 하는 진양성률(TPR)을 Y축에, 오탐률(FPR)을 X축에 그래프로 표시합니다. AUC는 이 ROC 곡선 아래의 전체 2차원 영역을 나타냅니다. ROC 곡선에 대한 포괄적인 개요는 Wikipedia에서 확인할 수 있습니다.

AUC의 해석

AUC는 모델이 무작위로 선택된 긍정적인 사례를 무작위로 선택된 부정적인 사례보다 더 높은 순위를 매길 확률로 해석됩니다. 따라서 모델의 전반적인 변별력을 측정하는 척도가 됩니다. AUC의 주요 장점 중 하나는 정확도와 같은 메트릭에 비해 클래스 불균형에 상대적으로 민감하지 않다는 것입니다. 한 클래스가 다른 클래스보다 훨씬 많은 데이터 세트(실제 문제에서 흔히 볼 수 있는 시나리오)에서는 정확도가 오해의 소지가 있는 반면, AUC는 모델이 클래스를 얼마나 잘 구분하는지를 보다 강력하게 측정할 수 있는 척도를 제공합니다. AUC가 1에 가까울수록 분리 능력이 뛰어난 모델이고, 0.5에 가까울수록 무작위 추측과 유사하게 변별력이 떨어진다는 것을 나타냅니다. 효과적인 모델 평가를 위해서는 이러한 해석을 이해하는 것이 중요합니다.

AI 및 ML 분야의 애플리케이션

AUC는 이진 분류 작업이 중요한 다양한 영역에서 널리 사용되고 있습니다. 다음은 두 가지 예입니다:

  1. 의료 진단: 의료 이미지 분석에서 모델은 종종 질병(예: 종양, 당뇨병성 망막증)의 유무를 감지하도록 훈련됩니다. AUC는 의료 분야에서 이러한 AI 모델이 다양한 진단 임계값에 걸쳐 이미지를 기반으로 건강한 환자와 질병에 걸린 환자를 얼마나 잘 구분할 수 있는지 평가하는 데 사용됩니다. 의료 연구에서 AUC의 중요성은 잘 알려져 있습니다.
  2. 사기 탐지: 금융 기관은 사기 거래를 식별하기 위해 머신러닝 모델을 사용합니다. 이는 전형적인 이분법적 분류 문제(사기 대 비사기)입니다. AUC는 잠재적 사기 활동을 플래그 지정하는 모델의 전반적인 효율성을 평가하는 동시에 금융 분야 AI에 필수적인 오경보를 최소화하는 데 도움이 됩니다.

다음을 포함한 많은 딥 러닝(DL) 프레임워크 및 라이브러리 PyTorchTensorFlow를 포함한 많은 딥 러닝 프레임워크와 라이브러리가 이러한 분류기를 구축하는 데 사용됩니다. Scikit-learn과 같은 도구는 ROC AUC 점수를 계산하는 편리한 기능을 제공하여 평가 프로세스를 간소화합니다. 또한 Ultralytics HUB와 같은 플랫폼은 이러한 메트릭과 관련된 모델의 훈련 및 평가를 용이하게 해줍니다.

AUC와 다른 지표 비교

AUC는 중요한 지표이지만, 컴퓨터 비전(CV) 및 머신러닝에서 사용되는 다른 평가 지표와 어떻게 다른지 이해하는 것이 중요합니다:

  • AUC 대 정확도: 정확도는 예측의 전반적인 정확도를 측정하지만 불균형한 데이터 세트에서는 오해를 불러일으킬 수 있습니다. AUC는 임계값에 독립적인 분리 가능성 측정값을 제공하므로 이러한 경우 더 신뢰할 수 있습니다.
  • AUC 대 정밀도-재콜: 양성 클래스가 드물고 주요 관심사인 불균형 데이터 세트의 경우(예: 희귀 질환 탐지), 정밀도-재콜 곡선과 해당 영역(AUC-PR)이 ROC AUC보다 더 많은 정보를 제공할 수 있습니다. 정확도회수율과 같은 메트릭은 특히 양성 클래스와 관련된 성능에 중점을 둡니다. F1 점수도 정확도와 회수율의 균형을 맞춥니다.
  • AUC와 mAP/IoU 비교: AUC는 주로 이진 분류 작업에 사용됩니다. 다음과 같은 모델에서 일반적으로 사용되는 객체 감지 작업의 경우 Ultralytics YOLO와 같은 모델의 경우 평균 평균 정밀도(mAP) 및 교집합 (IoU) 과 같은 메트릭이 표준입니다. 이러한 메트릭은 경계 상자를 사용하여 감지된 객체의 분류 정확도와 위치 정확도를 모두 평가합니다. YOLO 성능 메트릭에 대한 자세한 내용은 여기에서 확인할 수 있습니다. 서로 다른 모델을 비교하는 데는 종종 이러한 특정 메트릭을 분석하는 것이 포함됩니다( Ultralytics 모델 비교에서 볼 수 있듯이).

올바른 메트릭을 선택하는 것은 특정 문제, 데이터 세트의 특성(예: 클래스 균형), AI 프로젝트의 목표에 따라 달라집니다. AUC는 견고성과 해석 가능성으로 인해 이진 분류 성능을 평가하는 초석으로 남아 있습니다.

모두 보기