Yolo 비전 선전
선전
지금 참여하기
용어집

수신자 작동 특성(ROC) 곡선

이진 분류기를 평가하기 위해 수신자 작동 특성(ROC) 곡선을 사용하는 방법을 알아보세요. Ultralytics 통해 TPR(진양성률)과 FPR(위양성률) 간의 상충 관계를 탐구해 보세요.

수신자 작동 특성(ROC) 곡선은 이진 분류 모델의 성능을 평가하는 데 사용되는 기본적인 그래픽 도구입니다. 기계 학습(ML) 분야에서 이 곡선은 가능한 모든 결정 임계값에 걸쳐 모델의 민감도와 특이도 사이의 상충 관계를 시각화합니다. 데이터셋이 불균형할 경우 오해의 소지가 있는 정확도와 같은 단일 값 지표와 달리, ROC 곡선은 양성 사례를 식별하는 기준이 더 엄격해지거나 완화됨에 따라 분류기가 어떻게 행동하는지에 대한 포괄적인 시각을 제공합니다. 이 시각화는 감독 학습 기법을 활용하는 엔지니어가 특정 사용 사례에 대한 최적의 작동 지점을 결정하는 데 필수적입니다.

축과 상충관계 해석하기

ROC 곡선을 이해하려면 서로에 대해 플롯된 두 매개변수, 즉 진양성률(TPR)과 거짓양성률(FPR)을 살펴볼 필요가 있습니다.

  • 진양성률(TPR): 흔히 리콜 또는 민감도라고도 불리는 이 지표는 y축에서 모델이 실제 양성 관측값 중 정확히 식별한 비율을 측정합니다. 높은 TPR은 시스템이 목표를 거의 놓치지 않음을 의미합니다.
  • 거짓양성률(FPR): x축에 표시되며, 음성 사례 중 잘못 양성으로 분류된 비율을 나타내며, "거짓 경보"라고도 합니다.

이 곡선은 역동적인 관계를 보여줍니다: 더 많은 양성 사례를 포착하기 위해 신뢰도 임계값을 낮출수록 (TPR 증가), 부정 사례를 잘못 표시할 위험이 반드시 증가합니다(FPR 증가). 완벽한 분류기는 그래프의 좌상단 모서리에 위치하며, 이는 100% 민감도와 0% 오경보를 의미합니다. 무작위 추측을 하는 모델은 좌하단에서 우상단으로 이어지는 대각선으로 나타납니다. 전체 성능은 일반적으로 곡선 아래 면적(AUC)으로 요약되며, 1.0 값은 완벽함을 나타냅니다.

실제 애플리케이션

ROC 곡선에서 임계값을 어디에 설정할지에 대한 결정은 특정 산업 응용 분야에서 발생하는 오류 비용에 전적으로 달려 있다.

  1. 의료 진단: 의료 분야 인공지능, 특히 의료 영상 분석에서의 종양 검출과 같은 작업에서 양성 사례를 놓치는 비용(거짓 음성)은 잠재적으로 생명을 위협할 수 있습니다. 따라서 실무자들은 거짓 양성률이 높아져 더 많은 건강한 환자가 초기 추가 검사를 권고받을 수 있음에도, 진양성률(TPR)을 극대화하는 임계값을 선택하는 경우가 많습니다.
  2. 금융 사기 탐지: 금융 분야 AI를 신용카드 거래 모니터링에 활용할 때 은행은 보안과 고객 경험 사이의 균형을 유지해야 합니다. 시스템이 지나치게 민감하면 (높은 전체 탐지율), 정상 카드까지 차단할 수 있어 (높은 오탐지율) 사용자에게 불편을 초래합니다. 분석가들은 ROC 곡선을 활용해 대부분의 사기를 포착하면서도 오탐지를허용 가능한 최소 수준으로 유지하는 균형 잡힌 임계값을 찾습니다.

ROC 분석을 위한 확률 생성

ROC 곡선을 그리려면 최종 클래스 레이블이 아닌 원시 예측 확률이 필요합니다. 다음 예제는 최첨단 YOLO26 모델을 사용하여 분류 점수를 생성합니다.

from ultralytics import YOLO

# Load a pretrained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Run inference to get probability distribution
results = model("bus.jpg")

# Access the probability score for the predicted class
# These continuous scores are required to calculate TPR/FPR at different thresholds
print(f"Top Class Index: {results[0].probs.top1}")
print(f"Confidence Score: {results[0].probs.top1conf:.4f}")

검증 세트에 대해 이러한 확률 값을 수집한 후 개발자는 Scikit-learn과 같은 라이브러리를 사용하여 곡선 점들을 계산할 수 있습니다. 데이터셋 관리 및 시간 경과에 따른 이러한 지표 추적을 위해 Ultralytics 모델 평가 및 배포를 위한 통합 도구를 제공합니다.

ROC 대 관련 개념

ROC 곡선을 다른 평가 도구와 구분하는 것이 중요합니다:

  • 정밀도-재현율(PR) 곡선: ROC 곡선이 전체 적중률(TPR)을 전체 오탐률(FPR)에 대해 표시하는 반면, 정밀도-재현율 곡선 은정밀도를 재현율에 대해 표시합니다. 데이터셋이 극심하게 불균형한 경우(예: 희귀 이상 현상 탐지), PR 곡선이 일반적으로 선호됩니다. ROC 곡선은 이러한 시나리오에서 지나치게 낙관적인 관점을 제시할 수 있기 때문입니다.
  • 대 혼동 행렬: 혼동 행렬은 특정 임계값 하나에서의 성능을 순간적으로 보여줍니다. 반면 ROC 곡선은 가능한 모든 임계값에 걸친 성능을 시각화하므로, 최종 결정 규칙이 확립되기 전 예측 모델링 분석을 위한 보다 포괄적인 도구입니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기