IoU(Intersection over Union)가 무엇인지, 계산 방법, 객체 감지 및 AI 모델 평가에서 IoU의 중요한 역할에 대해 알아보세요.
IoU(Intersection over Union)는 컴퓨터 비전(CV)에서, 특히 객체 탐지 작업에 사용되는 기본적인 평가 지표입니다. 이는 모델이 생성한 예측 바운딩 박스와 손으로 직접 레이블링한 정확한 외곽선인 실제 바운딩 박스 간의 겹치는 정도를 측정합니다. 결과 점수는 0과 1 사이의 값으로, 모델이 이미지 내에서 객체의 위치를 얼마나 정확하게 찾아냈는지 수치화합니다. 1점은 완벽하게 일치함을 나타내고, 0점은 전혀 겹치지 않음을 나타냅니다. 이 지표는 Ultralytics YOLO11과 같은 모델의 위치 정확도를 평가하는 데 매우 중요합니다.
핵심적으로 IoU는 예측된 바운딩 박스와 실제 바운딩 박스의 교차 영역(겹치는 영역)과 합집합 영역(두 박스가 덮는 총 영역)의 비율을 계산합니다. 두 개의 겹치는 사각형을 상상해 보십시오. "교차"는 겹치는 공유 영역입니다. "합집합"은 두 사각형이 덮는 총 영역을 합한 것으로, 겹치는 부분은 한 번만 계산합니다. IoU는 교차 영역을 합집합 영역으로 나누어 예측된 상자가 실제 객체와 얼마나 잘 정렬되어 있는지에 대한 표준화된 측정값을 제공합니다. 이 간단하지만 강력한 개념은 객체 감지를 위한 최신 딥러닝(DL)의 초석입니다.
IoU를 사용할 때 중요한 부분은 "IoU 임계값"을 설정하는 것입니다. 이 임계값은 예측이 올바른지 여부를 결정하는 미리 정의된 값(예: 0.5)입니다. 예측된 상자에 대한 IoU 점수가 이 임계값보다 높으면 "True Positive"로 분류됩니다. 점수가 낮으면 "False Positive"입니다. 이 임계값은 정밀도(Precision) 및 재현율(Recall)과 같은 다른 성능 지표에 직접적인 영향을 미치며, 평균 정밀도(mAP)를 계산하는 데 중요한 요소입니다. mAP는 COCO와 같은 벤치마크 데이터 세트에서 객체 감지 모델을 평가하는 표준 지표입니다.
IoU는 수많은 AI 시스템의 성능을 검증하는 데 필수적입니다. 몇 가지 예를 들어보겠습니다.
IoU는 단순한 평가 지표일 뿐만 아니라 훈련 과정 자체에도 필수적입니다. Ultralytics YOLOv8 및 YOLO11의 변형을 포함한 많은 최신 객체 탐지 아키텍처는 손실 함수 내에서 직접 IoU 또는 그 변형을 사용합니다. GIoU(Generalized IoU), DIoU(Distance-IoU) 또는 CIoU(Complete-IoU)와 같은 이러한 고급 IoU 기반 손실은 모델이 겹치는 정도뿐만 아니라 중심 간의 거리 및 종횡비 일관성과 같은 요소도 고려하여 바운딩 박스를 예측하도록 학습하는 데 도움이 됩니다. 이를 통해 기존 회귀 손실에 비해 더 빠른 수렴과 더 나은 위치 성능을 얻을 수 있습니다. 자세한 내용은 문서에서 다양한 YOLO 모델 간의 비교를 확인할 수 있습니다.
모델 학습 및 하이퍼파라미터 튜닝 중 IoU를 모니터링하면 개발자가 더 나은 로컬리제이션을 위해 모델을 개선하는 데 도움이 됩니다. Ultralytics HUB와 같은 도구를 사용하면 IoU 및 기타 지표를 추적하여 모델 개선 주기를 간소화할 수 있습니다. 널리 사용됨에도 불구하고 표준 IoU는 특히 겹치지 않는 상자의 경우 때때로 둔감할 수 있습니다. 이러한 제한으로 인해 앞서 언급한 IoU 변형이 개발되었습니다. 그럼에도 불구하고 IoU는 컴퓨터 비전 평가의 초석으로 남아 있습니다.
IoU도 중요하지만, 다른 지표와의 관계를 이해하는 것이 중요합니다.