교차점 오버 유니온(IoU)이 무엇인지, 어떻게 계산되는지, 객체 감지 및 AI 모델 평가에서 중요한 역할을 하는지 알아보세요.
IoU(Intersection over Union)는 컴퓨터 비전(CV)에서 특히 객체 감지 작업에 사용되는 기본적인 평가 지표입니다. 이 지표는 모델에서 생성된 예측 경계 상자와 수작업으로 라벨을 붙인 정확한 윤곽선인 실측 경계 상자라는 두 경계 사이의 중첩을 측정합니다. 결과 점수는 0에서 1 사이의 값으로, 모델이 이미지에서 물체를 얼마나 정확하게 찾았는지를 정량화합니다. 1점은 완벽하게 일치함을 의미하며, 0점은 전혀 겹치지 않음을 나타냅니다. 이 메트릭은 Ultralytics YOLO11과 같은 모델의 로컬라이제이션 정확도를 평가하는 데 매우 중요합니다.
IoU의 핵심은 예측된 경계 상자와 실측 경계 상자의 합(두 상자가 포함하는 총 면적)에 대한 교차점(겹치는 면적)의 비율을 계산하는 것입니다. 두 개의 겹치는 정사각형을 상상해 보세요. '교집합'은 두 사각형이 겹치는 공유 영역입니다. '합집합'은 두 사각형이 합쳐진 총 면적으로, 겹치는 부분은 한 번만 계산합니다. 교집합을 합집합으로 나누면 IoU는 예측된 상자가 실제 개체와 얼마나 잘 일치하는지에 대한 표준화된 측정값을 제공합니다. 이 간단하지만 강력한 개념은 객체 감지를 위한 최신 딥러닝(DL) 의 초석입니다.
IoU 사용의 핵심은 "IoU 임계값"을 설정하는 것입니다. 이 임계값은 예측이 올바른지 여부를 결정하는 사전 정의된 값(예: 0.5)입니다. 예측된 상자에 대한 IoU 점수가 이 임계값보다 높으면 "진양성"으로 분류됩니다. 점수가 이보다 낮으면 "오탐"입니다. 이 임계값은 정확도 및 회수율과 같은 다른 성능 지표에 직접적인 영향을 미치며, COCO와 같은 벤치마크 데이터 세트에서 객체 탐지 모델을 평가하는 표준 지표인 평균 정밀도(mAP)를 계산하는 데 중요한 요소입니다.
IoU는 수많은 AI 시스템의 성능을 검증하는 데 필수적입니다. 다음은 몇 가지 예시입니다:
IoU는 단순한 평가 지표가 아니라 학습 프로세스 자체에 필수적인 요소이기도 합니다. 최신 객체 감지 아키텍처인 Ultralytics YOLOv8 및 YOLO11의 변형을 포함한 많은 최신 아키텍처는 손실 함수 내에서 IoU 또는 그 변형을 직접 사용합니다. 일반화된 IoU(GIoU), 거리 IoU(DIoU) 또는 완전 IoU(CIoU)와 같은 이러한 고급 IoU 기반 손실은 모델이 잘 겹칠 뿐만 아니라 중심 간 거리 및 화면비 일관성과 같은 요소를 고려한 경계 상자를 예측하는 방법을 학습하는 데 도움이 됩니다. 이를 통해 기존의 회귀 손실에 비해 더 빠른 수렴과 더 나은 로컬라이제이션 성능을 얻을 수 있습니다. 유니티 설명서에서 다양한 YOLO 모델 간의 자세한 비교를 확인할 수 있습니다.
모델 학습 및 하이퍼파라미터 튜닝 중에 IoU를 모니터링하면 개발자가 더 나은 로컬라이제이션을 위해 모델을 개선하는 데 도움이 됩니다. Ultralytics HUB와 같은 도구를 사용하면 IoU 및 기타 메트릭을 추적하여 모델 개선 주기를 간소화할 수 있습니다. 광범위한 유용성에도 불구하고 표준 IoU는 특히 겹치지 않는 박스의 경우 민감하지 않을 수 있습니다. 이러한 한계로 인해 앞서 언급한 IoU 변형이 개발되었습니다. 그럼에도 불구하고 IoU는 컴퓨터 비전 평가의 초석으로 남아 있습니다.
IoU는 매우 중요하지만 다른 지표와의 관계를 이해하는 것이 중요합니다: