용어집

비최대 억제(NMS)

물체 감지를 위한 비최대 억제(NMS)에 대해 알아보세요. 결과를 개선하고 정확도를 높이며 YOLO 과 같은 AI 애플리케이션을 지원하는 방법을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

비최대 억제(NMS)는 컴퓨터 비전(CV), 특히 객체 감지 파이프라인에서 널리 사용되는 중요한 후처리 기법입니다. 이 기술의 주요 역할은 감지 모델에서 생성된 원시 출력을 개선하는 것으로, 동일한 객체 인스턴스에 대해 여러 개의 겹치는 바운딩 박스를 식별하는 경우가 많습니다. 이러한 중복된 박스를 지능적으로 필터링함으로써 NMS는 이미지 또는 비디오 프레임의 각 개별 객체가 최적의 단일 바운딩 박스로 표시되도록 합니다. 이렇게 하면 최종 감지 결과의 선명도와 정확도가 크게 향상되어 후속 작업에 더 유용하게 사용할 수 있습니다.

비 최대 억제 작동 방식

다양한 객체 감지 모델과 같은 Ultralytics YOLO 버전과 같은 객체 감지 모델은 일반적으로 이미지를 스캔하고 감지된 객체 주위에 수많은 잠재적 경계 상자를 제안합니다. 제안된 각 상자에는 신뢰도 점수가 함께 제공되며, 이는 해당 상자에 객체가 포함되어 있고 특정 클래스에 속한다는 모델의 확신을 나타냅니다. NMS는 신뢰도 점수와 공간적 중첩을 기반으로 이러한 제안을 체계적으로 줄이는 방식으로 작동합니다.

프로세스는 일반적으로 다음 단계를 따릅니다:

  1. 제안된 모든 바운딩 박스는 신뢰도 점수를 기준으로 정렬되며, 일반적으로 내림차순으로 정렬됩니다.
  2. 신뢰도 점수가 가장 높은 경계 상자가 최종 탐지로 선택됩니다.
  3. 이 선택된 상자와 상당히 겹치는 다른 모든 바운딩 상자는 억제되거나 제거됩니다. 겹침은 IoU(Intersection over Union) 메트릭을 사용하여 측정되며, IoU가 미리 정의된 임계값(예: 0.5)을 초과하는 경우 억제가 발생합니다. 이 핵심 개념에 대한 자세한 설명은 PyImageSearch의 NMS 가이드와 같은 리소스에서 확인할 수 있습니다.
  4. 이 과정은 반복적으로 반복되며, 나머지 상자 중 다음으로 점수가 높은 상자가 선택되고 겹치는 상자는 제외됩니다.
  5. 이 과정은 모든 상자가 최종 감지 항목으로 선택되거나 억제될 때까지 계속됩니다.

이렇게 하면 가장 확실하고 겹치지 않는 상자만 남게 되어 많은 컴퓨터 비전 튜토리얼에서 시각화된 것처럼 훨씬 더 깔끔하고 해석하기 쉬운 결과물을 얻을 수 있습니다.

AI 및 머신 러닝의 중요성

인공 지능(AI)머신 러닝(ML)의 광범위한 분야에서 NMS는 신뢰할 수 있는 객체 감지 성능을 달성하는 데 필수적인 요소입니다. NMS가 없으면 다음과 같은 감지기의 출력은 YOLO11 와 같은 탐지기의 출력은 단일 객체에 대한 여러 개의 상자로 복잡해질 것입니다. 이러한 중복은 객체 수 계산(객체 계산 가이드), 객체 추적 또는 로봇 공학의 복잡한 장면 이해와 같은 다운스트림 애플리케이션에서 오류로 이어질 수 있습니다.

NMS는 이러한 중복 탐지(종종 오탐의 원인이 되는)를 제거함으로써 모델 예측의 정확성을 크게 향상시킵니다. 이러한 개선은 높은 신뢰성과 정확성을 요구하는 애플리케이션에 매우 중요합니다. NMS의 영향은 평균 정밀도(mAP)와 같은 평가 지표에 반영되며, 이는 일반적으로 YOLO 성능 지표 가이드에 자세히 설명된 대로 NMS가 적용된 후에 계산됩니다.

실제 애플리케이션

NMS는 수많은 실용적인 AI 애플리케이션을 가능하게 하는 초석 기술입니다:

  • 자율주행 차량: 자율 주행 차량에서 NMS는 각 물체에 대한 다중 감지 기능을 필터링하여 차량, 보행자, 자전거 운전자, 교통 표지판을 정확하게 식별하고 위치를 파악하여 보다 안전한 주행을 보장합니다. 자율 주행 차량의 AI에 대해 자세히 알아보세요.
  • 의료 이미지 분석: 의료 스캔(예: CT 스캔 또는 MRI)에서 종양이나 병변과 같은 이상 징후를 감지할 때 NMS는 각 발견 사항을 단일 경계 상자로 표시하여 방사선 전문의의 진단을 돕습니다. 이는 북미 방사선 학회(RSNA)와 같은 조직에서 지원하는 방사선과와 같은 분야에서 매우 중요합니다. 의료 분야의 AI에 대해 자세히 알아보세요.
  • 보안 및 감시: NMS는 비디오 감시 시스템에서 혼잡한 장면에서 개인이나 사물을 정확하게 감지하고 계산하는 데 사용됩니다(감시 블로그의 AI).
  • 리테일 분석: 재고 관리 또는 진열대 모니터링과 같은 작업의 경우 NMS를 사용하면 각 제품이 한 번만 감지되도록 할 수 있습니다.
  • 로봇 공학: 로봇은 탐색 및 상호 작용을 위해 정확한 물체 감지에 의존하며, NMS는 이러한 작업에 필요한 깨끗한 감지 데이터를 제공합니다(로봇 공학에 컴퓨터 비전 통합).

관련 기술과의 비교

NMS는 특히 객체 감지 모델이 초기 후보 경계 상자 집합을 생성한 후에 적용되는 후처리 단계입니다. 앵커 기반 감지기와 앵커가 없는 감지기의 차이점과 같은 감지 아키텍처 자체와 혼동해서는 안 됩니다. 이러한 아키텍처는 잠재적 박스가 제안되는 방식을 정의하며, NMS는 이러한 제안을 구체화합니다.

흥미롭게도 NMS와 관련된 계산 비용과 잠재적인 병목 현상으로 인해 NMS가 없는 객체 감지기에 대한 연구가 활발히 진행되고 있습니다. YOLOv10과 같은 모델은 훈련 중에 메커니즘을 통합하여(일관된 이중 할당과 같은) 본질적으로 중복 상자 예측을 피함으로써 추론 대기 시간을 줄이고 진정한 엔드투엔드 감지를 가능하게합니다(YOLOv10 NMS-free 접근 방식). 이는 다음과 같은 기존 접근 방식과는 대조적입니다. Ultralytics YOLOv8 또는 YOLOv5와 같은 전통적인 접근 방식과는 대조적입니다. 여기서 NMS는 추론 파이프라인의 표준적이고 필수적인 부분으로 남아 있습니다. YOLOv10과 YOLOv8 같은 기술 비교는 설명서에서 살펴볼 수 있습니다. Soft-NMS(Soft-NMS에 관한 문서)와 같은 변형은 겹치는 상자의 점수를 완전히 제거하는 대신 점수를 감쇄하는 대체 접근 방식을 제공합니다.

Ultralytics 도구와 통합

NMS는 Ultralytics 에코시스템 내에 원활하게 통합되어 있습니다. Ultralytics YOLO 모델은 자동으로 NMS를 적용합니다. 예측 (predict)유효성 검사 (val) 모드를 사용하여 사용자가 기본적으로 깨끗하고 정확한 탐지 출력을 받을 수 있도록 합니다. NMS 동작을 제어하는 매개변수(예: IoU 임계값 및 신뢰도 임계값)는 종종 특정 애플리케이션 요구 사항에 맞게 조정할 수 있습니다.

Ultralytics HUB와 같은 플랫폼은 이러한 세부 사항을 더욱 추상화하여 사용자가 모델을 훈련(클라우드 훈련 가이드)하고 최적화된 파이프라인의 일부로 NMS가 자동으로 처리되는 곳에 배포할 수 있게 해줍니다. 이러한 통합을 통해 사용자는 MLOps에 대한 깊은 기술 전문 지식에 관계없이 다양한 컴퓨터 비전 작업에 대한 최첨단 물체 감지 결과를 활용할 수 있습니다. Ultralytics 프레임워크 내의 구체적인 구현 세부 사항은 Ultralytics 유틸리티 참조에서 살펴볼 수 있습니다. 자세한 정의는 기본 Ultralytics 용어집에서 확인하세요.

모두 보기