작은 mAP 모델 mAP 향상 방법을 데이터 품질, 증강, 훈련 전략, 평가 및 배포에 관한 실용적인 팁과 함께 알아보세요.
작은 mAP 모델 mAP 향상 방법을 데이터 품질, 증강, 훈련 전략, 평가 및 배포에 관한 실용적인 팁과 함께 알아보세요.
인공지능(AI), 머신러닝, 컴퓨터 비전 기술의 도입이 지속적으로 확대됨에 따라, 물체 탐지 시스템은 스마트 교통 카메라부터 드론, 소매 분석 도구까지 다양한 분야에서 활용되고 있습니다. 이러한 시스템은 카메라에 가까운 대형 트럭부터 멀리 떨어진 작은 보행자에 이르기까지 모든 크기의 detect 수 있어야 하는 경우가 많습니다.
일반적으로 크고 선명하게 보이는 물체를 발견하는 것은 더 간단합니다. 반면, 작은 물체를 감지하는 것은 더 어렵습니다.
이미지에서 물체가 아주 작은 부분만을 차지할 경우 활용할 시각적 정보가 극히 부족합니다. 교통 영상 속 멀리 있는 보행자나 항공 촬영에서 포착된 소형 차량은 몇 픽셀에 불과할 수 있으나, 그 픽셀들조차도 중요한 정보를 담고 있을 수 있습니다.
컴퓨터 비전 모델인 Ultralytics YOLO 시각적 패턴에 의존하여 물체를 인식하며, 이러한 패턴이 제한적이거나 불분명할 경우 성능이 저하됩니다. 처리 과정에서 중요한 세부 사항이 손실될 수 있어 예측이 위치 오차에 더 민감해집니다. 경계 상자의 아주 작은 이동만으로도 정확한 탐지가 누락으로 바뀔 수 있습니다.
모델 성능을 살펴보면 이 차이가 명확해집니다. 대부분의 탐지 및 분할 모델은 중간 크기 및 큰 물체를 잘 처리하지만, 작은 물체는 종종 전체 정확도를 떨어뜨립니다.
딥 러닝 성능은 일반적으로 평균 정밀도( mAP)를 사용하여 측정됩니다. 이 지표는 탐지 정확도와 예측된 경계 상자가 실제 물체와 얼마나 잘 일치하는지를 모두 반영합니다.
정밀도(예측된 객체 중 정답인 객체의 비율)와 재현율(실제 객체 중 성공적으로 탐지된 객체의 비율)을 결합하여, 다양한 신뢰도 수준과 교차율 IoU 예측된 경계 상자가 실제 경계 상자와 얼마나 중첩되는지 측정하는 지표 IoU 임계값에 걸쳐 평가합니다.
이전 글에서는 소형 물체 탐지 기술과 컴퓨터 비전 모델에 있어 이 문제가 왜 어려운지 살펴보았습니다. 이번 글에서는 그 기초를 바탕으로 소형 물체가 포함된 mAP 향상시키는 방법에 집중해 보겠습니다. 시작해 볼까요!
물체 탐지기가 포함된 애플리케이션의 경우, 작은 물체는 반드시 인간의 눈으로 보기에 얼마나 작아 보이는지에 의해서가 아니라 이미지 내에서 차지하는 공간의 크기에 의해 정의됩니다. 만약 이미지에서 아주 작은 부분만을 차지한다면, 시각적 정보가 매우 적어 컴퓨터 비전 알고리즘이 detect 어렵습니다.

사용 가능한 픽셀 수가 적어지면 가장자리, 형태, 질감과 같은 중요한 세부 사항이 불분명해지거나 쉽게 손실될 수 있습니다. 모델이 이미지를 처리하는 과정에서 유용한 패턴을 강조하기 위해 크기가 조정되고 단순화됩니다.
이는 모델이 전체 장면을 이해하는 데 도움이 되지만, 미세한 디테일을 더욱 감소시킬 수도 있습니다. 작은 물체의 경우, 이러한 디테일은 정확한 감지에 종종 필수적입니다.
이러한 문제점은 평가 지표를 살펴볼 때 더욱 두드러진다. 작은 물체는 특히 위치 추정 오류에 민감하다. 경계 상자가 아주 조금만 어긋나도 필요한 교집합 대비 합집합( IoU) 기준값을 충족하지 못할 수 있다.
그럴 경우 합리적으로 보이는 예측도 잘못된 것으로 간주될 수 있습니다. 이는 정밀도와 재현율 모두를 낮추며, 결국 평균 정밀도( mAP)를 감소시킵니다.
이러한 요소들은 서로 밀접하게 연결되어 있기 때문에 성능 향상을 위해서는 종종 전체 시스템을 고려해야 합니다. 이는 작은 시각적 세부 사항이 더 잘 보존되고 해석될 수 있도록 이미지 해상도, 특징 추출, 모델 설계 및 평가 설정을 신중하게 균형 잡아야 함을 의미합니다.
작은 물체 탐지에서는 데이터 세트의 품질이 성능에 가장 큰 차이를 만드는 경우가 많습니다. 작은 물체는 이미지의 극히 일부만을 차지하므로 모델이 학습할 수 있는 시각적 정보가 매우 부족합니다. 이 때문에 훈련 데이터가 특히 중요해집니다. 데이터 세트에 명확하고 대표적인 예시가 충분히 포함되지 않으면 물체 탐지 모델이 일관된 패턴을 인식하는 데 어려움을 겪게 됩니다.
작은 물체 탐지에 효과적인 데이터셋은 일반적으로 고해상도 이미지, 작은 대상의 빈번한 출현, 일관된 시각적 조건을 포함합니다. COCO 같은 일반적인 데이터셋은 유용한 출발점이 될 수 있지만, 특정 실제 사용 사례의 규모, 밀도 또는 맥락과 일치하지 않는 경우가 많습니다. 이러한 경우 모델 성능 향상을 위해 도메인 특화 훈련 데이터 수집이 필수적입니다.
주석 품질 또한 중요한 역할을 합니다. 주석은 모델이 예측하도록 학습하는 올바른 객체 레이블과 경계 상자 위치를 지정함으로써 기준 진실을 확립합니다.
작은 물체의 경우 경계 상자를 신중하고 일관되게 그려야 합니다. 작은 물체는 픽셀 단위의 이동에 매우 민감하기 때문에 상자 배치의 사소한 차이조차도 위치 추정 정확도에 눈에 띄게 영향을 미칠 수 있습니다.
부실하거나 일관성 없는 주석은 mAP 크게 저하시킬 수 있습니다. 객체가 잘못 라벨링되면 모델이 잘못된 패턴을 학습하여 오탐을 증가시킬 수 있습니다.
이미지에는 물체가 나타나지만 실제 데이터에는 존재하지 않는 경우, 평가 과정에서 올바른 탐지 결과가 오탐으로 집계될 수 있습니다. 두 상황 모두 전체 성능을 저하시킵니다.
흥미롭게도 최근 연구에 따르면 소형 물체의 평균 정밀도는 표준 벤치마크에서 종종 20%에서 40% 사이를 유지하는데, 이는 대형 물체에 비해 현저히 낮은 수치입니다. 이러한 격차는 전체 탐지 정확도에서 데이터셋 설계와 주석 일관성의 중요성을 부각시킵니다.
데이터셋 품질과 주석 일관성의 중요성을 더 잘 이해한 상태에서, 객체 탐지 모델이 기존 데이터로부터 더 효과적으로 학습할 수 있는 방법을 살펴보겠습니다. 추가 이미지 수집이 어렵거나 비용이 많이 드는 경우에도, 이미 확보된 데이터를 더 잘 활용함으로써 성능을 향상시킬 수 있는 방법이 여전히 존재합니다.
가장 실용적인 접근법 중 하나는 데이터 증강이다. 특히 소형 물체 탐지에서는 소형 물체가 모델이 학습할 수 있는 시각적 단서를 적게 제공하기 때문에 데이터 증강의 역할이 매우 중요하다. 훈련 과정에서 통제된 변이를 도입함으로써, 증강은 새로운 데이터 수집 없이도 모델이 더 잘 일반화할 수 있도록 돕는다.
효과적인 데이터 증강은 작은 물체를 선명하게 보이도록 유지하는 데 중점을 둡니다. 제어된 크기 조정, 가벼운 크롭핑, 이미지 타일링과 같은 기법은 작은 물체의 형태와 외관을 보존하면서 더 두드러지게 만들 수 있습니다. 목표는 실제 상황에서 보이는 모습을 바꾸지 않으면서 모델이 작은 물체를 더 자주, 그리고 약간 다른 조건에서 인식할 수 있도록 돕는 것입니다.
그러나 증강은 신중하게 적용해야 합니다. 일부 변환은 작은 물체의 가시성을 저하시키거나 실제 데이터에서는 발생하기 어려운 방식으로 외관을 변경할 수 있습니다. 이런 경우 모델이 정확한 물체 경계를 학습하는 데 어려움을 겪을 수 있습니다.
또 다른 흥미로운 데이터 증강 방식은 생성형 AI를 활용해 합성 훈련 데이터를 생성하는 것으로, 점차 인기를 얻고 있습니다. 수동으로 수집하고 라벨링한 이미지에 의존하는 대신, 이제 팀들은 특정 환경, 객체 크기, 조명 조건, 배경 변형을 시뮬레이션하는 현실적인 장면을 생성할 수 있습니다.

이 접근법은 실제 사례를 일관되게 확보하기 어려운 소형 물체 탐지에 특히 유용합니다. 규모, 밀도, 배치 등을 조정하여 합성 이미지에 소형 물체가 나타나는 방식을 제어함으로써, 모델을 더 광범위한 훈련 시나리오에 노출시킬 수 있습니다.
실제 데이터와 신중하게 결합할 경우, 합성 데이터 증강은 모델의 견고성을 향상시키고 데이터 수집 비용을 절감하며 보다 목표 지향적인 성능 개선을 지원할 수 있습니다.
데이터셋 품질과 주석의 일관성 외에도, 모델 훈련 방식의 선택 역시 작은 물체 탐지 성능에 큰 영향을 미친다.
다음은 고려해야 할 주요 훈련 전략들입니다:
작은 물체 탐지 작업에는 일반적인 객체 탐지 모델을 사용할 수 있지만, 작은 물체 탐지 성능 향상을 위해 특별히 설계된 모델 아키텍처도 존재합니다. 예를 들어, Ultralytics YOLOv8 모델의 P2 변형들이 있는데, 이는 미세한 공간적 세부 사항을 보존하도록 최적화되어 있습니다.
YOLOv8 네트워크를 깊이 통과할수록 이미지를 점차 축소하여 여러 스케일로 YOLOv8 . 이는 모델이 전체 장면을 이해하는 데 도움이 되지만, 동시에 미세한 디테일을 감소시킵니다.
물체가 이미 매우 작을 경우, 이 과정에서 중요한 시각 정보가 사라질 수 있습니다.YOLOv8 P2 변형은 피처 피라미드에서 스트라이드 2를 사용하여 이 문제를YOLOv8 .
피처 피라미드는 모델의 일부로, 다양한 내부 해상도에서 이미지를 분석하여 서로 다른 크기의 detect 수 있게 합니다. 스트라이드 2를 사용하면 이 단계에서 이미지가 더 점진적으로 축소되어 원본 픽셀 수준의 디테일을 더 많이 보존할 수 있습니다.
공간적 세부 정보가 더 많이 보존되기 때문에, 작은 물체들은 네트워크 내부에서 더 많은 가시적 구조를 유지합니다. 이는 모델이 몇 픽셀만 차지하는 detect 더 쉽게 국소화하고 detect 수 있게 하여, 작은 물체의 mAP(평균 점유 점수) 향상에 기여할 수 있습니다.
평균 정밀도는 모델의 전반적인 성능을 요약하지만, 모델이 서로 다른 크기의 객체를 얼마나 잘 처리하는지는 항상 보여주지 못합니다. 작은 객체의 경우 성능은 분류 자체보다는 위치 정확도에 의해 제한되는 경우가 많으며, 이는 경계 상자의 미세한 이동이 결과에 상당한 영향을 미칠 수 있음을 의미합니다.
즉, 모델이 물체의 클래스를 정확히 식별하더라도 예측된 바운딩 박스의 위치가 약간 어긋나면 여전히 탐지가 잘못된 것으로 간주될 수 있습니다. 작은 물체는 소수의 픽셀만을 차지하기 때문에 박스 위치의 사소한 변화조차도 예측 박스와 실제 물체 사이의 중첩도를 크게 감소시킬 수 있습니다. 결과적으로 물체가 정확히 식별되었음에도 평가 점수가 하락할 수 있습니다.

더 유용한 접근법은 객체 크기에 따른 성능을 평가하는 것이다. 가장 널리 사용되는 벤치마크는 소형, 중형, 대형 객체별로 평균 정밀도를 별도로 보고한다.
이 크기별 분석은 모델이 우수한 성능을 보이는 영역과 어려움을 겪는 영역을 보다 명확하게 보여줍니다. 실제 적용 시 소형 객체 AP 전체 mAP 비해 종종 뒤처지며, 이는 집계된 지표에서는 명확히 드러나지 않을 수 있는 국소화 문제를 부각시킵니다.
모델 성능은 통제된 테스트 환경에서 실제 배포 환경으로 전환할 때 종종 변화합니다. 이미지 해상도, 처리 속도, 사용 가능한 하드웨어와 같은 요소들은 작은 물체 탐지에 직접적인 영향을 미치는 상충 관계를 초래합니다.
예를 들어, 입력 해상도를 높이면 작은 물체의 mAP 향상될 수 있습니다. 작은 목표물이 더 많은 픽셀을 차지하고 더 많은 세부 정보를 유지하기 mAP . 그러나 높은 해상도는 메모리 사용량과 처리 시간도 증가시킵니다. 이는 추론 속도를 늦추고 운영 비용을 높일 수 있습니다.

하드웨어 선택은 이러한 상충 관계를 관리하는 데 핵심적인 역할을 합니다. 더 강력한 GPU는 더 큰 모델과 더 빠른 처리를 가능하게 하지만, 배포 환경, 특히 에지 디바이스는 종종 제한된 컴퓨팅 및 메모리 자원을 가지고 있습니다.
실시간 애플리케이션은 또 다른 제약 조건을 추가합니다: 낮은 지연 시간을 유지하려면 모델 크기나 입력 해상도를 줄여야 할 수 있으며, 이는 작은 물체의 재현율에 부정적인 영향을 미칠 수 있습니다. 궁극적으로 배포 결정은 탐지 성능과 하드웨어 제약, 속도 요구사항, 전체 비용 간의 균형을 요구합니다.
작은 물체 감지 성능 향상은 특히 실제 환경에서 작업할 때 실용적이고 체계적인 접근이 필요합니다. 다음은 염두에 두어야 할 주요 단계의 개요입니다:
작은 mAP 향상을 mAP 무작위적인 조정 대신 체계적이고 데이터 중심의 접근법이 필요합니다. 진정한 개선은 양질의 데이터, 일관된 주석, 신중한 훈련, 그리고 적절한 평가 방법을 결합함으로써 이루어집니다. 실제 프로젝트에서는 꾸준한 테스트와 작지만 측정 가능한 변화가 시간이 지남에 따라 더 우수하고 신뢰할 수 있는 작은 물체 탐지로 이어집니다.
우리의 성장하는 커뮤니티에 참여하고 실습용 AI 리소스를 위한 GitHub 저장소를 탐색하세요. 비전 AI로 오늘 바로 구축하려면 라이선스 옵션을 살펴보세요. 솔루션 페이지를 방문하여 농업 분야의 AI가 농업을 어떻게 변화시키고 있는지, 로봇공학 분야의 비전 AI가 미래를 어떻게 만들어가고 있는지 알아보세요.