Yolo 비전 선전
선전
지금 참여하기

데이터 증강을 통한 AI 모델의 강건성 향상

데이터 증강을 통해 훈련 데이터에 현실적인 변형을 추가하는 것이 AI 모델의 견고성과 실제 성능 향상에 어떻게 도움이 되는지 알아보세요.

테스트는 모든 기술 솔루션 구축의 핵심 단계입니다. 이는 시스템이 실제 가동되기 전에 어떻게 작동하는지 팀에게 보여주며, 문제를 조기에 해결할 수 있게 합니다. 이는 AI를 포함한 다양한 분야에서 마찬가지입니다. AI 모델은 배포 후 예측 불가능한 실제 환경을 처리해야 하기 때문입니다.

예를 들어, 컴퓨터 비전은 기계가 이미지와 동영상을 이해하도록 가르치는 인공지능의 한 분야입니다. Ultralytics 같은 컴퓨터 비전 모델은 객체 탐지, 인스턴스 분할, 이미지 분류와 같은 작업을 지원합니다.

다양한 산업 분야에서 환자 모니터링, 교통 분석, 자동 결제, 제조 품질 검사 등에 활용될 수 있습니다. 그러나 고급 모델과 고품질 훈련 데이터를 사용하더라도, 비전 AI 솔루션은 변화하는 조명, 움직임, 부분적으로 가려진 물체 등 실제 환경의 변수에 직면하면 여전히 어려움을 겪을 수 있습니다.

이는 모델이 훈련 과정에서 제공된 예시로부터 학습하기 때문입니다. 눈부심, 모션 블러, 부분적 가시성 같은 조건을 이전에 본 적이 없다면, 해당 시나리오에서 물체를 정확히 인식할 가능성이 낮아집니다.

모델의 강건성을 향상시키는 한 가지 방법은 데이터 증강을 활용하는 것입니다. 새로운 데이터를 대량으로 수집하는 대신, 엔지니어들은 기존 이미지에 조명 조정, 자르기, 이미지 혼합 등과 같은 작고 의미 있는 변화를 가할 수 있습니다. 이는 모델이 더 다양한 상황에서 동일한 객체를 인식하도록 학습하는 데 도움이 됩니다.

이 글에서는 데이터 증강이 제어된 환경 외부에서 배포될 때 모델의 견고성과 비전 AI 시스템의 신뢰성을 어떻게 향상시키는지 살펴보겠습니다. 시작해 보겠습니다!

모델의 견고성을 확인하는 방법

데이터 증강에 대해 자세히 알아보기 전에, 컴퓨터 비전 모델이 실제 사용에 진정으로 준비되었는지 판단하는 방법을 논의해 보겠습니다. 

강건한 모델은 깨끗하고 완벽하게 라벨링된 이미지에만 작동하는 것이 아니라, 조건이 변해도 계속해서 우수한 성능을 발휘합니다. AI 모델의 강건성을 평가할 때 고려해야 할 실용적인 요소들은 다음과 같습니다:

  • 조명 변화: 모델은 밝은 빛, 어두운 빛, 눈부심 또는 그림자에 노출될 때 다르게 동작할 수 있으며, 이는 물체 인식의 정확도에 영향을 미칠 수 있습니다.
  • 부분 가림: 일상적인 장면에서 물체는 종종 다른 물체에 가려지거나 부분적으로만 보입니다. 더 강력한 모델은 시각 정보가 누락된 상태에서도 이를 인식할 수 있습니다.
  • 복잡한 장면: 많은 물체가 겹쳐 있는 환경은 물체 탐지를 더 어렵게 만들 수 있습니다. 이러한 상황에서 우수한 성능을 보이는 모델은 일반적으로 복잡한 환경에서도 더 신뢰할 수 있습니다.

깨끗하고 완벽하게 포착된 이미지에서 좋은 결과가 항상 실제 환경에서의 강력한 성능으로 이어지지는 않습니다. 다양한 조건에서 정기적인 테스트를 수행해야 모델이 배포된 후 얼마나 잘 견디는지 확인할 수 있습니다.

데이터 증강이란 무엇인가요?

사진 속 사물의 모습은 조명, 각도, 거리 또는 배경에 따라 달라질 수 있습니다. 컴퓨터 비전 모델을 훈련시킬 때, 학습 데이터셋에는 이러한 변동성을 포함시켜야 예측 불가능한 환경에서도 우수한 성능을 발휘할 수 있습니다.

데이터 증강은 기존 이미지를 활용해 추가 예시를 생성함으로써 훈련 데이터셋을 확장합니다. 이를 위해 이미지를 회전하거나 뒤집기, 밝기 조정, 일부 잘라내기 등 의도적인 변형을 적용합니다. 

예를 들어, 고양이 사진이 단 한 장만 있다고 가정해 보세요. 이 이미지를 회전하거나 밝기를 변경하면, 그 한 장의 사진에서 여러 새로운 버전을 만들 수 있습니다. 각 버전은 약간씩 다르게 보이지만, 여전히 같은 고양이의 사진입니다. 이러한 변형들은 모델에게 한 개체가 서로 다르게 보일 수 있지만 여전히 동일한 것임을 가르치는 데 도움이 됩니다.

그림 1. 고양이 이미지 증강 예시 (출처)

데이터 증강이 모델 성능을 향상시키는 방법

모델 훈련 중에는 데이터 증강을 훈련 파이프라인에 직접 통합할 수 있습니다. 이미지를 수동으로 복제하여 저장하는 대신, 각 이미지가 로드될 때마다 무작위 변환을 적용할 수 있습니다. 

이는 모델이 매번 약간 다른 버전의 이미지를 보게 된다는 의미로, 이미지가 더 밝게 보이거나 뒤집히거나 부분적으로 가려진 상태일 수 있습니다. 무작위 지우기 같은 기법은 이미지의 작은 영역을 제거하여 물체가 가려지거나 부분적으로만 보이는 실제 상황을 시뮬레이션할 수도 있습니다.

그림 2. 무작위 삭제 기반 증강 예시 (출처)

동일한 이미지의 다양한 버전을 접함으로써 모델은 하나의 완벽한 예시에 의존하기보다 어떤 특징이 중요한지 학습할 수 있습니다. 이러한 다양성은 AI 모델의 견고성을 구축하여 실제 환경에서 더 안정적으로 작동할 수 있게 합니다.

일반적인 데이터 증강 기법

훈련 이미지에 변이를 도입하기 위해 사용되는 데이터 증강 기법은 다음과 같습니다:

  • 기하학적 변환: 이러한 기법은 이미지 내에서 객체가 공간적으로 보이는 방식을 변경합니다. 이미지를 회전, 반전, 크기 조정, 자르기 또는 이동함으로써 모델이 객체가 다양한 각도나 거리에서 어떻게 관찰될 수 있는지 이해할 수 있게 합니다.
  • 색상 및 조명 조정: 실제 환경의 조명은 거의 일관되지 않습니다. 사용된 환경이나 카메라에 따라 이미지가 너무 밝거나, 너무 어둡거나, 색상이 약간 어긋날 수 있습니다. 밝기, 대비, 색조 및 채도를 조정하면 모델이 이러한 시각적 변화를 처리하고 다양한 장면에서 우수한 성능을 발휘할 수 있습니다.
  • 이미지 품질 변동: 흐림 현상이나 시각적 노이즈는 이미지를 불분명하게 보이게 할 수 있습니다. 훈련 과정에서 흐림이나 노이즈를 추가하면 모델이 모션 블러, 저조도 이미지 또는 저품질 카메라 결과물을 처리하는 법을 학습하게 되어 불완전한 시각적 요소에 덜 민감해집니다.
  • 가림 기반 증강: 실제 환경에서는 물체가 다른 물체에 의해 부분적으로 가려지는 경우가 흔합니다. 이를 이미지 가림 현상이라 합니다. 훈련 과정에서 이미지의 작은 영역을 숨기거나 가리는 작업은 물체의 일부만 보일 때에도 detect 모델이 학습하는 데 도움이 됩니다.
  • 다중 이미지 증강: 이러한 기법은 여러 이미지의 일부를 하나의 훈련 예시로 결합하여 시야 내 객체 수를 늘리고 복잡하거나 혼잡한 장면을 처리하는 모델의 능력을 향상시킬 수 있습니다.
그림 3. 다중 이미지 증강 예시 (출처)

Ultralytics Python 데이터 증강을 쉽게 구현하세요

데이터셋 관리, 이미지 변형 생성, 변환 코드 작성은 컴퓨터 비전 애플리케이션 구축에 추가 단계를 더할 수 있습니다. Ultralytics Python YOLO26과 같은 Ultralytics YOLO 훈련, 실행, 배포를 위한 단일 인터페이스를 제공함으로써 이러한 과정을 간소화합니다. 훈련 워크플로우를 효율화하기 위한 노력의 일환으로, 이 패키지에는 YOLO 최적화된 내장형 데이터 증강 기능이 포함되어 있으며 Ultralytics 테스트를 Ultralytics.

또한 별도의 도구나 맞춤형 코드가 필요 없는 유용한 통합 기능을 지원합니다. 특히 데이터 증강을 위해 이 패키지는 널리 사용되는 이미지 증강 라이브러리인 Albumentations와 통합됩니다. 이 통합을 통해 추가 스크립트나 맞춤형 코드 없이도 훈련 중에 증강을 자동으로 적용할 수 있습니다.

주석 및 확장 데이터셋 관리

모델의 견고성에 영향을 미치는 또 다른 요소는 주석 품질입니다. Roboflow 같은 주석 도구를 사용하여 생성 및 관리된 깨끗하고 정확한 레이블은 모델이 객체의 위치와 모양을 이해하는 데 도움이 됩니다.

훈련 중에는 뒤집기, 자르기, 회전 등의 데이터 증강 기법이 동적으로 적용되며, 주석은 이러한 변화에 맞춰 자동으로 조정됩니다. 라벨이 정밀할 경우 이 과정은 원활하게 진행되어 모델에 동일한 장면의 다양한 현실적인 예시를 제공합니다.

주석이 부정확하거나 일관성이 없을 경우, 이러한 오류가 증강된 이미지 전반에 걸쳐 반복될 수 있으며 이는 훈련 효율성을 저하시킵니다. 정확한 주석으로 시작하면 이러한 오류의 확산을 방지하고 모델의 견고성 향상에 기여합니다.

데이터 증강을 통한 비전 AI 애플리케이션 강화

다음으로, 실제 응용 분야에서 데이터 증강이 AI 모델의 견고성에 어떻게 기여하는지 예시를 살펴보겠습니다.

실제 환경에서의 객체 탐지 정확도 향상

실제 데이터가 제한적이거나 민감하거나 수집이 어려운 경우, 객체 탐지 시스템 훈련에 합성 이미지가 자주 활용됩니다. 이를 통해 팀은 실제 모든 시나리오를 촬영할 필요 없이 제품, 환경, 카메라 각도의 예시를 신속하게 생성할 수 있습니다. 

그러나 합성 데이터셋은 실제 영상에 비해 지나치게 깔끔해 보일 수 있습니다. 실제 영상에서는 조명이 변화하고, 물체가 겹치며, 배경 잡음이 포함되기 때문입니다. 데이터 증강은 다양한 조명, 노이즈, 물체 배치와 같은 현실적인 변형을 도입함으로써 이러한 격차를 해소하는 데 도움을 줍니다. 이를 통해 모델은 실제 배포 시 마주하게 될 조건들을 처리하는 법을 학습하게 됩니다.

예를 들어, 최근 연구에서 YOLO11 완전히 합성 이미지로만 훈련되었으며, 데이터 증강을 통해 추가적인 변이를 도입했습니다. 이는 모델이 더 광범위하게 물체를 인식하도록 학습하는 데 기여했습니다. 훈련 과정에서 실제 데이터를 본 적이 없음에도 불구하고, 실제 이미지로 테스트했을 때 우수한 성능을 보였습니다.

의료 영상 솔루션의 신뢰성 향상

의료 영상 데이터셋은 종종 제한적이며, 스캔 자체도 장비 유형, 영상 설정 또는 임상 환경에 따라 달라질 수 있습니다. 환자 해부학적 구조, 촬영 각도, 조명 또는 시각적 노이즈의 차이로 인해 컴퓨터 비전 모델이 환자 및 병원 전반에 걸쳐 잘 일반화되는 패턴을 학습하기 어려울 수 있습니다.

데이터 증강은 훈련 과정에서 동일한 스캔 이미지의 다양한 변형을 생성함으로써 이 문제를 해결합니다. 예를 들어 노이즈를 추가하거나, 이미지를 약간 이동시키거나, 미세한 왜곡을 적용하는 방식이 있습니다. 이러한 변경을 통해 훈련 데이터가 실제 임상 상황을 더 잘 반영하도록 합니다.

예를 들어, 소아 영상 연구에서 연구진은 해부학적 분할을 YOLO11 사용했으며, 이를 증강된 의료 데이터로 훈련시켰다. 그들은 추가된 노이즈, 미세한 위치 이동, 작은 왜곡과 같은 변형을 도입하여 이미지를 보다 현실적으로 만들었다.

그림 4. 원본 및 보강된 소아 의료 영상 (출처)

이러한 변이를 학습함으로써 모델은 표면 수준의 차이보다는 의미 있는 해부학적 특징에 집중했습니다. 이로 인해 서로 다른 스캔과 환자 사례 전반에 걸쳐 분할 결과가 더욱 안정적으로 나타났습니다.

주요 내용

다양한 데이터를 수집하는 것은 어렵지만, 데이터 증강을 통해 모델은 더 광범위한 시각적 조건에서 학습할 수 있습니다. 이는 가림 현상, 조명 변화, 복잡한 장면 처리 시 모델의 강건성을 강화합니다. 전반적으로 이는 통제된 훈련 환경 외부에서도 모델이 더 안정적으로 작동하도록 돕습니다. 

유니티 커뮤니티에 가입하고 GitHub 리포지토리에서 최신 비전 AI를 살펴보세요. 솔루션 페이지를 방문하여 제조 분야의 AI와 의료 분야의 컴퓨터 비전과 같은 애플리케이션이 어떻게 발전을 주도하고 있는지 알아보고, 다음 AI 솔루션을 지원하는 라이선스 옵션도 확인해 보세요.

함께 미래의 AI를 만들어 갑시다!

미래의 머신러닝 여정을 시작하세요

무료로 시작하기