다양한 훈련 데이터로 모델 성능을 향상시키기 위해 Ultralytics YOLO11을 사용자 정의 훈련할 때 Albumentations를 사용하여 증강하는 방법을 알아보세요.

다양한 훈련 데이터로 모델 성능을 향상시키기 위해 Ultralytics YOLO11을 사용자 정의 훈련할 때 Albumentations를 사용하여 증강하는 방법을 알아보세요.
컴퓨터 비전 솔루션을 구축할 때 비전 AI 모델 학습을 위한 다양한 이미지 세트를 수집하는 것은 프로세스의 중요한 부분일 수 있습니다. 종종 많은 시간과 비용이 필요하며 때로는 수집된 이미지가 모델이 효과적으로 학습하기에 충분히 다양하지 않은 경우도 있습니다.
예를 들어 Ultralytics YOLO11과 같은 컴퓨터 비전 모델은 다양한 애플리케이션과 관련된 다양한 컴퓨터 비전 작업을 위해 이미지 데이터 세트에 대해 사용자 정의 훈련을 할 수 있습니다. 다양한 데이터는 모델이 더 나은 일반화를 수행하도록 돕고 광범위한 실제 시나리오에서 객체와 패턴을 인식할 수 있도록 해주기 때문에 중요합니다.
다양한 데이터 부족으로 어려움을 겪고 있다면 이미지 데이터 증강 기술이 훌륭한 솔루션이 될 수 있습니다. 회전, 뒤집기 및 밝기 조정과 같은 방법은 데이터 세트의 다양성을 높여 모델이 더 광범위한 조건을 처리하는 데 도움이 될 수 있습니다.
이러한 이유로 Ultralytics는 이미지 데이터 증강을 위한 통합을 지원합니다. 다양한 변환 모음을 제공하는 인기 있는 도구인 Albumentations를 사용하면 다양한 시각적 데이터를 만들 수 있습니다. 이 통합은 학습 이미지를 자동으로 증강하여 YOLO11 학습 프로세스를 간소화하여 모델 성능을 향상시킵니다.
이 기사에서는 Albumentations 통합 사용법, 이점 및 모델 훈련에 미치는 영향에 대해 살펴봅니다.
컴퓨터 비전 모델은 광범위한 고품질 이미지 세트에서 학습하여 다양한 환경에서 객체를 인식할 수 있습니다. 실제 소스에서 대규모 데이터 세트를 수집하는 것은 느리고 비용이 많이 들고 비효율적일 수 있습니다. 이 작업을 간소화하기 위해 이미지 데이터 증강을 사용하여 기존 이미지의 새로운 변형을 만들어 모델이 더 많은 데이터를 수집하지 않고도 다양한 시나리오에서 학습할 수 있도록 지원할 수 있습니다.
특히, 2018년에 효율적인 이미지 데이터 증강을 위해 도입된 오픈 소스 라이브러리인 Albumentations를 활용할 수 있습니다. 회전 및 뒤집기와 같은 간단한 기하학적 변경부터 밝기, 대비 및 노이즈 추가와 같은 더 복잡한 조정에 이르기까지 다양한 작업을 지원합니다.
Albumentations는 고성능으로 알려져 있어 이미지를 빠르고 효율적으로 처리할 수 있습니다. OpenCV 및 NumPy와 같은 최적화된 라이브러리를 기반으로 구축되어 최소한의 처리 시간으로 대규모 데이터 세트를 처리하므로 모델 훈련 중 빠른 데이터 증강에 이상적입니다.
Albumentations의 주요 기능은 다음과 같습니다.
데이터 세트에 증강을 적용하는 방법은 여러 가지가 있으며 OpenCV와 같은 도구를 사용하여 직접 만들 수도 있는데, 왜 Albumentations와 같은 라이브러리를 지원하는 통합을 선택해야 하는지 궁금할 수 있습니다.
OpenCV와 같은 도구를 사용하여 수동으로 증강을 생성하는 데는 많은 시간이 걸리고 어느 정도 전문 지식이 필요합니다. 또한 최상의 결과를 얻기 위해 변환을 미세 조정하는 것이 까다로울 수 있습니다. Albumentations 통합은 이 프로세스를 더 쉽게 만듭니다. 데이터 세트를 준비할 때 시간과 노력을 절약할 수 있는 많은 즉시 사용 가능한 변환을 제공합니다.
Albumentations 통합을 선택해야 하는 또 다른 이유는 Ultralytics 모델 학습 파이프라인과 원활하게 작동하기 때문입니다. 증강이 학습 중에 자동으로 적용되므로 YOLO11을 사용자 정의 학습하는 것이 훨씬 쉽습니다. 프로세스를 단순화하므로 데이터 준비를 처리하는 대신 모델 개선에 더 집중할 수 있습니다.
흥미롭게도, Albumentations 통합을 사용하여 YOLO11을 훈련하는 것은 생각보다 간단합니다. 올바른 라이브러리가 설정되면 통합은 훈련 중에 이미지 데이터 증강을 자동으로 적용합니다. 이는 모델이 동일한 데이터 세트를 사용하여 다양한 이미지 변형으로부터 학습하는 데 도움이 됩니다.
다음으로 YOLO11을 사용자 정의 트레이닝할 때 Albumentations 통합을 설치하고 사용하는 방법을 살펴보겠습니다.
증강을 적용하기 전에 Ultralytics Python 패키지와 Albumentations를 모두 설치해야 합니다. 통합은 두 라이브러리가 기본적으로 원활하게 함께 작동하도록 구축되었으므로 복잡한 구성에 대해 걱정할 필요가 없습니다.
전체 설치 프로세스는 아래 이미지에 표시된 것처럼 Python 라이브러리를 설치하기 위한 패키지 관리 도구인 단일 pip 명령으로 몇 분 안에 완료할 수 있습니다.
Albumentations가 설치되면 Ultralytics 모델 훈련 모드는 훈련 중에 자동으로 이미지 증강을 적용합니다. Albumentations가 설치되지 않은 경우 이러한 증강은 적용되지 않습니다. 자세한 내용은 공식 Ultralytics 문서를 참조하십시오.
Albumentations 통합의 내부에서 무슨 일이 일어나고 있는지 더 잘 이해해 봅시다.
다음은 YOLO11 학습 중에 적용되는 증강에 대한 자세한 설명입니다.
특정 애플리케이션을 위해 YOLO11을 맞춤형으로 훈련하는 경우 Albumentations 통합은 다양한 조건에 적응하여 모델의 성능을 향상시키는 데 도움이 될 수 있습니다. 몇 가지 실제 애플리케이션과 이 통합이 해결할 수 있는 과제에 대해 논의해 보겠습니다.
헬스케어 분야의 비전 AI는 의사가 의료 이미지를 보다 정확하게 분석하여 진단을 돕고 환자 치료를 개선하는 데 도움이 됩니다. 실제로 헬스케어 조직의 약 5분의 1이 이미 AI 솔루션을 사용하고 있습니다.
그러나 이러한 컴퓨터 비전 솔루션을 만드는 데는 자체적인 과제가 따릅니다. 의료 스캔은 병원마다 크게 다를 수 있으며, 다른 장비, 설정, 심지어 기술자의 경험과 같은 요인의 영향을 받습니다. 밝기, 대비 및 노출의 변화는 Vision AI 모델의 일관성과 정확성에 영향을 미쳐 다양한 환경에서 안정적으로 수행하기 어렵게 만들 수 있습니다.
이러한 상황에서 Albumentations와 같은 도구의 통합이 필수적입니다. Albumentations는 동일한 스캔의 여러 증강 버전을 생성하여 모델이 다양한 이미지 품질에서 학습할 수 있도록 합니다. 이는 모델이 더욱 강력해지도록 도와 고품질 및 저품질 이미지 모두에서 질병을 정확하게 감지할 수 있도록 합니다.
Vision AI의 또 다른 흥미로운 응용 분야는 보안 및 감시입니다. 실시간 객체 감지는 보안 팀이 잠재적인 위협을 신속하게 식별하는 데 도움이 될 수 있습니다.
이 애플리케이션과 관련된 주요 관심사는 보안 카메라가 하루 종일 다양한 조명 조건에서 영상을 캡처하고 이러한 조건이 모델이 이미지를 이해하는 방식에 큰 영향을 미칠 수 있다는 것입니다. 저조도 환경, 눈부심 또는 열악한 가시성과 같은 요소로 인해 컴퓨터 비전 모델이 일관되게 객체를 감지하거나 잠재적인 위협을 인식하기 어려울 수 있습니다.
Albumentations 통합은 다양한 조명 조건을 모방하여 변환을 적용함으로써 도움이 됩니다. 이를 통해 모델은 밝은 환경과 어두운 환경 모두에서 객체를 탐지하는 방법을 학습하여 더욱 안정적이고 까다로운 조건에서 응답 시간을 개선할 수 있습니다.
슈퍼마켓 통로의 액체 유출, 매장 안을 뛰어다니는 개, 또는 어린이가 제품 진열대를 넘어뜨리는 것과 같은 일상적인 사건은 소매 환경의 Vision AI에서 엣지 케이스가 될 수 있는 몇 가지 예에 불과합니다. 컴퓨터 비전은 쇼핑객 행동 추적, 보행량 모니터링, 선반 위의 제품 식별 등을 통해 고객 경험을 개선하는 데 점점 더 많이 사용되고 있습니다. 그러나 이러한 실제 상황은 AI 시스템이 이해하고 정확하게 처리하기 어려울 수 있습니다.
모든 시나리오를 컴퓨터 비전 데이터 세트로 나타낼 수는 없지만, Albumentations 통합은 예기치 않은 조명, 비정상적인 각도 또는 장애물과 같은 가능한 많은 상황을 포괄하도록 데이터를 증강하여 도움이 됩니다. 이는 컴퓨터 비전 모델이 다양한 조건에 적응하고 에지 케이스를 처리하며 역동적인 소매 환경에서 정확한 예측을 수행하는 능력을 향상시키는 데 도움이 됩니다.
모델 훈련을 위해 다양한 실제 데이터를 수집하는 것은 복잡할 수 있지만, Albumentations는 모델이 다양한 조건에 적응하도록 돕는 이미지 변형을 생성하여 이를 더 쉽게 만듭니다.
Ultralytics에서 지원하는 Albumentations 통합은 YOLO11을 사용자 정의 학습하는 동안 이러한 증강을 적용하는 프로세스를 간소화합니다. 이를 통해 데이터 세트 품질이 향상되어 보다 정확하고 신뢰할 수 있는 Vision AI 모델을 생성함으로써 광범위한 산업 분야에 도움이 됩니다.
커뮤니티에 참여하고 GitHub 저장소를 탐색하여 AI에 대해 자세히 알아보고 라이선스 옵션을 확인하여 Vision AI 프로젝트를 시작하세요. 제조 분야의 AI 또는 자율 주행 분야의 컴퓨터 비전과 같은 혁신에 관심이 있으신가요? 솔루션 페이지를 방문하여 자세히 알아보세요.