용어집

앙상블

앙상블 메서드로 예측 정확도를 높이세요! 여러 모델을 결합하여 객체 감지, NLP 등의 성능을 향상시키는 방법을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

앙상블 방법은 머신러닝(ML)인공 지능(AI) 에서 기본 학습자 또는 약한 학습자라고 하는 여러 개별 모델을 전략적으로 결합하여 더 강력한 단일 예측 모델을 생성하는 강력한 기법입니다. 핵심 아이디어는 여러 가지 다양한 모델의 '의견'을 취합함으로써 최종 앙상블 모델이 단일 구성 모델에 비해 더 나은 성능, 더 큰 견고성, 향상된 일반화를 달성할 수 있다는 것입니다. 이 접근 방식은 '군중의 지혜'라는 원칙을 활용하여 개별 모델의 오류와 편견을 완화함으로써 컴퓨터 비전(CV)과 같은 복잡한 작업에서 중요한 보다 신뢰할 수 있는 결과에 도달할 수 있습니다.

앙상블 작동 방식

앙상블 방법은 먼저 여러 개의 기본 모델을 학습시키는 방식으로 작동합니다. 이러한 모델은 의사 결정 트리, 서포트 벡터 머신(SVM), 신경망(NN)을 결합하는 것과 같이 동일한 유형(동종 앙상블)이거나 다른 유형(이기종 앙상블)일 수 있습니다. 핵심은 종종 학습 데이터의 다른 하위 집합에 대한 학습이나 다른 알고리즘 또는 하이퍼파라미터 사용과 같은 기술을 통해 기본 모델 간의 다양성을 장려하는 것입니다. 학습이 완료되면 이러한 개별 모델의 예측은 특정 전략을 사용하여 결합됩니다. 일반적인 전략에는 예측 평균화(회귀 작업의 경우) 또는 다수결 투표 사용(분류 작업의 경우)이 포함됩니다. 보다 정교한 방법으로는 가중 평균을 적용하거나 다른 모델(메타 학습자)을 학습하여 기본 모델 결과를 결합하는 최적의 방법을 결정하는 방법이 있을 수 있습니다.

앙상블 사용의 이점

앙상블 방식을 사용하면 몇 가지 중요한 이점이 있습니다:

  • 예측 성능 향상: 앙상블은 일반적으로 전체 오류를 줄임으로써 단일 모델에 비해 F1 점수와 같은 메트릭에서 더 높은 정확도와 더 나은 성능을 제공합니다.
  • 견고성 향상: 여러 모델의 예측을 평균화함으로써 앙상블은 학습 데이터의 특성이나 노이즈, 개별 학습자의 특정 약점에 덜 민감해집니다. 따라서 과적합의 위험을 줄이는 데 도움이 됩니다.
  • 더 나은 일반화: 앙상블은 더 넓은 범위의 패턴을 포착하고 훈련 세트의 특정 측면에 편향될 가능성이 적기 때문에 보이지 않는 테스트 데이터에 더 잘 일반화되는 경향이 있습니다. 이는 편향성-편차 트레이드오프 관리와 관련이 있습니다.

일반적인 앙상블 기법

효과적인 앙상블을 만들기 위해 몇 가지 확립된 기법이 사용됩니다:

  • 배깅(부트스트랩 어그리게이팅): 훈련 데이터의 서로 다른 무작위 하위 집합(교체로 샘플링)에 대해 동일한 기본 학습자의 여러 인스턴스를 훈련하는 것을 포함합니다. 예측은 일반적으로 투표 또는 평균을 통해 집계됩니다. 랜덤 포레스트는 의사 결정 트리를 사용하는 배깅 기법의 대표적인 예입니다.
  • 부스팅: 앙상블을 순차적으로 빌드합니다. 각각의 새로운 모델은 이전 모델의 오류를 수정하는 데 중점을 둡니다. 예를 들어 AdaBoost와 그라디언트 부스팅 머신(GBM)이 있습니다.
  • 스태킹(스택 일반화): 여러 다른 기본 모델의 예측을 결합합니다. Ultralytics YOLO 모델, RT-DETR 모델, SVM 등) 메타 모델(예: 로지스틱 회귀)을 학습하여 출력을 가장 잘 결합하는 방법을 학습합니다. 스태킹 일반화에 대해 자세히 알아보세요.

관련 용어와의 차이점

앙상블을 다른 ML 개념과 구별하는 것이 중요합니다:

  • 단일 복합 모델: 단일 대형 모델(예: 딥 CNN 또는 비전 트랜스포머(ViT))은 매우 강력할 수 있지만, 앙상블은 여러 개의 단순한 모델을 결합하여 견고함과 잠재적으로 더 높은 정확도를 달성할 수 있습니다.
  • 전이 학습: 독립적으로 학습된 여러 모델의 결과를 결합하는 대신 미리 학습된 모델(또는 그 일부)을 새로운 작업의 시작점으로 재사용하는 것입니다.
  • 다중 모드 학습: 다양한 유형의 데이터(예: 이미지 및 텍스트)의 정보를 처리하고 통합할 수 있는 모델 학습에 중점을 두는 반면, 앙상블은 일반적으로 동일한 유형의 데이터 및 작업에서 작동하는 모델을 결합합니다.

실제 애플리케이션

앙상블 방식은 성능상의 이점으로 인해 다양한 영역에서 널리 사용되고 있습니다:

  1. 자율 시스템을 위한 컴퓨터 비전: 자율주행 차량과 첨단 운전자 지원 시스템(ADAS)에서는 물체 감지 모델의 앙상블(아마도 YOLOv10과 같은 서로 다른 아키텍처를 결합한 YOLO11와 같은 서로 다른 아키텍처 또는 서로 다른 데이터 증강 전략으로 훈련된 모델을 결합하여) 단일 모델의 실패 모드를 완화함으로써 보행자, 차량, 장애물을 더욱 안정적으로 감지할 수 있습니다. 입력 이미지의 증강 버전에 대한 예측의 평균을 구하는 TTA(테스트 시간 증강)와 같은 기술은 추론 시 앙상블의 한 형태로 볼 수 있습니다.
  2. 금융 사기 탐지: 금융 기관에서는 사기 거래를 탐지하기 위해 다양한 모델(로지스틱 회귀, 그라데이션 부스팅, 신경망)을 조합하여 사용하는 경우가 많습니다. 다양한 패턴과 사기 행위 유형을 포착하는 모델을 결합하면 더욱 강력하고 정확한 탐지 시스템을 구축할 수 있으며, 이는 재정적 손실을 최소화하는 데 매우 중요합니다. 금융 분야의 AI에 대해 자세히 알아보세요.
  3. 의료 이미지 분석: 종양 탐지 또는 질병 분류와 같은 작업(예: 종양 탐지에YOLO11 사용)을 위해 의료 이미지 분석에서 CNN의 앙상블이 사용됩니다. 서로 다른 데이터 하위 집합 또는 서로 다른 아키텍처로 훈련된 모델을 결합하면 진단 정확도와 신뢰도를 향상시킬 수 있습니다.
  4. 대회 플랫폼: 앙상블은 참가자들이 경쟁 우위를 점하기 위해 여러 고성능 모델을 결합하는 머신 러닝 대회에서 효과적인 것으로 유명합니다.

이점 및 고려 사항

강력하지만 앙상블은 모델 학습모델 배포에 대한 복잡성과 계산 요구 사항을 증가시킵니다. 여러 모델을 관리하려면 더 많은 리소스와 세심한 엔지니어링이 필요합니다. 그러나 중요한 애플리케이션에서는 성능의 상당한 향상으로 이러한 비용을 정당화할 수 있는 경우가 많습니다. Ultralytics HUB와 같은 플랫폼은 여러 모델의 관리와 훈련을 간소화하여 다음과 같은 프레임워크를 사용하여 구축된 효과적인 앙상블의 생성 및 배포를 촉진할 수 있습니다. PyTorch 또는 TensorFlow. 모델 평가 시 성능 향상과 복잡성 증가 사이의 절충점을 평가하는 것은 실제 적용에 필수적입니다.

모두 보기