Ensemble
앙상블 학습(ensemble learning)이 어떻게 정확도를 개선하고 과적합을 줄이는지 알아보십시오. 뛰어난 컴퓨터 비전 결과를 위해 Ultralytics YOLO26과 같은 다중 모델을 결합하는 방법을 학습하십시오.
Ensemble learning is a robust strategy in machine learning (ML) where multiple independent models, often referred to as "weak learners," are combined to produce a single predictive output. The fundamental premise is that a group of models can often achieve higher accuracy and better generalization than any single model acting alone. By aggregating the predictions from diverse algorithms, ensemble methods effectively reduce the risk of overfitting to the training data, smooth out random errors, and improve overall system stability. This approach is analogous to consulting a panel of experts rather than relying on the opinion of a single individual to make a critical decision.
Link to this section앙상블 학습의 메커니즘#
앙상블 방법의 효과는 편향-분산 트레이드오프(bias-variance tradeoff)를 조절하는 능력에 있습니다. 개별 모델은 높은 분산(노이즈에 대한 민감도)이나 높은 편향(과도한 단순화) 문제를 겪을 수 있습니다. 앙상블은 구체적인 기법을 통해 이러한 문제를 완화합니다:
- 배깅(Bagging, Bootstrap Aggregating): 이 기법은 동일한 알고리즘의 여러 인스턴스를 데이터셋의 서로 다른 하위 집합에서 훈련시키는 것을 포함합니다. 가장 유명한 예는 랜덤 포레스트(Random Forest) 알고리즘으로, 이는 많은 의사결정 나무(decision trees)의 결정을 집계하여 분산을 줄입니다.
- 부스팅(Boosting): 배깅과 달리 부스팅은 모델을 순차적으로 훈련시킵니다. 각 새로운 모델은 이전 모델이 범한 오류를 수정하는 데 집중합니다. LightGBM 및 CatBoost와 같은 인기 있는 프레임워크는 이를 활용하여 매우 정확한 예측 시스템을 구축합니다.
- 스태킹(Stacking, Stacked Generalization): 이는 새로운 "메타 모델"을 훈련시켜 여러 이질적인 기본 모델(예: 신경망(neural network)과 서포트 벡터 머신(SVM))의 예측을 결합하는 방식입니다.
Link to this section컴퓨터 비전에서의 앙상블#
컴퓨터 비전(CV) 분야에서 앙상블은 경진대회 및 중요 안전 응용 분야에서 성능을 극대화하기 위해 자주 사용됩니다. 객체 탐지(object detection)의 경우, 이는 종종 동일한 이미지에 대해 YOLO26의 여러 버전과 같은 다중 모델을 실행하는 과정을 포함합니다. 그 결과로 얻은 바운딩 박스(bounding box)는 NMS(Non-Maximum Suppression)나 WBF(Weighted Box Fusion)와 같은 기법을 사용하여 병합되어 가장 가능성이 높은 객체 위치를 도출합니다.
Link to this section실제 애플리케이션 사례#
앙상블 방법은 예측 신뢰성이 무엇보다 중요한 산업 분야에서 널리 사용됩니다.
-
의료 진단 및 영상(Medical Diagnosis and Imaging): 헬스케어 분야에서는 위음성(false negatives)을 피하는 것이 매우 중요합니다. 앙상블은 X-레이로 훈련된 합성곱 신경망(CNN)과 이상 징후를 탐지하는 비전 트랜스포머(ViT)를 결합할 수 있습니다. 모델 간의 합의는 더 높은 신뢰 점수를 제공하여 영상 의학 전문의가 종양 탐지(detecting tumors)를 하거나 희귀 질환을 진단하는 데 도움을 줍니다.
-
금융 사기 탐지(Financial Fraud Detection): 금융 기관은 트랜잭션 패턴을 분석하기 위해 앙상블을 사용합니다. 로지스틱 회귀(logistic regression) 모델과 그래디언트 부스팅(gradient boosting) 머신을 결합함으로써, 시스템은 오탐지율을 낮게 유지하면서 단일 모델이 놓칠 수 있는 미묘한 사기 징후를 감지할 수 있습니다.
Link to this sectionPython으로 모델 앙상블 구현하기#
여러 훈련된 모델을 로드하고 동일한 입력에 대해 예측을 생성하여 기본적인 추론 앙상블을 시뮬레이션할 수 있습니다. Ultralytics Platform을 사용하면 이러한 변형 모델을 쉽게 훈련할 수 있습니다. 다음 예제는 두 가지 다른 Ultralytics YOLO 모델(YOLO26n 및 YOLO26s)을 로드하여 이미지의 탐지 결과를 확인하는 방법을 보여줍니다.
from ultralytics import YOLO
# Load two distinct YOLO26 model variants
# 'n' (nano) is faster, 's' (small) is more accurate
model_nano = YOLO("yolo26n.pt")
model_small = YOLO("yolo26s.pt")
# Define the image source
source = "https://ultralytics.com/images/bus.jpg"
# Run inference with both models
results_n = model_nano(source)
results_s = model_small(source)
# Compare the number of objects detected by each model
print(f"Nano Model Found: {len(results_n[0].boxes)} objects")
print(f"Small Model Found: {len(results_s[0].boxes)} objects")Link to this section앙상블 vs. 데이터 증강#
앙상블(Ensemble) 학습과 데이터 증강(Data Augmentation)을 구분하는 것이 중요합니다.
- 앙상블은 아키텍처 및 예측 단계에 중점을 두며, 훈련된 여러 개의 서로 다른 모델을 결합하여 결과를 개선합니다.
- 데이터 증강은 훈련 데이터 단계에 중점을 두며, 데이터셋의 다양성을 인위적으로 증가시켜(예: 회전이나 뒤집기를 통해) 더 견고한 단일 모델을 훈련시킵니다.
데이터 증강은 단일 모델이 더 잘 학습하도록 돕지만, 앙상블 학습은 여러 모델이 서로의 출력을 검증하도록 돕습니다. 두 전략은 인스턴스 세그멘테이션(instance segmentation) 및 포즈 추정(pose estimation)과 같은 작업에서 최첨단 결과를 달성하기 위해 함께 자주 사용됩니다.






