Model Soups

Ultralytics YOLO 모델의 가중치를 평균화하여 정확도와 견고성을 향상시키는 Model Soups에 대해 알아보십시오. 지연 시간 증가 없이 성능을 향상시키는 방법을 배울 수 있습니다.

Model Soups는 서로 다른 하이퍼파라미터를 사용하여 동일한 사전 학습된 베이스 모델로부터 미세 조정된 여러 신경망의 가중치를 함께 평균화하여 단일하고 더 강력한 모델을 만드는 머신 러닝 기법을 의미합니다. 이 접근 방식을 사용하면 추론 중 계산 비용을 증가시키지 않으면서 전체적인 정확도와 일반화 성능을 향상시킬 수 있습니다.

모델을 미세 조정할 때 실무자들은 일반적으로 최고의 성능을 내는 구성을 찾기 위해 광범위한 hyperparameter tuning 스윕을 실행합니다. 전통적으로는 단 하나의 최적 모델만 선택하고 나머지는 폐기합니다. 그러나 Model Soup를 생성하면 스윕 내의 모든 모델이 학습한 다양한 특징을 활용할 수 있습니다. model weights를 직접 평균화함으로써 결과물인 네트워크는 종종 단일 최적 모델보다 더 나은 성능을 보이며, overfitting을 최소화하면서 각 모델의 강점을 효과적으로 결합합니다. 이 과정은 매우 효율적이며 Ultralytics Platform과 같은 협업 환경 내에서 쉽게 관리할 수 있습니다.

Link to this section실제 응용 분야#

Model Soups는 계산 자원이 제한되어 있으면서도 높은 정확도와 견고성이 요구되는 시나리오에서 매우 효과적입니다.

자율 주행 자동차 비전: 자율 주행 자동차에 object detection 시스템을 배포할 때 모델은 다양한 조명 및 날씨 조건에서 일반화되어야 합니다. 다양한 데이터 증강 및 학습률로 훈련된 여러 모델을 평균화함으로써 엔지니어는 낮은 inference latency를 유지하는 매우 견고한 soup를 생성합니다. 이를 통해 autonomous navigation에 중요한 실시간 처리 속도가 영향을 받지 않도록 보장합니다.
모바일 의료 진단: 초기 피부과 검진을 위해 스마트폰에서 image classification을 실행하는 것과 같은 엣지 AI 애플리케이션에서는 계산 능력이 심각하게 제한됩니다. Model soup는 임상적 신뢰성에 필요한 향상된 정확도를 제공하는 동시에, 최종 모델의 크기가 배터리 소모나 클라우드 연결 없이도 mobile edge devices에 쉽게 탑재될 수 있도록 합니다.

Link to this section관련 개념 구별하기#

deep learning optimization의 영역을 탐색할 때, Model Soups를 유사한 기법들과 구별하는 것이 중요합니다.

Model Ensemble: 앙상블은 여러 독립 모델의 예측(출력값)을 결합합니다. 이는 정확도를 향상시키지만 추론 시 모든 모델을 실행해야 하므로 계산 비용이 배가됩니다. Model Soups는 추론 전에 가중치를 평균화하므로 단일 모델과 동일한 계산 비용을 유지합니다.
Model Merging: 이는 완전히 다른 작업이나 데이터셋에서 훈련되었을 수 있는 모델을 결합하는 보다 광범위한 용어입니다. Model Soups는 모든 모델이 정확히 동일한 pre-trained base architecture에서 시작하여 동일한 대상 작업에 대해 미세 조정되는 머징의 특정 하위 집합입니다.

Link to this section구현 예시#

Creating a uniform model soup involves accessing the PyTorch state dictionary of multiple trained models and mathematically averaging their tensors. Below is a concise example of how this can be achieved using an Ultralytics YOLO26 workflow natively backed by the PyTorch framework.

import torch

# Load the PyTorch state dictionaries from two fine-tuned YOLO26 models
model1 = torch.load("yolo26_run1.pt")["model"].state_dict()
model2 = torch.load("yolo26_run2.pt")["model"].state_dict()

# Create a uniform model soup by averaging the model weights
soup_dict = {key: (model1[key] + model2[key]) / 2.0 for key in model1.keys()}

# The resulting soup_dict can now be loaded into a new YOLO26 instance

By leveraging this technique, computer vision practitioners can easily boost performance metrics like zero-shot learning capabilities and general robustness without sacrificing the deployment speed required for modern, edge-first AI architectures.

Explore solutions

농업 분야의 AI

Ultralytics YOLO 모델로 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적, 정밀 농업을 강화하여 더 높고 스마트한 생산성을 달성하십시오.

Model Soups

Link to this section실제 응용 분야#

Link to this section관련 개념 구별하기#

Link to this section구현 예시#

Explore solutions

농업 분야의 AI

자동차 분야의 AI

의료 분야의 AI

소매업을 위한 AI

로봇 공학의 AI

제조업에서의 AI

물류 분야의 AI

농업 분야의 AI

자동차 분야의 AI

의료 분야의 AI

소매업을 위한 AI

로봇 공학의 AI

제조업에서의 AI

물류 분야의 AI

농업 분야의 AI

자동차 분야의 AI

의료 분야의 AI

소매업을 위한 AI

로봇 공학의 AI

제조업에서의 AI

물류 분야의 AI

미래의 AI를 함께 구축합시다!