YOLO Vision Shenzhen
深セン
今すぐ参加
用語集

おすすめスープ

Model Soupsが、YOLO 重みを平均化することで、精度と堅牢性をどのように向上させるかをご紹介します。レイテンシを増やすことなくパフォーマンスを向上させる方法を学びましょう。

「モデルスープ」とは、同じ事前学習済みベースモデルから異なるハイパーパラメータを用いて微調整された複数のニューラルネットワークの重みを平均化し、より堅牢な単一のモデルを構築する機械学習の手法を指します。このアプローチにより、開発者は推論時の計算コストを増やすことなく、全体的な精度と汎化性能を向上させることができます。

モデルの微調整を行う際、実務者は通常、 ハイパーパラメータの広範囲なチューニングスイープを実行し、 最もパフォーマンスの高い設定を見つけ出します。 従来は、最も優れた単一のモデルが選択され、残りは破棄されてきました。しかし、 「モデルスープ」を作成することで、チューニングスイープ中のすべてのモデルが学習した多様な特徴を活用できます。それらのモデル重みを直接 平均化することで、結果として得られるネットワークは 多くの場合、単一の最良モデルよりも優れた性能を発揮し、各モデルの強みを効果的に組み合わせつつ、 過学習を最小限に抑えます。このプロセスは非常に効率的であり、 Ultralytics コラボレーション環境内で容易に管理することができます。

実際のアプリケーション

モデルスープは、計算リソースが限られているものの、高い精度と 頑健性が求められる状況において、非常に有効である。

  • 自動運転車のビジョン技術:自動運転車に 物体検出システムを導入する際、モデルは 多様な照明や気象条件に対応できる汎化能力が求められます。エンジニアは、様々なデータ拡張手法や学習率を用いて 訓練された複数のモデルを平均化することで、推論の遅延を低く抑えつつ 高い堅牢性を備えた「モデルスープ」を作成します。これにより、 自動走行に不可欠なリアルタイム 処理速度が損なわれることなく維持されます。
  • モバイル医療診断:スマートフォン上で画像分類を実行し、皮膚科の初期スクリーニングを行うといったエッジAIアプリケーションでは、 演算能力が著しく制限されています。モデルスープは、臨床的な信頼性に必要な精度の向上を実現すると同時に、 バッテリーを消耗させたりクラウド接続を必要としたりすることなく、 モバイルエッジデバイスに容易に収まる最終的なフットプリントを確保します。

関連概念の区別

ディープラーニングの最適化という分野を理解するためには、 「モデルスープ」と類似した手法とを区別することが重要です:

  • モデルアンサンブルアンサンブル は、複数の独立したモデルの予測(出力)を組み合わせる手法です。これにより精度は向上しますが、 推論時にすべてのモデルを実行する必要があるため、計算コストが倍増します。一方、モデルスープは、 推論前に重みを平均化するため、計算コストは単一のモデルと同等になります。
  • モデルの統合これは、全く異なるタスクやデータセットで学習されたモデルを組み合わせることを指す、より広義の 用語です。モデルスープは、統合の一 特定の形態であり、すべてのモデルがまったく同じ 事前学習済みの基本アーキテクチャに由来し、 同じターゲットタスクに対して微調整が行われます。

実施例

統一されたモデルスープを作成するには、 複数の学習済みモデルの PyTorch 辞書にアクセスし、それらのテンソルを数学的に平均化する必要があります。以下に、PyTorch ネイティブにサポートUltralytics ワークフローを使用して、 これを実現する簡潔な例を示します。

import torch

# Load the PyTorch state dictionaries from two fine-tuned YOLO26 models
model1 = torch.load("yolo26_run1.pt")["model"].state_dict()
model2 = torch.load("yolo26_run2.pt")["model"].state_dict()

# Create a uniform model soup by averaging the model weights
soup_dict = {key: (model1[key] + model2[key]) / 2.0 for key in model1.keys()}

# The resulting soup_dict can now be loaded into a new YOLO26 instance

この手法を活用することで、コンピュータビジョンの実務者は、現代のエッジファースト型AIアーキテクチャに求められる展開速度を損なうことなく、 ゼロショット学習能力や全般的な 堅牢性といった性能指標を容易に向上させることができます。

共にAIの未来を築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。