用語集

アンサンブル

アンサンブル手法で予測精度を高める複数のモデルを組み合わせることで、物体検出やNLPなどのパフォーマンスがどのように向上するかを学びましょう。

アンサンブル法は機械学習(ML)における強力な手法であり、複数の個別モデルを組み合わせて単一の優れた予測モデルを生成する。核となる考え方は、複数のモデルの「知恵」を集約することで、最終的な予測は単一の構成モデルからの予測よりも正確で安定し、ロバストになるというものである。このアプローチは、多様な専門家グループに助言を求めることに似ている。これらのテクニックは、オーバーフィッティングを減らし、未知のデータに対するモデルの汎化を改善するのに非常に効果的です。

アンサンブルの仕組み

アンサンブル学習には、2つの主要なステップが含まれる:多様なベースモデルのグループを訓練し、次にそれらの予測を組み合わせる。ベースモデル間の多様性は非常に重要であり、すべてのモデルが同じエラーを出すと、アンサンブルは何の改善ももたらさない。この多様性は、異なるアルゴリズムの使用、訓練データの異なるサブセットでの訓練、または異なるハイパーパラメータの使用によって達成することができる。

モデルが学習されると、その予測値が集約される。分類タスクの場合、これは多くの場合、投票メカニズム(例えば、最も投票数の多いクラスが勝つ)によって行われる。回帰タスクの場合、予測値は通常平均化されます。結果として得られる結合されたモデルは、多くの場合、より優れた性能を示し、これはコンドルセ陪審定理で探求されている概念です。

一般的なアンサンブル・テクニック

効果的なアンサンブルを作るには、いくつかの一般的な方法がある:

  • バギング(ブートストラップ集計):この手法は、訓練データの異なるランダム・サブセットで複数のモデル(決定木など)を訓練することを含む。ランダムフォレストアルゴリズムは、バギングの実装としてよく知られている。
  • ブースティング:モデルは順次学習され、新しいモデルは前のモデルが犯したエラーを修正することに集中する。ブースティング・アルゴリズムには、AdaBoost、Gradient BoostingXGBoostLightGBMなどがある。
  • スタッキング(積み重ね汎化):この方法では、複数の異なるモデル(ベースラーナー)を学習し、別の機械学習モデル(メタラーナー)を使用して、それらの予測を最適に組み合わせる方法を学習する。
  • 投票と平均化:これらは最も単純な方法で、最終的な予測は多数決(ハード投票)またはすべてのモデルからの予測確率の平均(ソフト投票)となります。Ultralytics YOLOモデルは、モデル・アンサンブル機能により平均化をサポートしています。

実世界での応用

アンサンブル法は、高精度が最優先される重要なアプリケーションで広く使用されている:

  1. 医療画像解析: 腫瘍検出のようなタスクでは、畳み込みニューラルネットワーク(CNN)のアンサンブルを使用することができる。各CNNは、医療スキャン画像の異なるサブセットや異なるアーキテクチャーでトレーニングされる。それらの出力を組み合わせることで、システムはより信頼性の高い正確な診断を実現し、医療画像のようなアプリケーションにおける偽陰性や偽陽性のリスクを減らすことができる。
  2. 自律システム: 自律走行車にとって、信頼性の高い物体検出は安全性の問題である。アンサンブルは、YOLOv8と YOLO11のような異なるモデルや、異なるデータ増強戦略で訓練されたモデルを組み合わせることができる。このアプローチは、単一のモデルが歩行者や障害物の検出に失敗するリスクを軽減し、よりロバストな知覚システムにつながります。

アンサンブルと関連概念

アンサンブル法を他の関連概念と区別することは有益である:

  • モデル・アンサンブル:この用語は、しばしば "Ensemble "と同じ意味で使われる。アンサンブル」が一般的な手法を指すのに対し、「モデル・アンサンブル」は通常、特定の学習済みモデル・インスタンスを組み合わせる実用的な実装を指す。基本的な原理は同じである。
  • 専門家の混合(MoE):どちらも複数のモデルを使用するが、そのメカニズムは異なる。アンサンブルは、すべての入力に対してすべてのモデルからの予測を組み合わせる。対照的に、エキスパート混合(MoE)モデルは、ゲーティングネットワークを使用して、特定の入力に対して最も適切な「エキスパート」モデルを動的に選択し、各予測に対してモデルのサブセットのみを使用します。

アンサンブルはモデルのトレーニングとデプロイに複雑さと計算オーバーヘッドを追加しますが、パフォーマンスの向上はしばしばコストを正当化します。Ultralytics HUBのようなプラットフォームは、PyTorchや TensorFlowのようなフレームワークで構築された複数のモデルの管理を合理化し、強力なアンサンブルの作成を簡素化することができます。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク