用語集

アンサンブル

アンサンブル手法で予測精度を高める複数のモデルを組み合わせることで、物体検出やNLPなどのパフォーマンスがどのように向上するかを学びましょう。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

アンサンブル法は、機械学習(ML)や人工知能(AI)における強力な手法であり、ベース学習者や弱学習者と呼ばれる複数の個別モデルを戦略的に組み合わせて、単一の強力な予測モデルを生成する。中核となる考え方は、複数の多様なモデルの「意見」を集約することで、最終的なアンサンブルモデルは、単一の構成モデルと比較して、より優れたパフォーマンス、より高い頑健性、および改善された汎化を達成できるというものである。このアプローチは「群衆の知恵」の原理を活用し、個々のモデルのエラーやバイアスを軽減して、より信頼性の高い結果を導き出す。

アンサンブルの仕組み

アンサンブル法は、まず複数のベースモデルを学習させる。これらのモデルは、決定木サポートベクターマシン(SVM)ニューラルネットワーク(NN)を組み合わせるなど、同じタイプ(同種アンサンブル)でも異なるタイプ(異種アンサンブル)でもよい。キーとなるのは、多くの場合、訓練データの異なるサブセットで訓練したり、異なるアルゴリズムやハイパーパラメータを使用するなどの技術によって達成される、ベースモデル間の多様性を奨励することである。一旦訓練されると、これらの個々のモデルからの予測は、特定の戦略を使用して結合される。一般的な戦略には、予測値の平均化(回帰タスクの場合)や多数決の使用(分類タスクの場合)などがあります。より洗練された手法では、加重平均や、ベース・モデルの出力を組み合わせる最適な方法を決定するための別のモデル(メタ・ラーナー)の学習が含まれるかもしれない。

アンサンブルの利点

アンサンブル法を採用することには、いくつかの大きな利点がある:

  • 予測性能の向上:アンサンブルは通常、全体的な誤差を減らすことで、単一モデルと比較してより高い精度と F1スコアのような指標でより良いパフォーマンスをもたらします。
  • 頑健性の向上:複数のモデルの予測値を平均化することで、アンサンブルは訓練データの特異性やノイズ、個々の学習者特有の弱点の影響を受けにくくなる。これはオーバーフィッティングのリスクを低減するのに役立ちます。
  • より良い汎化:アンサンブルは、より幅広いパターンを捉え、トレーニングセットの特定の側面に偏りにくいため、未知のテストデータに対してより良く汎化する傾向がある。これはバイアスと分散のトレードオフを管理することに関係する。

一般的なアンサンブル・テクニック

効果的なアンサンブルを作るために、いくつかの確立されたテクニックが使われている:

  • バギング(Bagging:Bootstrap Aggregating):学習データの異なるランダムな部分集合(置換ありでサンプリング)に対して、同じベース学習器の複数のインスタンスを学習させる。予測は通常、投票または平均化によって集約される。ランダムフォレストは、決定木を使用したバギング手法の一般的な例です。
  • ブースティング:アンサンブルを順次構築する。それぞれの新しいモデルは、前のモデルによるエラーを修正することに焦点を当てる。AdaBoostや 勾配ブースティング・マシン(GBM)などがその例。
  • スタッキング(積み重ね汎化):複数の異なるベースモデルからの予測を組み合わせる。 Ultralytics YOLOモデル、RT-DETR RT-DETRモデル、SVM)から予測された結果を、メタモデル(例えば、ロジスティック回帰)を学習することによって組み合わせます。スタッキング汎化の詳細

関連用語との区別

アンサンブルを他のMLの概念と区別することは重要だ:

  • 単一の複雑なモデル:単一の大きなモデル(ディープCNNや Vision Transformer(ViT)のような)は非常に強力である可能性があるが、アンサンブルは、ロバスト性と潜在的に高い精度を達成するために、複数の、しばしばより単純なモデルを組み合わせる。
  • 転移学習独立して訓練された複数のモデルの出力を組み合わせるのではなく、事前に訓練されたモデル(またはその一部)を新しいタスクの出発点として再利用すること。
  • マルチモーダル学習異なるタイプのデータ(画像やテキストなど)からの情報を処理し、統合することができるモデルのトレーニングに重点を置く。

実世界での応用

アンサンブル手法は、そのパフォーマンス上の利点から、様々な領域で広く使用されている:

  1. 自律システムのためのコンピュータビジョン: 自律走行車や先進運転支援システム(ADAS)では、物体検出モデルのアンサンブル(おそらく、YOLOv10YOLO11やYOLO11のような異なるアーキテクチャを組み合わせたり、異なるデータ補強戦略で学習させたモデル)を用いることで、単一のモデルの故障モードを軽減し、歩行者、車両、障害物のより信頼性の高い検出を実現することができます。入力画像の補強されたバージョン上の予測を平均化するTTA(Test-Time Augmentation)のような技術は、推論時のアンサンブルの一形態と見なすことができる。
  2. 金融詐欺の検出:金融機関では、不正取引の検出に多様なモデル(ロジスティック回帰、勾配ブースティング、ニューラルネットワーク)のアンサンブルを使用することがよくあります。不正行為のさまざまなパターンやタイプを捉えるモデルを組み合わせることで、より堅牢で正確な検知システムが実現し、金融損失を最小限に抑えるために極めて重要です。金融におけるAIについてさらに詳しく
  3. 医療画像解析: CNNのアンサンブルは、腫瘍検出や疾患分類のようなタスクのための医用画像解析に使用される(例えば、腫瘍検出にYOLO11 使用)。異なるデータサブセットや異なるアーキテクチャで学習したモデルを組み合わせることで、診断精度と信頼性を向上させることができる。
  4. コンペティション・プラットフォーム:アンサンブルは、機械学習のコンペティションで効果的であることはよく知られており、参加者は競争力を得るために複数の高性能モデルを組み合わせることが多い。

メリットと留意点

アンサンブルは強力な反面、モデルのトレーニングや モデル展開に必要な複雑さや計算量が増える。複数のモデルを管理するには、より多くのリソースと慎重なエンジニアリングが必要です。しかし、パフォーマンスが大幅に向上するため、重要なアプリケーションではこれらのコストが正当化されることがよくあります。Ultralytics HUBのようなプラットフォームは、複数のモデルの管理とトレーニングを簡素化し、以下のようなフレームワークを使用して構築された効果的なアンサンブルの作成と展開を容易にする可能性があります。 PyTorchまたは TensorFlow.モデル評価中のパフォーマンス向上と複雑性の増加のトレードオフを評価することは、実用的なアプリケーションにとって不可欠である。

すべて読む