YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
Ultralytics用語集に戻る

Mixture of Experts (MoE)

Mixture of Experts (MoE) アーキテクチャを探ります。ゲーティングネットワークとスパースレイヤーが、高性能な AI やコンピュータビジョンのためにどのようにニューラルネットワークをスケールさせるかを学びましょう。

Mixture of Experts (MoE) is a specialized architectural design in deep learning that allows models to scale to massive sizes without a proportional increase in computational cost. Unlike a standard dense neural network (NN), where every parameter is active for every input, an MoE model employs a technique called conditional computation. This approach dynamically activates only a small subset of the network's components—referred to as "experts"—based on the specific characteristics of the input data. By doing so, MoE architectures enable the creation of powerful foundation models that can possess trillions of parameters while maintaining the inference latency and operational speed of much smaller systems.

Link to this sectionMoEの主要なメカニズム#

Mixture of Expertsモデルの効率性は、標準的な密結合層を疎結合なMoE層に置き換えることから生まれます。この層は通常、情報を効率的に処理するために連携する2つの主要な要素で構成されています。

  • エキスパート: これらは、多くの場合単純なフィードフォワードニューラルネットワーク(FFN)である独立したサブネットワークです。各エキスパートはデータのさまざまな側面を処理することに特化しています。自然言語処理 (NLP)の文脈では、あるエキスパートは文法の処理に習熟し、別のエキスパートは事実の検索やコードの構文に集中するかもしれません。
  • ゲーティングネットワーク (ルーター): ルーターはデータの交通整理の役割を果たします。画像パッチやテキストトークンなどの入力が層に入ると、ルーターはソフトマックス関数を使用して確率スコアを計算します。その後、その入力をスコアが最も高い「Top-K」のエキスパート(通常は1つか2つ)にのみ振り分けます。これにより、モデルは最も関連性の高いパラメータに対してのみエネルギーを消費することが保証されます。

Link to this sectionモデルアンサンブルとの違い#

どちらの概念も複数のサブモデルを使用しますが、Mixture of Expertsをモデルアンサンブルと区別することは極めて重要です。従来のアンサンブルでは、グループ内のすべてのモデルが同じ入力を処理し、精度を最大化するためにそれらの結果が平均化または投票されます。このアプローチでは、モデルの数に比例して計算コストが増加します。

対照的に、MoEは単一の統合されたモデルであり、異なる入力は異なるパスをたどります。疎結合なMoEは、任意の推論ステップにおいて全パラメータのうち一部のみを実行することで、スケーラビリティと効率化を目指します。これにより、密結合なアンサンブルに伴う莫大なコストをかけずに、膨大な量の学習データでのトレーニングが可能になります。

Link to this section実社会での応用#

MoEアーキテクチャは、現代の高性能AIの礎となっており、特にマルチタスク機能と幅広い知識保持が求められるシナリオにおいて重要です。

  1. 多言語言語モデル: Mistral AIのMixtral 8x7Bのような著名なモデルは、MoEを活用して多様な言語タスクで優れた性能を発揮します。トークンを専門のエキスパートにルーティングすることで、これらのシステムは単一のモデル構造内で翻訳、要約、コーディングタスクを処理でき、同等のアクティブパラメータ数を持つ密結合モデルを凌駕します。

  2. スケーラブルなコンピュータビジョン: コンピュータビジョン (CV)の領域では、研究者はMoEを適用して巨大なビジョンバックボーンを構築しています。Vision MoE (V-MoE)アーキテクチャは、エキスパートが特徴的な視覚的特徴の認識に特化できることを示しており、ImageNetのようなベンチマークで効果的にパフォーマンスをスケーリングしています。YOLO26のように高度に最適化された密結合モデルは、メモリフットプリントが予測可能であるためリアルタイムのエッジ検出において標準であり続けていますが、MoEの研究はサーバーサイドの視覚的理解の限界を押し広げ続けています。

Link to this sectionルーティングロジックの例#

ゲーティングネットワークがどのようにエキスパートを選択するかを理解するために、この簡略化されたPyTorchの例を考えてみましょう。これは、特定の入力に対して最も関連性の高いエキスパートを選択するルーティングメカニズムを示しています。

import torch
import torch.nn as nn

# A simple router deciding between 4 experts for input dimension of 10
num_experts = 4
input_dim = 10
router = nn.Linear(input_dim, num_experts)

# Batch of 2 inputs
input_data = torch.randn(2, input_dim)

# Calculate scores and select the top-1 expert for each input
logits = router(input_data)
probs = torch.softmax(logits, dim=-1)
weights, indices = torch.topk(probs, k=1, dim=-1)

print(f"Selected Expert Indices: {indices.flatten().tolist()}")

Link to this sectionトレーニングとデプロイにおける課題#

利点にもかかわらず、MoEモデルはトレーニングプロセスに独自の課題をもたらします。主な問題は負荷分散です。ルーターが一部の「人気のある」エキスパートを優先し、他のエキスパートを無視する可能性があり、その結果、容量が無駄になります。これを緩和するために、研究者はすべてのエキスパートが均等に使用されるよう促す補助的な損失関数を使用します。

Furthermore, deploying these massive models requires sophisticated hardware setups. Since the total parameter count is high (even if active parameters are low), the model often requires significant VRAM, necessitating distributed training across multiple GPUs. Frameworks like Microsoft DeepSpeed help manage the parallelism required to train these systems efficiently. For managing datasets and training workflows for such complex architectures, tools like the Ultralytics Platform provide essential infrastructure for logging, visualization, and deployment.

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう