YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

連合学習

連合学習を発見しましょう:プライバシーを重視したAIアプローチで、生データを共有せずにデバイス間で分散型モデル学習を可能にします。

連合学習(FL)は、データを交換することなく、ローカルデータサンプルを保持する複数の分散型デバイスまたはサーバー間でモデルをトレーニングできる機械学習(ML)技術です。このアプローチは、生データをユーザーのデバイス上に保持することにより、重要なデータプライバシーとセキュリティの懸念に対処します。モデルトレーニングのためにデータを中央サーバーにプールする代わりに、FLはグローバルモデルをローカルデバイスに送信することで機能します。各デバイスは独自のデータでモデルをトレーニングし、結果として得られるモデルの更新(小規模で集中的な改善)のみが、集約される中央サーバーに送り返されます。この共同プロセスは、ユーザー情報を侵害することなく、共有グローバルモデルを改善します。

連合学習はどのように機能しますか?

連合学習プロセスは通常、中央の調整サーバーによって調整されるステップの反復サイクルで構成されます。

  1. モデル配布: 中央サーバーは、AIモデルニューラルネットワークなど)を初期化し、クライアントデバイス(携帯電話や病院のコンピューターなど)の選択に配布します。
  2. ローカル学習: 各クライアントデバイスは、ローカルデータセットでモデルをトレーニングします。このデータはデバイスから離れることがないため、プライベートが保たれます。このローカル学習は、オンデバイスインテリジェンスの重要な要素であり、エッジAIと関連付けられることがよくあります。
  3. 更新の送信: 数回のイテレーションのトレーニング後、各クライアントは計算されたモデルの更新(勾配やモデルの重みなど)を中央サーバーに送り返します。これは、生データそのものよりもはるかに小さく、安全なペイロードです。
  4. セキュア集約: 中央サーバーは、グローバルモデルを改善するために、すべてのクライアントからの更新(例えば、それらを平均化することによって)を集約します。セキュアマルチパーティ計算のような手法を使用して、サーバーが個々の更新をリバースエンジニアリングできないようにすることができます。
  5. モデルの改善: 洗練されたグローバルモデルは、次回のトレーニングのためにクライアントに送り返されます。この反復プロセスは、モデルのパフォーマンスが望ましいレベルの精度に達するまで継続されます。

実際のアプリケーション

連合学習は単なる理論的概念ではありません。いくつかの主流アプリケーションを強化し、データの機密性が最も重要な業界を変革しています。

  • スマートキーボードの予測: Googleのような企業はFLを使用して、モバイルキーボードでの予測テキストを改善しています。お使いの携帯電話は、入力履歴から学習して次の単語を提案し、これらの学習は匿名化されたモデルアップデートとして共有され、実際のメッセージがデバイスから離れることなく、すべてのユーザーの予測エンジンを改善します。
  • 共同医療研究:FLを使用すると、病院や研究機関が協力して、腫瘍を検出するための医用画像解析などのタスク向けの強力な診断モデルを構築できます。各病院は、HIPAAのようなプライバシー法によって保護されている患者データに基づいて共有モデルをトレーニングできます。機密性の高い患者記録を他の機関や中央リポジトリに公開することはありません。これにより、多様なデータセットでトレーニングされた、より堅牢なモデルを作成できます。

連合学習と関連概念の比較

FLを、他の学習パラダイムと区別することが重要です。

  • 集中型学習: すべてのデータを1か所に集めて学習させる従来のアプローチです。FLはこれとは正反対で、データを集中化させないように特別に設計されています。
  • 分散学習: この手法も複数のマシンを使用して学習を高速化しますが、学習データが中央の場所に保存されており、学習ノード間で自由に分散できることを前提としています。対照的に、FLは本質的に分散化されており、移動できないデータで動作します。
  • アクティブラーニング: この手法は、アノテーションコストを削減するために、ラベル付けされる最も有益なデータポイントを効率的に選択することに焦点を当てています。FLはトレーニングがどこで行われるかを扱うのに対し、アクティブラーニングはどのデータが使用されるかを扱います。このアクティブラーニングに関するブログで説明されているように、プライバシーと効率をさらに高めるために、これら2つを組み合わせることができます。

課題とフレームワーク

FLはその利点にもかかわらず、高い通信コスト、さまざまな計算能力(CPU/GPU)を持つデバイスの管理、およびモデルに偏りを与える可能性のある非IID(独立同分布ではない)データの処理などの課題に直面しています。システムは、モデルの更新を標的とする敵対的攻撃にも脆弱になる可能性があります。これらの複雑さに対処するために、TensorFlow FederatedOpenMinedなどの組織のPySyftなどのフレームワークが開発されました。テクノロジーが成熟するにつれて、モデルのデプロイと監視のライフサイクル全体を管理することが重要になり、Ultralytics HUBのようなプラットフォームによってプロセスが簡素化されます。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました