Yolo 深圳
深セン
今すぐ参加
用語集

連合学習

連合学習を発見しましょう:プライバシーを重視したAIアプローチで、生データを共有せずにデバイス間で分散型モデル学習を可能にします。

フェデレーテッド・ラーニングは、機械学習(ML)に対する分散型アプローチである。 機械学習(ML)の分散型アプローチである。 を実現する分散型アプローチである。 データを一元化されたデータレイクやクラウドサーバーに集約する必要がある従来の手法とは異なり データレイクやクラウドサーバーにデータを集約する必要がある従来の方法とは異なり、連携学習はモデルをデータ モデルをデータにもたらします。このパラダイムシフトは、データのプライバシーとセキュリティに関する重要な課題に対処するものである。 このパラダイムシフトは、データのプライバシーとセキュリティに関連する重要な課題を解決し、機密性の高いユーザー情報を厳重に保ちながら スマートフォンやIoTセンサーなどのローカル・デバイスに機密性の高いユーザー情報を厳重に保管しながら、堅牢なシステムを構築することが可能になる、 あるいは病院のサーバーなどである。

連合学習はどのように機能しますか?

このプロセスは、中央サーバーと参加クライアントデバイス間の反復的な通信サイクルに依存している。 一般的には、以下のような明確なステップを踏む:

  1. 初期化:中央サーバーがグローバルニューラルネットワークモデルを初期化し それをブロードキャストする。 選択された適格なクライアントデバイスのグループにブロードキャストする。
  2. ローカルトレーニング:各クライアント・デバイスは モデルの学習をローカルで行う。これにより エッジAIの機能を活用し、生データがデバイスの外に出ることがないようにする。 デバイスから離れることはありません。
  3. アップデートの送信:データを共有する代わりに、クライアントは数学モデル を中央サーバーに送信する。 モデルの重みを中央サーバーに送り返す。
  4. 集約:サーバーは サーバはFederated Averaging (FedAvg)のようテクニックを使って、これらのアップデートを新しい 改善されたグローバルモデルに統合する。
  5. 反復:更新されたグローバルモデルはクライアントに送り返され、モデルが望ましい精度を達成するまでこのサイクルが繰り返される。 サイクルが繰り返される。

実際のアプリケーション

フェデレーテッド・ラーニングは、理論的な研究から、データの機密性が最重要視される産業における実用的な展開へと移行した。 実用化されている。

  • ヘルスケアと医療画像:病院が連携学習を使って 腫瘍検出のための医療画像解析に 患者記録を共有することなくこれにより、医療機関は多様なデータセットで強力な AIを多様なデータセット HIPAAなどの規制を厳守しながら。
  • モバイル予測入力:スマートフォンのキーボードは、自然言語処理(NLP)を改善するためにこの技術を利用している。 自然言語処理(NLP) モデルを改善するために利用されている。入力パターンをローカルで学習することで、システムはユーザー体験を向上させる。 クラウドに個人的なテキストメッセージを送信することなく、ユーザー体験を向上させる。 Google AI研究

統合学習と分散トレーニング

どちらの概念も複数のマシンを含むが、データガバナンスとネットワーク環境において根本的に異なる。

  • 統合学習:データはローカルに生成され、プライバシーの制約から分散化されたままである。 デバイスは異機種(異なるハードウェア)であることが多く、ネットワーク接続も不安定。
  • 分散トレーニング:通常、制御されたデータセンター内で行われ、中央のデータセットが(GPUクラスターのような)計算ノード間で分割される。 GPUのクラスターなど)に分割される。 大規模なデータセットの処理を高速化する。

コード例ローカルクライアントの更新をシミュレートする

連携セットアップでは、クライアントの役割は、ローカルデータ上でグローバルモデルを微調整することである。次のPython スニペットは を使用して、クライアントがローカルトレーニングの1ラウンドをどのように実行するかを示します。 Ultralytics YOLO11モデルを使用してローカル学習を1ラウンド 集計のために抽出される。

from ultralytics import YOLO

# Load the global model received from the central server
# In a real scenario, this 'yolo11n.pt' comes from the aggregator
model = YOLO("yolo11n.pt")

# Perform local training on the client's private dataset
# 'epochs=1' simulates a single round of local computation
results = model.train(data="coco8.yaml", epochs=1, imgsz=640)

# After training, the updated model weights are saved
# These weights are what the client sends back to the server
print("Local training complete. Update ready for transmission.")

利点と課題

フェデレーテッド・ラーニングの第一の利点は、プライバシー・バイ・デザインである。これにより 合成データや実世界の個人データを利用できる。 を使用することができる。さらに、大規模なデータセットを転送しないため、ネットワーク帯域幅の消費 大容量のデータセットが転送されないためである。

しかし、課題も残っている。システムの異質性とは、強力なサーバーからバッテリーに制約のあるIoTセンサーまで、さまざまな計算能力を持つデバイス上でモデルを実行しなければならないことを意味する。 強力なサーバーからバッテリーに制約のあるIoTセンサーまで、さまざまな計算能力を持つデバイス上でモデルを実行しなければならない。また、以下のようなリスクもある。 敵対的攻撃悪意のあるクライアントがポイズンアップデートを送信し、グローバルモデルを破壊する可能性がある。これを軽減するために、研究者は ディファレンシャル・プライバシー技術を採用し 更新にノイズを加えることで、1人のユーザーのデータをリバースエンジニアリングできないようにしている。

TensorFlow FederatedPySyftは現在、開発者がこれらの複雑なワークフローを実装するのを支援している。 ワークフローの実装を支援している。コンピュータビジョンが進化し続ける中 学習は、高性能な結果を提供しながら、ユーザーのプライバシーを尊重するインテリジェントなシステムを展開する上で、重要な役割を果たすだろう。 フェデレーション学習は、高性能な結果を提供しながら、ユーザーのプライバシーを尊重するインテリジェントなシステムを展開する上で重要な役割を果たすだろう。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加