Scaleout、Ultralytics YOLOを活用してモデルのアップデート時間を数週間から数時間に短縮
ScaleoutがどのようにUltralytics YOLOと連合学習を活用し、機密データを保護しながらエッジデバイス上でAIモデルをファインチューニングしているかをご覧ください。

Problem
Scaleoutは、防衛、産業、およびその他規制の厳しい分野向けのエッジAIシステムを開発しており、機密データを移動させたり安定したネットワークに依存したりすることなく、現場でコンピュータビジョンモデルを継続的に改善する方法を模索していました。
Solution
Scaleoutはエッジデバイス上でUltralytics YOLOモデルをファインチューニングすることで、データをその場に留め、オフラインで動作させ、新しい検知モデルを数週間ではなく数時間でリリースしています。
機械学習モデルのトレーニングでは通常、すべてのデータを一か所に集め、クラウドへ送信して完成したモデルをデプロイできることが前提となります。しかし、多くの現実の環境ではその前提が成立しません。防衛、産業、および規制の厳しい環境全体において、データはプライバシー法、セキュリティ分類、あるいは単純に帯域幅のコストによってその場所に縛り付けられており、それらの場所を結ぶネットワークが常に信頼できるとは限らないためです。
Scaleoutは、まさにこのような状況のためのインフラストラクチャを構築しています。同社のプラットフォームであるScaleout Edgeは、連合学習を活用することで、データをモデルへ移動させるのではなく、データが存在する場所にモデルのトレーニングをもたらします。コンピュータビジョンプロジェクトにおいて、Scaleoutは各現場に展開されたGPUアクセラレーション対応のエッジステーション「Vision Ground Nodes」上でUltralytics YOLOモデルのカスタムトレーニングおよびファインチューニングを行い、機密画像がデバイスから外部へ流出することなく、現場での検知性能を向上させ続けています。
Link to this sectionデータが存在する場所に機械学習をもたらす#
2018年にウプサラ大学の研究者らによって設立されたScaleoutは、大規模分散システムの研究を通じて、データを一元化できない環境での機械学習を可能にすることを目指しました。同社は、データを一か所に集約することが困難あるいは不可能なコンテキストに焦点を当てており、それを実現する中核的なメカニズムが連合学習です。
連合学習は、トレーニングを多数のデバイスに分散させ、それぞれのモデルアップデートを中央制御プレーンへ収集して、統合された新しいグローバルモデルを作成します。各デバイスは独自のローカル環境を理解することでメリットを得られ、フリート全体は集合知から恩恵を受けます。データは本来あるべき場所に留まり、モデルが学習した内容のみが伝送されます。
Scaleoutの事業は防衛、産業、輸送、その他規制の厳しい分野に及んでおり、NATO DIANAアクセラレータプログラムやBAE Systemsとの連携といった取り組みも含まれています。これらすべてに共通しているのは、データを移動できず、かつモデルの改善が必要とされるというパターンです。
Link to this sectionエッジ機械学習の複雑さ#
現場でのモデルトレーニングにおいてScaleoutが直面した制約について、詳しく見ていきましょう。
-
限られたハードウェア: 現場の展開環境にはデータセンターのサーバーはなく、ドローンのコンピューターのような小型かつ低電力のデバイスしかありません。それらの上で完成したモデルを実行することは可能ですが、再トレーニングにはさらに多くの計算能力が必要となります。
-
デバイスに固定されたデータ: 再トレーニングに必要な映像は機密性が高いことが多く、中央サーバーに送信できないため、モデルはエッジから決して離れることのないデータから学習しなければなりません。
-
現場に専門家が不在: 現場でデータを取得するオペレーターが機械学習エンジニアであることは稀であるため、再トレーニングにはデータサイエンスの専門知識がその場に存在することを前提とできません。
-
絶えず変化する環境: 現場環境は急速に変化するため、遅い定期的な再トレーニングサイクルではなく、継続的にモデルを更新する必要があります。
Link to this sectionエッジでのUltralytics YOLOモデルのファインチューニング#
これらの制約の中で機能させるため、ScaleoutはUltralytics YOLOモデルを中核とした、現場で完全に完結するトレーニングループを構築しました。
各現場には、独自の計算リソースとストレージを備えたGPUアクセラレーション対応のエッジステーションである「Vision Ground Node」が、ドローン群と共に配置されています。ドローンが映像を取得すると、ノードは最も有用なフレームを選択し、オペレーターがラベル付けを行い、ローカルのハードウェア上でYOLOモデルがファインチューニングされます。
数エポックのトレーニングの後、生の映像ではなく、アップデートされたモデルのみが中央制御プレーンへ送信されます。このループは、コンピュータビジョンプロジェクトに必要なツールを単一のパッケージにまとめた「Scaleout Edge」プラットフォームの拡張機能であるScaleoutのビジョンモジュールを通じて提供されます。
このモジュールは、フレーム選択、アノテーション、トレーニング、デプロイメントを統合し、Ultralytics YOLOが検知を処理することで、チームがこれらの要素を個別に組み立てることなく、動作する基盤の上に構築を開始できるようにします。
Scaleoutはこのアプローチを最初にNATO DIANAアクセラレータプログラムで実践し、YOLOv8を使用して現場で収集されたデータに対する検知のファインチューニングを行いました。そのデータは、現場のネットワーク経由での移動や、機密上の理由による一元化が不可能であったため、チームはファインチューニングを分散化し、モデルがローカルで新しい事例から学習できるようにしました。
このループはデータサイエンティストではなく、オペレーター向けに設計されています。システムは非専門家が重要なフレームを確認およびラベル付けするようガイドするため、現場の担当者が自分たちでモデルの改善を継続できます。
これを支えるツールには、アノテーション用のオープンソース版Label Studio、ドローンフィードを取り込むためのストリーミングサーバー、およびファインチューニング用のUltralytics Python packageが含まれています。これらはすべて、展開先に応じて、NVIDIA Jetsonモジュールから頑丈なフィールドユニット、あるいはラップトップまで、さまざまなハードウェア上で実行されます。
Link to this sectionなぜUltralytics YOLOモデルが選ばれるのか#
Scaleoutにとって、Ultralytics YOLOの最大の利点はモデルの軽量さにあり、これこそが不安定な接続環境下での連合トレーニングを実用的なものにしています。Scaleoutは生のデータを移動させるのではなく、モデルのアップデートのみを移動させます。最も頻繁に使用されるUltralytics YOLOv8 nanoは約10.7 MBであり、帯域幅が限られている場合でも、完全なアップデートを小さなパッケージとして送信可能です。
また、Ultralytics Python packageにより、Scaleoutのエンジニアは多様なハードウェア間でのトレーニングとデプロイメントの柔軟性を得ています。コンパクトなYOLOv8 nanoモデルは、制約のあるエッジデバイス上で快適に動作し、パッケージのエクスポートオプションはScaleoutが取り組むさまざまな環境へのデプロイをサポートしています。モデルのファインチューニングが簡単であるため、チームは現場の状況変化に合わせて迅速にイテレーションを行うことができます。
Link to this sectionUltralytics YOLOがScaleoutによる迅速なモデル更新を支援#
Ultralytics YOLOを使用すると、最も負荷のかかる作業はデバイス上に留まります。トレーニングは何百ギガバイトもの現場映像に対して実行されますが、実際に移動するのは約10 MBのモデルです。これにより移動が必要なデータ量は約10分の1に削減され、これらの展開環境が依存する限られたネットワーク上でも連合トレーニングが可能になります。
このアプローチは、改善されたモデルが現場へ戻るまでの時間も変化させます。データの収集、中央への送付、再トレーニング、再デプロイといったプロセスが、そうでなければ数週間から数か月かかるところ、ループをエッジで実行することで数日あるいは数時間へと短縮されます。
これは、Scaleoutのドローン関連の取り組みにおいて最も顕著に現れています。防衛偵察において、ドローンは探索パターンを飛行し、オンボードのUltralytics YOLOモデルを使用して、対象物の検知、識別、地理的位置特定をリアルタイムで行います。処理はすべてドローン自身のコンピューターで完結し、分析のために外部へ送信されることはありません。
ドローンが新しい映像を収集すると、そのデータはVision Ground Nodeへ入力され、新しいフレームに基づいてYOLOがファインチューニングされ、更新されたモデルが再度プッシュされます。これらすべてが、映像が現場を離れることなく行われます。検知モデルは急速に変化する状況と移動不可能なデータに適応する必要があり、ローカルで再トレーニングされたモデルは、静的な中央トレーニングモデルが陳腐化するような環境でも有用性を維持します。

図1. ScaleoutとUltralytics YOLOがどのようにAIドローンを強化しているかの例 (ソース)
同じパターンはドローン以外にも広く適用されます。エネルギー施設や遠隔施設といった産業環境では、各拠点のデータは機密性が高く、プラットフォームは生のデータを施設境界の外へ出すことなく、多数の拠点にわたって検知モデルを向上させます。データがドローン上にあるか固定設備にあるかにかかわらず、Scaleoutは映像をその場に留め、モデルが学習した内容のみを移動させます。
Link to this sectionデータを移動できない環境に適応型AIを構築する#
Scaleoutは成長に伴い、連合型かつエッジベースのコンピュータビジョンを、より多くの設定やハードウェアへと拡張し続けています。同社の事前構築済みモジュールは、数か月かかる統合作業を数日へと短縮するように設計されているため、顧客は基盤となる機械学習コードを再構築することなく、独自のハードウェアを持ち込んで適応型の学習ループを採用できます。
Ultralytics YOLOを検知パイプラインの中核に据えることで、Scaleoutは従来のアプローチでは不十分だった環境でのAIトレーニングと改善を可能にしています。データをその場に留め、ネットワークが停止しても運用を継続し、エッジデバイスのフリートを全体として学習し続けるシステムに変貌させています。
Vision AIで何ができるか探求する準備はできましたか?当社のGitHubリポジトリにアクセスして、YOLOモデルが製造業におけるAIやロボット工学におけるコンピュータビジョンといった分野をどのように変革しているかをご覧ください。当社のライセンスオプションを確認し、よりスマートな自動化に向けた旅を始めましょう。






