効率的なEdge AIのためのRockchip上でのUltralytics YOLO11のデプロイ
効率的なEdge AI、AIアクセラレーション、およびリアルタイム物体検出のために、RKNN Toolkitを使用してRockchip上でUltralytics YOLO11を展開する方法を解説します。

最近のAIコミュニティで注目されているキーワードにエッジAIがあります。特にコンピュータビジョンの分野でその傾向が顕著です。AI主導のアプリケーションが普及するにつれ、電力やコンピューティングリソースが限られた組み込みデバイス上でモデルを効率的に実行する必要性が高まっています。
例えば、ドローンはリアルタイムナビゲーションにビジョンAIを使用し、スマートカメラは物体を瞬時に検出し、産業オートメーションシステムはクラウドコンピューティングに頼らずに品質管理を行います。これらのアプリケーションでは、リアルタイムのパフォーマンスと低レイテンシを確保するため、エッジデバイス上で直接、高速かつ効率的なAI処理が求められます。しかし、エッジデバイスでAIモデルを実行するのは常に容易とは限りません。AIモデルは、多くの場合、エッジデバイスが対応できる以上の電力とメモリを消費するためです。
RockchipのRKNN Toolkitは、Rockchip搭載デバイス向けにディープラーニングモデルを最適化することで、この問題を解決します。このツールキットは専用のニューラルネットワーク処理ユニット(NPU)を使用して推論を高速化し、CPUやGPUでの処理と比較してレイテンシと消費電力を削減します。
ビジョンAIコミュニティでは、RockchipベースのデバイスでUltralytics YOLO11を実行することへの期待が高まっており、私たちはその声に応えました。これに伴い、YOLO11をRKNNモデルフォーマットへエクスポートするサポートを追加しました。この記事では、RKNNへのエクスポートがどのように機能するのか、そしてRockchip搭載デバイスへのYOLO11のデプロイがなぜ革新的なのかを解説します。
Link to this sectionRockchipとRKNN Toolkitとは?#
Rockchipは、システムオンチップ(SoC)を設計する企業です。SoCは、多くの組み込みデバイスを動かす小型でありながら強力なプロセッサです。これらのチップは、CPU、GPU、およびニューラルネットワーク処理ユニット(NPU)を統合しており、一般的な計算タスクから、物体検出や画像処理に依存するビジョンAIアプリケーションまで、あらゆる処理に対応します。
RockchipのSoCは、シングルボードコンピュータ(SBC)、開発ボード、産業用AIシステム、スマートカメラなど、さまざまなデバイスで使用されています。Radxa、ASUS、Pine64、Orange Pi、Odroid、Khadas、Banana Piといった多くの有名なハードウェアメーカーが、Rockchip SoCを搭載したデバイスを製造しています。これらのボードは、パフォーマンス、電力効率、コストのバランスが良いため、エッジAIやコンピュータビジョンのアプリケーションで人気があります。

Fig 1. Rockchip搭載デバイスの例です。
AIモデルをこれらのデバイス上で効率的に実行できるよう、RockchipはRKNN(Rockchip Neural Network)Toolkitを提供しています。これにより、開発者はディープラーニングモデルを変換および最適化して、Rockchipのニューラルネットワーク処理ユニット(NPU)を活用できるようになります。
RKNNモデルは、低レイテンシの推論と効率的な電力使用のために最適化されています。モデルをRKNNに変換することで、開発者はRockchip搭載デバイスにおいて、より高速な処理速度、消費電力の削減、効率の向上を実現できます。
Link to this sectionRKNNモデルは最適化されています#
RKNNモデルがRockchip対応デバイス上でどのようにAIのパフォーマンスを向上させるのか、詳しく見ていきましょう。
広範な計算タスクを処理するCPUやGPUとは異なり、RockchipのNPUはディープラーニング専用に設計されています。AIモデルをRKNNフォーマットに変換することで、開発者はNPU上で直接推論を実行できるようになります。このため、RKNNモデルは迅速かつ効率的な処理が不可欠なリアルタイムのコンピュータビジョンタスクに特に適しています。
NPUは、ニューラルネットワークの計算を並列処理するように構築されているため、AIタスクにおいてCPUやGPUよりも高速かつ効率的です。CPUがタスクを一つずつ処理し、GPUがワークロードを複数のコアに分散させるのに対し、NPUはAI特有の計算をより効率的に実行するように最適化されています。
その結果、RKNNモデルはより高速に動作し消費電力も抑えられるため、バッテリー駆動のデバイス、スマートカメラ、産業オートメーションなど、リアルタイムの意思決定を必要とするエッジAIアプリケーションに最適です。
Link to this sectionUltralytics YOLOモデルの概要#
Ultralytics YOLO (You Only Look Once) モデルは、物体検出、インスタンスセグメンテーション、画像分類といったリアルタイムのコンピュータビジョンタスク向けに設計されています。これらのモデルは、その速度、精度、効率性で知られており、農業、製造、ヘルスケア、自律システムなどの業界で広く利用されています。
これらのモデルは時間の経過とともに大幅に改善されています。例えば、Ultralytics YOLOv5は、PyTorchを使用して物体検出をより使いやすくしました。その後、Ultralytics YOLOv8は、ポーズ推定や画像分類などの新しい機能を追加しました。そして今、YOLO11はリソース使用量を抑えつつ精度を向上させることで、さらに進化しました。実際に、YOLO11mはCOCOデータセットにおいてYOLOv8mよりもパラメータ数を22%削減しながら、より優れたパフォーマンスを発揮し、精度と効率の両方を高めています。

Fig 2. YOLO11を使用した物体検出。
Ultralytics YOLOモデルは、複数のフォーマットへのエクスポートもサポートしており、さまざまなプラットフォーム間での柔軟なデプロイを可能にします。これらのフォーマットには、ONNX、TensorRT、CoreML、OpenVINOが含まれており、開発者はターゲットハードウェアに基づいてパフォーマンスを最適化する自由が得られます。
YOLO11をRKNNモデルフォーマットへエクスポートするサポートが追加されたことで、YOLO11はRockchipのNPUを活用できるようになりました。最も小型のモデルであるRKNNフォーマットのYOLO11nは、画像あたり99.5msという驚異的な推論時間を実現し、組み込みデバイス上でもリアルタイム処理を可能にします。
Link to this sectionYOLO11モデルをRKNNフォーマットへエクスポートする#
現在、YOLO11物体検出モデルをRKNNフォーマットにエクスポートできます。また、その他のコンピュータビジョンのタスクやINT8量子化のサポートも今後のアップデートで追加予定ですので、ご期待ください。
YOLO11のRKNNフォーマットへのエクスポートは非常にシンプルなプロセスです。独自に学習させた YOLO11モデルを読み込み、ターゲットのRockchipプラットフォームを指定するだけで、数行のコードでRKNNフォーマットに変換できます。RKNNフォーマットはRK3588、RK3566、RK3576など、さまざまなRockchip SoCと互換性があり、幅広いハードウェアサポートを保証します。

Fig 3. YOLO11をRKNNモデルフォーマットへエクスポート。
Link to this sectionRockchipベースのデバイスへのYOLO11のデプロイ#
エクスポートが完了すると、RKNNモデルをRockchipベースのデバイスにデプロイできます。モデルをデプロイするには、エクスポートされたRKNNファイルをRockchipデバイスに読み込み、推論を実行するだけです。推論とは、学習済みのAIモデルを使用して新しい画像やビデオを分析し、物体をリアルタイムで検出するプロセスのことです。数行のコードを実行するだけで、画像やビデオストリームから物体の識別を開始できます。

Fig 4. エクスポートされたRKNNモデルを使用して推論を実行。
Link to this sectionYOLO11とRockchipのエッジAIアプリケーション#
Rockchip対応デバイス上でYOLO11を実際の現場でどこにデプロイできるかをよりよく理解するために、主要なエッジAIアプリケーションをいくつか見ていきましょう。
Rockchipプロセッサは、Androidベースのタブレット、開発ボード、産業用AIシステムで広く使用されています。Android、Linux、Pythonをサポートしているため、さまざまな業界向けにビジョンAI主導のソリューションを簡単に構築およびデプロイできます。
Link to this sectionYOLO11が統合された堅牢なタブレット#
YOLO11をRockchip搭載デバイスで実行する一般的なアプリケーションの一つに、堅牢なタブレットがあります。これらは、倉庫、建設現場、産業環境といった厳しい環境向けに設計された、耐久性と高性能を兼ね備えたタブレットです。これらのタブレットは、物体検出を活用して効率と安全性を向上させることができます。
例えば、倉庫物流において、作業員はYOLO11を搭載したRockchipベースのタブレットを使用して在庫を自動的にスキャンし、検出することで、人為的なエラーを減らし、処理時間を短縮できます。同様に、建設現場では、これらのタブレットを使用して、作業員がヘルメットやベストといった必要な安全装備を着用しているかを検出し、企業の規制遵守と事故防止を支援できます。

Fig 5. YOLO11を使用した安全装備の検出。
Link to this section品質管理のための産業用AI#
製造およびオートメーションに関して、Rockchip搭載の産業用ボードは品質管理やプロセス監視において大きな役割を果たします。産業用ボードは、産業環境における組み込みシステム向けに設計された、コンパクトで高性能なコンピューティングモジュールです。これらのボードは通常、プロセッサ、メモリ、I/Oインターフェース、接続オプションを備えており、センサー、カメラ、自動化機械と統合できます。
これらのボード上でYOLO11モデルを実行することで、製造ラインをリアルタイムで分析し、問題を瞬時に発見して効率を改善することが可能になります。例えば、自動車製造において、RockchipハードウェアとYOLO11を使用したAIシステムは、自動車が組み立てラインを移動する際に、傷、部品の不整合、塗装の欠陥を検出できます。これらの欠陥をリアルタイムで特定することで、メーカーは廃棄物を削減し、生産コストを下げ、車両が顧客の元へ届く前に高い品質基準を保証できます。
Link to this sectionRockchipベースのデバイスでYOLO11を実行する利点#
Rockchipベースのデバイスは、パフォーマンス、コスト、効率の優れたバランスを提供しており、エッジAIアプリケーションでYOLO11をデプロイするための素晴らしい選択肢です。
RockchipベースのデバイスでYOLO11を実行する利点をいくつか挙げます:
- AIパフォーマンスの向上: Rockchip搭載デバイスは、Raspberry PiのようなCPUベースのボードよりも効率的にAI推論を処理し、より高速な物体検出と低いレイテンシを実現します。
- 費用対効果の高いソリューション: AIの実験を行っており、強力なパフォーマンスを提供しながらも予算にやさしい選択肢が必要な場合、Rockchipは最適です。スピードや効率に妥協することなく、手頃な価格でYOLO11を実行できます。
- エネルギー効率: Rockchip搭載デバイスでコンピュータビジョンモデルを実行すると、GPUよりも消費電力が少なくなるため、バッテリー駆動のデバイスや組み込みAIアプリケーションに理想的です。
Link to this section重要なポイント#
Ultralytics YOLO11は、ハードウェアアクセラレーションとRKNNフォーマットを活用することで、Rockchipベースのデバイス上で効率的に実行できます。これにより推論時間が短縮され、パフォーマンスが向上するため、リアルタイムのコンピュータビジョンタスクやエッジAIアプリケーションに最適です。
RKNN Toolkitは、量子化や微調整といった重要な最適化ツールを提供し、YOLO11モデルがRockchipプラットフォーム上で確実に良好なパフォーマンスを発揮できるようにします。エッジAIの採用が進むにつれ、デバイス上での効率的な処理に向けたモデルの最適化は不可欠なものとなるでしょう。適切なツールとハードウェアを使用することで、開発者はさまざまな業界におけるコンピュータビジョンソリューションの新たな可能性を引き出すことができます。
コミュニティに参加してGitHubリポジトリを探索し、AIについてさらに学びましょう。農業におけるコンピュータビジョンやヘルスケアにおけるAIがどのようにイノベーションを推進しているかは、ソリューションページをご覧ください。また、ライセンスオプションをチェックして、ビジョンAIソリューションの開発を今すぐ始めましょう!






