Yolo 深圳
深セン
今すぐ参加

Ultralytics YOLO モデルをIntelAI PCでOpenVino実行する

Abirami Vina

4分で読めます

2024年10月9日

Dmitriy Pastushenkov氏とAdrian Boguszewski氏によるYOLO Vision 2024を再訪し、Intel OpenVino YOLO モデルの最適化と、IntelAI PC上でのリアルタイム推論の実行について語る。

YOLO ビジョン2024(YV24)は、Ultralytics毎年開催しているハイブリッドイベントで、世界中からAI愛好家、開発者、専門家が集まり、コンピュータービジョンの最新イノベーションを探求しました。YV24は、新たなブレークスルーを議論する絶好の機会であり、プラットフォームでした。このイベントでは、AI業界の主要企業が最新のイノベーションを紹介した。その中にはIntel参加し、同社の新しい画期的なAI PCとIntel OpenVino Ultralytics YOLO モデルとの統合に関する基調講演を行いました。 Ultralytics YOLO11.

講演は、LandCover.aiデータセットを共同作成し、Intel OpenVINO ツールキットについて開発者を教育するソフトウェア・エバンジェリストのAdrian Boguszewski氏と、産業オートメーションとAIで20年以上の経験を持つAI PCエバンジェリストのDmitriy Pastushenkov氏によって行われた。イベント中、エイドリアンは興奮を分かち合い、"Ultralytics YOLO 新バージョンを提供したからだけでなく、私たちの新しいハードウェア上で動作するこの新しいモデル、そしてOpenVINO新バージョンを発表することができたので、今日は素晴らしいイベントとなりました。"と語った。

この記事では、IntelYV24で行った講演の主なハイライトを紹介し、AI PCであるIntel Core Ultra 200Vシリーズの裏側と、OpenVINO ツールキットを使用したUltralytics YOLO モデルとの統合方法について掘り下げる。さっそく始めよう!

2024年の最先端AI技術

Dmitriy氏は、基調講演の冒頭で、従来のAIと生成AIの主な違いについて掘り下げました。焦点は、これらのテクノロジーとそのユースケースが2024年にどのように進化しているかを中心に展開されました。コンピュータビジョン自然言語処理のような従来のAI技術は、ポーズ推定物体検出音声認識などのタスクに不可欠でした。しかし、生成AIは、チャットボットテキストから画像生成コード作成、さらにはテキストからビデオなどのアプリケーションを含む、AI技術の新しい波を表しています。 

__wf_reserved_inherit
図1.YV24のステージでAIのユースケースについて議論するIntelエイドリアンとドミトリー。

Dmitriy氏は、2つの規模の違いを指摘しました。彼は、従来のAIモデルは数百万のパラメータで構成されているのに対し、生成AIモデルははるかに大規模に動作すると説明しました。生成AIモデルは、数十億、あるいは数兆ものパラメータを含むことが多く、計算負荷がはるかに高くなります。

Intel AI PC:AIハードウェアの新境地

ドミトリーは、従来のAIモデルとジェネレーティブAIモデルの両方を効率的に実行するという増大する課題に対処するために設計された新しいハードウェアソリューションとして、Intel AI PCを紹介した。Intel AI PCは、パワフルでエネルギー効率の高いマシンです。クラウドベースの処理を必要とせず、幅広いAIモデルをローカルで実行することができる。 

ローカル処理は、機密性の高いデータを保護するのに役立ちます。AIモデルがインターネット接続に依存せずに動作できる場合、プライバシーとセキュリティに関する業界の倫理的な懸念が解消されます。

Intel AI PCの原動力は、Intel コア・ウルトラ200Vシリーズ・プロセッサーである。このプロセッサーには、中央処理ユニットCPU)、グラフィックス・プロセッシング・ユニットGPU)、ニューラル・プロセッシング・ユニット(NPU)の3つの主要コンポーネントが組み込まれている。それぞれが、さまざまなタイプのAIワークロードを処理する上で特定の役割を果たす。CPU 迅速な応答が必要な小規模で低レイテンシーのタスクに最適で、GPU AIモデルの実行のような高スループット処理に最適化されている。電力効率を重視して設計されたNPUは、以下のようなモデルによるリアルタイムの物体検出のような長時間実行タスクに適している。 YOLO11

CPU 最大5TOPS(1秒間に数兆回の演算)、GPU 最大67TOPS、NPUはシステムリソースを消耗することなくAIタスクを継続的に実行するエネルギー効率の高い方法を提供することが強調された。

IntelAIの進化Intel コア・ウルトラ200Vシリーズ

Intel Core Ultra 200Vシリーズ・プロセッサーは、NPU、CPU、GPU 3つのAIエンジンを1つの小さなチップに統合しています。そのデザインは、性能を犠牲にすることなく、ノートPCのようなコンパクトなデバイスに最適です。

プロセッサーにはRAMも内蔵されており、グラフィックカードを別途用意する必要がない。これにより、消費電力を削減し、デバイスをコンパクトに保つことができる。ドミトリーはまた、プロセッサーの柔軟性を強調した。ユーザーはタスクに応じて、AIモデルをCPU、GPU、NPUのどれで実行するかを決めることができる。例えば、 YOLO11 モデルによる物体検出は、これらのエンジンのいずれかで実行することができます。一方、テキストから画像への生成のような、より複雑なタスクは、より良いパフォーマンスのためにGPU NPUの両方を同時に使用することができます。

プレゼンテーションの間、ドミトリーはポケットからチップを取り出し、このような高度なAIタスクを処理する能力があるにもかかわらず、チップが本当に小さいことを皆にはっきりと実感させた。それは、Intel いかに強力なAI機能をよりポータブルで実用的なデバイスにもたらそうとしているかを示す、楽しく印象的な方法だった。

__wf_reserved_inherit
図2.Intel Core Ultra 2000Vプロセッサーはポケットに入る。

Intel OpenVinoAIモデルの最適化

ドミトリーは、Intel最新のハードウェアを紹介した後、AIをサポートするIntelソフトウェア・スタックに話を移した。彼はOpenVINO紹介した。OpenVINO、異なるデバイス間でAIモデルを最適化し、効率的に展開するために設計されたIntel オープンソース・フレームワークである。OpenVINO ビジュアル・タスクにとどまらず、自然言語処理、オーディオ処理トランスフォーマーなどに使用されるAIモデルにもサポートを拡大している。

OpenVINO 、次のような一般的なプラットフォームと互換性があります。 PyTorchTensorFlow、そして ONNX開発者はワークフローに簡単に組み込むことができる。彼が注目した重要な機能のひとつは量子化だ。量子化はモデルの重みを圧縮してサイズを小さくするため、大規模なモデルでもクラウドを必要とせず、ローカルデバイスでスムーズに実行できる。OpenVINO 複数のフレームワークで動作し、CPU、GPU、NPU、FPGA、あるいはARMデバイスでも動作し、Windows、Linux、macOSをサポートしている。ドミトリーはまた、OpenVINO使い始めるのがいかに簡単かを聴衆に説明した。 

__wf_reserved_inherit
図3.OpenVino始め方を説明するドミトリー。

Ultralytics Intel OpenVino統合

講演の第2部では、マイクがエイドリアンに渡され、Ultralytics YOLO モデルとIntel OpenVINO ツールキットとのシームレスな統合について説明し、YOLO モデルのデプロイプロセスを簡素化した。彼は、Ultralytics Python パッケージを使った YOLO モデルの OpenVINO フォーマットへのエクスポートがいかに迅速で簡単であるかを、ステップ・バイ・ステップで説明した。この統合により、開発者はIntel ハードウェア向けにモデルを最適化し、両プラットフォームを最大限に活用することがより容易になります。

__wf_reserved_inherit
図4.Ultralytics モデルをOpenVino 形式に簡単にエクスポートできることを説明するエイドリアン。

エイドリアンは、Ultralytics YOLO モデルが一度トレーニングされると、ユーザーはいくつかの簡単なコマンドラインフラグを使用して、それをエクスポートできることを示しました。例えば、ユーザーはモデルを最大精度の浮動小数点バージョンとしてエクスポートするか、スピードと効率性を高めるために量子化バージョンとしてエクスポートするかを指定することができます。また、開発者がコードを通じてこのプロセスを直接管理し、INT8量子化などのオプションを使用することで、精度をあまり犠牲にすることなくパフォーマンスを向上させる方法についても強調しました。 

Intel AI PCによるリアルタイムAIデモ

この理論を実践するために、Intel チームは、YOLO11を実行し、物体検出のリアルタイムデモを発表しました。 YOLO11をIntel AI PC上で実行し、オブジェクト検出のリアルタイム・デモを披露した。エイドリアンは、システムが異なるプロセッサ間でモデルをどのように処理するかを紹介し、CPU 浮動小数点モデルで毎秒36フレーム(FPS)、統合GPU100FPS以上、INT8量子化バージョンでは70FPSを達成した。彼らは、Intel AI PCが複雑なAIタスクをいかに効率的に管理できるかを示すことができました。

また、すべてのデータやビデオフレームが前もって利用可能なタスクでは、CPU、GPU、NPUを併用し、並列にモデルを実行できることも指摘した。これは動画のような高負荷を処理する場合に有効だ。システムは作業負荷を異なるプロセッサーに分割できるため、より高速で効率的な処理が可能になる。

最後に、エイドリアンはユーザーが自宅でデモを試すことができることに触れ、その中にはピープル・カウントや インテリジェント・キュー・マネージメントといった ソリューションも含まれていると述べた。そして、ユーザーがプロンプトを入力することで、夢のような画像をGPU上でリアルタイムに生成できるボーナスデモを披露した。このデモは、伝統的なAIタスクと創造的でジェネレーティブなAIプロジェクトの両方に対するIntel AI PCの多用途性を示した。

Intel OpenVINOリアルタイムのオブジェクト検出

このイベントでIntel ブースを構え、Intel AI PC上で動作するYOLO11使ったリアルタイムの物体検出デモを展示した。参加者は、OpenVINO最適化され、Intel Core Ultra 200Vプロセッサーにデプロイされたモデルを実際に見ることができた。 

__wf_reserved_inherit
図5.参加者は、Intel OpenVino ブースでリアルタイムのデモを見ることができた。

Intel ブースでドミトリーは、「YOLO ビジョンに参加するのは初めてで、マドリードに来られてうれしいです。Intel Core Ultra 200Vプロセッサーで動作するUltralytics YOLO11 モデルを紹介します。優れたパフォーマンスを示しており、モデルの最適化とデプロイにはOpenVINO 使用しています。CPU、GPU、NPUを活用し、Ultralytics 協力し、最新のIntel ハードウェア上でモデルを実行するのは非常に簡単でした。ブースでは、参加者が持ち帰れるTシャツやノートブックなど、楽しい景品も用意されていた。

主なポイント

IntelYV24で、Intel コア・ウルトラ200Vシリーズ・プロセッサーを使った技術講演を行い、OpenVINO ツールキットがUltralytics YOLO11ようなAIモデルをどのように最適化するかを紹介した。この統合により、ユーザーはYOLO モデルをデバイス上で直接実行することができ、物体検出のようなコンピュータ・ビジョン・タスクに優れたパフォーマンスを提供することができる。主な利点は、ユーザーがクラウドサービスに依存する必要がないことです。

開発者やAI愛好家は、CPU、GPU、NPUなどのハードウェアをリアルタイム・アプリケーションにフル活用しながら、YOLO モデルを簡単に実行し、微調整することができます。Intel OpenVINO ツールキットは、Ultralytics YOLO モデルと組み合わせることで、高度なAI機能をパーソナル・デバイスに直接もたらす新たな可能性を開き、さまざまな業界でAIイノベーションを推進することを熱望する開発者にとって理想的な選択肢となります。

協力して革新を起こしましょう。GitHubリポジトリにアクセスして、私たちの貢献を探り、コミュニティと交流してください。私たちがAIをどのように活用して、製造業ヘルスケアなどの業界に影響を与えているかをご覧ください。

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる