Ultralytics YOLO11を使用したバッチ推論の実行
さまざまなコンピュータビジョンアプリケーションでUltralytics YOLO11を使用する際の、リアルタイム推論とバッチ推論の違いを探求します。

自動運転車が実際に走行している様子を見たことがあれば、リアルタイムAI推論を目の当たりにしたことになります。自動運転車は通常、カメラ、センサー、AIを使用して周囲の状況を処理し、ほぼ瞬時に判断を下します。しかし、迅速な応答が必要ない場合、リアルタイム推論はリソースを大量に消費する可能性があります。
このような場合に適した選択肢がバッチ推論です。データをリアルタイムで継続的に処理するのではなく、バッチ推論では大量のデータをスケジュールされた間隔で処理できます。この手法は、リソースの節約、消費電力の削減、インフラストラクチャコストの削減に役立ちます。
例えば、コンピュータビジョンのアプリケーションにおいて、Ultralytics YOLO11のようなモデルは、物体検出やインスタンスセグメンテーションといったリアルタイムのタスクに使用できます。しかし、大量の視覚データをリアルタイムで処理することは負荷がかかる場合があります。

図1。YOLO11を使用して画像内のオブジェクトをセグメンテーションする例。
バッチ推論を使用すると、YOLO11を視覚データに対してバッチ単位で実行できるため、パフォーマンスを犠牲にすることなくシステムの負荷を軽減し、効率を向上させることができます。これにより、ハードウェアに過負荷をかけたりコストを増大させたりすることなく、Vision AIソリューションを大規模に導入しやすくなります。
この記事では、バッチ推論とその利点、そしてコンピュータビジョンアプリケーションにおいてYOLO11を使用したバッチ推論をどのように適用できるかを探ります。それでは始めましょう!
Link to this sectionコンピュータビジョンにおけるバッチ推論の概要#
バッチ推論とは、データが入ってくるたびに個別に処理するのではなく、一度にまとめて大きなタスクに取り組むようなものだと考えてください。リアルタイムで常にデータを処理するのではなく、バッチ推論ではデータの大きなグループを一定の間隔で処理できます。この手法は即時の応答が必要ない場合に非常に効率的で、コンピューティングリソースの節約、エネルギー消費の削減、コスト削減に役立ちます。
コンピュータビジョンに関しては、低遅延が不可欠な特定のアプリケーションが存在します。低遅延とは、入力(画像やビデオフレームなど)を受け取ってからシステムが応答するまでの最小限の遅延を指します。例えば、リアルタイムのセキュリティ監視では、わずかな遅延でも安全上のリスクにつながる可能性があります。
しかし、他の多くのコンピュータビジョンシナリオでは、低遅延はそれほど重要ではありません。ここでバッチ推論が威力を発揮します。システムが即座に反応する必要がない場合です。バッチ推論は、視覚データをグループまたはバッチでコンピュータビジョンモデルに供給することで、大規模なデータセットをリアルタイムで継続的に処理するのではなく、一度に処理できるようにします。
Link to this sectionバッチ推論の仕組みを理解する#
バッチ推論に伴うステップを詳しく見ていきましょう:
-
データ収集: 視覚データは一定期間にわたって収集されます。これには、アプリケーションに応じて、セキュリティ映像、製品画像、顧客データなどが含まれます。
-
バッチ準備: 収集されたデータは、バッチとしてグループ化されます。このステップ中に、データはモデルが必要とする形式にフォーマットされます。例えば、画像のリサイズ、正規化、またはモデルが処理するための適切な形式への変換が行われます。
-
予測: データが準備されると、バッチ全体がモデル(YOLO11など)に入力され、バッチ全体が一度に処理されます。これにより、モデルはバッチ内のすべてのデータの予測を同時に行うことが可能になり、各データポイントを個別に行う場合と比較してプロセスがより効率的になります。
Link to this sectionバッチ推論はいつ使用すべきか?#
バッチ推論とは何か、リアルタイム推論とどう違うのかを説明しましたので、次はいつ使用すべきかを詳しく見ていきましょう。
バッチ推論は過去のデータを分析するのに最適です。例えば、過去1ヶ月間にわたる地下鉄駅の監視カメラ映像があり、時間帯ごとの乗降客数などの特定のパターンを特定しようとしているとします。
各フレームをリアルタイムで処理するのではなく、バッチ推論を使用すれば、1ヶ月分の全映像をバッチ単位で処理し、即時の結果を必要とせずに主要なイベントや傾向を特定できます。この方法なら、大量のデータをより効率的に分析し、システムに過負荷をかけたり継続的な監視を必要としたりすることなく、長期的なパターンの洞察を得ることができます。
バッチ推論は、システムリソースが限られている場合にも最適なソリューションです。オフピーク時間帯(夜間など)に推論を実行することで、コンピューティングコストを節約し、ピーク利用時にシステムに過負荷がかからないようにすることができます。これは、大規模なデータセットを処理する必要があるが、リアルタイム分析を必要としない企業やプロジェクトにとって、効率的で費用対効果の高いアプローチです。
Link to this sectionUltralytics YOLO11を使用したバッチ推論#
Ultralytics Pythonパッケージは、YOLO11のようなモデルのバッチ推論をサポートしています。YOLO11では、「batch」引数を指定することで簡単にバッチ推論を実行でき、一度に何枚の画像やビデオフレームを処理するかを決定できます。
バッチ推論プロセス中、バッチ内のすべての画像に対する予測が同時に生成されます。デフォルトではバッチサイズは1に設定されていますが、好みの数値に調整可能です。
例えば、バッチサイズを5に設定した場合、YOLO11は5枚の画像またはビデオフレームを一度に処理し、5枚すべてに対する予測を同時に生成します。バッチ内で複数の画像を処理することは個別に行うよりも効率的であるため、一般的にバッチサイズを大きくすると推論時間は短縮されます。
Link to this sectionバッチ推論によって実現されるコンピュータビジョンアプリケーション#
次に、バッチ推論の現実的なコンピュータビジョンのユースケースをいくつか探ってみましょう。
Link to this sectionヘルスケアにおける診断と研究の強化#
医学研究では、大量の視覚データを扱うことが非常に一般的です。ここでは、バッチ推論が化学、生物学、遺伝学などの分野で科学者がデータをより簡単に分析するのに役立ちます。一度に1つずつ分析するのではなく、データがバッチで処理されるため、時間と労力が節約されます。
例えば、医療施設では、MRIやCTスキャンなどの大量の医療画像を分析するのにバッチ推論が特に有用です。病院はこれらのスキャンを一日かけて収集し、夜間にバッチで処理することができます。
このアプローチにより、病院はハードウェアとスタッフをより有効に活用し、運用コストを削減し、すべてのスキャンが一貫した統一された方法でレビューされるようにすることができます。これはまた、膨大な量のデータを処理する必要がある大規模な研究プロジェクトや長期研究にも有益です。

図2。YOLO11を使用した医療スキャンの検出。
Link to this sectionシミュレーションを使用した自動運転車の改善#
自動運転車は、周囲の世界を処理するためにコンピュータビジョンのようなAI技術を使用しています。YOLO11のような高度なモデルの助けを借りて、車両のオンボードシステムは他の車両、車線、道路標識、歩行者を認識できます。路上ではリアルタイム推論が重要ですが、自動運転技術は舞台裏でのバッチ推論にも大きく依存しています。

図3。YOLO11は道路上の歩行者を容易に検出できます。
車が走行を完了した後、収集されたデータ(数時間のカメラ映像、センサー読み取り値、LIDARスキャンなど)は、後で大規模なバッチで処理されます。これにより、エンジニアは車両のAIモデルを更新し、システムの安全性を高め、さまざまな運転状況に対応する能力を向上させることができます。
バッチ推論は、自動運転シミュレーションでも使用され、混雑した交差点でのナビゲーションや予測不能な歩行者の動きへの対応など、さまざまな状況で自動運転車がどのように反応するかをテストします。このアプローチは時間を節約し、コストを削減し、すべてのシナリオを実生活でテストすることに関連するリスクを回避します。
Link to this sectionバッチ推論による小売データ分析#
同様に、小売店では、YOLO11のようなコンピュータビジョンモデルを使用したバッチ推論により、運用効率を大幅に向上させることができます。例えば、店舗のカメラシステムは一日を通して数千枚の画像をキャプチャでき、それらを夜間にバッチで処理できます。
これにより、店舗はリアルタイム処理(小規模な店舗では困難な場合があります)を必要とせずに、顧客の行動、通行パターン、製品との対話など、店内で何が起こっているかを分析できます。
もう1つの興味深い例は、バッチ推論を使用してヒートマップを生成することです。これは、店舗内の顧客のアクティビティが高いエリアと低いエリアを可視化します。これらのヒートマップを分析することで、小売業者はどのエリアが最も通行量が多く、店舗のどの部分がより注意を必要とするか、または製品配置の最適化が必要かを特定できます。このデータは、小売業者が店舗レイアウト、製品配置、さらには顧客体験と売上を向上させるための販促戦略について、より良い決定を下すのに役立ちます。

図4。ヒートマップは、小売業者が店舗内の人気エリアを特定するのに役立ちます。
Link to this sectionバッチ推論の長所と短所#
バッチ推論がさまざまな業界にもたらす主な利点は以下の通りです:
- 統合の容易さ: バッチ推論は既存のワークフローに簡単に統合できます。特に、小売、セキュリティ、ヘルスケアなど、大量のデータを一括で処理する必要がある業界において有効です。
- データ管理の簡素化: 大量のデータを扱う場合、データは管理可能なチャンクにグループ化されるため、バッチ推論によってデータ管理が合理化されます。これにより、時間の経過とともにデータを追跡、レビュー、整理しやすくなります。
- ネットワーク負荷の低減: データをバッチで処理すると、特定の瞬間に転送されるデータ量を最小限に抑えることができるため、クラウドベースのシステムや分散コンピューティング環境におけるネットワークリソースの負荷が軽減されます。
バッチ推論には多くの利点がありますが、考慮すべき制限もいくつかあります。留意すべき要因をいくつか挙げます:
- ストレージ要件: バッチ処理のために大きなデータセットを保存すると、特に高解像度の画像、ビデオ、または大量のデータの場合、ストレージコストが大幅に増加する可能性があります。
- バックログの可能性: データが急速に蓄積されたり、大きなバッチが時間通りに処理されなかったりすると、バックログ(処理の滞留)が発生する可能性があります。これは、洞察の提供や新しいデータのタイムリーな処理の遅延につながる可能性があります。
- リソースの急増: 大きなバッチ、特に高解像度の画像を含むものは、メモリやコンピューティング使用量のスパイクを引き起こす可能性があります。適切に管理されていない場合、これらのスパイクがシステムに過負荷をかけ、速度低下やクラッシュにつながる可能性があります。
Link to this section重要なポイント#
バッチ推論は、即時の結果を必要としない大量の視覚データを処理するための効率的な方法です。各画像をリアルタイムで分析するのではなく、夜間などの予定された時間にバッチ単位で処理します。
この方法は費用対効果が高く、計算負荷を軽減し、正確な結果を提供します。店舗の在庫管理から医師の医療スキャン分析の支援、自動運転車技術の強化まで、バッチ推論はコンピュータビジョンをよりアクセスしやすく、手頃な価格で、実用的なアプリケーションにとって実用的なものにします。
AIの世界へ深く飛び込む準備はできましたか?GitHubリポジトリを探索し、コミュニティとつながり、ライセンスオプションをチェックして、コンピュータビジョンの旅を始めましょう。製造業におけるAIや物流業界におけるコンピュータビジョンといったイノベーションの詳細については、ソリューションページをご覧ください。






