Ultralytics YOLO によるリアルタイム推論が、自律走行やセキュリティ・システムなどのAIアプリケーションの即時予測をどのように可能にするかをご覧ください。
リアルタイム推論とは、学習された機械学習(ML)モデルが、新しいデータが到着すると即座に予測や決定を行うプロセスを指す。時間をかけて収集されたデータをまとめて処理するバッチ推論とは異なり、リアルタイム推論は低レイテンシーと即時応答を優先します。この機能は、ライブ・データ・ストリームに基づく即時のフィードバックやアクションを必要とするアプリケーションに不可欠であり、リアルタイム・コンピューティングの原則に沿い、変化する状況にシステムが動的に反応することを可能にする。
実際には、リアルタイム推論とは、以下のようなMLモデルを展開することを意味する。 Ultralytics YOLOモデルのようなMLモデルを配置し、個々のデータ入力(ビデオフレームやセンサーの読み取り値など)を分析し、最小限の遅延で出力を生成できるようにすることです。重要なパフォーマンス指標は推論レイテンシ(入力を受けてから予測を生成するまでにかかる時間)です。低遅延を達成するには、モデル自体の最適化や、特殊なハードウェアやソフトウェアの活用など、いくつかの戦略が必要になることが多い。
主な違いは、データの処理方法とそれに伴うレイテンシー要件にある:
リアルタイム推論は、瞬時の意思決定が重要な現代の人工知能(AI)アプリケーションの多くに力を与えている:
リアルタイム・アプリケーションでモデルを十分に高速に動作させるには、多くの場合、大幅な最適化が必要になる:
以下のようなモデル Ultralytics YOLO11のようなモデルは、効率と精度を念頭に置いて設計されているため、リアルタイムの物体検出タスクに適している。Ultralytics HUBのようなプラットフォームは、学習、最適化(例:ONNXへのエクスポート)、最適化(例:ONNXへのエクスポート)、最適化(例:ONNXへのエクスポート)のためのツールを提供します。 ONNXやTensorRT 形式へのエクスポートなど)、モデルのデプロイを行うツールを提供し、さまざまなデプロイメントオプションにわたるリアルタイム推論ソリューションの実装を容易にします。