Yolo 深圳
深セン
今すぐ参加
用語集

マルチオブジェクトトラッキング(MOT)

マルチオブジェクトトラッキング(MOT)の探求:YOLO11、カルマンフィルター、アピアランスマッチング、最新のデータアソシエーションを使って、ビデオフレーム全体でオブジェクトをtrack し、再識別します。

マルチオブジェクトトラッキング(MOT)は、コンピュータビジョンにおける極めて重要なタスクである。 コンピュータビジョンにおける極めて重要なタスクである。 ビデオストリーム内の複数の別個のエンティティを検出し、連続するフレーム間でそれらのユニークなアイデンティティを維持する。一方 標準的な物体検出は、単一の静止画像に存在するものを識別する。 標準的な物体検出は、1つの静止画像に存在するものを特定する。 という疑問に答えます。検出された各インスタンスに永続的な識別番号(ID)を割り当てることで、MOTは以下のことを可能にする。 システムは軌跡を分析し、相互作用を理解し、ユニークなアイテムを数えることができる。 現代の映像理解アプリケーションの基本要素となっている。

トラッキング・システムのメカニズム

を動力源とするものも含め、ほとんどの最新MOTシステムは、このようなものである。 YOLO11を搭載したものも含め、最先端のMOTシステムのほとんどは、"トラッキング・バイ・ディテクション "パラダイムで作動している。 パラダイムで作動する。このワークフローでは、プロセスを明確な段階に分け、映像のフレームごとにそれを繰り返すことで、高い精度と連続性を確保している。 精度と連続性を確保する。

  1. 検出:システムはまず、高性能モデルを利用して、関心のあるオブジェクトを見つける、 バウンディングボックスと 信頼スコアを生成する。
  2. モーション予測:フレーム間の検出を関連付けるために、以下のようなアルゴリズムが使用される。 カルマンフィルターのようなアルゴリズムは、過去の速度と位置に基づいて カルマンフィルターのようなアルゴリズムは、過去の速度と位置に基づいてオブジェクトの将来の位置を推定します。これにより 状態推定を作成し、次のフレームの探索範囲を狭める。 次のフレーム
  3. データの関連付け:システムは新しい検出を既存のトラックと照合する。最適化技術 ハンガリー・アルゴリズムなどの最適化技術は を計算し、マッチングのコストを最小化する。 IoU計算する。 を計算します。
  4. 再識別(ReID):オブジェクトが経路を横切ったり、一時的に隠れたりするシナリオでは、オクルージョンと呼ばれる現象が発生します。 オクルージョンと呼ばれる現象 先進的なトラッカーは、視覚的な埋め込みを使用して、物体が再び現れたとき IDの切り替えを防ぎます。

MOTと関連するコンピュータ・ビジョン用語

特定のユースケースに適切な技術を選択するためには、MOTを類似概念と区別することが重要である。

  • 対オブジェクト検出:検出はすべてのフレームを独立したイベントとして扱う。車両が2つのフレームに連続 2つのフレームに連続して車両が現れた場合、検出器は2つの別々の「車」を見る。対照的に オブジェクト・トラッキングはこれらのインスタンスをリンクさせます、 同じ車両として認識します。
  • 対単一オブジェクト追跡(SOT):SOTは、ユーザーによって初期化された特定の1つのターゲットを追跡することに重点を置く SOTは、ユーザーによって初期化された特定のターゲットを追跡することに重点を置き、多くの場合、他のすべてのアクティビティを無視する。MOTは、シーンに出入りする未知で変動する物体を自律的にdetect、track、管理しなければならないため、より複雑である。 MOTはより複雑で、シーンに出入りする未知で変動するオブジェクトの数を自律的に検出、追跡、管理しなければならないため、堅牢なメモリ管理ロジックが必要となる。 メモリ管理ロジックが必要となる。

実際のアプリケーション

複数の物体を同時にtrack する能力は、生のビデオデータを実用的なデータに変換し、様々な業界のイノベーションを促進します。 データを実用的な 予測モデリングに変換します。

  • インテリジェント・トランスポーテーション自動車のAI 自動車のAI分野では、MOTは自律走行や交通監視に不可欠である。 自律走行や交通監視に欠かせない。これによってシステムは 行うことができる。 また、歩行者や自転車の軌跡を監視することで、衝突の可能性を予測することもできる。 歩行者や自転車の軌跡を監視することで、衝突の可能性を予測することができる。
  • リテール・アナリティクス実店舗がAIを活用 小売業におけるAIを活用した顧客行動の把握そのために MOTを適用することで、正確な物体カウントが可能になる、 を適用することで、足元の通行量を計測し、特定の通路での滞留時間を分析し、列管理を最適化することができる。 最適することができる。 体験ができる。
  • スポーツ分析コーチやアナリストはMOTを使って試合中の選手やボールをtrack する。この このデータは、高度なポーズ推定分析を容易にし、チームがフォーメーション、選手の疲労、ゲームダイナミクスを理解するのに役立ちます。 フォーメーション、選手の疲労、ゲームダイナミクスを理解するのに役立ちます。 リアルタイム推論シナリオ

Pythonトラッキングを実装する

について ultralytics パッケージは、以下のような強力なトラッカーを統合することで、MOTの複雑さを簡素化している。 ボット・ソート そして バイトトラック 予測パイプラインに直接 パイプラインに直接組み込まれる。これらのトラッカーは引数で簡単に入れ替えることができる。

以下の例は、事前に学習されたYOLO11 モデルをロードし、ビデオファイルにトラッキングを適用する方法を示しています:

from ultralytics import YOLO

# Load an official YOLO11 model pretrained on COCO
model = YOLO("yolo11n.pt")

# Perform tracking on a video file
# 'persist=True' ensures IDs are maintained between frames
# 'tracker' allows selection of algorithms like 'bytetrack.yaml' or 'botsort.yaml'
results = model.track(source="traffic_analysis.mp4", persist=True, tracker="bytetrack.yaml")

# Visualize the results
for result in results:
    result.show()

このコードは、検出からIDの割り当てまで、パイプライン全体を処理する。 のような高レベルのロジックに集中できる。 分析に集中できる。さらなるカスタマイズについては トラッキング・モードのドキュメントを参照。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加