Yolo 深圳
深セン
今すぐ参加
用語集

物体追跡

Ultralyticsオブジェクトトラッキングをご覧ください!リアルタイムのアプリケーションのためにYOLO モデルを使用してビデオ内の動き、行動、相互作用をtrack する方法を学びます。

物体追跡は、コンピュータビジョン(CV コンピュータビジョン(CV)における極めて重要なタスクである。 ビデオシーケンス内の特定のエンティティを特定し、連続するフレームをまたいでその動きを監視する。静的な画像解析とは異なり このプロセスは、静的な画像分析とは異なり、時間的な次元を導入することで、システムがシーンを横断する際に、検出された各アイテムの一意のアイデンティティを維持することを可能にする。 検出されたアイテムがシーンを横断する際に、システムは一意のIDを維持することができます。各エンティティに永続的な識別番号(ID)を割り当てることで、人工知能(AI)モデルは、各エンティティを識別することができる、 人工知能(AI)モデルは 軌跡を分析し、速度を計算し、時間の経過に伴う相互作用を理解することができる。この機能は この機能は、生の映像データを実用的な洞察に変換し、高度な映像理解システムのバックボーンとして機能するために不可欠です。 ビデオ理解システムのバックボーンとして機能します。

トラッキングの核となるメカニズム

最新のトラッキングシステムは通常、"トラッキング・バイ・ディテクション "のパラダイムで運用されている。このワークフローは のような物体検出モデルから始まる。 最先端の YOLO11のような物体検出モデルから始まる。 のようなオブジェクト検出モデルから始める。オブジェクトが検出され バウンディング・ボックスで位置が特定されると、トラッキング・アルゴリズ これらの検出を前のフレームからの既存のトラックと関連付ける。

このプロセスには一般的に3つの重要なステップがある:

  1. 動きの予測:カルマンフィルター(KF)のようなアルゴリズム カルマンフィルター(KF)のようなアルゴリズムは、物体の過去の の位置と速度を用いて、次のフレームに現れるであろう場所を推定する。この予測により、探索範囲が狭まる。 を絞り込み、計算効率を大幅に向上させます。
  2. データの関連付け:システムは、ハンガリー・アルゴリズムのような最適化手法を用いて、新しく検出された物体を既存のトラックにマッチングさせる。 手法で既存のトラックとマッチングさせます。このステップ は以下のようなメトリクスに依存する。 空間的な重なりや視覚的特徴の類似IoU表す 空間的な重なりや視覚的な特徴の類似性。
  3. アイデンティティの維持:洗練されたトラッカー ByteTrackおよび ByteTrackやBoT-SORTのような高度なトラッカーは、物体が経路を横切ったり オブジェクトが経路を横切ったり、一時的に障害物の後ろに隠れたり(オクルージョン)する複雑なシナリオを処理します。特徴抽出と 特徴抽出とディープラーニング 特徴抽出とディープラーニングによる埋め込みを利用することで、物体が再び現れた後でも再識別することができ、"IDスイッチング "を防ぐことができる。

オブジェクト追跡 vs. 物体検出

これらの用語はしばしば一緒に言及されるが、機械学習(ML)パイプラインでは、それぞれ異なる目的を果たす。 機械学習(ML)パイプラインでは、それぞれ異なる目的を果たす。

  • 物体検出は、"この画像のどこに何が写っているか?"という質問に答えるものです。それは すべてのフレームを独立したイベントとして扱い、クラスラベルと信頼度スコアを出力する。 出力する。
  • 物体追跡は、"この特定の物体はどこに向かっているのか?"に答えます。それは検出されたものを時間軸で結びつけ フレーム10の車がフレーム100の車と同じ車であることを認識することができます。 この区別は 行動の予測モデリング

実際のアプリケーション

物体を確実に追跡する能力は、ダイナミックな環境でのリアルタイム推論を可能にすることで、さまざまな産業を変革している。 ダイナミックな環境におけるリアルタイムの推論を可能にします。

  • 高度道路交通システム自律走行車の領域では 自律走行車の領域では は譲れない。自動運転車は、歩行者、自転車、他の車両をtrack 、それらの将来の位置を予測し、衝突を回避しなければならない。 衝突を回避しなければならない。これには多くの場合、カメラと LiDARセンサーのデータを融合させ、さまざまな気象条件下で精度を維持する必要がある。
  • 小売分析:実店舗がAIを活用 小売業ではAIを活用してカスタマージャーニーをマッピングします。移動パターンを追跡することで ヒートマップを作成し、滞留時間を分析し、店舗レイアウトを最適化することができます。 レイアウトを最適化することができる。このデータは、効率的な このデータは、効率的な待ち行列管理と在庫配置に役立ちます。
  • スポーツ分析:プロチームはトラッキングを活用して選手のパフォーマンスを分析しています。トラッキングとポーズ推定を組み合わせることで トラッキングとポーズ推定を組み合わせることで、コーチはバイオメカニクスやスピード、チームフォーメーションを評価することができます。 バイオメカニクス、スピード、チームのフォーメーションを評価し、データ主導の戦略によって競争力を高めることができます。

Pythonトラッキングを実装する

を使えば、高性能なトラッキングを簡単に実装できます。 ultralytics パッケージ次の をロードする方法を示す。 YOLO11 モデル ビデオファイル内のオブジェクトをtrack します。その track モードでは、検出とID割り当てが自動的に行われる。

from ultralytics import YOLO

# Load the official YOLO11 nano model
model = YOLO("yolo11n.pt")

# Track objects in a video source (use '0' for webcam)
# The 'show=True' argument visualizes the tracking IDs in real-time
results = model.track(source="https://supervision.roboflow.com/assets/", show=True)

# Print the unique IDs detected in the first frame
if results[0].boxes.id is not None:
    print(f"Tracked IDs: {results[0].boxes.id.cpu().numpy()}")

関連概念

トラッキングのニュアンスを完全に把握するためには、以下のことを理解することが役に立つ。 マルチオブジェクトトラッキング(MOT)。 特に、混雑したシーンで複数のターゲットを同時に扱うことに焦点を当てています。さらに、トラッキングはしばしば インスタンスセグメンテーションと組み合わせて さらに、トラッキングはしばしばインスタンス分割と組み合わされ、単なるバウンディングボックスではなく、正確なオブジェクトの輪郭をトラッキングする。 イメージングやロボット操作のようなタスクに対して、より高度な粒度を提供します。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加