グリーンチェック
クリップボードにコピーされたリンク

Ultralytics YOLO モデルを使った動画中の移動物体追跡ガイド

コンピュータビジョントラッキングシステムの仕組みを学び、YOLO11ようなオブジェクトトラッキングをサポートする一般的なモデルを探求し、実際のアプリケーションを発見する。

電気部品を組み立てるロボット、スピード違反の車を捕まえるシステム、顧客の買い物を追跡するスマート小売ソリューションなど、これらのイノベーションはすべてコンピューター・ビジョンに依存している。コンピュータ・ビジョンは人工知能(AI)の一分野であり、機械が画像や動画を分析し理解するのを助ける。

例えば、ロボットが部品を正しく組み立てるには、異なる部品を認識し、それに従う必要がある。同様に、交通システムはコンピュータ・ビジョンを使って車を発見し、ナンバープレートを読み取り、誰かがスピード違反をしているときを把握することができる。一方、店舗では、ビジョンAIが顧客が何を見たり手に取ったりしているかを追跡し、在庫を監視することもできる。

このようなアプリケーションは、次のようなコンピュータビジョンモデルによって駆動されます。 Ultralytics YOLO11のようなコンピュータ・ビジョン・モデルによって支えられている。これらのタスクの多くは、1枚の画像から洞察を得ることに重点を置いていますが、特に興味深いタスクの1つである物体追跡は、一連の画像やビデオフレームにわたる物体の動きを追跡するために使用できます。

図1.車の検出と追跡の例。

このガイドでは、オブジェクトトラッキングがどのように機能するのかを詳しく見ていき、実際にどのように使用されているのか実例を探ります。また、Ultralytics YOLO11 ようなVision AIモデルがどのようにオブジェクトトラッキングをサポートしているかについても説明します。それでは始めましょう!

コンピュータビジョントラッキングシステムを詳しく見る

オブジェクト・トラッキングは、ビデオフレームを横断するオブジェクトの動きを追跡するために使用されるコンピュータ・ビジョンのタスクで あり、システムが時間経過とともに物事がどのように変化するかを監視し理解するのに役立ちます。これは、テニスの試合を見ていて、ボールがコートを行ったり来たりするのを目で追うときのように、人間が動く人や物体を目で追うのとよく似ている。

同じように、オブジェクトトラッキングでは、カメラとAIを使ってボールの動きをリアルタイムで追う。この技術は、特にスピード、軌道、選手の位置などの分析を通じて、家庭の視聴者に試合の流れをより深く理解させることができる。

このようなビジュアル・トラッキングは人間には簡単に見えるかもしれませんが、マシン・ビジョンに関しては、Vision AIモデルによる一連のステップが必要です。オブジェクト・トラッキングの仕組みを簡単に説明しよう: 

  • ビデオを撮る:カメラはビデオ映像を記録し、時間の経過とともに物体がシーン内をどのように移動するかを捉える。
    ‍。
  • 物体の検出:YOLO11 ようなAIを搭載したコンピュータ・ビジョン・モデルは、各フレームを分析し、人、車両、製品などの特定の物体を識別し、位置を特定することができる。
  • IDの割り当て:物体が検出されると、追跡アルゴリズムはその物体に一意のIDを割り当て、複数のフレームにまたがってそれを追跡し、物体が移動しても同じ物体であることをシステムが認識できるようにする。
  • 動きのモニタリング:システムは時間の経過とともに動きを追跡し、このデータを使って速度、方向、他の物体との相互作用などのデータを収集することができる。
  • 洞察の生成:この情報は、分析、意思決定の支援、視覚的なオーバーレイのためにリアルタイムで使用することができます - 特定のユースケースに応じて。

YOLO物体検出とトラッキングの比較

YOLO11 サポートするもう1つのコンピュータビジョンタスクは、物体追跡と密接な関係がある物体検出である。この2つのタスクの違いを探ってみよう。 

物体検出は、1つの画像またはビデオフレーム内で関心のある物体を識別し、位置を特定することを含む。例えば、自動運転車は、車載カメラで撮影された単一フレーム内の一時停止標識や歩行者を認識するために物体検出を使用します。これは次のような質問に答えるものだ:「この画像には何が写っているのか?しかし、その物体が次にどこへ行くのかという情報は得られない。

オブジェクトトラッキングは、オブジェクト検出の上に、時間経過に伴う動きの理解を加えたものである。両者の主な違いは、時間と動きの扱い方です。オブジェクト検出は各フレームを独立したスナップショットとして扱いますが、オブジェクトトラッキングはフレーム間の点をつなぎ、過去のデータを使ってオブジェクトの将来の位置を予測します。

この2つを組み合わせることで、ダイナミックな環境でリアルタイム追跡が可能な強力なビジョンAIシステムを構築することができる。例えば、自動化されたセキュリティシステムは、空間に入る人を検知し、フレームを横切ってその動きを継続的に追跡することができる。

Ultralytics YOLO モデルを使ったリアルタイムトラッキング

さて、オブジェクト検出とトラッキングの違いを説明したところで、YOLO11ようなUltralytics YOLO モデルがどのようにリアルタイムのオブジェクトトラッキングをサポートしているかを見てみよう。

YOLO モデルはトラッキングアルゴリズムそのものではないが、各ビデオフレームでオブジェクトを検出することで重要な役割を果たしている。一旦オブジェクトが検出されると、トラッキング・アルゴリズムはそれらにユニークなIDを割り当て、システムがフレームからフレームへの動きを追跡できるようにする必要がある。 

このニーズに対応するため、Ultralytics Python パッケージは、物体検出をBoT-SORTやByteTrackのような一般的なトラッキングアルゴリズムとシームレスに統合します。この統合により、ユーザーは最小限のセットアップで検出とトラッキングを一緒に実行することができます。

YOLO モデルをオブジェクト追跡に使用する場合、アプリケーションの要件に基づいて適用する追跡アルゴリズムを選択できます。例えば、BoT-SORTは、動き予測とディープラーニングの使用により、予測不可能な動きをする物体を追跡するのに適したオプションです。一方、ByteTrackは混雑したシーンで特に優れたパフォーマンスを発揮し、オブジェクトがぼやけていたり、部分的に隠れていたりしても信頼性の高いトラッキングを維持します。

図2. Ultralytics Python パッケージは、BoT-SORTとByteTrackをシームレスに統合します。

カスタムYOLO モデルのトレーニングは、オブジェクト・トラッキングとどのように関係しているのですか?

カスタムトレーニングとは、YOLO11ような事前にトレーニングされた物体検出モデルを特定のデータセット上で微調整し、標準的なデータセットに含まれていない物体を認識できるようにするプロセスです。これは、トラッキングシステムがカスタムオブジェクトや珍しいオブジェクトを追跡する必要がある場合に特に重要です。

追跡システムは、最初に物体を認識する検出モデルに依存している。YOLO モデルが特定のアイテム、例えば特定のタイプの機械や野生動物の種を検出できなければ、追跡アルゴリズムはそれを追うことができない。

そのため、カスタム・トレーニングが不可欠なのです。このトレーニングによって、検出モデルが追跡したいオブジェクトを正確に識別できるようになります。

また、このプロセスで微調整されるのは検出モデルだけであることも覚えておく必要がある。BoT-SORTやByteTrackのようなトラッキングアルゴリズムは、カスタムトレーニングされたものではなく、単純にYOLO モデルからの出力を使用して、フレームをまたいで検出されたオブジェクトを追跡します。

Ultralytics YOLO物体追跡のアプリケーション

オブジェクト・トラッキングとは何か、どのように機能するのかについて理解を深めたところで、この技術がインパクトを与えている実際のアプリケーションをいくつか見てみよう。

速度推定にUltralytics YOLO 使用したリアルタイムトラッキング

コンピュータビジョンによって実現される速度推定システムは、物体の検出や追跡などのタスクに依存します。これらのシステムは、車両、自転車、人など、物体の移動速度を計算するように設計されています。この情報は、交通管理から安全監視、産業オートメーションまで、さまざまなアプリケーションにとって極めて重要です。

Ultralytics YOLO11ようなモデルを使えば、ビデオフレーム全体で物体を検出し、追跡することができる。特定の期間に物体がどれだけ移動したかを分析することで、システムはその速度を推定することができる。 

図3.速度推定にYOLO11物体追跡機能を使用。

製造業における物体追跡の探求

製造工程はテンポが速く、非常に複雑であるため、手作業で生産されるすべてのアイテムを追跡することは困難です。オブジェクト・トラッキングは、生産の各段階を通過する製品の監視を自動化するための優れたソリューションを提供します。工場のスピードを落とすことなく、高い精度と効率を維持することができます。

ベルトコンベア上の製品のカウントから、不良品の発見や適切な組み立ての確認まで、オブジェクトトラッキングは、通常であれば時間がかかったり、ミスが起こりやすかったりする作業に可視性と制御をもたらします。このテクノロジーは、スピードと精度が重要な食品加工、電子機器、パッケージングなどの大量生産産業において、特に大きな効果を発揮します。

図4. YOLO11使用した、組立ライン上の食品の追跡と計数の例。

リテール・アナリティクスにおけるオブジェクト・トラッキングの概要

毎日数え切れないほどの顧客が小売店舗を出入りしており、彼らの行動を理解することは、顧客体験とビジネスパフォーマンスの両方を向上させる鍵となります。オブジェクト・トラッキングにより、小売業者は、侵襲的または手動的な方法を必要とすることなく、足の往来を監視し、滞留時間を測定し、移動パターンを分析することが可能になります。

入店、退店、店内の移動を追跡することで、企業はピーク時間帯、人気エリア、さらには行列の長さに関する洞察を得ることができる。これらの洞察は、スタッフの配置、店舗のレイアウト、在庫の配置に関する意思決定に反映され、最終的にはより効率的なオペレーションと売上の増加につながります。

図5.YOLO11物体追跡能力を使って、店舗に出入りする人々を監視する。

オブジェクト・トラッキングの長所と短所

小売店から工場まで、オブジェクト・トラッキングは、効率性、安全性、全体的な体験などの要素を改善するために、あらゆる産業で利用されています。ここでは、オブジェクトトラッキングが様々な業界にもたらす主なメリットをご紹介します:

  • リアルタイムの警告が可能: オブジェクト追跡と統合されたシステムは、人が制限区域に入ったり、配達物が一か所に長く放置された りするなど、何か異常が検出されたときに自動的にアラートを発するように設定できます。
    ‍。
  • 他のシステムとの統合: 物体追跡データを、顔認識、サーマルカメラ、在庫システムなどの他のテクノロジーと組み合わせることで、さらに強力な洞察を得ることができます。
    ‍。
  • 長期的な費用対効果 初期セットアップには投資が必要かもしれないが、自動トラッキングは手作業の必要性を減らし、エラー率を下げ、長期的に運用コストを削減する。

これらの利点は、オブジェクトトラッキングが様々なユースケースにポジティブな影響を与えることを強調する一方で、その実装に伴う課題を考慮することも重要です。オブジェクトトラッキングの限界について詳しく見ていきましょう:

  • 混雑した環境での困難 混雑した環境: コンサート、ショッピングセンター、街路などの混雑した環境では、トラッキングシステムは近くにいる人や物を区別するのに苦労し、混乱や不正確な結果につながる可能性がある。
  • 環境条件に敏感: 特に屋外や制御されていない環境では、劣悪な照明、霧、速い動き、手ぶれなどが、対象物を正確に追跡するシステムの能力に影響を与える可能性があります。
  • プライバシーと法的懸念:個人データの不適切な取り扱い、ユーザー同意の欠如、公共空間での監視は、倫理的問題を引き起こし、プライバシー法の非遵守につながる可能性がある。

要点

オブジェクト・トラッキングは、機械が物体の動きを時間経過とともに追跡するコンピュータ・ビジョンのタスクです。車両速度の推定や組立ラインでの製品カウント、スポーツにおける選手の動きの分析など、実世界のさまざまな場面で使用されている。

YOLO11 ようなVision AIモデルや、BoT-SORTやByteTrackのようなトラッキング・アルゴリズムにより、オブジェクト・トラッキングはより速く、よりスマートに、そして様々な業界においてより利用しやすくなりました。オブジェクトトラッキング技術が進化するにつれ、システムはよりインテリジェントになり、効率的になり、1フレームずつ反応するようになります。

コンピュータビジョンとAIについてもっと知りたいですか?GitHubリポジトリを探索し、コミュニティとつながり、ライセンスオプションをチェックして、コンピュータビジョンプロジェクトを始めましょう。製造業におけるAIや 自動車産業におけるコンピュータビジョンのような革新的な技術をお探しなら、当社のソリューションページをご覧ください。 

リンクトインのロゴツイッターのロゴFacebookのロゴコピー・リンク・シンボル

このカテゴリの続きを読む

AIの未来
を一緒に作りましょう!

機械学習の未来への旅を始めよう