Yolo 深圳
深セン
今すぐ参加

Ultralytics YOLO モデルを使った動画中の移動物体追跡ガイド

Abirami Vina

5分で読めます

2025年4月15日

コンピュータビジョントラッキングシステムの仕組みを学び、YOLO11ようなオブジェクトトラッキングをサポートする一般的なモデルを探求し、実際のアプリケーションを発見する。

電気部品を組み立てるロボット、スピード違反の車を捕まえるシステム、顧客の買い物をtrack するスマート小売ソリューションなど、これらのイノベーションはすべてコンピューター・ビジョンに依存している。コンピュータ・ビジョンは人工知能(AI)の一分野であり、機械が画像や動画を分析し理解するのを助ける。

例えば、ロボットが部品を正しく組み立てるには、異なる部品を認識し、それに従う必要がある。同様に、交通システムはコンピュータ・ビジョンを使って車を発見し、ナンバープレートを読み取り、誰かがスピード違反をしているときを把握することができる。一方、店舗では、ビジョンAIが顧客が何を見たり手に取ったりしてtrack し、在庫を監視することもできる。

このようなアプリケーションは、次のようなコンピュータビジョンモデルによって駆動されます。 Ultralytics YOLO11のようなコンピュータ・ビジョン・モデルによって支えられている。これらのタスクの多くは、1枚の画像から洞察を得ることに重点を置いていますが、特に興味深いタスクの1つである物体追跡は、一連の画像やビデオフレームを横断して物体の動きを追跡するために使用できます。

__wf_reserved_inherit
図1. 車両の検出と追跡の例。

このガイドでは、オブジェクトトラッキングがどのように機能するのかを詳しく見ていき、実際にどのように使用されているのか実例を探ります。また、Ultralytics YOLO11 ようなVision AIモデルがどのようにオブジェクトトラッキングをサポートしているかについても説明します。それでは始めましょう!

コンピュータビジョントラッキングシステムの詳細

オブジェクト・トラッキングは、ビデオフレームを横断するオブジェクトの動きを追跡するために使用されるコンピュータ・ビジョンのタスクで あり、システムが時間経過とともに物事がどのように変化するかを監視し理解するのに役立ちます。これは、テニスの試合を見ていて、ボールがコートを行ったり来たりするのを目でtrack ときのように、人間が動く人や物体を目で追うのとよく似ている。

同様に、物体追跡は、カメラとAIを使用して、ボールの動きをリアルタイムで追跡することを含みます。この技術は、特に速度、軌道、プレイヤーの位置などの分析を通じて、視聴者にゲームの流れをより良く理解させることができます。

この種の視覚的な追跡は人間にとっては簡単に見えるかもしれませんが、マシンビジョンにおいては、Vision AIモデルによって駆動される一連のステップが含まれます。物体追跡の仕組みを簡単に説明します。 

  • ビデオのキャプチャ: カメラはビデオ映像を記録し、オブジェクトが時間とともにシーン内をどのように移動するかをキャプチャします。
  • 物体の検出:YOLO11 ようなAIを搭載したコンピュータ・ビジョン・モデルは、各フレームを分析し、人、車両、製品などの特定の物体を識別し、位置を特定することができる。
  • IDの割り当て: オブジェクトが検出されると、追跡アルゴリズムは一意のIDを割り当てて、複数のフレームにわたって追跡します。これにより、システムはオブジェクトが移動しても同じオブジェクトであることを認識します。
  • 動きの監視:システムは時間の経過に伴う動きを追跡し、このデータを使用して、速度、方向、他のオブジェクトとの相互作用などのデータを収集できます。
  • 洞察の生成: この情報は、リアルタイムで分析を提供したり、意思決定を支援したり、特定のユースケースに応じて視覚的なオーバーレイを強化するために使用できます。

YOLO物体検出とトラッキングの比較

YOLO11 サポートするもう1つのコンピュータビジョンタスクは、物体追跡と密接な関係がある物体検出である。この2つのタスクの違いを探ってみよう。 

物体検出とは、単一の画像またはビデオフレーム内で、関心のある物体を識別して位置を特定することです。たとえば、自動運転車は物体検出を使用して、車載カメラで撮影された単一のフレーム内の停止標識や歩行者を認識します。これは、「この画像には何があり、どこにあるのか」という質問に答えます。ただし、物体が次にどこへ行くかについての情報は提供しません。

物体追跡は、時間経過に伴う動きの理解を追加することにより、物体検出を基に構築されます。2つの主な違いは、時間と動きの処理方法です。物体検出は各フレームを独立したスナップショットとして扱いますが、物体追跡はフレーム間の点を結び付け、過去のデータを使用して物体の将来の位置を予測します。

この2つを組み合わせることで、ダイナミックな環境でリアルタイム追跡が可能な強力なビジョンAIシステムを構築することができる。例えば、自動化されたセキュリティシステムは、空間に入る人をdetect し、フレームを横切ってその動きを継続的にtrack することができる。

Ultralytics YOLO モデルを使ったリアルタイムトラッキング

さて、オブジェクト検出とトラッキングの違いを説明したところで、YOLO11ようなUltralytics YOLO モデルがどのようにリアルタイムのオブジェクトトラッキングをサポートしているかを見てみよう。

YOLO モデルはトラッキングアルゴリズムそのものではないが、各ビデオフレームでオブジェクトを検出することで重要な役割を果たしている。一旦オブジェクトが検出されると、トラッキング・アルゴリズムはそれらにユニークなIDを割り当て、システムがフレームからフレームへの動きを追跡できるようにする必要がある。 

このニーズに対応するため、Ultralytics Python パッケージは、物体検出をBoT-SORTやByteTrackのような一般的なトラッキングアルゴリズムとシームレスに統合します。この統合により、ユーザーは最小限のセットアップで検出とトラッキングを一緒に実行することができます。

YOLO モデルをオブジェクト追跡に使用する場合、アプリケーションの要件に基づいて適用する追跡アルゴリズムを選択できます。例えば、BoT-SORTは、動き予測とディープラーニングの使用により、予測不可能な動きをする物体を追跡するのに適したオプションです。一方、ByteTrackは混雑したシーンで特に優れたパフォーマンスを発揮し、オブジェクトがぼやけていたり、部分的に隠れていたりしても信頼性の高いトラッキングを維持します。

__wf_reserved_inherit
図2. Ultralytics Python パッケージは、BoT-SORTとByteTrackをシームレスに統合します。

カスタムYOLO モデルのトレーニングは、オブジェクト・トラッキングとどのように関係しているのですか?

カスタムトレーニングとは、YOLO11ような事前にトレーニングされた物体検出モデルを特定のデータセット上で微調整し、標準的なデータセットに含まれていない物体を認識できるようにするプロセスです。これは、トラッキングシステムがカスタムオブジェクトや珍しいオブジェクトを追跡する必要がある場合に特に重要です。

追跡システムは、最初に物体を認識する検出モデルに依存している。YOLO モデルが特定のアイテム、例えば特定のタイプの機械や野生動物の種をdetect できなければ、追跡アルゴリズムはそれを追うことができない。

そのため、カスタム・トレーニングが不可欠なのです。このトレーニングによって、検出モデルがtrackしたいオブジェクトを正確に識別できるようになります。

また、このプロセスで微調整されるのは検出モデルだけであることも覚えておく必要がある。BoT-SORTやByteTrackのようなトラッキングアルゴリズムは、カスタムトレーニングされたものではなく、単純にYOLO モデルからの出力を使用して、フレームをまたいで検出されたオブジェクトを追跡します。

Ultralytics YOLO物体追跡のアプリケーション

オブジェクト追跡とは何か、そしてそれがどのように機能するかをより深く理解したところで、この技術が影響を与えている現実世界の応用例をいくつか見ていきましょう。

速度推定にUltralytics YOLO 使用したリアルタイムトラッキング

コンピュータビジョンによって実現される速度推定システムは、物体検出や追跡などのタスクに依存しています。これらのシステムは、車両、自転車、または人でさえ、オブジェクトがどれくらいの速さで移動しているかを計算するように設計されています。この情報は、交通管理から安全監視、産業オートメーションまで、さまざまなアプリケーションにとって非常に重要です。

Ultralytics YOLO11ようなモデルを使えば、ビデオフレーム全体で物体を検出し、追跡することができる。特定の期間に物体がどれだけ移動したかを分析することで、システムはその速度を推定することができる。 

__wf_reserved_inherit
図3.速度推定にYOLO11物体追跡機能を使用。

製造業における物体追跡の探求

製造工程はテンポが速く、非常に複雑であるため、手作業で生産されるすべてのアイテムをtrack することは困難です。オブジェクト・トラッキングは、生産の各段階を通過する製品の監視を自動化するための優れたソリューションを提供します。工場のスピードを落とすことなく、高い精度と効率を維持することができます。

コンベアベルト上の製品のカウントから、欠陥の発見、適切な組み立ての検証まで、物体追跡は、時間のかかる、またはエラーが発生しやすいタスクに可視性と制御をもたらします。この技術は、速度と精度が重要な食品加工、エレクトロニクス、包装などの大量生産産業において特に影響力があります。

__wf_reserved_inherit
図4. YOLO11使用した、組立ライン上の食品の追跡と計数の例。

小売分析におけるオブジェクト追跡の概要

小売店には毎日数え切れないほどの顧客が出入りしますが、顧客の行動を理解することは、顧客体験とビジネスパフォーマンスの両方を向上させる鍵となります。オブジェクト追跡により、小売業者は、侵襲的な方法や手作業による方法を必要とせずに、来店者数の測定、滞留時間の計測、移動パターンの分析を行うことができます。

個人が店舗に出入りし、移動する際に追跡することで、企業はピーク時、人気のあるエリア、さらには行列の長さを把握できます。これらの洞察は、人員配置、店舗レイアウト、在庫配置に関する意思決定に役立ち、最終的には業務の効率化と売上の増加につながります。

__wf_reserved_inherit
図5.YOLO11物体追跡能力を使って、店舗に出入りする人々を監視する。

物体追跡の利点と欠点

小売店から工場のフロアまで、物体追跡は、効率、安全性、全体的な体験などの要素を改善するために、あらゆる種類の産業で使用されています。物体追跡がさまざまな産業にもたらすことができる主な利点をいくつかご紹介します。

  • リアルタイムアラートを有効にする:オブジェクト追跡と統合されたシステムは、制限区域への人の立ち入りや、配達物が1か所に長時間放置されているなど、異常が検出された場合に自動的にアラートをトリガーするように構成できます。
  • 他のシステムとの統合: オブジェクト追跡データは、顔認識、サーマルカメラ、在庫管理システムなどの他のテクノロジーと組み合わせて、さらに強力な洞察を得ることができます。
  • 長期的には費用対効果が高い:初期設定には投資が必要になる場合がありますが、自動追跡により、手作業の必要性が減り、エラー率が低下し、長期的に運用コストが削減されます。

これらの利点は、物体追跡がさまざまなユースケースにどのようにプラスの影響を与えるかを示していますが、その実装に伴う課題を考慮することも重要です。物体追跡のいくつかの制限事項について詳しく見ていきましょう。

  • 密集した環境における困難さ:コンサート、ショッピングセンター、または都市の通りなどの混雑した場所では、追跡システムは互いに接近している人や物体を区別するのが難しく、混乱や不正確な結果につながる可能性があります。
  • 環境条件に敏感: 特に屋外や制御されていない環境では、劣悪な照明、霧、速い動き、手ぶれなどが、対象物を正確にtrack するシステムの能力に影響を与える可能性があります。
  • プライバシーと法的懸念: 個人データの不適切な取り扱い、ユーザーの同意の欠如、または公共スペースでの監視は、倫理的な問題を引き起こし、プライバシー法に違反する可能性があります。

主なポイント

物体追跡は、機械が時間の経過とともに物体の動きを追跡できるようにするコンピュータビジョンのタスクです。車両の速度の推定や組立ラインでの製品のカウントから、スポーツでの選手の動きの分析まで、幅広い現実世界のシナリオで使用されています。

YOLO11 ようなVision AIモデルや、BoT-SORTやByteTrackのようなトラッキング・アルゴリズムにより、オブジェクト・トラッキングはより速く、よりスマートに、そして様々な業界においてより利用しやすくなりました。オブジェクトトラッキング技術が進化するにつれ、システムはよりインテリジェントになり、効率的になり、1フレームずつ反応するようになります。

コンピュータビジョンと AI についてもっと知りたいですか? GitHub リポジトリを探索し、コミュニティとつながり、ライセンスオプションを確認して、コンピュータビジョンプロジェクトを始めましょう。製造業における AI自動車産業におけるコンピュータビジョンなどのイノベーションに関心がある場合は、ソリューションページをご覧ください。 

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる