ヨロビジョン深圳
深セン
今すぐ参加

Ultralytics YOLOモデルを使用したビデオ内の移動物体の追跡に関するガイド

Abirami Vina

5分で読めます

2025年4月15日

コンピュータビジョントラッキングシステムがどのように機能するかを学び、YOLO11のような物体追跡をサポートする一般的なモデルを探求し、それらの現実世界のアプリケーションを発見します。

電気部品を組み立てるロボット、スピード違反の車を検知するシステム、顧客の購買行動を追跡するスマートリテールソリューションなど、これらのイノベーションはすべてコンピュータビジョンに依存しています。これは、機械が画像やビデオを分析し理解するのを支援する人工知能(AI)の一分野です。

例えば、ロボットは、さまざまな部品を認識して追跡し、正しく組み立てる必要があります。同様に、交通システムは、コンピュータビジョンを使用して、車を特定し、ナンバープレートを読み取り、誰かがスピード違反をしているかどうかを判断できます。一方、店舗では、Vision AI は、顧客が見ているものや手に取っているものを追跡したり、在庫を監視したりするのに役立ちます。

このようなアプリケーションは、Ultralytics YOLO11のようなコンピュータビジョンモデルによって実現されており、幅広い視覚タスクをサポートしています。これらのタスクの多くは、単一の画像から洞察を得ることに重点を置いていますが、特に興味深いタスクである物体追跡は、一連の画像またはビデオフレームにわたる物体の動きを追跡するために使用できます。

__wf_reserved_inherit
図1. 車両の検出と追跡の例。

このガイドでは、オブジェクト追跡の仕組みを詳しく見ていき、その使用例を実例を挙げて解説します。また、Ultralytics YOLO11のようなVision AIモデルがどのようにオブジェクト追跡をサポートしているかについても解説します。それでは始めましょう!

コンピュータビジョントラッキングシステムの詳細

物体追跡は、コンピュータビジョンのタスクであり、ビデオフレーム全体にわたる物体の動きを追跡するために使用され、システムが時間の経過とともに物事がどのように変化するかを監視および理解するのに役立ちます。これは、人間がテニスの試合を見ているときに、ボールがコート上を行ったり来たりするのを目で追うように、動いている人や物体を自然に目で追うことができる方法と非常によく似ています。

同様に、物体追跡は、カメラとAIを使用して、ボールの動きをリアルタイムで追跡することを含みます。この技術は、特に速度、軌道、プレイヤーの位置などの分析を通じて、視聴者にゲームの流れをより良く理解させることができます。

この種の視覚的な追跡は人間にとっては簡単に見えるかもしれませんが、マシンビジョンにおいては、Vision AIモデルによって駆動される一連のステップが含まれます。物体追跡の仕組みを簡単に説明します。 

  • ビデオのキャプチャ: カメラはビデオ映像を記録し、オブジェクトが時間とともにシーン内をどのように移動するかをキャプチャします。
  • オブジェクトの検出: YOLO11のようなAI搭載のコンピュータビジョンモデルは、各フレームを分析して、人、車両、製品などの特定のオブジェクトを識別して特定できます。
  • IDの割り当て: オブジェクトが検出されると、追跡アルゴリズムは一意のIDを割り当てて、複数のフレームにわたって追跡します。これにより、システムはオブジェクトが移動しても同じオブジェクトであることを認識します。
  • 動きの監視:システムは時間の経過に伴う動きを追跡し、このデータを使用して、速度、方向、他のオブジェクトとの相互作用などのデータを収集できます。
  • 洞察の生成: この情報は、リアルタイムで分析を提供したり、意思決定を支援したり、特定のユースケースに応じて視覚的なオーバーレイを強化するために使用できます。

YOLOによる物体検出とトラッキングの比較

YOLO11でサポートされているもう一つのコンピュータビジョンのタスクで、オブジェクト追跡と密接に関連しているのは、物体検出です。これらの2つのタスクの違いについて見ていきましょう。 

物体検出とは、単一の画像またはビデオフレーム内で、関心のある物体を識別して位置を特定することです。たとえば、自動運転車は物体検出を使用して、車載カメラで撮影された単一のフレーム内の停止標識や歩行者を認識します。これは、「この画像には何があり、どこにあるのか」という質問に答えます。ただし、物体が次にどこへ行くかについての情報は提供しません。

物体追跡は、時間経過に伴う動きの理解を追加することにより、物体検出を基に構築されます。2つの主な違いは、時間と動きの処理方法です。物体検出は各フレームを独立したスナップショットとして扱いますが、物体追跡はフレーム間の点を結び付け、過去のデータを使用して物体の将来の位置を予測します。

両方を組み合わせることで、動的な環境でリアルタイム追跡が可能な強力なVision AIシステムを構築できます。たとえば、自動化されたセキュリティシステムは、空間に入る人を検出し、フレーム全体でその動きを継続的に追跡できます。

Ultralytics YOLOモデルを使用したリアルタイム追跡

オブジェクト検出と追跡の違いについて説明したところで、YOLO11のようなUltralytics YOLOモデルがリアルタイムのオブジェクト追跡をどのようにサポートしているかを見ていきましょう。

YOLOモデルは追跡アルゴリズム自体ではありませんが、各ビデオフレームで物体を検出することにより、重要な役割を果たします。物体が検出されると、追跡アルゴリズムはそれらに一意のIDを割り当てる必要があり、システムはフレームごとにそれらの動きを追跡できます。 

このニーズに対応するため、Ultralytics Pythonパッケージは、物体検出をBoT-SORTやByteTrackのような一般的な追跡アルゴリズムとシームレスに統合します。この統合により、ユーザーは最小限のセットアップで検出と追跡を同時に実行できます。

YOLOモデルを物体追跡に使用する場合、アプリケーションの要件に基づいて適用する追跡アルゴリズムを選択できます。たとえば、BoT-SORTは、モーション予測と深層学習を利用しているため、予測不能な動きをする物体を追跡するのに適しています。一方、ByteTrackは、混雑したシーンで特に優れたパフォーマンスを発揮し、物体がぼやけていたり、部分的に隠れていたりする場合でも、信頼性の高い追跡を維持します。

__wf_reserved_inherit
Fig 2.  Ultralytics Pythonパッケージは、BoT-SORTとByteTrackをシームレスに統合します。

カスタムYOLOモデルのトレーニングは、オブジェクトトラッキングとどのように関連していますか?

カスタムトレーニングとは、YOLO11のような事前学習済みの物体検出モデルを、標準的なデータセットに含まれていない物体を認識できるように、特定のデータセットで微調整するプロセスです。これは、追跡システムがカスタムオブジェクトや一般的でないオブジェクトを追跡する必要がある場合に特に重要です。

追跡システムは、まずオブジェクトを認識する検出モデルに依存しています。YOLOモデルが、特定の種類の機械や野生生物など、特定のアイテムを検出できない場合、追跡アルゴリズムはそれを追跡できません。

カスタムトレーニングが不可欠なのはそのためです。カスタムトレーニングを行うことで、検出モデルが追跡したいオブジェクトを正確に識別できるようになります。

このプロセス中に微調整されるのは検出モデルのみであることに注意することも重要です。BoT-SORTやByteTrackなどの追跡アルゴリズムはカスタムトレーニングされていません。YOLOモデルからの出力を使用して、フレーム間で検出されたオブジェクトを追跡するだけです。

Ultralytics YOLOによる物体追跡の応用

オブジェクト追跡とは何か、そしてそれがどのように機能するかをより深く理解したところで、この技術が影響を与えている現実世界の応用例をいくつか見ていきましょう。

Ultralytics YOLOを使用した速度推定のためのリアルタイム追跡

コンピュータビジョンによって実現される速度推定システムは、物体検出や追跡などのタスクに依存しています。これらのシステムは、車両、自転車、または人でさえ、オブジェクトがどれくらいの速さで移動しているかを計算するように設計されています。この情報は、交通管理から安全監視、産業オートメーションまで、さまざまなアプリケーションにとって非常に重要です。

Ultralytics YOLO11のようなモデルを使用すると、ビデオフレーム全体でオブジェクトを検出および追跡できます。特定の期間にオブジェクトが移動する距離を分析することにより、システムはその速度を推定できます。 

__wf_reserved_inherit
Fig 3. 速度推定のためのYOLO11のオブジェクト追跡サポートの使用。

製造業における物体追跡の探求

製造プロセスはペースが速く、非常に複雑になる可能性があるため、生産されるすべてのアイテムを手動で追跡することは困難です。物体追跡は、製品が生産の各段階を移動する際の監視を自動化するための優れたソリューションを提供します。これにより、工場は速度を落とすことなく、高レベルの精度と効率を維持できます。

コンベアベルト上の製品のカウントから、欠陥の発見、適切な組み立ての検証まで、物体追跡は、時間のかかる、またはエラーが発生しやすいタスクに可視性と制御をもたらします。この技術は、速度と精度が重要な食品加工、エレクトロニクス、包装などの大量生産産業において特に影響力があります。

__wf_reserved_inherit
図4. YOLO11を使用して、組立ライン上の食品を追跡およびカウントする例。

小売分析におけるオブジェクト追跡の概要

小売店には毎日数え切れないほどの顧客が出入りしますが、顧客の行動を理解することは、顧客体験とビジネスパフォーマンスの両方を向上させる鍵となります。オブジェクト追跡により、小売業者は、侵襲的な方法や手作業による方法を必要とせずに、来店者数の測定、滞留時間の計測、移動パターンの分析を行うことができます。

個人が店舗に出入りし、移動する際に追跡することで、企業はピーク時、人気のあるエリア、さらには行列の長さを把握できます。これらの洞察は、人員配置、店舗レイアウト、在庫配置に関する意思決定に役立ち、最終的には業務の効率化と売上の増加につながります。

__wf_reserved_inherit
図5:YOLO11の物体追跡機能を利用して、店舗への出入りを監視。

物体追跡の利点と欠点

小売店から工場のフロアまで、物体追跡は、効率、安全性、全体的な体験などの要素を改善するために、あらゆる種類の産業で使用されています。物体追跡がさまざまな産業にもたらすことができる主な利点をいくつかご紹介します。

  • リアルタイムアラートを有効にする:オブジェクト追跡と統合されたシステムは、制限区域への人の立ち入りや、配達物が1か所に長時間放置されているなど、異常が検出された場合に自動的にアラートをトリガーするように構成できます。
  • 他のシステムとの統合: オブジェクト追跡データは、顔認識、サーマルカメラ、在庫管理システムなどの他のテクノロジーと組み合わせて、さらに強力な洞察を得ることができます。
  • 長期的には費用対効果が高い:初期設定には投資が必要になる場合がありますが、自動追跡により、手作業の必要性が減り、エラー率が低下し、長期的に運用コストが削減されます。

これらの利点は、物体追跡がさまざまなユースケースにどのようにプラスの影響を与えるかを示していますが、その実装に伴う課題を考慮することも重要です。物体追跡のいくつかの制限事項について詳しく見ていきましょう。

  • 密集した環境における困難さ:コンサート、ショッピングセンター、または都市の通りなどの混雑した場所では、追跡システムは互いに接近している人や物体を区別するのが難しく、混乱や不正確な結果につながる可能性があります。
  • 環境条件に左右されやすい: 照明不足、霧、速い動き、またはカメラの揺れは、特に屋外または制御されていない環境で、オブジェクトを正確に追跡するシステムの能力に影響を与える可能性があります。
  • プライバシーと法的懸念: 個人データの不適切な取り扱い、ユーザーの同意の欠如、または公共スペースでの監視は、倫理的な問題を引き起こし、プライバシー法に違反する可能性があります。

主なポイント

物体追跡は、機械が時間の経過とともに物体の動きを追跡できるようにするコンピュータビジョンのタスクです。車両の速度の推定や組立ラインでの製品のカウントから、スポーツでの選手の動きの分析まで、幅広い現実世界のシナリオで使用されています。

YOLO11 のような Vision AI モデルや、BoT-SORT や ByteTrack のような追跡アルゴリズムにより、オブジェクト追跡はより高速、よりスマートになり、さまざまな業界でアクセスしやすくなりました。オブジェクト追跡技術が進化するにつれて、システムはよりインテリジェントで効率的、かつ応答性が高くなり、フレームごとに改善されています。

コンピュータビジョンと AI についてもっと知りたいですか? GitHub リポジトリを探索し、コミュニティとつながり、ライセンスオプションを確認して、コンピュータビジョンプロジェクトを始めましょう。製造業における AI自動車産業におけるコンピュータビジョンなどのイノベーションに関心がある場合は、ソリューションページをご覧ください。 

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる
クリップボードにコピーしました