コンピュータービジョンにおけるオブジェクト track の仕組みを学びましょう。Ultralytics YOLO26 を使用して、リアルタイム分析のために一意のIDを持つオブジェクトを識別し監視する方法を発見してください。
オブジェクトトラッキングは、コンピュータービジョン(CV)における動的なプロセスであり、ビデオ内の特定のエンティティを識別し、一連のフレームにわたるその動きを監視します。各スナップショットを個別に扱う静的画像分析とは異なり、トラッキングは時間の次元を導入します。これにより、人工知能(AI)システムは、車、人物、動物などの検出された各アイテムに一意の識別番号(ID)を割り当て、オブジェクトが移動したり、向きを変えたり、一時的に遮られたりしてもそのIDを維持できます。この機能は、高度なビデオ理解の基礎であり、機械が生の映像から行動を分析し、軌道を計算し、実用的な洞察を導き出すことを可能にします。
現代のtrackingシステムは、一般的に「tracking-by-detection(検出による追跡)」パラダイムを利用しています。このワークフローは、強力なdetectionモデルと特殊なアルゴリズムを組み合わせて、時間経過に伴うdetectionを関連付けます。このプロセスは通常、3つの主要な段階に従います。
これらの用語は密接に関連していますが、機械学習 (ML)パイプライン内で異なる機能を果たします。
オブジェクトの同一性を維持する能力は、さまざまな業界で複雑なリアルタイム推論アプリケーションを可能にします。
Ultralyticsは、高性能なtrackの実装を簡素化します。 track ライブラリのモードは、detect、モーション予測、ID割り当てを自動的に処理します。以下の例は、その使用方法を示しています。
Ultralyticsプラットフォーム ビデオ内でオブジェクトをtrackするための互換性のあるYOLO26モデル。
from ultralytics import YOLO
# Load the official YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Track objects in a video file or webcam (source=0)
# 'show=True' displays the video with bounding boxes and unique IDs
results = model.track(source="https://ultralytics.com/images/bus.jpg", show=True)
# Access the unique tracking IDs from the results
if results[0].boxes.id is not None:
print(f"Detected Track IDs: {results[0].boxes.id.cpu().numpy()}")
trackのエコシステムを完全に理解するには、ボックスだけでなくオブジェクトの正確なピクセルレベルの輪郭をtrackするインスタンスsegmentを探求することが役立ちます。さらに、マルチオブジェクトトラッキング (MOT) の課題では、アルゴリズムが混雑したシーンやオクルージョンをどの程度うまく処理できるかを評価するために、MOTChallengeのような広く使用されているベンチマークがしばしば用いられます。本番環境でのデプロイメントには、開発者はしばしばNVIDIA DeepStreamやOpenCVのようなツールを利用して、これらのモデルを効率的なパイプラインに統合します。

未来の機械学習で、新たな一歩を踏み出しましょう。