Yolo 深圳
深セン
今すぐ参加
用語集

ポーズ推定

ポーズ推定:キーポイントモデル(トップダウン型とボトムアップ型)の仕組み、ヘルスケアからスポーツまでの実際の使用例、主な利点と課題についてご紹介します。

姿勢推定は、物体の検出を超え、その特定の形状や向きを特定する専門的なコンピュータビジョン課題である。構造的ランドマーク(キーポイントと呼ばれる)の座標を特定することで、この技術は対象の骨格表現を生成する。 人間の場合、これらのキーポイントは通常、肩、肘、股関節、膝などの主要な関節に対応します。この機能により、機械学習モデルはボディランゲージ、活動、姿勢を解釈できるようになり、単純なピクセル検出と複雑な身体的行動の理解との間のギャップを埋めます。

核となるメカニズムとアプローチ

現代の姿勢推定は、主に深層学習アーキテクチャ、特に畳み込みニューラルネットワーク(CNN)と、ますます普及しているトランスフォーマーに依存している。このプロセスは一般的に、以下の2つの主要な方法論に分類される:

  • トップダウン・アプローチ:この方法では、まず オブジェクト検出モデルを採用し バウンディングボックス内の個々のインスタンス(例えば人間)を見つける。一旦 一旦切り取られると、システムはその一人の人物のキーポイントを推定する。これは、より正確であることが多いが、人数が増えるにつれて 人数が増えれば増えるほど、計算コストは高くなる。
  • ボトムアップ・アプローチ:別の方法として、モデルはまず画像全体からすべての潜在的なキーポイントを検出し(例えば左肘のすべて をまず検出し(例えば、すべての左肘)、次にそれらを関連付けて明確な骨格を形成する。これは、混雑したシーンで 混雑したシーンでのリアルタイム推論では、処理時間が 処理時間は被写体の数にあまり依存しない。

高性能アプリケーション向けに、最新のYOLO26モデルは これらの概念を統合し、エッジデバイスに適した高速な 姿勢推定を実現します。

関連概念の区別

ポーズ推定を類似の視覚タスクと区別することは極めて重要である:

  • 対オブジェクト検出:一方 オブジェクト検出は、オブジェクトがどこにあり がであるか(クラスラベル)を特定するのに対し、物体検出は物体を硬い箱として扱う。姿勢推定は、その箱の内部構造と関節を明らかにする。 を明らかにする。
  • インスタンス・セグメンテーションとの比較: インスタンス分割は インスタンスセグメンテーションは、オブジェクトの形状をピクセル単位で完全にマスクする。インスタンスセグメンテーションは、オブジェクトの形状をピクセル単位で完全にマスクする。 これは、動きのダイナミクスやキネマティクスを分析するために必要である。 運動学

実際のアプリケーション

ポーズ推定の有用性は、動きの分析が重要な様々な業界に広がっている。

ヘルスケアとリハビリテーション

ヘルスケアにおけるAIの分野では、患者の動きを自動的に追跡することにより、ポーズ推定が理学療法に役立っている。 は、患者の動きを自動的に追跡することで、理学療法を支援する。システムは関節の角度を測定することができる。 リハビリのエクササイズ中に関節の角度を測定し、患者が適切なフォームを維持できるようにすることで、再負傷のリスクを減らすことができる。これにより 遠隔モニタリングや遠隔医療が可能になります、 質の高いケアをより身近なものにする。

スポーツ分析とバイオメカニクス

コーチとアスリートは スポーツアナリティクス パフォーマンスを分析する。ビデオから 映像から生体力学的データを抽出することで 映像から生体力学的データを抽出することで、従来のモーションキャプチャーで使用されていた侵入型のマーカースーツを使用することなく、AIがゴルファーのスイングプレーンやランナーの歩行効率を分析することができる。 従来のモーションキャプチャーで使用されていた

コード例: YOLO26による姿勢推定

以下の通りである。 Python スニペットは、事前学習済みYOLO26モデルの読み込み方法と、画像に対する姿勢推定の実行方法を示しています。これには ultralytics パッケージで 骨格出力を可視化する。

from ultralytics import YOLO

# Load the official YOLO26 nano pose model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image source to detect keypoints
results = model("path/to/image.jpg")

# Visualize the detected keypoints and skeleton
results[0].show()

課題とデータ

ロバストなポーズモデルのトレーニングには、膨大な注釈付きデータセットが必要です。 COCO Poseデータセットのような標準ベンチマークは のような標準的なベンチマークは、何千ものラベル付けされた人物データを提供する。しかし、オクルージョン(体の一部が隠れること や自己閉塞(人が自分の手足を遮る場合)などの課題があります。)これらに対処するには 高度なデータ補強技術と多様な 様々な角度や照明条件をカバーする 条件が必要です。

さらに、これらのモデルをエッジAIデバイスに展開するには、 速度を犠牲にすることなく高い精度を維持するために、 モデル量子化などの慎重な最適化が必要です。 ユーザーUltralytics このワークフローを効率化でき、 これによりトレーニングとデプロイメントが簡素化されます。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加