Yolo 深圳
深セン
今すぐ参加
用語集

ポーズ推定

ポーズ推定:キーポイントモデル(トップダウン型とボトムアップ型)の仕組み、ヘルスケアからスポーツまでの実際の使用例、主な利点と課題についてご紹介します。

姿勢推定は コンピュータビジョン(CV)タスクである。 物体を検出するだけでなく、その形状や向きを特定する特殊なコンピュータビジョン(CV)タスクです。キーポイントと呼ばれる この技術により、被写体の骨格表現が作成されます。 被写体の骨格表現を作成する。人間の場合、これらのキーポイントは通常、肩、肘、腰、膝などの主要な関節に対応する、 腰、膝などである。この機能により 機械学習(ML)モデルは、ボディランゲージ、活動、姿勢 この機能により、機械学習(ML)モデルは、身体言語、活動、姿勢を解釈し、単純なピクセル検出と複雑な身体動作の理解とのギャップを埋めることができる。 の間のギャップを埋める。

核となるメカニズムとアプローチ

最新のポーズ推定は ディープラーニング(DL)アーキテクチャ、特に 畳み込みニューラルネットワーク(CNN) トランスフォーマーなどである。このプロセスは一般的に2つの主要な方法論に分類される:

  • トップダウン・アプローチ:この方法では、まず オブジェクト検出モデルを採用し バウンディングボックス内の個々のインスタンス(例えば人間)を見つける。一旦 一旦切り取られると、システムはその一人の人物のキーポイントを推定する。これは、より正確であることが多いが、人数が増えるにつれて 人数が増えれば増えるほど、計算コストは高くなる。
  • ボトムアップ・アプローチ:別の方法として、モデルはまず画像全体からすべての潜在的なキーポイントを検出し(例えば左肘のすべて をまず検出し(例えば、すべての左肘)、次にそれらを関連付けて明確な骨格を形成する。これは、混雑したシーンで 混雑したシーンでのリアルタイム推論では、処理時間が 処理時間は被写体の数にあまり依存しない。

高性能のアプリケーションには、次のようなモデルがある。 Ultralytics YOLO11のようなモデルは、これらのコンセプトを統合して、エッジ・デバイスに適した迅速な エッジデバイスに適した迅速な姿勢推定を提供します。

関連概念の区別

ポーズ推定を類似の視覚タスクと区別することは極めて重要である:

  • 対オブジェクト検出:一方 オブジェクト検出は、オブジェクトがどこにあり がであるか(クラスラベル)を特定するのに対し、物体検出は物体を硬い箱として扱う。姿勢推定は、その箱の内部構造と関節を明らかにする。 を明らかにする。
  • インスタンス・セグメンテーションとの比較: インスタンス分割は インスタンスセグメンテーションは、オブジェクトの形状をピクセル単位で完全にマスクする。インスタンスセグメンテーションは、オブジェクトの形状をピクセル単位で完全にマスクする。 これは、動きのダイナミクスやキネマティクスを分析するために必要である。 運動学

実際のアプリケーション

ポーズ推定の有用性は、動きの分析が重要な様々な業界に広がっている。

ヘルスケアとリハビリテーション

ヘルスケアにおけるAIの分野では、患者の動きを自動的に追跡することにより、ポーズ推定が理学療法に役立っている。 は、患者の動きを自動的に追跡することで、理学療法を支援する。システムは関節の角度を測定することができる。 リハビリのエクササイズ中に関節の角度を測定し、患者が適切なフォームを維持できるようにすることで、再負傷のリスクを減らすことができる。これにより 遠隔モニタリングや遠隔医療が可能になります、 質の高いケアをより身近なものにする。

スポーツ分析とバイオメカニクス

コーチとアスリートは スポーツアナリティクス パフォーマンスを分析する。ビデオから 映像から生体力学的データを抽出することで 映像から生体力学的データを抽出することで、従来のモーションキャプチャーで使用されていた侵入型のマーカースーツを使用することなく、AIがゴルファーのスイングプレーンやランナーの歩行効率を分析することができる。 従来のモーションキャプチャーで使用されていた

コード例YOLO11ポーズ推定

以下の通りである。 Python スニペットは、事前にトレーニングされたYOLO11 モデルをロードし モデルをロードし、画像に対してポーズ推定を実行する方法を示します。これには ultralytics パッケージで 骨格出力を可視化する。

from ultralytics import YOLO

# Load the official YOLO11 nano pose model
model = YOLO("yolo11n-pose.pt")

# Run inference on an image source
results = model("https://docs.ultralytics.com/usage/python/")

# Visualize the detected keypoints and skeleton
results[0].show()

課題とデータ

ロバストなポーズモデルのトレーニングには、膨大な注釈付きデータセットが必要です。 COCO Poseデータセットのような標準ベンチマークは のような標準的なベンチマークは、何千ものラベル付けされた人物データを提供する。しかし、オクルージョン(体の一部が隠れること や自己閉塞(人が自分の手足を遮る場合)などの課題があります。)これらに対処するには 高度なデータ補強技術と多様な 様々な角度や照明条件をカバーする 条件が必要です。

さらに、これらのモデルをエッジAIデバイスに展開するには への導入には、精度を維持するために モデルの量子化 速度を犠牲にすることなく

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加