Ultralytics YOLO11で姿勢推定を行う方法
Ultralytics YOLO11モデルを使用して正確な姿勢推定を行う方法を学びます。リアルタイム推論やさまざまなアプリケーションのためのカスタムモデルトレーニングについても解説します。

Research related to computer vision, a branch of artificial intelligence (AI), can be traced back to the 1960s. However, it wasn’t until the 2010s, with the rise of deep learning, that we saw major breakthroughs in how machines understand images. One of the latest advancements in computer vision is the cutting-edge Ultralytics YOLO11 models. The YOLO11 models, first introduced at Ultralytics’ annual hybrid event, YOLO Vision 2024 (YV24), support a range of computer vision tasks, including pose estimation.
Pose estimation can be used to detect key points on a person or object in an image or video to understand their position, posture, or movement. It’s widely used in applications like sports analytics, animal behavior monitoring, and robotics to help machines interpret physical actions in real time. Thanks to its improved accuracy, efficiency, and speed over earlier models in the YOLO (You Only Look Once) series, YOLO11 is well-suited for real-time pose estimation tasks.

図1:ポーズ推定のためにUltralytics YOLO11を使用する例。
In this article, we’ll explore what pose estimation is, discuss some of its applications, and walk through how you can use YOLO11 with the Ultralytics Python package for pose estimation. We’ll also take a look at how you can use Ultralytics HUB to try out YOLO11 and pose estimation in a few simple clicks. Let’s get started!
Link to this sectionポーズ推定とは何ですか?#
ポーズ推定に新しいUltralytics YOLO11モデルを使用する方法を詳しく説明する前に、まずポーズ推定についての理解を深めましょう。
ポーズ推定は、画像や動画内の人物や物体のポーズを分析するために使用されるコンピュータビジョン技術です。YOLO11のようなディープラーニングモデルは、特定の物体や人物のキーポイントを識別、特定、追跡できます。物体の場合、これらのキーポイントには角、エッジ、あるいは特徴的な表面の印が含まれる場合があります。一方、人間の場合は、これらのキーポイントは肘、膝、肩といった主要な関節を表します。
ポーズ推定は、物体検出のような他のコンピュータビジョンタスクと比較してユニークで、より複雑です。物体検出は物体の周囲にボックスを描くことで画像内の物体を特定しますが、ポーズ推定は物体上のキーポイントの正確な位置を予測することでさらに一歩踏み込んでいます。

図2:YOLO11を使用してオフィス内の人物を検出し、そのポーズを推定する様子。
ポーズ推定には、ボトムアップとトップダウンという2つの主な手法があります。ボトムアップアプローチは個々のキーポイントを検出してスケルトンにグループ化し、トップダウンアプローチはまず物体を検出してからその内部のキーポイントを推定することに焦点を当てます。
YOLO11は、トップダウンとボトムアップ両方の手法の強みを組み合わせています。ボトムアップアプローチのように、手動でキーポイントをグループ化する必要なく、シンプルかつ高速に処理できます。同時に、トップダウン手法の精度を活用し、人物を検出しそのポーズを推定する処理を単一のステップで行います。
Link to this sectionYOLO11のポーズ推定のユースケース#
ポーズ推定におけるYOLO11の汎用的な機能は、多くの産業において幅広い応用可能性を切り開きます。YOLO11のポーズ推定ユースケースをいくつか詳しく見ていきましょう。
Link to this sectionYOLO11によるリアルタイムポーズ推定:作業者の安全性向上#
安全性は、いかなる建設プロジェクトにおいても重要な側面です。統計的に見て建設現場では労働災害の発生率が高いため、これは特に重要です。2021年には、全労働災害による死亡事故の約20%が建設現場またはその周辺で発生しました。重機や電気システムなどの日常的なリスクがあるため、作業者の安全を確保するには強力な安全対策が不可欠です。標識の使用、バリケードの設置、監督者による手動監視といった従来の方法は必ずしも効果的ではなく、監督者を重要な業務から遠ざけてしまうことも多くあります。
AIを導入することで安全性を向上させ、ポーズ推定ベースの作業者監視システムを使用することで事故のリスクを低減できます。Ultralytics YOLO11モデルを使用して、作業者の動きや姿勢を追跡できます。危険な機器に作業者が近づきすぎたり、作業を不適切に行ったりといった潜在的な危険は迅速に発見できます。リスクが検出された場合、監督者に通知したり、アラームで作業者に警告したりできます。継続的な監視システムは、常に危険を見張り作業者を保護することで、建設現場をより安全にすることができます。

図3:YOLO11を使用した建設現場でのポーズ推定の例。
Link to this section家畜監視のためのYOLO11によるポーズ推定#
農家や研究者は、YOLO11を使用して、牛などの家畜の動きや行動を研究し、跛行(はこう)などの病気の兆候を早期に発見できます。跛行とは、脚や足の痛みによって動物が適切に歩けなくなる状態です。牛において跛行のような病気は、健康や福祉に悪影響を及ぼすだけでなく、酪農場における生産上の問題にもつながります。研究によると、跛行は、放牧システムでは牛の8%、密飼いシステムでは15%から30%に影響を与えていることが示されています。跛行を早期に検出して対処することは、動物福祉を向上させ、この状態に関連する生産損失を減らすのに役立ちます。
YOLO11のポーズ推定機能は、農家が動物の歩行パターンを追跡し、関節の問題や感染症などの健康上の問題を示唆する異常を迅速に特定するのに役立ちます。これらの問題を早期に発見することで迅速な治療が可能になり、動物の不快感を軽減し、農家が経済的な損失を回避するのに役立ちます。
ビジョンAI対応の監視システムは、休息行動、社会的相互作用、摂食パターンを分析するのにも役立ちます。また、農家はポーズ推定を使用して、ストレスや攻撃性の兆候を観察することもできます。これらの洞察は、動物のためにより良い生活環境を構築し、福祉を向上させるために使用できます。

図 4. 牛のポーズ推定の視覚化。
Link to this sectionフィットネス業界におけるYOLO11のユースケース#
ポーズ推定は、人々がトレーニング中にリアルタイムで姿勢を改善するのにも役立ちます。YOLO11を使用すれば、ジムやヨガのインストラクターがトレーニング中の人々の体の動きを監視および追跡し、関節や手足などのキーポイントに焦点を当てて姿勢を評価できます。収集されたデータは、理想的なポーズやトレーニング技術と比較でき、もし誰かが誤った動きをしていればインストラクターにアラートが通知されるため、怪我の予防につながります。

図5. ポーズ推定を使用したトレーニングの分析。
例えば、ヨガのクラス中、ポーズ推定を利用してすべての受講者が適切なバランスとアライメントを維持しているかを監視できます。コンピュータビジョンとポーズ推定が統合されたモバイルアプリケーションにより、自宅でトレーニングする人やパーソナルトレーナーにアクセスできない人でも、フィットネスをより身近に利用できるようになります。この継続的なリアルタイムフィードバックは、ユーザーが技術を向上させてフィットネスの目標を達成しつつ、怪我のリスクを減らすのに役立ちます。
Link to this sectionYOLO11モデルでリアルタイムポーズ推定を試す#
ポーズ推定とは何か、そのアプリケーションの一部について理解したところで、新しいYOLO11モデルでポーズ推定を試す方法を見ていきましょう。始めるには、Ultralytics Pythonパッケージを使用するか、Ultralytics HUBを介するという、2つの便利な方法があります。両方のオプションを見ていきましょう。
Link to this sectionYOLO11を使用した推論の実行#
推論を実行するには、YOLO11モデルがトレーニングセット以外の新しいデータを処理し、学習したパターンを使用してそのデータに基づいた予測を行うという作業が含まれます。Ultralytics Pythonパッケージを使用して、コードを通じて推論を実行できます。始めるには、pip、conda、またはDockerを使用してUltralyticsパッケージをインストールするだけです。インストール中に問題が発生した場合は、私たちの共通の問題ガイドが役立つトラブルシューティングのヒントを提供します。
パッケージのインストールが成功したら、以下のコードはモデルをロードし、それを使用して画像内の物体のポーズを予測する方法の概要を示しています。

図6:YOLO11を使用した推論実行のコードスニペット。
Link to this sectionカスタムYOLO11モデルのトレーニング#
Let's say you are working on a computer vision project and you have a specific dataset for a particular application involving pose estimation. Then you can fine-tune and train a custom YOLO11 model to suit your application. For example, you can use a dataset of keypoints to analyze and understand the pose of a tiger in images by identifying key features such as the position of its limbs, head, and tail.
以下のコードスニペットを使用して、YOLO11ポーズ推定モデルをロードおよびトレーニングできます。モデルはYAML設定から構築することも、トレーニング済みのモデルをロードしてトレーニングすることもできます。このスクリプトでは、重みを転送し、ポーズ推定用のCOCOデータセットなどの指定されたデータセットを使用してモデルのトレーニングを開始することもできます。

図7:YOLO11のカスタムトレーニング。
新しくトレーニングされたカスタムモデルを使用して、あなたのコンピュータビジョンソリューションに関連する未見の画像に対して推論を実行できます。トレーニング済みモデルは、エクスポートモードを使用して他のフォーマットに変換することも可能です。
Link to this sectionUltralytics HUBでYOLO11を試す#
これまでは、基本的なコーディング知識を必要とするYOLO11の使用方法について見てきました。もしそれが望むものではない、あるいはコーディングに慣れていない場合は、もう一つの選択肢があります。それがUltralytics HUBです。Ultralytics HUBは、YOLOモデルのトレーニングとデプロイのプロセスを簡素化するために設計されたユーザーフレンドリーなプラットフォームです。HUBを使用すると、技術的な専門知識がなくても、簡単にデータセットを管理し、モデルをトレーニングし、それらをデプロイできます。
画像に対して推論を実行するには、アカウントを作成し、「Models(モデル)」セクションに移動して、関心のあるYOLO11ポーズ推定モデルを選択します。プレビューセクションで画像をアップロードすると、以下に示すように予測の結果を表示できます。

図8:YOLO11を使用したUltralytics HUBでのポーズ推定。
Link to this section人間ポーズ検出におけるYOLO11の進歩#
Ultralytics YOLO11は、幅広いアプリケーションにわたり、ポーズ推定のようなタスクに対して正確で柔軟なソリューションを提供します。建設現場での作業者の安全向上から家畜の健康モニタリング、フィットネスルーチンにおける姿勢矯正の支援まで、YOLO11は高度なコンピュータビジョン技術を通じて精度とリアルタイムのフィードバックをもたらします。
複数のモデルバリエーションと特定のユースケースに合わせてカスタムトレーニングできる能力を備えたその汎用性は、開発者にとっても企業にとっても非常に価値のあるツールです。Ultralytics Pythonパッケージでのコーディング、あるいはより容易な実装のためのUltralytics HUBの使用を通じて、YOLO11はポーズ推定を身近で影響力のあるものにしています。
詳細については、私たちのGitHubリポジトリを訪問し、私たちのコミュニティに参加してください。私たちのソリューションページで、製造業や農業におけるAIアプリケーションを探索してください。 🚀






