YOLO11 ポーズ推定：ガイド

人工知能（AI）の一分野であるコンピュータービジョンに関する研究は、1960年代まで遡ることができる。しかし、機械が画像を理解する方法に大きなブレークスルーが見られるようになったのは、ディープラーニングが台頭した2010年代になってからである。コンピュータビジョンにおける最新の進歩のひとつが、最先端の Ultralytics YOLO11モデルである。YOLO11 モデルは、Ultralytics 年次ハイブリッドイベント、YOLO Vision 2024（YV24）で初めて紹介され、ポーズ推定を含む様々なコンピュータビジョンタスクをサポートします。

姿勢推定は、画像やビデオ内の人物や物体のキーポイントをdetect し、その位置、姿勢、動きを理解するために使用できます。スポーツ分析、動物の行動監視、ロボット工学などのアプリケーションで広く使用され、機械がリアルタイムで物理的な動作を解釈するのに役立っています。YOLO Only Look Once）シリーズの初期モデルよりも精度、効率、スピードが向上しています、 YOLO11は、リアルタイムの姿勢推定タスクに適しています。

‍

この記事では、ポーズ推定とは何かを探り、その応用例について説明し、さらに、ポーズ推定をどのように使うかを説明します。 YOLO11をUltralytics Python パッケージと組み合わせてポーズ推定に使用する方法を説明します。また、Ultralytics HUBを使って、YOLO11 ポーズ推定を簡単なクリック操作で試す方法も紹介します。それでは始めましょう！

ポーズ推定とは？

ポーズ推定のための新しいUltralytics YOLO11 モデルの使い方に入る前に、ポーズ推定について理解を深めておこう。

ポーズ推定は、画像やビデオ内の人物や物体のポーズを分析するために使用されるコンピュータビジョン技術である。ディープラーニングモデル YOLO11のようなディープラーニングモデルは、与えられた物体や人物のキーポイントを特定し、位置を特定し、track することができる。物体の場合、これらのキーポイントには角、エッジ、または明確な表面マークが含まれ、人間の場合、これらのキーポイントは肘、膝、肩などの主要な関節を表す。

姿勢推定は、物体検出などの他のコンピュータビジョンタスクと比較して、独特でより複雑です。物体検出は、オブジェクトの周りにボックスを描画して画像内のオブジェクトを特定しますが、姿勢推定は、オブジェクト上のキーポイントの正確な位置を予測することで、さらに踏み込みます。

図2.YOLO11 、オフィス内の人物のポーズをdetect ・推定しているところ。

‍

姿勢推定に関して言えば、ボトムアップとトップダウンという2つの主な方法があります。ボトムアップアプローチは、個々のキーポイントを検出し、それらをスケルトンにグループ化しますが、トップダウンアプローチは、最初にオブジェクトを検出し、次にそれらの中のキーポイントを推定することに焦点を当てています。

YOLO11 、トップダウン方式とボトムアップ方式の両方の長所を兼ね備えている。ボトムアップ手法のように、キーポイントを手作業でグループ化する必要がなく、シンプルかつ高速に動作する。同時に、人物の検出とポーズの推定をワンステップで行うことで、トップダウン方式の精度を利用している。

YOLO11ポーズ推定ユースケース

ポーズ推定のためのYOLO11 多彩な機能は、多くの産業における可能なアプリケーションの幅を広げている。YOLO11ポーズ推定ユースケースを詳しく見てみよう。

YOLO11リアルタイム姿勢推定：作業員の安全性向上

安全は、あらゆる建設プロジェクトにおいて重要な側面です。統計的に、建設現場では労働災害による負傷者数が多いため、特にそうです。2021年には、労働災害による死亡事故の約20％が建設現場またはその付近で発生しました。重機や電気システムなどの日常的なリスクがあるため、作業員の安全を確保するには、強力な安全対策が不可欠です。標識、バリケード、監督者による手動監視などの従来の方法は、必ずしも効果的ではなく、監督者がより重要なタスクから離れてしまうことがよくあります。

AIは安全性を向上させるために介入することができ、ポーズ推定ベースの作業員監視システムを使用することで事故のリスクを減らすことができます。Ultralytics YOLO11 モデルは、作業員の動きや姿勢をtrack ために使用することができます。作業員が危険な機器の近くに立ちすぎたり、作業を誤って行ったりするような潜在的な危険は、すぐに発見することができます。リスクが検出された場合、監督者に通知したり、アラームで作業員に警告したりすることができる。常時監視システムは、常に危険を察知し、作業員を保護することで、建設現場をより安全にすることができます。

‍

家畜モニタリングのためのYOLO11 姿勢推定

農家や研究者は、YOLO11 牛のような家畜の動きや行動を研究し、跛行などの病気の初期兆候をdetect ことができる。跛行とは、動物が足腰の痛みのためにうまく動けない状態のことである。牛の場合、跛行のような病気は健康と福祉に影響を与えるだけでなく、酪農場での生産問題にもつながります。研究によると、跛行は世界の酪農産業において、放牧システムでは牛の8％、閉鎖システムでは15％から30％が罹患している。跛行を早期に発見し対処することで、動物福祉を向上させ、跛行による生産損失を減らすことができます。

YOLO11ポーズ推定機能は、酪農家が動物の歩行パターンをtrack し、関節の問題や感染症などの健康問題を知らせる可能性のある異常を素早く特定するのに役立ちます。このような問題を早期に発見することで、迅速な治療が可能になり、動物の不快感を軽減し、酪農家が経済的損失を回避するのに役立ちます。

Vision AI対応の監視システムは、休息行動、社会的相互作用、および摂食パターンを分析するのにも役立ちます。農家はまた、姿勢推定を使用して、ストレスや攻撃性の兆候に関する観察を得ることができます。これらの洞察は、動物の生活環境を改善し、幸福を高めるために使用できます。

‍

フィットネス業界におけるYOLO11 使用例

ポーズ推定は、ワークアウト中にリアルタイムで姿勢を改善するのにも役立つ。YOLO11使えば、ジムやヨガのインストラクターは、関節や手足などの重要なポイントに焦点を当てながら、トレーニング中の人々の体の動きをモニターし、track 姿勢を評価することができる。収集されたデータは、理想的なポーズやワークアウトのテクニックと比較することができ、インストラクターは、誰かが間違った動きをしている場合にアラートを受け取ることができ、怪我の予防に役立つ。

‍

例えば、ヨガのクラスでは、姿勢推定は、すべての生徒が適切なバランスとアライメントを維持しているかどうかを監視するのに役立ちます。コンピュータビジョンと姿勢推定が統合されたモバイルアプリケーションは、自宅でトレーニングしている人や、パーソナルトレーナーにアクセスできない人にとって、フィットネスをよりアクセスしやすくすることができます。この継続的なリアルタイムフィードバックは、ユーザーがテクニックを向上させ、怪我のリスクを軽減しながらフィットネス目標を達成するのに役立ちます。

YOLO11 モデルでリアルタイムポーズ推定を試す

さて、ここまでポーズ推定とは何かを探り、その応用例をいくつか説明してきた。新しいYOLO11 モデルを使ってポーズ推定を試す方法を見てみよう。これを始めるには、Ultralytics Python パッケージを使うか、Ultralytics HUBを使うかの2つの方法があります。両方のオプションを見てみましょう。

YOLO11使った推論の実行

推論を実行するには、YOLO11 モデルがトレーニングセット以外の新しいデータを処理し、そのデータに基づいて予測を行うために学習したパターンを使用します。Ultralytics Python パッケージを使えば、コードを通して推論を実行することができる。Ultralytics パッケージをpip、conda、またはDockerを使ってインストールするだけです。インストール中に何らかの問題に直面した場合は、よくある問題ガイドに役立つトラブルシューティングのヒントが掲載されています。

パッケージのインストールが完了したら、次のコードは、モデルをロードし、それを使用して画像内のオブジェクトのポーズを予測する方法を示しています。

‍

YOLO11 カスタムモデルのトレーニング

例えば、コンピュータビジョンのプロジェクトに取り組んでいて、ポーズ推定を含む特定のアプリケーションのための特定のデータセットを持っているとします。そうすれば、用途に合わせて YOLO11 カスタムモデルを微調整し、訓練することができます。例えば、キーポイントのデータセットを使って、トラの手足、頭、尾の位置などの主要な特徴を特定することで、画像中のトラのポーズを分析し、理解することができます。

以下のコード・スニペットを使って、YOLO11 ポーズ推定モデルをロードし、トレーニングすることができます。モデルはYAML設定から構築することもできるし、トレーニング済みのモデルをロードしてトレーニングすることもできる。このスクリプトでは、重みを転送し、指定されたデータセット（例えば、ポーズ推定用のCOCO データセット）を使ってモデルの学習を開始することもできます。

‍

新しくトレーニングされたカスタムモデルを使用して、コンピュータビジョンソリューションに関連する、まだ見ぬ画像に対して推論を実行できます。トレーニングされたモデルは、エクスポートモードを使用して他の形式に変換することもできます。

Ultralytics HUBでYOLO11 試す

ここまでは、基本的なコーディングの知識を必要とするYOLO11 使い方について見てきた。もしそれがあなたの求めているものでないなら、あるいはコーディングに慣れていないなら、別の選択肢がある：Ultralytics HUBだ。Ultralytics HUBは、YOLO モデルのトレーニングとデプロイのプロセスを簡素化するために設計されたユーザーフレンドリーなプラットフォームです。HUBを使えば、技術的な専門知識がなくても、データセットの管理、モデルのトレーニング、デプロイを簡単に行うことができます。

画像に対して推論を実行するには、アカウントを作成し、「モデル」セクションに移動して、対象YOLO11 推定モデルを選択します。プレビューセクションでは、画像をアップロードし、以下に示すように予測結果を確認できます。

‍

YOLO11 人間のポーズ検出の進歩

Ultralytics YOLO11 、幅広い用途において、姿勢推定などのタスクに正確で柔軟なソリューションを提供します。建設現場での作業員の安全性向上から、家畜の健康状態のモニタリング、フィットネス・ルーティンにおける姿勢矯正の支援まで、YOLO11 11は高度なコンピューター・ビジョン技術によって精度とリアルタイムのフィードバックをもたらします。

複数のモデルバリエーションや特定のユースケースに合わせたカスタムトレーニング機能など、その多用途性により、開発者や企業にとって非常に価値のあるツールとなっています。Ultralytics Python パッケージでコーディングしても、Ultralytics HUBを使用して簡単に実装しても、YOLO11 11はポーズ推定を身近でインパクトのあるものにします。

詳細については、GitHubリポジトリにアクセスし、コミュニティにご参加ください。ソリューションページで、製造業や農業におけるAIアプリケーションをご覧ください。🚀

ポーズ推定のためのUltralytics YOLO11 使い方

ポーズ推定とは？