Ultralytics YOLO11モデルを正確な姿勢推定に使用する方法を学びます。リアルタイム推論と、さまざまなアプリケーション向けのカスタムモデルのトレーニングについて説明します。

Ultralytics YOLO11モデルを正確な姿勢推定に使用する方法を学びます。リアルタイム推論と、さまざまなアプリケーション向けのカスタムモデルのトレーニングについて説明します。
コンピュータビジョン(人工知能(AI)の一分野)に関連する研究は、1960年代に遡ることができます。しかし、ディープラーニングの台頭により、機械が画像を理解する方法に大きなブレークスルーが見られたのは、2010年代に入ってからです。コンピュータビジョンにおける最新の進歩の1つは、最先端のUltralytics YOLO11モデルです。YOLO11モデルは、Ultralyticsの年次ハイブリッドイベントであるYOLO Vision 2024(YV24)で初めて発表され、姿勢推定を含むさまざまなコンピュータビジョンタスクをサポートしています。
姿勢推定は、画像またはビデオ内の人物またはオブジェクトのキーポイントを検出して、その位置、姿勢、または動きを理解するために使用できます。スポーツ分析、動物の行動監視、ロボティクスなどのアプリケーションで広く使用されており、機械が物理的な動作をリアルタイムで解釈するのに役立ちます。YOLO(You Only Look Once)シリーズの以前のモデルと比較して、精度、効率、速度が向上したため、YOLO11はリアルタイムの姿勢推定タスクに適しています。
この記事では、ポーズ推定とは何か、その応用例、そしてYOLO11とUltralytics Pythonパッケージを使ってポーズ推定を行う方法について解説します。また、Ultralytics HUBを使って、ほんの数クリックでYOLO11とポーズ推定を試す方法もご紹介します。それでは始めましょう!
新しいUltralytics YOLO11モデルを姿勢推定に使用する方法に入る前に、姿勢推定についてより深く理解しましょう。
姿勢推定は、画像またはビデオ内の人またはオブジェクトの姿勢を分析するために使用されるコンピュータビジョン技術です。YOLO11のような深層学習モデルは、特定のオブジェクトまたは人物のキーポイントを識別、特定、追跡できます。オブジェクトの場合、これらのキーポイントには、角、エッジ、または明確な表面のマークが含まれる可能性があり、人間の場合、これらのキーポイントは、肘、膝、肩などの主要な関節を表します。
姿勢推定は、物体検出などの他のコンピュータビジョンタスクと比較して、独特でより複雑です。物体検出は、オブジェクトの周りにボックスを描画して画像内のオブジェクトを特定しますが、姿勢推定は、オブジェクト上のキーポイントの正確な位置を予測することで、さらに踏み込みます。
姿勢推定に関して言えば、ボトムアップとトップダウンという2つの主な方法があります。 ボトムアップアプローチは、個々のキーポイントを検出し、それらをスケルトンにグループ化しますが、トップダウンアプローチは、最初にオブジェクトを検出し、次にそれらの中のキーポイントを推定することに焦点を当てています。
YOLO11は、トップダウンとボトムアップの両方のアプローチの強みを兼ね備えています。ボトムアップのアプローチと同様に、キーポイントを手動でグループ化する必要がなく、シンプルかつ高速です。同時に、人を検出し、姿勢を推定することで、トップダウン方式の精度を一度に実現します。
ポーズ推定のためのYOLO11の汎用性の高い機能は、多くの業界で幅広い応用を可能にします。YOLO11のポーズ推定の使用例をいくつか詳しく見てみましょう。
安全は、あらゆる建設プロジェクトにおいて重要な側面です。統計的に、建設現場では労働災害による負傷者数が多いため、特にそうです。2021年には、労働災害による死亡事故の約20%が建設現場またはその付近で発生しました。重機や電気システムなどの日常的なリスクがあるため、作業員の安全を確保するには、強力な安全対策が不可欠です。標識、バリケード、監督者による手動監視などの従来の方法は、必ずしも効果的ではなく、監督者がより重要なタスクから離れてしまうことがよくあります。
AIは安全性を向上させるために介入でき、姿勢推定ベースの作業員監視システムを使用することで、事故のリスクを軽減できます。Ultralytics YOLO11モデルを使用して、作業員の動きと姿勢を追跡できます。危険な機器に近づきすぎたり、タスクを誤って実行したりするなど、潜在的な危険を迅速に特定できます。リスクが検出された場合、監督者に通知したり、アラームで作業員に警告したりできます。継続的な監視システムは、常に危険を探し、作業員を保護することで、建設現場をより安全にすることができます。
農家と研究者は、YOLO11を使用して、牛などの家畜の動きと行動を研究し、跛行などの病気の早期兆候を検出できます。跛行とは、動物が脚や足の痛みにより適切に動くのに苦労する状態です。牛では、跛行のような病気は、健康と福祉に影響を与えるだけでなく、酪農場での生産上の問題にもつながります。調査によると、跛行は、世界の酪農産業全体で、放牧システムでは牛の8%、閉鎖システムでは15%から30%に影響を与えています。跛行を検出し早期に対処することは、動物福祉を改善し、この状態に関連する生産損失を削減するのに役立ちます。
YOLO11の姿勢推定機能は、農家が動物の歩行パターンを追跡し、関節の問題や感染症など、健康上の問題を示す可能性のある異常を迅速に特定するのに役立ちます。これらの問題を早期に発見することで、迅速な治療が可能になり、動物の不快感を軽減し、農家が経済的損失を回避するのに役立ちます。
Vision AI対応の監視システムは、休息行動、社会的相互作用、および摂食パターンを分析するのにも役立ちます。農家はまた、姿勢推定を使用して、ストレスや攻撃性の兆候に関する観察を得ることができます。これらの洞察は、動物の生活環境を改善し、幸福を高めるために使用できます。
姿勢推定は、運動中の姿勢をリアルタイムで改善するのにも役立ちます。YOLO11を使用することで、ジムやヨガのインストラクターは、運動する人々の体の動きを監視および追跡し、関節や手足などのキーポイントに焦点を当てて姿勢を評価できます。収集されたデータを理想的なポーズやトレーニングテクニックと比較し、誰かが間違った動きをしている場合にインストラクターがアラートを受け取れるようにすることで、怪我の防止に役立ちます。
例えば、ヨガのクラスでは、姿勢推定は、すべての生徒が適切なバランスとアライメントを維持しているかどうかを監視するのに役立ちます。コンピュータビジョンと姿勢推定が統合されたモバイルアプリケーションは、自宅でトレーニングしている人や、パーソナルトレーナーにアクセスできない人にとって、フィットネスをよりアクセスしやすくすることができます。この継続的なリアルタイムフィードバックは、ユーザーがテクニックを向上させ、怪我のリスクを軽減しながらフィットネス目標を達成するのに役立ちます。
ポーズ推定とは何かを説明し、そのアプリケーションのいくつかについて説明しました。新しいYOLO11モデルでポーズ推定を試す方法を見ていきましょう。開始するには、Ultralytics Pythonパッケージを使用するか、Ultralytics HUBを使用するかの2つの便利な方法があります。両方のオプションを見ていきましょう。
推論の実行とは、YOLO11モデルがトレーニングセット外の新しいデータを処理し、学習したパターンを使用してそのデータに基づいて予測を行うことです。Ultralytics Pythonパッケージを使用すると、コードを通じて推論を実行できます。開始するには、pip、conda、またはDockerを使用してUltralyticsパッケージをインストールするだけです。インストール中に問題が発生した場合は、よくある問題ガイドに役立つトラブルシューティングのヒントが記載されています。
パッケージのインストールが完了したら、次のコードは、モデルをロードし、それを使用して画像内のオブジェクトのポーズを予測する方法を示しています。
例えば、コンピュータビジョンプロジェクトに取り組んでいて、姿勢推定に関する特定のアプリケーション用のデータセットがあるとします。次に、アプリケーションに合わせてファインチューニングを行い、カスタムYOLO11モデルをトレーニングできます。たとえば、キーポイントのデータセットを使用して、手足、頭、尾の位置などの主要な特徴を特定することにより、画像内のトラのポーズを分析および理解できます。
以下のコードスニペットを使用すると、YOLO11のポーズ推定モデルをロードしてトレーニングできます。モデルはYAML構成ファイルから構築することも、トレーニング用に事前トレーニングされたモデルをロードすることもできます。このスクリプトでは、重みを転送し、ポーズ推定用のCOCOデータセットなど、指定されたデータセットを使用してモデルのトレーニングを開始することもできます。
新しくトレーニングされたカスタムモデルを使用して、コンピュータビジョンソリューションに関連する、まだ見ぬ画像に対して推論を実行できます。トレーニングされたモデルは、エクスポートモードを使用して他の形式に変換することもできます。
これまでは、YOLO11を使用するために、ある程度のコーディング知識が必要な方法を見てきました。もしそうでない場合や、コーディングに慣れていない場合は、別の選択肢があります。Ultralytics HUBです。Ultralytics HUBは、YOLOモデルのトレーニングとデプロイのプロセスを簡素化するために設計された、ユーザーフレンドリーなプラットフォームです。HUBを使用すると、技術的な専門知識がなくても、データセットの管理、モデルのトレーニング、デプロイを簡単に行うことができます。
画像に対して推論を実行するには、アカウントを作成し、‘モデル’セクションに移動して、関心のあるYOLO11ポーズ推定モデルを選択します。プレビューセクションでは、画像をアップロードして、以下に示すように予測結果を表示できます。
Ultralytics YOLO11は、幅広いアプリケーションにわたる姿勢推定などのタスクに対して、正確で柔軟なソリューションを提供します。建設現場での作業員の安全性の向上から、家畜の健康状態の監視、フィットネスルーチンでの姿勢矯正の支援まで、YOLO11は高度なコンピュータビジョン技術を通じて、精度とリアルタイムフィードバックをもたらします。
複数のモデルバリアントがあり、特定のユースケースに合わせてカスタムトレーニングできる汎用性により、開発者や企業にとって非常に価値のあるツールとなっています。Ultralytics Pythonパッケージを使用したコーディングでも、実装を容易にするためのUltralytics HUBの使用でも、YOLO11は姿勢推定をアクセスしやすく、インパクトのあるものにします。
詳細については、GitHubリポジトリにアクセスし、コミュニティにご参加ください。ソリューションページで、製造業や農業におけるAIアプリケーションをご覧ください。🚀