Yolo 深圳
深セン
今すぐ参加

Ultralytics とUltralytics YOLO による姿勢推定の比較

Ultralytics 、非人間キーポイントのサポート強化、収束速度の向上、遮蔽処理の改善、効率的なリアルタイム展開により、姿勢推定をどのように向上させるかをご覧ください。

Ultralyticsでコンピュータビジョンプロジェクトをスケールアップ

お問い合わせ

誰かの姿勢を見ると、猫背になっているか、前かがみになっているか、背筋を伸ばしているかはすぐにわかります。人間は体の各部分が互いにどう関連しているかを素早く理解できるのです。 

これは日常生活において私たちが動きやボディランゲージを解釈する際に本質的に備わっている能力です。しかし機械にとって、この種の視覚的理解は自動的には行われません。システムに動きや構造を認識させるためには、画像を有意義な方法で解釈できるようにする高度な深層学習とコンピュータビジョン技術が必要です。

特に姿勢推定は、コンピュータビジョンモデルが同様の理解を構築することを可能にするビジョンAI技術である。画像内の物体を単純に検出する代わりに、モデルは重要な構造的ランドマークを表すキーポイントを予測する。 

これらのキーポイントは、身体の関節、動物の四肢、機械部品、あるいはコートのコーナーのような固定点に対応し得る。これらのポイントを識別・追跡することで、システムは位置、位置合わせ、動きを体系的かつ測定可能な方法で理解できる。

姿勢推定がより多くの実世界シナリオに適用されるにつれ、モデルは非人間キーポイント、複雑なシーン、カスタムデータセットをより効果的に処理する必要がある。例えば、Ultralytics のような最先端モデルは姿勢推定などのコンピュータビジョンタスクをサポートし、柔軟性と全体的な性能を向上させるために設計されたアーキテクチャとトレーニングの改善により、以前YOLO モデルを基盤としている。

図1.YOLO による姿勢推定の例YOLO 出典

本記事では、YOLO26-poseをUltralytics YOLO モデルと比較し、複雑なシーンにおける柔軟性、収束速度、性能の向上について探ります。さっそく始めましょう!

ポーズ推定とは?

比較に入る前に Ultralytics YOLO ポーズモデルを比較する前に、コンピュータビジョンにおけるポーズ推定が実際に何を意味するのか、詳しく見ていきましょう。

姿勢推定は、画像や動画フレーム内のtrack キーdetect track 用いられる技術である。これらのキーポイントは、人体における関節、動物の四肢、機械の構成要素、あるいはシーン内の固定参照点など、重要な構造的ランドマークを表すことができる。 

図2. 人間姿勢推定を用いた作業員の姿勢推定(出典

これらの点の座標を特定することで、モデルは物体の位置や時間経過に伴う動きを理解できる。画像分類が画像全体に単一のラベルを割り当てるのとは異なり、物体検出モデルが物体の周囲に境界ボックスを描くことに焦点を当てるのとは異なり、姿勢推定は構造と動きに関するより詳細な空間情報を提供する。

YOLO26-poseの概要

YOLO26-poseは複数のモデルバリエーションまたはモデルサイズで利用可能であり、軽量オプションであるYOLO26n-poseや、より大規模なモデルであるYOLO26m-pose、YOLO26l-pose、YOLO26x-poseなどが含まれます。これにより、チームはハードウェアや性能要件に応じて、速度と精度の適切なバランスを選択できます。

Ultralytics COCO などの大規模な汎用データセット、特に人体姿勢推定COCO(COCO )アノテーションで訓練された事前学習済み姿勢Ultralytics 提供しています。これにより、ゼロから始める必要はありません。多くの場合、チームはこれらのモデルを自社のデータセットで微調整し、特定のキーポイント、レイアウト、環境に適応させます。 

これは通常、キーポイントの座標とクラスラベルを構造化された形式で定義するカスタムアノテーションファイルの準備を伴います。これらのアノテーションは、各画像内のキーポイントを特定のピクセル座標にマッピングし、モデルが学習中に正確な空間的関係を学習できるようにします。

事前学習済みモデルを使用することで、トレーニングが高速化され、データ要件が削減され、プロジェクトをより効率的に本番環境へ移行できます。 

人体姿勢推定の実世界応用

姿勢推定が重要な役割を果たす実際のユースケースをいくつかご紹介します:

  • 医療とリハビリテーション:臨床医は、姿勢モデルを用いて姿勢を評価し、回復の進捗をモニタリングし、理学療法中の動作パターンを分析することができます。
  • 自律システム:ドローンやスマートカメラは姿勢情報を活用することで、動的なシーンにおける物体の向きや動きをより正確に把握できる。
  • 職場の安全:組織は身体の位置や反復動作を監視することで、潜在的な安全リスクの特定を支援できる。
  • フィットネスとパーソナルトレーニング: フィットネスアプリは姿勢推定技術を用いて、track 、反復回数のカウント、フィットネスチュートリアル中の姿勢と動作維持に関するリアルタイムフィードバックを提供します。
図3. ポーズ推定は、運動中のtrack 身体部位track 役立つ。(出典

Ultralytics 姿勢推定のサポートを探る

Ultralytics 、Ultralytics YOLO 基盤とし、トレーニングとデプロイメントをより実用的にするための更新が施されています。 

以前のバージョンと同様に、統一されたフレームワークの一部として姿勢推定をサポートしています。主な違いは、YOLO26がより幅広い実世界のユースケースにおいて柔軟性と安定性を高めるように設計されている点です。

図4. YOLO26のベンチマーク比較(出典

Ultralytics YOLO モデルは、主に人間の姿勢データセットの影響を受けており、古い手法の一部は人間の関節構造を中心に最適化されていた。YOLO26はこうした人間固有の前提を排除している。 

その結果、テニスコートのコーナーやその他のカスタム構造ランドマークの検出など、人間以外のキーポイントに適している。これは重要な点である。なぜなら、既成の事前学習済みYOLO26-poseモデルはCOCOデータセットで学習されており、データセットの注釈で定義された人間のキーポイントを予測するためである。 

ただし、チームが機械部品、スポーツフィールドのマーカー、インフラストラクチャポイントなど、detect ランドマークをdetect 場合、モデルは通常、それらの特定のキーポイントがアノテーションされたカスタムデータセットで微調整する必要があります。

YOLO26は人間の関節構造に関する仮定に縛られないため、微調整時により効果的に適応できる。この柔軟性により、モデルはカスタムキーポイント配置をより確実に学習でき、独自のキーポイント構成を持つデータセットで検証する際の評価指標が向上する。

YOLO26-poseは、物体の一部が部分的に隠れている場合や非常に小さなスケールで出現する場合におけるキーポイントの局所化を改善するよう設計されています。遠方の被写体、ドローン映像、または微小物体を含む実世界シーンにおいて、従来の姿勢推定モデルと比較してより正確なキーポイント予測が可能となります。

もう1つの重要な更新点は、学習中に使用される損失関数の改良です。損失関数は、モデルが学習中に誤りを修正する方法を決定します。 

YOLO26ポーズに関しては、この手法がより効果的であり、モデルがより速く学習し、少ないエポック数で高い精度を達成するのに役立つ。ここでエポックとは、トレーニングデータセットを1回完全に処理することを指す。

全体として、YOLO26-poseはUltralytics YOLO モデルを基盤としつつ、非人間キーポイントのサポートと学習収束において明確な改善を実現しながら、従来と同じワークフローを維持している。

Ultralytics poseとUltralytics YOLOv5のYOLOv5

Ultralytics YOLO YOLOモデルの初期バージョン Ultralytics YOLOv5は、主に物体検出のために構築されました。YOLOv5 インスタンスセグメンテーションをサポートするように拡張されましたが、公式Ultralytics 内にはネイティブで専用の姿勢推定ヘッドは含まれていません。 

キーポイント検出を必要とするチームは、通常、別個の実装やカスタム改造に依存していました。Ultralytics 、姿勢推定が組み込みタスクとして含まれており、キーポイント予測専用に設計された専用のアーキテクチャヘッドを備えています。 

これは、YOLO26ポーズモデルが検出やセグメンテーションと同じ統一ワークフロー内で学習、検証、展開できることを意味します。構造化キーポイント検出に焦点を当てたプロジェクトでは、YOLO26はネイティブなポーズサポートと、YOLOv5 標準では提供YOLOv5 タスク特化型アーキテクチャを提供します。

主な相違点:YOLO26-pose 対Ultralytics YOLOv8

Ultralytics YOLOv8Ultralytics 統一Ultralytics ネイティブな姿勢推定を導入し、検出やセグメンテーションと同じワークフローでキーポイントモデルのトレーニングとデプロイを容易にしました。これは非最大抑制(NMS)を用いた従来の後処理パイプラインに依存し、バウンディングボックス回帰とトレーニングには従来の損失関数式を採用しています。

YOLO26はこの基盤をさらに発展させ、姿勢推定に直接影響を与えるアーキテクチャと学習の更新を実施しています。主な違いの一つはエンドツーエンド設計です。YOLO26はNMS の必要性を排除し、特にCPUやエッジデバイスにおいて、デプロイメントを簡素化しレイテンシの一貫性を向上させます。

もう一つの重要な改良点はトレーニング手法にある。YOLO26ではMuSGDオプティマイザと更新された損失戦略を導入した。姿勢推定タスクでは残差対数尤度推定を統合し、キーポイントの不確実性のモデリングを改善している。これらの変更により、特に複雑なシーンや部分的に遮蔽されたシーンにおいて、収束速度の向上とキーポイント予測の安定化が実現される。

要するに、YOLOv8強力で汎用性の高いベースラインを確立した。YOLO26-poseは、訓練効率の向上、遮蔽処理の改善、そして現実世界の非人間姿勢アプリケーションに対する柔軟性の拡大により、このベースラインを洗練させている。

Ultralytics YOLO11:何が改善されたのか?

Ultralytics YOLO11Ultralytics YOLOv8 基盤YOLOv8 バックボーンと特徴抽出層YOLOv8 FLOPsを削減し、パラメータ効率を向上させ、高いmAP 強力なリアルタイム性能を維持した。姿勢推定タスクにおいては、軽量なアーキテクチャでより優れたキーポイント精度を実現した。

YOLO26-poseはこの進化を、より根本的なアーキテクチャ変更によって継続する。端的に言えば、YOLOv8効率性と精度YOLO11 、YOLO26はその基盤の上に、収束速度の向上、推論の安定性強化、複雑なシナリオにおける姿勢精度改善を目的としたアーキテクチャと学習手法の更新を加えている。

なぜ姿勢推定にYOLO26モデルを使い始めるべきなのか?

YOLO を探る中で、YOLO26-poseへの切り替えを検討しているかもしれません。

簡単に言えば、アップグレードは容易です。既にUltralytics YOLOv8 Ultralytics YOLO11を使用している場合、YOLO26-poseへの切り替えは通常、モデルバージョンを変更するだけで、パイプラインを再構築する必要はありません。

非人間キーポイントのサポート強化、トレーニング中の収束速度向上、遮蔽ポイントの処理改善といった利点を、Ultralytics 享受できます。新規および既存の姿勢推定プロジェクトの大半において、YOLO26-poseへの移行は、最小限の手間でこれらの改善を実現する簡便な方法です。

さらに、YOLO26-poseはPyTorch 基盤Ultralytics Python 内で完全にサポートされておりPyTorch トレーニング、検証、デプロイを簡素化しますPyTorch モデルONNX、TensorRT、OpenVINO、CoreML、TFLite形式でエクスポート可能でありPyTorch ワークフロー全体を変更することなく、GPU、CPU、エッジデバイスへのデプロイを容易にします。

主なポイント

Ultralytics 、特に非人間のキーポイントや複雑なシーンを扱う場合において、姿勢推定をより柔軟かつ信頼性の高いものにします。トレーニング速度が向上し、遮蔽への対応力が強化され、異なるデータセット間でより一貫した結果を提供します。Ultralytics YOLO を利用しているチームにとって、YOLO26は既存のワークフローを変更することなく明らかな改善をもたらします。

AIについてもっと知りたいですか?コミュニティGitHubリポジトリをご覧ください。ロボティクスにおけるAI農業におけるコンピュータビジョンについては、ソリューションページをご覧ください。ライセンスオプションを確認して、今日からコンピュータビジョンを使った開発を始めましょう。

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる