Keypoints
キーポイントがAIにおいて物体のジオメトリや姿勢をどのように定義するかを学びます。Ultralytics YOLO26でポーズ推定を探究し、使いやすいPython SDKを使い始めましょう。
キーポイントとは、画像内において対象物や被写体の重要な特徴を定義する、明確な空間上の位置やランドマークのことです。コンピュータビジョンや機械学習の文脈において、キーポイントは通常、人物の肘、建物の角、車のホイールの中心といった、対象の特定の部位をピンポイントで示す座標セット(X, Y)として表現されます。対象物の存在を識別するだけの単純なタスクとは異なり、キーポイントを特定することで、人工知能(AI)モデルは被写体の形状、姿勢、構造的配置を理解できるようになります。この能力は高度な視覚分析において不可欠であり、マシンがボディランゲージを解釈し、正確な動きを追跡し、デジタルオーバーレイを現実世界のオブジェクトに合わせることを可能にします。
Link to this sectionAIモデルにおけるキーポイントの役割#
キーポイントは、人間や動物の骨格構造をマッピングする手法である姿勢推定の基礎データとして機能します。肩、膝、足首などのあらかじめ定義されたポイントセットを検出することで、アルゴリズムは被写体の完全な姿勢をリアルタイムで再構築できます。このプロセスは、オブジェクトの内部形状を理解することなくオブジェクトの周囲を囲むバウンディングボックスを出力する、一般的な物体検出の域を超えています。
最先端のUltralytics YOLO26のような現代的なアーキテクチャは、これらのキーポイントを高い精度と速度で予測するように進化しました。これらのモデルは、ディープラーニング(DL)ネットワークを活用し、COCO Keypointsのような大規模なアノテーション付きデータセットでトレーニングを行うことで、関節や顔の特徴に関連する視覚パターンを学習します。推論時、モデルは各キーポイントの座標を回帰し、多くの場合、予測の信頼性を示す信頼度スコアを付加します。
Link to this sectionキーポイントと関連概念の比較#
キーポイントが持つ独自の有用性を理解するために、他の一般的なコンピュータビジョンの出力と区別することは有益です。
- キーポイントとバウンディングボックスの比較: バウンディングボックスは、オブジェクト全体を長方形で囲む大まかな位置情報を提供します。キーポイントは、そのオブジェクト「内部」の特定の部位について、きめ細かい位置情報を提供します。
- キーポイントと画像セグメンテーションの比較: 画像セグメンテーションは、すべてのピクセルを分類してオブジェクトの形状の精密なマスクを作成します。セグメンテーションが詳細な境界情報を提供するのに対し、キーポイントは、動作や運動学の分析において多くの場合より効率的な、構造的な要約(「骨格」)を提供します。
- キーポイントと特徴記述子の比較: SIFT (Scale-Invariant Feature Transform)のような従来の画像処理において、キーポイントとは画像マッチングに使用される関心点(角やブロブなど)を指します。現代のDLを用いた姿勢推定において、キーポイントとはネットワークが学習する意味的なラベル(例:「左手首」)です。
Link to this section実社会での応用#
身体の特定部位やオブジェクトの特徴を追跡する能力は、業界全体で多様なアプリケーションを実現します。
- スポーツ分析: コーチやアスリートは、姿勢推定を使用してバイオメカニクスを分析します。関節のキーポイントを追跡することで、システムは角度や速度を計算し、ゴルフ、テニス、短距離走などのスポーツにおける技術向上を支援します。Ultralytics YOLOモデルがゴルフのスイングを追跡して実行可能なフィードバックを提供する様子をご覧ください。
- ヘルスケアおよびリハビリテーション: 理学療法プラットフォームは、キーポイントを活用して患者の運動を遠隔で監視します。システムは、リハビリテーションのルーチン中に患者が正しいフォームを維持しているかを確認し、怪我のリスクを低減して回復の進捗状況を追跡します。
- 拡張現実(AR): ソーシャルメディアのフィルターや仮想試着アプリケーションは、顔のキーポイント(目、鼻、口の輪郭)に依存しており、デジタルマスクや眼鏡をユーザーの顔にしっかりと固定し、ユーザーが動いても位置合わせを維持します。
- ドライバー監視: 自動車の安全システムは、顔のランドマークを追跡して眠気や脇見運転の兆候を検出し、目が閉じている場合や頭の位置が注意散漫を示している場合にドライバーに警告します。
Link to this sectionYOLO26によるキーポイント検出の実装#
Ultralytics PlatformまたはPython SDKを使用することで、開発者はキーポイント検出を簡単に実装できます。以下の例は、事前学習済みのYOLO26-poseモデルを読み込み、画像に対して推論を実行して人間の骨格を検出する方法を示しています。
from ultralytics import YOLO
# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results showing detected keypoints and skeletons
for result in results:
result.show() # Display the image with keypoints drawn
# Access keypoint coordinates (x, y, confidence)
keypoints = result.keypoints.data
print(f"Detected keypoints shape: {keypoints.shape}")このシンプルなワークフローにより、高度なコンピュータビジョン(CV)アプリケーションの迅速なデプロイが可能になります。工業機械や特定の動物種を検出するために独自のキーポイントモデルを学習させたいユーザーにとって、Ultralytics Platformはクラウド上でのデータアノテーションとモデルトレーニングのプロセスを簡素化します。
Link to this section高度な考慮事項#
キーポイント検出を成功させるには、オクルージョン(身体の一部が隠れている状態)や多様な照明条件といった課題に対処する必要があります。現代のモデルは、トレーニング中に堅牢なデータ拡張を行うことでこれに対処し、ネットワークを多様なシナリオにさらしています。さらに、キーポイントを物体追跡アルゴリズムと統合することで、ビデオストリーム内で人物を長期間にわたり一貫して識別できるようになり、セキュリティや行動分析のようなアプリケーションにおいて不可欠となります。






