用語集

データラベリング

機械学習におけるデータラベリングの重要な役割、そのプロセス、課題、そしてAI開発における現実世界の応用について解説します。

データラベリングとは、生データに意味のある文脈をタグ付けしたり注釈を付けたりして、データセットを作成する基本的なプロセスである。機械学習（ML）モデルの学習に適した機械学習（ML）モデルの学習に適したデータセットを作成する。教師あり学習では教師あり学習では、アルゴリズムは入力データ（画像など）と期待される出力（ラベル）の両方を含む例。このラベル付きとして機能する。モデルの予測を測定し、改善するための決定的な基準として機能する。高品質なラベリングがなければのような最も洗練されたアーキテクチャーでさえも、このようなラベリングが必要である。 Ultralytics YOLO11のような最も洗練されたアーキテクチャでさえ、パターンを正確に認識したりパターンを正確に認識したり、物体を識別したりすることはできない。

正確なラベリングの重要性

AIシステムの性能は、その学習データの質と表裏一体である。とは切っても切れない関係にある。もしラベルに一貫性がなかったり、不正確であったりすると、モデルは欠陥のある関連付けを学習することになる、不正確であったり、間違っていたりすると、モデルは欠陥のある関連付けを学習することになる。「ガベージ・イン、ガベージ・アウト正確なラベリングは、モデルが新しい未知のデータに対してうまく汎化することを可能にします。ロバストなコンピュータ・ビジョン（CV）アプリケーションを展開する上で極めて重要です。主要なベンチマークデータセット COCO データセットや ImageNetなどの主要なベンチマーク・データセットが業界標準となったのはその広範かつ慎重なラベリングによってである。

コンピュータ・ビジョンにおける一般的なラベリングの種類

データラベリングの具体的な方法は、目的とするコンピュータビジョンのタスクに大きく依存する：

画像の分類： 画像全体に1つのカテゴリーまたはクラスタグを割り当てること（例えば、写真を「晴れ」または「雨」とラベル付けする雨 "など)。
オブジェクトの検出2D描画バウンディング・ボックスを描画し各ボックスにクラスを割り当てる。これにより、オブジェクトが何であり、どこに位置しているかをモデルに教える。
画像分割ピクセルパーフェクトなマスクの作成ピクセルパーフェクトなマスクの作成セマンティック・セグメンテーションはインスタンス・セグメンテーションでは、画像内のすべてのピクセルを区別する。インスタンスセグメンテーションはインスタンス・セグメンテーションは、同じクラスの個々のオブジェクト（「車1」、「車2」など）を区別する。
ポーズ推定アノテーション人体の関節など、被写体の特定のキーポイントに注釈を付けること（骨格トラッキング）。人体の関節などの特定のキーポイントに注釈を付け（骨格トラッキング）、動きや姿勢を理解すること。

実際のアプリケーション

データラベリングによって、AIは複雑な実世界環境で機能することができる。2つの顕著な例がある：

自律走行車自動運転車が安全にナビゲートするためには自動運転車が安全にナビゲートするためには、人間が車線を綿密にラベル付けしたトレーニングデータに依存する、交通標識、歩行者、他の車両。これにより、車の知覚システムは道路形状や潜在的な危険を瞬時に解釈することができる。ジオメトリーと潜在的な危険を瞬時に解釈することができる。詳しくは車載AIソリューションをご覧ください。
医療画像解析： 医療では、放射線技師が医療スキャンにラベルを付けて異常を特定する。例えば脳腫瘍のデータセットでは病変の正確な境界を示す。このラベル付けされたデータは、医師の早期診断を支援するモデルをトレーニングし、患者の予後を改善します。患者の予後を改善します。詳しくはヘルスケアにおけるAIについて詳しくはこちらをご覧ください。