用語集

データ注釈

データアノテーションとは?バウンディングボックスやポリゴンでデータにラベリングすることが、正確なAIやコンピュータビジョンモデルのトレーニングに不可欠であることを学びましょう。

データアノテーションとは、機械学習(ML)モデルがデータを理解し、そこから学習できるように、生データにラベルやタグを付けるプロセスのことである。この重要なステップは、画像やビデオのような構造化されていないデータを、アルゴリズムが解釈できる構造化された情報に変換する。教師あり学習の文脈では、これらのアノテーションは「グランドトゥルース」、つまりモデルがそれ自体を学習するために使用する正しい答えの役割を果たします。データのアノテーションの質と精度は、結果として得られる人工知能(AI)モデルのパフォーマンスと信頼性に直接影響します。正確なアノテーションがなければ、最先端のモデルであっても効果的にパターンを学習することはできません。

コンピュータ・ビジョンにおけるアノテーションの役割

コンピュータビジョン(CV)において、データアノテーションは、モデルに世界を「見て」解釈させるための基本である。データアノテーションには、視覚データ内の関心のあるオブジェクトを特定し、マークを付けるために、専用のソフトウェアを使用する人間のアノテーターが関与します。アノテーションにはいくつかの種類があり、それぞれ異なるCVタスクに適しています:

  • バウンディングボックスのアノテーションこれは最も一般的な形式で、オブジェクト検出に使用される。アノテーターは個々のオブジェクトの周囲に長方形のボックスを描き、クラスラベル(例えば、"車"、"人")を割り当てる。
  • ポリゴン・セグメンテーション: インスタンスのセグメンテーションなど、より高い精度が要求されるタスクでは、アノテーターが各オブジェクトの輪郭を正確にトレースする。これにより、オブジェクトが重なっていても、モデルはオブジェクトの特定の形状と境界を理解することができます。
  • セマンティック・セグメンテーションこの手法では、画像内のすべてのピクセルを特定のカテゴリー(「空」、「道路」、「建物」など)に分類する。インスタンス・セグメンテーションとは異なり、同じオブジェクト・クラスの異なるインスタンスを区別することはない。
  • キーポイント注釈: ポーズ推定に使用されるこの技術は、人体の関節や顔の角など、オブジェクト上の特定の注目点(キーポイント)をマークする。
  • 分類:最も単純な形式で、画像全体に単一のラベルが割り当てられる。画像分類タスクの基礎となる。

注釈方法の選択は、CVプロジェクトの具体的な目標に依存する。

実世界での応用

  1. 自律走行車自動運転車は、広範な注釈データに基づいて学習されたモデルに依存している。アノテーターは、何百万もの画像やLiDARの点群に含まれる、歩行者や自転車から交通信号、車線標識、道路標識に至るまで、あらゆるものにラベルを付ける。この詳細な学習データにより、車両の知覚システムは環境を理解し、安全な運転判断を下すことができる。Argoverseのようなデータセットは、車載ソリューションでロバストなAIを開発するために不可欠です。
  2. 医療画像分析 ヘルスケア向けAIでは、放射線科医や医療専門家がMRI、CT、X線などの医療スキャンに注釈を付け、腫瘍、病変、骨折、その他の異常を強調する。公開されている脳腫瘍データセットのようなこれらの注釈付きデータセットは、早期診断や治療計画を支援するUltralytics YOLOのようなモデルの学習に使用される。北米放射線学会(RSNA)は、このようなデータセットを研究用にいくつか提供している。

データ注釈と関連概念

データアノテーションは、しばしば他のデータ準備技術と一緒に議論されるが、その目的は異なる。

  • データ・アノテーションとデータ・ラベリングこの2つの用語はしばしば互換的に使用され、同じコアプロセスを指す。「アノテーション "はコンピュータビジョンにおいて、ポリゴンやキーポイントを描くような複雑なタスクを表現するのに使われ、"ラベリング "は分類のような単純なタスクに使われることが多い。しかし、実用上は、これらは同義語です。詳しくは、コンピュータビジョンのためのデータラベリングについての解説をご覧ください。
  • データ注釈 vs.データ補強アノテーションは、最初の真実のラベルを作成するプロセスである。一方、データ補強は、アノテーションの後に、アノテーションされた画像の修正版(回転、反転、明るさの変更など)を作成することで、データセットのサイズを人為的に増加させるために使用されるテクニックである。
  • データ注釈とデータクリーニングの比較データクリーニングとは、データセット全体の品質を保証するために、エラーを修正し、重複を削除し、欠損値を処理することである。クリーニングは、アノテーションの前(不鮮明な画像の除去など)または後(不正確なラベルの修正など)に行われるが、新しいラベルを追加する行為自体とは異なる。効果的なアノテーションには、高いデータ品質が不可欠である。

アノテーションのプロセスは、CVATのようなオープンソースのオプションから、Scale AIや Labelboxのような商用プラットフォームまで、様々なツールを使って管理することができる。Ultralytics HUBのようなプラットフォームは、データセットを管理し、モデルを訓練し、データ収集とアノテーションから展開までのワークフロー全体を合理化する統合ソリューションを提供する。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク