YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

データアノテーション

データアノテーションとは? 正確なAIおよびコンピュータビジョンモデルをトレーニングするために、バウンディングボックスまたはポリゴンでデータをラベリングする方法を学びましょう。

データアノテーションとは、機械学習(ML)モデルが理解し、学習するのを助けるために、生のデータにラベル付けまたはタグ付けを行うプロセスです。この重要なステップにより、画像や動画などの非構造化データが、アルゴリズムが解釈できる構造化された情報に変換されます。教師あり学習の文脈では、これらのアノテーションは「正解」として機能し、モデルが自身をトレーニングするために使用します。データアノテーションの品質と精度は、結果として得られる人工知能(AI)モデルの性能と信頼性に直接影響します。正確なアノテーションがなければ、最先端のモデルであっても、効果的にパターンを学習することはできません。

コンピュータビジョンにおけるアノテーションの役割

コンピュータビジョン(CV)において、データアノテーションは、モデルに「見る」ことと世界を解釈することを教えるための基本です。これには、人間のアノテーターが特殊なソフトウェアを使用して、視覚データ内の関心のある物体を識別し、マークすることが含まれます。アノテーションにはいくつかの種類があり、それぞれ異なるCVタスクに適しています。

  • バウンディングボックスアノテーション: これは最も一般的な形式であり、物体検出に使用されます。アノテーターは、個々のオブジェクトの周りに長方形のボックスを描画し、クラスラベル(例:「車」、「人」)を割り当てます。
  • ポリゴンセグメンテーション: インスタンスセグメンテーションのように、より高い精度が求められるタスクでは、アノテーターは各オブジェクトの正確な輪郭をトレースします。これにより、モデルはオブジェクトが重なっていても、オブジェクトの特定の形状と境界を理解できます。
  • セマンティックセグメンテーション: この手法では、画像内のすべてのピクセルを特定のカテゴリ(例:「空」、「道路」、「建物」)に分類します。インスタンスセグメンテーションとは異なり、同じオブジェクトクラスの異なるインスタンスを区別しません。
  • キーポイントアノテーション: ポーズ推定に使用されるこの手法では、人体の関節や顔の角など、オブジェクト上の特定の関心のあるポイント(キーポイント)をマークします。
  • 分類: 最も単純な形式で、画像全体に単一のラベルが割り当てられます。これは、画像分類タスクの基礎となります。

アノテーション方法の選択は、CVプロジェクトの具体的な目標によって異なります。具体的な目標については、プロジェクト目標の定義に関するガイドで概説されています。

実際のアプリケーション

  1. 自動運転車: 自動運転車は、広範囲にアノテーションが付けられたデータでトレーニングされたモデルに依存しています。アノテーターは、歩行者や自転車から、交通信号、車線表示、および道路標識に至るまで、数百万枚の画像とLiDARポイントクラウド内のすべてにラベルを付けます。この詳細なトレーニングデータにより、車両の知覚システムは、その環境を理解し、安全な運転の意思決定を行うことができます。Argoverseのようなデータセットは、堅牢な自動車向けAIソリューションの開発に不可欠です。
  2. 医用画像解析: ヘルスケアAIでは、放射線科医と医療専門家は、MRI、CT、X線のような医療スキャンに注釈を付けて、腫瘍、病変、骨折、またはその他の異常を強調表示します。これらの注釈付きデータセット(公開されている脳腫瘍データセットなど)は、早期診断と治療計画を支援できるUltralytics YOLOのようなモデルをトレーニングするために使用されます。北米放射線学会(RSNA)は、研究のためにそのようなデータセットをいくつか提供しています。

データアノテーションと関連概念

データアノテーションは、他のデータ準備技術と並んで議論されることが多いですが、それぞれ異なる目的を果たします。

  • データアノテーション vs. データラベリング: これら2つの用語は頻繁に同じ意味で使用され、同じコアプロセスを指します。「アノテーション」は、ポリゴンやキーポイントの描画など、より複雑なタスクを記述するためにコンピュータビジョンでよく使用されます。一方、「ラベリング」は、分類のようなより単純なタスクに使用されることがあります。ただし、実際には、これらは同義です。詳細については、コンピュータビジョンにおけるデータラベリングに関する解説をご覧ください。
  • データアノテーション vs. データ拡張: アノテーションは、初期の正解ラベル(ground truth)を作成するプロセスです。一方、データ拡張は、アノテーションが完了した後に、アノテーションされた画像の修正版(回転、反転、明るさの変更など)を作成して、データセットのサイズを人工的に拡大するために使用される手法です。
  • データアノテーション vs. データクリーニング: データクリーニングとは、データセット内のエラーの修正、重複の削除、欠損値の処理を行い、データセット全体の品質を確保することです。クリーニングは、アノテーションの前(例:ぼやけた画像の削除)または後(例:誤ったラベルの修正)に行うことができますが、新しいラベルを追加する行為とは異なります。効果的なアノテーションを行うには、高いデータ品質が不可欠です。

アノテーションのプロセスは、CVATのようなオープンソースのオプションから、Scale AILabelboxのような商用プラットフォームまで、さまざまなツールを使用して管理できます。Ultralytics HUBのようなプラットフォームは、データセットの管理、モデルのトレーニング、およびデータ収集とアノテーションからデプロイメントまでのワークフロー全体を効率化するための統合ソリューションを提供します。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました