Yolo 深圳
深セン
今すぐ参加
用語集

データアノテーション

データアノテーションとは? 正確なAIおよびコンピュータビジョンモデルをトレーニングするために、バウンディングボックスまたはポリゴンでデータをラベリングする方法を学びましょう。

データアノテーションは、機械学習(ML)モデルが学習するために必要な文脈を提供するため、生データにラベル付け、タグ付け、または文字起こしを行う重要なプロセスです。このステップは、アルゴリズムが入力-出力ペアで訓練され、パターンを認識して予測を行う手法である教師あり学習の基盤となります。 ラベリングされた情報は 真の基準値として機能し、モデルが 再現を目指す理想的な結果を表します。正確かつ一貫性のあるアノテーションがなければ、 Ultralytics 高度なアーキテクチャでさえ 効果的に機能しません。システムの精度は そのトレーニングデータの品質に直接依存するからです。

コンピュータビジョンにおける一般的なアノテーションの種類

コンピュータビジョン(CV)の分野において、データアノテーションとは画像や動画フレーム内の特定の特徴をマークすることを指す。使用される手法は、構築されるモデルが実行する特定のタスクに大きく依存する。

  • 物体検出アノテーターは 車両や歩行者など、関心のある物体の周囲に2D境界ボックスを描画します。 これにより、モデルは物体の定義とシーン内での位置を学習します。
  • インスタンスセグメンテーション この手法は、物体の縁に沿って精密なポリゴンをトレースするものです。単純なボックスとは異なり、セグメンテーションは正確な形状と輪郭をマッピングします。これはロボットによる把持など、高精度を必要とするタスクにおいて極めて重要です。
  • 姿勢推定アノテーターは被写体上の特定のキーポイント(例:人体の関節部(肘、膝、肩))にマークを付けます。これによりモデルはtrack 姿勢track 、さらには運動パフォーマンスの分析さえ可能になります。
  • 画像分類これは最も単純な形式であり、単一のカテゴリラベル(例:「健康な葉」対「病気の葉」)が画像全体に割り当てられる。

実際のアプリケーション

データアノテーションは、様々な産業において、生のセンサーデータと知的な意思決定の間のギャップを埋める役割を果たす。

  1. スマート農業: 農業分野におけるAIでは、作物の画像からなる膨大なデータセットに注釈を付け、雑草、害虫、または栄養不足を特定します。このデータでモデルを訓練することで、農家は作物の監視を自動化し、必要な箇所にのみ処理を施すことが可能となり、無駄を減らし収量を向上させます。
  2. 自動運転:自動運転車は、車線マーカー、交通標識、障害物などがすべてラベル付けされた膨大な注釈付きデータライブラリに依存している。カメラやLiDARセンサーからのデータは処理され、車両の知覚システムを訓練するために使用される。これにより、複雑な交通状況を安全にナビゲートできることが保証される。

関連概念の区別

データセット準備ワークフローで頻繁に使用される他の用語とデータアノテーションを区別することは有益である。

  • アノテーションとデータラベリング しばしば同義語として使われるが、「ラベリング」は通常、より単純な分類タスク(タグの割り当て)を指すのに対し、「アノテーション」は複雑な幾何学図形の描画や動画内のタイムスタンプのマーキングなど、より豊富なメタデータ生成を意味する。
  • アノテーションとデータ拡張 アノテーションは初期の真値データを生成する。拡張は、既存のアノテーション済み画像に変換(回転や色調変化など)を適用してデータセットを人工的に拡大し、モデルの頑健性を向上させる後続のプロセスである。
  • アノテーション対アクティブラーニング アクティブラーニングとは、モデルが最も混乱している特定のデータポイントを特定し、 それらの例のみについて人間の注釈を要求する戦略であり、注釈プロセスの時間とコストを最適化する。

ツールとワークフロー

高品質なアノテーションの作成には通常、JSONやXMLなどの標準フォーマットでデータをエクスポートする専用ソフトウェアが必要です。現代のワークフローは、データソースの取得、自動アノテーション、モデルトレーニングを単一インターフェースでUltralytics 統合環境へと急速に移行しています。

データにアノテーションが付与されると、トレーニング用の設定ファイル(多くの場合YAML)で参照されます。以下の例は、既存のアノテーションが付属するCOCO8 を使用してYOLO26モデルをトレーニングする方法を示しています。

from ultralytics import YOLO

# Load the latest YOLO26 model (nano version)
model = YOLO("yolo26n.pt")

# Train the model using a dataset configuration file
# The YAML file points to the annotated images and labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加