Yolo 深圳
深セン
今すぐ参加
用語集

データ拡張

データ拡張で機械学習モデルを強化しましょう。精度を高め、過学習を減らし、堅牢性を向上させるテクニックをご紹介します。

データ補強は、次のような戦略的手法である。 機械学習(ML)における戦略的手法である。 のサイズと多様性を人工的に拡大することである。 学習データセット新たな生データを収集することなく を人工的に拡大するために使用される。既存のデータサンプルに様々な変換を適用することで、開発者は、画像、テキスト、音声を変更しながらもリアルなバージョンを作成することができます。 画像、テキスト、音声のリアルバージョンを作成することができる。このプロセスは オーバーフィッティングこれは、モデルが一般化可能なパターンを学習するのではなく、学習例を記憶してしまうという一般的な問題です。 最終的に、効果的なオーグメンテーションは、より高い学習効果をもたらします。 精度につながり、モデル は、実世界環境で未知のデータにさらされたときにロバストに機能することを保証します。

コア・テクニックとメソッド

の分野では コンピュータビジョン補強は、異なる条件をシミュレートするために入力画像を操作することを含む。これらの変換は モデルは、方向、照明、スケールの変化に対して不変になります。

  • 幾何学変換:画像の空間レイアウトを変更します。一般的な操作には ランダム回転、水平反転、切り抜き、拡大縮小などです。例えば OpenCV 幾何変換 を使えば、逆さまでも傾いていても、物体を認識することができる。
  • フォトメトリック変換:ジオメトリを変えることなく、ピクセル値を調整して見た目を変える。 ジオメトリを変更することなく明るさ、コントラスト、彩度を調整し、以下の機能を追加します。 ガウスノイズを追加することで 照明条件を変化させることができます。
  • 高度なミキシングモダン オブジェクト検出フレームワーク 最近の物体検出フレームワークは、モザイク、MixUp、カットミックスといった複雑なテクニックを使うことが多い。これらの手法は、複数の画像を1つの モデルに文脈的な関係を学習させます。これらの実装方法は その Ultralytics Albumentationsインテグレーション.

実際のアプリケーション

高品質なデータが乏しい、あるいは入手にコストがかかる業界では、データの増強が不可欠である。

  1. メディカル・イメージング医療画像 医療画像解析医療画像解析では、個人情報保護法や特定の疾患の希少性により、データセットのサイズが制限されます。X線やMRIスキャンに回転や弾性変形を加えることで のロバストモデルを訓練することができる。 腫瘍検出患者の位置や機械の較正に関係なく、AIが確実に異常を識別できるようにする。
  2. 自律走行:自動運転車は予測不可能な環境をナビゲートしなければならない。あらゆる気象条件のデータを収集することは あらゆる気象条件のデータを収集することは不可能です。エンジニアは、晴天の映像に雨、霧、または低照度のシナリオをシミュレートするためにオーグメンテーションを使用します。 シナリオをシミュレートします。これにより 自律走行車を準備する。 のような組織が説明する安全基準を大幅に改善する。 NHTSA.

Ultralytics YOLOオーグメンテーションの実装

について ultralytics ライブラリは、オーグメンテーションの適用を簡素化します。 モデルのトレーニング パイプラインあなたは ハイパーパラメータを調整し、変換の強度と確率を制御することができます。

from ultralytics import YOLO

# Load the YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model with custom data augmentation parameters
# These arguments modify the training data on-the-fly
model.train(
    data="coco8.yaml",
    epochs=5,
    degrees=30.0,  # Apply random rotations between -30 and +30 degrees
    fliplr=0.5,  # 50% probability of flipping images horizontally
    mosaic=1.0,  # Use Mosaic augmentation (combining 4 images)
    mixup=0.1,  # Apply MixUp augmentation with 10% probability
)

関連概念の区別

データ補強を類似のデータ戦略と区別することは重要である:

  • 対合成データ:オーグメンテーションは既存の実世界データを修正する、 合成データ合成データ コンピュータ・シミュレーションを使用して、完全にゼロから生成される。 生成的AI.オーグメンテーションは持っているものに多様性を加えるもので、合成データは持っていないものを作り出すものである。
  • 対データ前処理: データの前処理データの前処理 データのクリーニングとフォーマット(サイズ変更、正規化など)を行い、モデルに適した状態にすること。オーグメンテーション 前処理の後に行われ、データセットの形式よりも多様性を拡大することに重点を置く。
  • 対トランスファー学習: トランスファー学習活用 事前に訓練されたモデル(例えば、次のようなモデルで訓練されたもの)の知識を活用する。 ImageNetで訓練されたモデル)の知識を活用して新しいタスクを解く。よく一緒に使われるが、転移学習はモデルの重みに関係し、増強は入力データに関係する。 は入力データに関係する。

最新のオーグメンテーション・ライブラリをより深く知るには Albumentationsドキュメントを参照してください。 YOLO11参照してください。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加