データ拡張で機械学習モデルを強化しましょう。精度を高め、過学習を減らし、堅牢性を向上させるテクニックをご紹介します。
データ補強は、次のような戦略的手法である。 機械学習(ML)における戦略的手法である。 のサイズと多様性を人工的に拡大することである。 学習データセット新たな生データを収集することなく を人工的に拡大するために使用される。既存のデータサンプルに様々な変換を適用することで、開発者は、画像、テキスト、音声を変更しながらもリアルなバージョンを作成することができます。 画像、テキスト、音声のリアルバージョンを作成することができる。このプロセスは オーバーフィッティングこれは、モデルが一般化可能なパターンを学習するのではなく、学習例を記憶してしまうという一般的な問題です。 最終的に、効果的なオーグメンテーションは、より高い学習効果をもたらします。 精度につながり、モデル は、実世界環境で未知のデータにさらされたときにロバストに機能することを保証します。
の分野では コンピュータビジョン補強は、異なる条件をシミュレートするために入力画像を操作することを含む。これらの変換は モデルは、方向、照明、スケールの変化に対して不変になります。
高品質なデータが乏しい、あるいは入手にコストがかかる業界では、データの増強が不可欠である。
について ultralytics ライブラリは、オーグメンテーションの適用を簡素化します。
モデルのトレーニング パイプラインあなたは
ハイパーパラメータを調整し、変換の強度と確率を制御することができます。
from ultralytics import YOLO
# Load the YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model with custom data augmentation parameters
# These arguments modify the training data on-the-fly
model.train(
data="coco8.yaml",
epochs=5,
degrees=30.0, # Apply random rotations between -30 and +30 degrees
fliplr=0.5, # 50% probability of flipping images horizontally
mosaic=1.0, # Use Mosaic augmentation (combining 4 images)
mixup=0.1, # Apply MixUp augmentation with 10% probability
)
データ補強を類似のデータ戦略と区別することは重要である:
最新のオーグメンテーション・ライブラリをより深く知るには Albumentationsドキュメントを参照してください。 YOLO11参照してください。


