YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

データ拡張

データ拡張で機械学習モデルを強化しましょう。精度を高め、過学習を減らし、堅牢性を向上させるテクニックをご紹介します。

データ拡張は、機械学習(ML)において、トレーニングデータセットのサイズと多様性を人工的に増加させるために使用される重要なテクニックです。これは、既存のデータサンプルを修正した、しかし現実的なバージョンを作成することによって実現されます。主な目標は、トレーニング中により多様な条件にAIモデルをさらすことによって、特にコンピュータビジョン(CV)において、その性能とロバスト性を向上させることです。これは、モデルがトレーニングデータを過剰に学習し、新しい、未知のデータに一般化できなくなる過学習を防ぐのに役立ち、最終的にはモデルの精度を向上させます。

Data Augmentation(データ拡張)の仕組み

コンピュータビジョンでは、データ拡張には、一連の変換を画像に適用することが含まれます。これらの変換は、デプロイメント後にモデルが遭遇する可能性のある現実世界の変動をシミュレートするように設計されています。一般的な手法は次のとおりです。

  • Geometric Transformations: これらは、画像の空間的な向きを変えます。例としては、ランダムな回転、スケーリング、平行移動(シフト)、トリミング、および反転(水平または垂直)があります。これらは、オブジェクトの位置と向きに対して不変になるようにモデルを教えます。
  • 色空間変換:これらは、画像の色のプロパティを変更します。明るさ、コントラスト、彩度、色相を調整すると、モデルは照明条件の変化に対する耐性が向上します。
  • 高度なテクニック: より複雑な方法では、画像コンテンツをより大幅に変更します。これには、ランダムノイズ(ガウスノイズなど)の追加、ぼかし効果の適用、または既存の2つの画像を線形に結合して新しい画像を作成するMixupや、画像の領域をランダムに削除するCutoutなどの方法の使用が含まれます。これらの方法の詳細については、データ拡張の究極のガイドをご覧ください。

PyTorchTensorFlowのような多くの深層学習フレームワークは、データ拡張のためのツールを提供しています。Albumentationsのような特殊なライブラリは、高性能な拡張技術を豊富に提供し、Ultralytics YOLO11のようなモデルと統合して、トレーニングデータをシームレスに多様化します。

実際のアプリケーション

データ拡張は、より信頼性の高いAIシステムを構築するために、多くの分野で標準的な手法となっています。

  1. 医療におけるAI: 医用画像解析では、患者のプライバシー規制と特定の疾患のまれさのために、データセットが小さいことがよくあります。スキャンで腫瘍を検出するためのモデルをトレーニングするために、回転、スケーリング、明るさの変化などのデータ拡張手法により、より多様なトレーニング例が作成されます。これにより、モデルは、画像機器または患者のポジショニングの変動に関係なく、異常を正確に識別できるようになり、診断の信頼性が向上します。
  2. 自動車向けAI: 自動運転車向けの堅牢な物体検出システムを開発するには、無数の運転シナリオからのデータが必要です。考えられるすべての条件に対してデータを収集する代わりに、データ拡張を使用して、さまざまな天候(合成的な雨や雪の追加など)、照明(昼、夕暮れ、夜)、および遮蔽(別の車に部分的に隠された歩行者など)をシミュレートできます。これにより、車両の認識システムは、予測不可能な現実世界の環境でより信頼性が高まります。

その他の重要な応用例としては、品質管理のための製造業におけるAIや、さまざまな圃場条件下での作物の病害検出のための農業におけるAIなどがあります。

データ拡張と関連概念

データ拡張を、他のデータ関連技術と区別することが重要です。

  • 合成データ:どちらの手法もデータセットを強化しますが、動作が異なります。データ拡張は、既存の実際のデータを変更します。対照的に、合成データ生成は、シミュレーションまたは生成モデルGANなど)を使用して、ゼロから完全に新しい人工データを作成します。拡張は観測されたデータの周りの分散を拡大しますが、合成データは、元のデータセットには存在しない新しいシナリオを作成できます。この概念は、コンピュータビジョンにおける合成データの概要で探求されています。
  • データクリーニング:データクリーニングは、データセット内のエラー、矛盾、および不正確さを特定して修正することに焦点を当てた、より広範なデータ前処理パイプラインの一部です。その目標は、データ品質を向上させることです。一方、データ拡張は、データの量と多様性を増やすことです。クリーンなデータセットは、拡張を適用する前の理想的な出発点です。
  • 転移学習:この手法では、ImageNetのような大規模なベンチマークデータセットで事前学習されたモデルを使用し、それをより小さく、タスク固有のデータセットでファインチューニングします。データ拡張は、新しいデータでのパフォーマンスをさらに向上させ、過学習を防ぐために、ファインチューニング段階でよく使用されます。

Ultralytics HUBのようなプラットフォームは、モデルのトレーニングプロセス全体を効率化し、データ拡張を重要なステップとして組み込むことで、ユーザーが強力で最先端のビジョンAIモデルを構築できるようにします。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました