用語集

クロスバリデーション

モデルの精度を高め、オーバーフィッティングを防ぎ、ロバストなパフォーマンスを保証する、機械学習における交差検証の威力をご覧ください。

クロスバリデーションは、機械学習(ML)における強力なモデル評価手法であり、統計解析の結果が独立したデータセットにどのように一般化するかを評価するために使用される。これは、限られたデータサンプルでMLモデルを評価するために使用されるリサンプリング手順です。主な目的はオーバーフィッティングを防ぐことであり、これはモデルが訓練データを非常によく学習するため、新しい未知のデータではパフォーマンスが悪くなることである。モデルが実世界でどのように動作するかをシミュレートすることで、クロスバリデーションはよりロバストで信頼性の高いモデル性能の推定を提供します。

クロスバリデーションの仕組み

クロスバリデーションの最も一般的な方法は、K-Foldクロスバリデーションである。このプロセスでは、1つのデータセットを複数の部分に分割する:

  1. データの分割: 訓練データセット全体が、ランダムに「k」個の等しいサイズのサブセット、つまり「フォールド」に分割される。
  2. 反復学習と検証:モデルは「k」回学習される。各反復において、フォールドの1つが検証セットとして保持され、モデルは残りのk-1フォールドで学習される。
  3. 性能評価:モデルの性能は、保持されたフォールドで評価される。精度や 平均平均精度(mAP)などの主要なメトリクスが、各反復について記録される。
  4. 結果の平均化:すべての「k」回の反復が完了した後、パフォーマンス・メトリクスが平均化され、モデルの有効性のより安定した推定値が生成される。

このアプローチでは、すべてのデータポイントが検証セットにちょうど1回、トレーニングセットにk-1回含まれるようになります。実装に関する詳細なガイドは、Ultralytics K-Fold Cross-Validationガイドに記載されています。

交差検証 vs 単純検証の分割

典型的なMLプロジェクトでは、データは訓練セット、検証セット、テストセットに分けられる。

単純な訓練と検証の分割は、検証セットが偶然、特に簡単または難しいサンプルを含んでいる場合、時には誤解を招くことがあります。クロスバリデーションは、データセットのすべての部分を訓練と検証の両方に使用することで、この問題を克服し、モデルの汎化能力のより信頼できる尺度を提供します。そのため、利用可能なデータ量が限られている場合に特に有効です。Scikit-learnのような一般的なフレームワークは、クロスバリデーション技術のロバストな実装を提供します。

実世界での応用

クロスバリデーションは、様々な領域で信頼性の高いAIシステムを構築するために不可欠である:

  1. 医療画像解析: 脳腫瘍データセットのようなデータセットを使って脳スキャンから腫瘍を検出するような、医療画像解析のための畳み込みニューラルネットワーク(CNN)を開発する場合、多様な患者データにわたってモデルの診断精度と汎化を厳密に評価するためにCVを使用します。このロバストな評価は、臨床試験を検討したり、FDAのような機関から規制上の承認を求めたりする前に極めて重要である。
  2. 自律走行車 自律走行車両で使用されるUltralytics YOLOのような物体検出モデルにとって、CVは様々な環境条件下で歩行者、自転車、その他の車両を検出する際の信頼できるパフォーマンスを保証するのに役立ちます。Argoverseのような複雑なデータセットでのこの検証は、AI in Automotiveソリューションのようなセーフティクリティカルなシステムにモデルを展開する前に非常に重要です。

その他の用途としては、画像セグメンテーションのモデル評価、感情分析のような自然言語処理(NLP)タスク、金融モデリングにおけるリスク評価などがあります。Ultralytics HUBのようなプラットフォームは、このような評価技術中に生成される実験や成果物の管理を支援し、開発ライフサイクルを合理化します。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク