検証データを使用して機械学習モデルを最適化し、過学習を防ぎ、ハイパーパラメータを調整し、堅牢な実世界のパフォーマンスを保証します。
検証データは、機械学習開発ライフサイクルにおける重要な中間段階として機能し、モデル学習プロセスにおける未見データの代理として機能する。 検証データは、機械学習開発ライフサイクルにおける重要な中間段階であり、モデル学習プロセスにおける未経験データの代理として機能する。検証データは、データセットの明確なサブセットであり、モデルの設定をチューニングしながら、モデルの適合性を偏りなく評価するために使用される。 モデルの設定をチューニングしながら、モデルの適合度を偏りなく評価するために使用されるデータセットの別個のサブセットです。モデルを定期的に 開発者は、検証データに対してモデルを定期的にテストすることで、システムが新しい情報に対してどの程度学習しているかを評価することができます。 単に学習例を記憶するのではなく を評価することができる。このフィードバック・ループは、問題を早期に発見し、モデルを最適化するために不可欠である。 モデルを最適化するために不可欠です。
検証データの主な機能は、ハイパーパラメータのチューニングを容易にすることである。 ハイパーパラメータのチューニングを容易にすることである。モデルの重みのような モデルの重みのような内部パラメータとは異なり のようなハイパーパラメータは、学習プロセスから直接学習される。 学習率や のようなハイパーパラメータは、手動で設定するか、実験を通じて最適化する必要がある。 実験によって最適化されなければならない。検証セットを使用することで、エンジニアはさまざまなモデル・アーキテクチャや構成を比較し、最終的なテストに手をつけることなく、最もパフォーマンスの高いものを選択することができます。 最終的なテストセットに触れることなく、最適なモデルを選択することができます。
さらに、検証データのパフォーマンスを監視することで、オーバーフィッティングを防ぐことができる。 オーバーフィッティングを防ぐことができる。オーバーフィッティングは、モデルが学習データ モデルが学習データのノイズや特定の詳細を学習することで、新しいデータでの性能が損なわれる。トレーニングエラー は減少するが、検証誤差が増加する場合は、モデルが汎化能力を失っていることを示している。 早期停止のような介入技術が必要であることを示します。
信頼できる評価を確実にするために、完全なデータセットは通常3つの部分に分けられる。それぞれの それぞれの分割の具体的な目的を理解することは、効果的な データ管理には不可欠である。
Ultralytics エコシステムでは、検証はワークフローにシームレスに統合されている。データセットYAML コンフィギュレーションを定義する際、ユーザーはトレーニング画像と検証画像のパスを指定します。そして Ultralytics 検証モードは、次のようなメトリクスを計算するために呼び出すことができます。 次のようなメトリクスを計算します。 平均平均精度 (mAP) を計算します。
以下は、学習済みのYOLO11 モデルを検証する方法です。 Python使用します:
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Validate the model on the 'coco8.yaml' dataset
# The 'data' argument specifies the dataset configuration containing the validation split
metrics = model.val(data="coco8.yaml")
# Display the Mean Average Precision (mAP) at IoU 50-95
print(f"Validation mAP50-95: {metrics.box.map}")
検証データにより、開発者は精度が最も重要な特定の業界向けにモデルを微調整することができる。
データが乏しいシナリオでは、静的な検証分割は貴重な学習データを削除しすぎる可能性がある。このような場合 このような場合、実務家はしばしば クロスバリデーション、特にK-Fold クロスバリデーション。この手法では、データを「K」個の部分集合に分割し、どの部分集合を検証データとして使用するかをローテーションします。 検証データとする。これにより、すべてのデータポイントが訓練と検証の両方に使用され、統計的によりロバストなモデル性能の推定が可能になります。 に詳述されているように、統計的によりロバストなモデル性能の推定を提供します。 scikit-learn cross-validationのドキュメントで詳しく説明されています。
検証データの適切な使用は、機械学習オペレーション(MLOps)の要である。 機械学習オペレーション(MLOps)の要である。検証例をトレーニングプロセスから厳密に分離することで、開発者はモデルが単に事実を記憶するだけでなく、純粋に視覚世界の解釈を学習していることを確認することができる。 事実を記憶しているのではなく、純粋に視覚世界の解釈を学習していることを保証する。


