Yolo 深圳
深セン
今すぐ参加
用語集

検証データ

検証データを使用して機械学習モデルを最適化し、過学習を防ぎ、ハイパーパラメータを調整し、堅牢な実世界のパフォーマンスを保証します。

検証データは、機械学習開発ライフサイクルにおける重要な中間段階として機能し、モデル学習プロセスにおける未見データの代理として機能する。 検証データは、機械学習開発ライフサイクルにおける重要な中間段階であり、モデル学習プロセスにおける未経験データの代理として機能する。検証データは、データセットの明確なサブセットであり、モデルの設定をチューニングしながら、モデルの適合性を偏りなく評価するために使用される。 モデルの設定をチューニングしながら、モデルの適合度を偏りなく評価するために使用されるデータセットの別個のサブセットです。モデルを定期的に 開発者は、検証データに対してモデルを定期的にテストすることで、システムが新しい情報に対してどの程度学習しているかを評価することができます。 単に学習例を記憶するのではなく を評価することができる。このフィードバック・ループは、問題を早期に発見し、モデルを最適化するために不可欠である。 モデルを最適化するために不可欠です。

モデルのチューニングにおける検証の役割

検証データの主な機能は、ハイパーパラメータのチューニングを容易にすることである。 ハイパーパラメータのチューニングを容易にすることである。モデルの重みのような モデルの重みのような内部パラメータとは異なり のようなハイパーパラメータは、学習プロセスから直接学習される。 学習率ようハイパーパラメータは、手動で設定するか、実験を通じて最適化する必要がある。 実験によって最適化されなければならない。検証セットを使用することで、エンジニアはさまざまなモデル・アーキテクチャや構成を比較し、最終的なテストに手をつけることなく、最もパフォーマンスの高いものを選択することができます。 最終的なテストセットに触れることなく、最適なモデルを選択することができます。

さらに、検証データのパフォーマンスを監視することで、オーバーフィッティングを防ぐことができる。 オーバーフィッティングを防ぐことができる。オーバーフィッティングは、モデルが学習データ モデルが学習データのノイズや特定の詳細を学習することで、新しいデータでの性能が損なわれる。トレーニングエラー は減少するが、検証誤差が増加する場合は、モデルが汎化能力を失っていることを示している。 早期停止のような介入技術が必要であることを示します。

データ分割の区別

信頼できる評価を確実にするために、完全なデータセットは通常3つの部分に分けられる。それぞれの それぞれの分割の具体的な目的を理解することは、効果的な データ管理には不可欠である。

  • トレーニングデータこれは最大の ニューラルネットワークの学習に使用される。モデルはこのデータを反復し、パラメータを調整して損失関数を最小化する。 最小化するようにパラメータを調整する。
  • 検証データ:トレーニング中の評価にのみ使用される。最適な ハイパーパラメータの調整に役立ちます。重要なのは、モデルがこのデータから直接「学習」することはないということです。 評価のみに使用します。
  • テストデータ完全に非公開のデータ 最終的なモデルが選択された場合にのみ使用されるデータセット。モデル展開の前に、精度と信頼性のバイアスのない最終的な指標を提供する。 の最終的な指標を提供する。

Ultralytics実践的実装

Ultralytics エコシステムでは、検証はワークフローにシームレスに統合されている。データセットYAML コンフィギュレーションを定義する際、ユーザーはトレーニング画像と検証画像のパスを指定します。そして Ultralytics 検証モードは、次のようなメトリクスを計算するために呼び出すことができます。 次のようなメトリクスを計算します。 平均平均精度 (mAP) を計算します。

以下は、学習済みのYOLO11 モデルを検証する方法です。 Python使用します:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Validate the model on the 'coco8.yaml' dataset
# The 'data' argument specifies the dataset configuration containing the validation split
metrics = model.val(data="coco8.yaml")

# Display the Mean Average Precision (mAP) at IoU 50-95
print(f"Validation mAP50-95: {metrics.box.map}")

実際のアプリケーション

検証データにより、開発者は精度が最も重要な特定の業界向けにモデルを微調整することができる。

  • スマート農業:農業における 農業におけるAIでは、作物の病気を検出したり 作物の病気をdetect したり、熟度を監視したりするために学習される。様々な天候条件下(晴れ、曇り、雨)で撮影された画像を含む検証セット (晴れ、曇り、雨)の下で撮影された画像を含む検証セットによって、モデルが環境の変化に対してロバストであることが保証される。チューニングにより 検証フィードバックに基づいて 検証フィードバックに基づいてデータ増強戦略を調整することで、農家は予報に関係なく信頼できる予測を得ることができる。
  • ヘルスケア診断薬医療診断 医療診断:CTスキャンを分析するようなタスクのために スキャンを分析するようなタスクでAIを開発する場合、バイアスを避けることが重要です。検証データは、ある病院のデータで訓練されたモデルが、異なるメーカーのスキャナーにもうまく一般化することを保証するのに役立ちます。 が異なるメーカーのスキャナーにうまく一般化されることを確認するのに役立つ。この厳密なチェックは バイアスと分散のトレードオフの落とし穴を回避し、患者の安全性を確保します。 患者の安全を確保します。

高度なテクニッククロスバリデーション

データが乏しいシナリオでは、静的な検証分割は貴重な学習データを削除しすぎる可能性がある。このような場合 このような場合、実務家はしばしば クロスバリデーション、特にK-Fold クロスバリデーション。この手法では、データを「K」個の部分集合に分割し、どの部分集合を検証データとして使用するかをローテーションします。 検証データとする。これにより、すべてのデータポイントが訓練と検証の両方に使用され、統計的によりロバストなモデル性能の推定が可能になります。 に詳述されているように、統計的によりロバストなモデル性能の推定を提供します。 scikit-learn cross-validationのドキュメントで詳しく説明されています。

検証データの適切な使用は、機械学習オペレーション(MLOps)の要である。 機械学習オペレーション(MLOps)の要である。検証例をトレーニングプロセスから厳密に分離することで、開発者はモデルが単に事実を記憶するだけでなく、純粋に視覚世界の解釈を学習していることを確認することができる。 事実を記憶しているのではなく、純粋に視覚世界の解釈を学習していることを保証する。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加