用語集

クロスバリデーション

機械学習における交差検証の力を発見し、モデルの精度を高め、過学習を防ぎ、堅牢なパフォーマンスを確保しましょう。

クロスバリデーションは、統計分析の結果が独立したデータセットにどの程度一般化されるかを評価するために、機械学習（ML）で使用される強力なモデル評価手法です。これは、限られたデータサンプルでMLモデルを評価するために使用されるリサンプリング手順です。主な目標は、モデルがトレーニングデータを過剰に学習し、新しい未知のデータに対してパフォーマンスが低下する過学習を防ぐことです。クロスバリデーションは、モデルが現実世界でどのように機能するかをシミュレートすることにより、モデルのパフォーマンスのより堅牢で信頼性の高い推定を提供します。

クロスバリデーション（交差検証）の仕組み

最も一般的な交差検証の方法は、K-分割交差検証です。このプロセスでは、単一のデータセットを複数の部分に分割します。

データの分割: トレーニングデータセット全体は、ランダムに「k」個の等しいサイズのサブセット（または「フォールド」）に分割されます。
反復的なトレーニングと検証: モデルは「k」回トレーニングされます。各イテレーションでは、フォールドの1つが検証セットとして保持され、モデルは残りのk-1フォールドでトレーニングされます。
パフォーマンス評価: モデルのパフォーマンスは、ホールドアウトフォールドで評価されます。精度や平均適合率（mAP）などの主要な指標が、各イテレーションで記録されます。
結果の平均化： すべての「k」回のイテレーションが完了した後、パフォーマンス指標を平均化して、モデルの有効性のより安定した単一の推定値を生成します。

このアプローチにより、すべてのデータポイントが検証セットに正確に1回、トレーニングセットにk-1回含まれることが保証されます。実装に関する詳細なガイドは、Ultralytics K-Fold Cross-Validationガイドにあります。

クロスバリデーション vs. 単純な検証分割

一般的な機械学習プロジェクトでは、データはトレーニングセット、検証セット、テストセットに分割されます。

検証データ: ハイパーパラメータの調整とモデルアーキテクチャに関する決定を行うために、トレーニングフェーズ中に使用されます。
Test Data: すべてのトレーニングと調整が完了した後にのみ使用され、モデルの汎化能力に関する最終的な偏りのない評価を提供します。

単純なトレーニング/検証分割は、検証セットにたまたま特に簡単または難しいサンプルが含まれている場合、誤解を招く可能性があります。交差検証は、データセットのすべての部分をトレーニングと検証の両方に使用することでこれを克服し、モデルの汎化能力のより信頼性の高い尺度を提供します。これにより、利用可能なデータ量が限られている場合に特に役立ちます。Scikit-learnのような一般的なフレームワークは、交差検証手法の堅牢な実装を提供します。

実際のアプリケーション

クロスバリデーションは、さまざまな分野で信頼性の高いAIシステムを構築する上で不可欠です。

医療画像解析: 脳腫瘍データセットのようなデータセットを使用して脳スキャンで腫瘍を検出するなど、医療画像解析用の畳み込みニューラルネットワーク（CNN）を開発する場合、CVを使用して、モデルの診断精度と多様な患者データ全体の一般化を厳密に評価します。この堅牢な評価は、臨床試験を検討したり、FDAのような団体から規制当局の承認を求める前に非常に重要です。
自動運転車: 自動運転車で使用されるUltralytics YOLOのような物体検出モデルの場合、CVは、さまざまな環境条件下で歩行者、自転車、およびその他の車両を確実に検出できるようにします。Argoverseのような複雑なデータセットでのこの検証は、自動車ソリューションにおけるAIのような安全が重要なシステムにモデルをデプロイする前に不可欠です。

その他のアプリケーションには、画像セグメンテーション、センチメント分析のような自然言語処理（NLP）タスク、および金融モデリングにおけるリスク評価のためのモデル評価が含まれます。Ultralytics HUBのようなプラットフォームは、このような評価手法中に生成される実験や成果物を管理し、開発ライフサイクルを効率化するのに役立ちます。

クロスバリデーション

Ultralytics YOLOモデルをトレーニングして、業界全体のワークフローを効率化

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOでAIモデルを数秒でトレーニング

クロスバリデーション（交差検証）の仕組み

クロスバリデーション vs. 単純な検証分割

実際のアプリケーション

このカテゴリの関連記事

ビットから量子ビットへ：量子最適化がAIをどう変えるか

初心者のためのAIモデルのトレーニング方法クイックガイド

洞察に満ちたドバイから：GDG MENA-Tサミット2025の要点

Ultralyticsコミュニティに参加しませんか？