専門家によるヒント、戦略、および実際の例を用いて、機械学習モデルにおけるアンダーフィッティングを特定、防止、および対処する方法を学びます。
アンダーフィッティングは 機械学習(ML)において、統計モデル またはアルゴリズムが単純すぎて、データの根本的な構造を捉えることができない場合。これは、モデル が、入力変数と目的変数の関係を適切に学習できない場合を指す。モデルがデータのシグナルを捉えられないため モデルはデータ中のシグナルを捉えることができないため、学習データに対して低いパフォーマンスを示し、新しいデータに対して汎化がうまくいかない。 新しい未知のデータへの汎化がうまくいかない。 となります。アンダーフィットモデルは通常、高いバイアスに悩まされます。 バイアスが高い。 その結果、パターンを見逃し、精度が低くなる。 精度が低くなります。
アンダーフィッティングの検出は、モデル評価段階では一般的に簡単です。主な指標は 主な指標は、訓練セットと検証データの両方において、高いエラー率や低い精度など、性能指標のスコアが低いことです。 妥当性確認データもし 損失関数が高いままで 時間が経過しても損失関数が大きく減少しない場合、モデルはアンダーフィッティングである可能性が高い。オーバーフィッティングとは異なり アンダーフィッティングは、学習データ上では良いが検証データ上では悪いというオーバーフィッティングとは異なり、本質的にタスクを最初から学習できていないことを意味する。 とは異なり、アンダーフィッティングはタスクの学習が本質的に最初からできていないことを意味する。学習曲線を分析することで アンダーフィットモデルでは、訓練曲線と検証曲線はすぐに収束するが、エラー率は高い。 高いエラー率で。
アンダーフィッティングを理解するには、その対極にあるものと対比させることが役に立つ、 オーバーフィッティングこの2つの概念は バイアスと分散のトレードオフの両極端を表している。 ロバストなAIシステムを構築する上で中心的なものである。
ディープラーニング(DL)や他のAI分野の目標は、この両極端の間の「スイートスポット」を見つけることだ。 ディープラーニング(DL)やその他のAI分野の目標は、この両極端の間の「スイートスポット」を見つけることである。 モデルを作成することである。
アンダーフィッティングを引き起こす要因はいくつかあるが、モデル・アーキテクチャやデータ処理パイプラインを調整することで解決できることが多い。 を調整することで解決できることが多い。
コンピュータビジョンの文脈では、タスクの難易度(例えば、高解像度のドローン画像で小さな物体を検出する)に対して小さすぎるモデルバリアントを使用すると、しばしばアンダーフィッティングが起こります。
例えば、高解像度のドローン画像から小さな物体を検出するような場合)。以下はその例である。
Python を使用して、より小型のモデルからより大型で高性能のモデルに切り替える方法を示している。
を使用して ultralytics ライブラリを使って、アンダーフィッティングの可能性を解消する。
from ultralytics import YOLO
# If 'yolo11n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo11l.pt' (Large).
model = YOLO("yolo11l.pt")
# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
より大きな Ultralytics YOLO11モデルに移行し 十分なトレーニング期間を確保することで、システムは複雑なパターンを学習するのに必要なパラメーターを獲得し、アンダーフィッティングを効果的に軽減することができる。 アンダーフィッティングを軽減する。非常に複雑なタスクについては、YOLO26(現在開発中)のような将来のアーキテクチャが、さらに高い密度と精度を提供することを目指している。 現在開発中)のような将来のアーキテクチャは、さらに高い密度と精度を提供することを目指している。モデルがもはやアンダーフィットしていないことを確認するには、常に以下を行う。 ロバストなテスト・データセットに対して評価する。


