Yolo 深圳
深セン
今すぐ参加
用語集

学習不足 (Underfitting)

専門家によるヒント、戦略、および実際の例を用いて、機械学習モデルにおけるアンダーフィッティングを特定、防止、および対処する方法を学びます。

アンダーフィッティングは 機械学習(ML)において、統計モデル またはアルゴリズムが単純すぎて、データの根本的な構造を捉えることができない場合。これは、モデル が、入力変数と目的変数の関係を適切に学習できない場合を指す。モデルがデータのシグナルを捉えられないため モデルはデータ中のシグナルを捉えることができないため、学習データに対して低いパフォーマンスを示し、新しいデータに対して汎化がうまくいかない。 新しい未知のデータへの汎化がうまくいかない。 となります。アンダーフィットモデルは通常、高いバイアスに悩まされます。 バイアスが高い。 その結果、パターンを見逃し、精度が低くなる。 精度が低くなります。

アンダーフィッティングの兆候と症状

アンダーフィッティングの検出は、モデル評価段階では一般的に簡単です。主な指標は 主な指標は、訓練セットと検証データの両方において、高いエラー率や低い精度など、性能指標のスコアが低いことです。 妥当性確認データもし 損失関数が高いままで 時間が経過しても損失関数が大きく減少しない場合、モデルはアンダーフィッティングである可能性が高い。オーバーフィッティングとは異なり アンダーフィッティングは、学習データ上では良いが検証データ上では悪いというオーバーフィッティングとは異なり、本質的にタスクを最初から学習できていないことを意味する。 とは異なり、アンダーフィッティングはタスクの学習が本質的に最初からできていないことを意味する。学習曲線を分析することで アンダーフィットモデルでは、訓練曲線と検証曲線はすぐに収束するが、エラー率は高い。 高いエラー率で。

アンダーフィッティングとオーバーフィッティング

アンダーフィッティングを理解するには、その対極にあるものと対比させることが役に立つ、 オーバーフィッティングこの2つの概念は バイアスと分散のトレードオフの両極端を表している。 ロバストなAIシステムを構築する上で中心的なものである。

  • アンダーフィット(高いバイアス):モデルが単純すぎる(例えば、非線形データに対する線形モデル)。また 学習データにあまり注意を払わず、問題を単純化しすぎている。
  • オーバーフィット(高分散):モデルが複雑すぎる。ノイズや異常値を含む 新しい入力に対して汎化できない。

ディープラーニング(DL)や他のAI分野の目標は、この両極端の間の「スイートスポット」を見つけることだ。 ディープラーニング(DL)やその他のAI分野の目標は、この両極端の間の「スイートスポット」を見つけることである。 モデルを作成することである。

一般的な原因と解決策

アンダーフィッティングを引き起こす要因はいくつかあるが、モデル・アーキテクチャやデータ処理パイプラインを調整することで解決できることが多い。 を調整することで解決できることが多い。

  • シンプルなモデル: 複雑で非線形なデータセットに対して線形モデルを使うことは、よくある原因である。
  • 機能不足: モデルは、正確な予測を行うために必要な入力データが不足している可能性がある。
  • 過剰なレギュラー化: オーバーフィッティングを防止するために設計されたテクニックは、時として積極的に適用されすぎることがある。 攻撃的に適用されることがある。
  • 不十分なトレーニング時間: 学習プロセスをあまりに早い段階で止めると、モデルが 収束を妨げる。
    • 解決策より多くのエポック数を訓練する、 最適化アルゴリズムが損失を最小化する時間を増やす。

実世界の例

  1. 不動産価格予測:単純な線形回帰モデルを使って 単純な線形回帰モデルを使って 単純な線形回帰モデルを使って住宅価格を予測することを想像してみてほしい。現実の住宅価格は、立地条件や近隣の質、市場動向など、複雑で非線形な要因に影響される。 現実の住宅価格は、立地、近隣の環境、市場動向などの複雑な非線形の要因に影響される。線形モデルでは、このような微妙な違いを捉えることができず、その結果 アンダーフィットとなり 予測モデリング結果は が常に不正確になる。
  2. 医療画像診断:In 医療におけるAIでは、MRIスキャンで腫瘍を検出するには、複雑な形状を識別する必要がある。 は、複雑な形状やテクスチャーを識別する必要がある。もし開発者が、この物体検出タスクに浅いネットワークや非常に少ないパラメーターのモデル この物体検出タスクに、開発者が浅いネットワーク 健康な組織と腫瘍を区別できない可能性が高い。そのモデルには、高い精度に必要な詳細な特徴を学習する "能力 "がないのだ。 高い感度と特異性に必要な がない

コードによるアンダーフィットへの対処

コンピュータビジョンの文脈では、タスクの難易度(例えば、高解像度のドローン画像で小さな物体を検出する)に対して小さすぎるモデルバリアントを使用すると、しばしばアンダーフィッティングが起こります。 例えば、高解像度のドローン画像から小さな物体を検出するような場合)。以下はその例である。 Python を使用して、より小型のモデルからより大型で高性能のモデルに切り替える方法を示している。 を使用して ultralytics ライブラリを使って、アンダーフィッティングの可能性を解消する。

from ultralytics import YOLO

# If 'yolo11n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo11l.pt' (Large).
model = YOLO("yolo11l.pt")

# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

より大きな Ultralytics YOLO11モデルに移行し 十分なトレーニング期間を確保することで、システムは複雑なパターンを学習するのに必要なパラメーターを獲得し、アンダーフィッティングを効果的に軽減することができる。 アンダーフィッティングを軽減する。非常に複雑なタスクについては、YOLO26(現在開発中)のような将来のアーキテクチャが、さらに高い密度と精度を提供することを目指している。 現在開発中)のような将来のアーキテクチャは、さらに高い密度と精度を提供することを目指している。モデルがもはやアンダーフィットしていないことを確認するには、常に以下を行う。 ロバストなテスト・データセットに対して評価する。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加