用語集

学習不足 (Underfitting)

専門家によるヒント、戦略、および実際の例を用いて、機械学習モデルにおけるアンダーフィッティングを特定、防止、および対処する方法を学びます。

アンダーフィッティングは、機械学習（ML）においてよく見られる問題であり、モデルが単純すぎてトレーニングデータ内の根本的なパターンを捉えられない場合に発生します。この単純さにより、入力特徴とターゲット変数の間の関係を学習できず、トレーニングに使用したデータと新しい未知のデータの両方でパフォーマンスが低下します。アンダーフィットモデルは高いバイアスを持ち、データについて強固で、しばしば誤った仮定を立てます。その結果、高いレベルの精度を達成できず、うまく一般化できないモデルになります。

アンダーフィッティング vs. オーバーフィッティング

アンダーフィッティングとオーバーフィッティングは、MLにおける2つの重要な課題であり、モデルがトレーニングデータから新しいデータへ一般化する能力に関連しています。これらは、モデルの複雑さのスペクトルにおける2つの極端な状態を表します。

Underfitting（過少適合）: モデルが単純すぎ、高いバイアスを持っています。データの根本的な構造を学習できず、高い損失関数値を招き、トレーニングおよび検証データセットの両方でパフォーマンスが低下します。
過学習: モデルが複雑すぎ、分散が大きくなっています。ノイズやランダムな変動など、トレーニングデータを過剰に学習してしまいます。その結果、トレーニングセットでは優れたパフォーマンスを発揮しますが、モデルが一般的なパターンを学習する代わりにトレーニング例を暗記してしまうため、未知のデータではパフォーマンスが低下します。

MLの最終的な目標は、これら2つのバランスを取り、バイアス-バリアンスのトレードオフとして知られる概念を実現し、新しい現実世界のシナリオに効果的に汎化できるモデルを作成することです。学習曲線の分析は、モデルがアンダーフィッティング、オーバーフィッティング、または適切にフィッティングされているかどうかを診断するための一般的な方法です。

アンダーフィッティングの原因と解決策

効果的なモデルを構築するには、アンダーフィッティングを特定して対処することが重要です。この問題は通常、いくつかの一般的な原因に起因し、それぞれに対応する解決策があります。

モデルが単純すぎる：複雑な非線形問題に線形モデルを使用することは、過少適合の典型的な原因です。
- ソリューション: モデルの複雑さを高めます。これには、より深いニューラルネットワークや、より小さいUltralytics YOLOモデルバリアントからより大きいモデルバリアントに移行するなど、より強力なモデルアーキテクチャに切り替えることが含まれる場合があります。さまざまなYOLOモデルの比較を調べて、より適切なアーキテクチャを選択できます。
不十分または低品質のフィーチャ：モデルに提供される入力特徴に、正確な予測を行うのに十分な情報が含まれていない場合、モデルは適合不足になります。
- ソリューション: 特徴量エンジニアリングを通じて特徴を改善します。これには、新しい特徴を作成したり、多項式特徴を使用したり、さまざまなデータ前処理手法を適用して、基礎となるパターンをより適切に表現することが含まれる場合があります。特徴選択手法を適用することもできます。
不十分なトレーニング：モデルのトレーニング時間が十分でない可能性があります。エポック数データのパターンを学習します。
- ソリューション: トレーニング期間を長くします。トレーニングが長くなると過学習につながる可能性があるため、検証メトリクスを監視することが重要です。Ultralytics HUBのようなツールは、トレーニング実験を追跡および管理するのに役立ちます。
過剰な正則化：次のような手法 L1およびL2正則化または高いドロップアウト過学習を防ぐためにレートが使用されますが、過剰に適用するとモデルを過度に制約し、学習不足を引き起こす可能性があります。
- ソリューション: 正則化の量を減らします。これは、正則化関数のペナルティ項を下げるか、ドロップアウト率を下げることを意味する場合があります。モデルトレーニングのベストプラクティスに従うと、適切なバランスを見つけるのに役立ちます。

アンダーフィッティングの実世界の例

単純な画像分類器：非常に基本的な畳み込みニューラルネットワーク（CNN）を、1つまたは2つのレイヤーのみで、複雑な画像分類タスク（たとえば、ImageNetデータセット内の数千のオブジェクトカテゴリを識別するなど）でトレーニングすることを想像してみてください。モデルの限られた容量では、非常に多くのクラスを区別するために必要な複雑な特徴を学習できず、トレーニングデータとテストデータの両方で精度が低くなります。PyTorchやTensorFlowのようなフレームワークは、これを克服するためにより洗練されたアーキテクチャを構築するためのツールを提供します。
基本的な予測メンテナンス：機械の動作温度のみに基づいて機械が故障する時期を推定するために、単純な線形回帰モデルを予測モデリングに使用することを検討してください。機械の故障が実際には、振動、経年劣化、圧力などの要因の複雑な非線形の相互作用によって影響を受ける場合、単純な線形モデルは適合不足になります。システムの真の複雑さを捉えることができず、予測パフォーマンスが低下し、故障を正確に予測できなくなります。勾配ブースティングマシンやニューラルネットワークのような、より複雑なモデルの方が適切です。

学習不足 (Underfitting)

Ultralytics YOLOモデルをトレーニングして、業界全体のワークフローを効率化

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOでAIモデルを数秒でトレーニング

アンダーフィッティング vs. オーバーフィッティング

アンダーフィッティングの原因と解決策

アンダーフィッティングの実世界の例

このカテゴリの関連記事

ビットから量子ビットへ：量子最適化がAIをどう変えるか

初心者のためのAIモデルのトレーニング方法クイックガイド

洞察に満ちたドバイから：GDG MENA-Tサミット2025の要点

Ultralyticsコミュニティに参加しませんか？