YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

学習不足 (Underfitting)

専門家によるヒント、戦略、および実際の例を用いて、機械学習モデルにおけるアンダーフィッティングを特定、防止、および対処する方法を学びます。

アンダーフィッティングは、機械学習(ML)においてよく見られる問題であり、モデルが単純すぎてトレーニングデータ内の根本的なパターンを捉えられない場合に発生します。この単純さにより、入力特徴とターゲット変数の間の関係を学習できず、トレーニングに使用したデータと新しい未知のデータの両方でパフォーマンスが低下します。アンダーフィットモデルは高いバイアスを持ち、データについて強固で、しばしば誤った仮定を立てます。その結果、高いレベルの精度を達成できず、うまく一般化できないモデルになります。

アンダーフィッティング vs. オーバーフィッティング

アンダーフィッティングとオーバーフィッティングは、MLにおける2つの重要な課題であり、モデルがトレーニングデータから新しいデータへ一般化する能力に関連しています。これらは、モデルの複雑さのスペクトルにおける2つの極端な状態を表します。

  • Underfitting(過少適合): モデルが単純すぎ、高いバイアスを持っています。データの根本的な構造を学習できず、高い損失関数値を招き、トレーニングおよび検証データセットの両方でパフォーマンスが低下します。
  • 過学習: モデルが複雑すぎ、分散が大きくなっています。ノイズやランダムな変動など、トレーニングデータを過剰に学習してしまいます。その結果、トレーニングセットでは優れたパフォーマンスを発揮しますが、モデルが一般的なパターンを学習する代わりにトレーニング例を暗記してしまうため、未知のデータではパフォーマンスが低下します。

MLの最終的な目標は、これら2つのバランスを取り、バイアス-バリアンスのトレードオフとして知られる概念を実現し、新しい現実世界のシナリオに効果的に汎化できるモデルを作成することです。学習曲線の分析は、モデルがアンダーフィッティング、オーバーフィッティング、または適切にフィッティングされているかどうかを診断するための一般的な方法です。

アンダーフィッティングの原因と解決策

効果的なモデルを構築するには、アンダーフィッティングを特定して対処することが重要です。この問題は通常、いくつかの一般的な原因に起因し、それぞれに対応する解決策があります。

  • モデルが単純すぎる:複雑な非線形問題に線形モデルを使用することは、過少適合の典型的な原因です。
    • ソリューション: モデルの複雑さを高めます。これには、より深いニューラルネットワークや、より小さいUltralytics YOLOモデルバリアントからより大きいモデルバリアントに移行するなど、より強力なモデルアーキテクチャに切り替えることが含まれる場合があります。さまざまなYOLOモデルの比較を調べて、より適切なアーキテクチャを選択できます。
  • 不十分または低品質のフィーチャ:モデルに提供される入力特徴に、正確な予測を行うのに十分な情報が含まれていない場合、モデルは適合不足になります。
  • 不十分なトレーニング:モデルのトレーニング時間が十分でない可能性があります。 エポック数 データのパターンを学習します。
  • 過剰な正則化:次のような手法 L1およびL2正則化 または高い ドロップアウト 過学習を防ぐためにレートが使用されますが、過剰に適用するとモデルを過度に制約し、学習不足を引き起こす可能性があります。
    • ソリューション: 正則化の量を減らします。これは、正則化関数のペナルティ項を下げるか、ドロップアウト率を下げることを意味する場合があります。モデルトレーニングのベストプラクティスに従うと、適切なバランスを見つけるのに役立ちます。

アンダーフィッティングの実世界の例

  1. 単純な画像分類器:非常に基本的な畳み込みニューラルネットワーク(CNN)を、1つまたは2つのレイヤーのみで、複雑な画像分類タスク(たとえば、ImageNetデータセット内の数千のオブジェクトカテゴリを識別するなど)でトレーニングすることを想像してみてください。モデルの限られた容量では、非常に多くのクラスを区別するために必要な複雑な特徴を学習できず、トレーニングデータとテストデータの両方で精度が低くなりますPyTorchTensorFlowのようなフレームワークは、これを克服するためにより洗練されたアーキテクチャを構築するためのツールを提供します。
  2. 基本的な予測メンテナンス:機械の動作温度のみに基づいて機械が故障する時期を推定するために、単純な線形回帰モデル予測モデリングに使用することを検討してください。機械の故障が実際には、振動、経年劣化、圧力などの要因の複雑な非線形の相互作用によって影響を受ける場合、単純な線形モデルは適合不足になります。システムの真の複雑さを捉えることができず、予測パフォーマンスが低下し、故障を正確に予測できなくなります。勾配ブースティングマシンやニューラルネットワークのような、より複雑なモデルの方が適切です。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました