機械学習におけるアンダーフィッティングを特定し、解決する方法を学びましょう。その原因、指標、そしてより良い精度を得るためにUltralytics YOLO26モデルを最適化する方法を探ってください。
アンダーフィッティングは、機械学習モデルが単純すぎたり、訓練データ内の根本的な傾向やパターンを捉える能力が不足している場合に発生します。概念的には、明確な曲線を描くデータ点に直線で当てはめようとするのと似ており、モデルは入力と出力の関係の複雑さを捉えることができません。モデルがデータを効果的に学習していないため、訓練セットだけでなく、未知の検証データに対しても低い性能を示し、予測精度が低下します。この現象は、アルゴリズムがターゲット関数について過度に単純な仮定をする、高いAIにおけるバイアスの結果であることがよくあります。
いくつかの要因がアンダーフィットモデルにつながる可能性があります。最も一般的な原因は、非線形データに線形回帰を適用するなど、タスクに対して十分複雑ではないモデルアーキテクチャを使用することです。モデルが収束するのに十分なエポックが与えられない不十分なトレーニング期間も、適切な学習を妨げます。さらに、過度な正則化(通常は逆の問題を防ぐために使用される手法)は、モデルを過度に制約し、重要な特徴を捉えるのを妨げることがあります。
エンジニアは、トレーニング中に損失関数を監視することでアンダーフィッティングを特定できます。トレーニングエラーと検証エラーの両方が高いままで、大幅に減少しない場合、モデルはアンダーフィッティングしている可能性が高いです。モデルがデータを理解するのに役立つ効果的な特徴量エンジニアリングとは対照的に、特徴量が少なすぎると、モデルに必要な情報が不足する可能性があります。
未学習をその対極である過学習と区別することが重要です。これら2つの概念は、バイアス-バリアンスのトレードオフの両極端を表します。
これら二つの極端な間の「スイートスポット」を見つけることが、モデル最適化の主要な目標です。
アンダーフィッティングを理解することは、さまざまな業界で信頼性の高いAIシステムを開発するために極めて重要です。
において コンピュータビジョン、タスクの難易度に対して小さすぎるモデルバリアントを使用すると、アンダーフィッティングが発生しやすくなります(例:高解像度のドローン画像で小さなオブジェクトをdetectする場合など)。以下の Python この例は、より小さなモデルから、より大きく、より高性能なモデルに切り替える方法を、これを使用して示しています。 ultralytics ライブラリは、潜在的なアンダーフィッティングを解決します。
from ultralytics import YOLO
# If 'yolo26n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo26l.pt' (Large).
model = YOLO("yolo26l.pt")
# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
より大きなUltralytics YOLO26モデルに移行し、十分な訓練期間を確保することで、システムは複雑なパターンを学習するために必要なパラメータを獲得し、アンダーフィッティングを効果的に軽減します。モデルがアンダーフィッティングしていないことを確認するには、常に堅牢なテストデータセットに対して評価してください。データセットの管理と、アンダーフィッティングを早期に発見するための実験追跡には、Ultralytics Platformが可視化と分析のための包括的なツールを提供します。

未来の機械学習で、新たな一歩を踏み出しましょう。