Underfitting
学习如何识别和解决机器学习中的欠拟合。探索原因、迹象,以及如何优化 Ultralytics YOLO26 模型以获得更好的准确性。
当 machine learning 模型过于简单或缺乏足够的容量来捕捉 training data 中的内在趋势和模式时,就会发生欠拟合。从概念上讲,这类似于试图用一条直线来拟合形成明显曲线的数据点;模型无法掌握输入和输出之间关系的复杂性。由于模型未能有效学习数据,它不仅在训练集上表现不佳,在未见过的 validation data 上表现同样糟糕,从而导致较低的预测 accuracy。这种现象通常是由于高 bias in AI 造成的,即算法对目标函数做出了过于简单的假设。
Link to this section原因与指标#
有几个因素会导致模型出现欠拟合。最常见的原因是使用了对于手头任务而言复杂度不足的模型架构,例如将 linear regression 应用于非线性数据。训练时长不足(即模型没有获得足够的 epochs 来收敛)也会阻碍充分学习。此外,过度的 regularization(一种通常用于防止相反问题的技术)可能会过度约束模型,使其无法捕捉重要的特征。
工程师可以通过在训练期间监控 loss functions 来识别欠拟合。如果训练误差和验证误差都保持较高水平且没有显著下降,那么模型很可能存在欠拟合。与有助于模型理解数据的有效 feature engineering 相比,提供过少的特征也会使模型缺乏必要的信息。
Link to this section欠拟合与过拟合#
区分欠拟合与其对应情况 overfitting 至关重要。这两个概念代表了 bias-variance tradeoff 的两个极端。
- 欠拟合(高偏差): 模型过于僵化。它在训练数据和 test data 上的表现都很差,因为它没有学到基本的信号。
- 过拟合(高方差): 模型过于灵活。它记住了训练数据(包括噪声),在训练期间表现优异,但无法 generalize 到新的示例。
在这两个极端之间找到“最佳平衡点”是 model optimization 的首要目标。
Link to this section实际应用#
理解欠拟合对于在各个行业开发可靠的 AI 系统至关重要。
- 自动驾驶: 在 autonomous vehicles 的背景下,一个欠拟合的对象检测模型可能无法在复杂的城市环境中区分行人和灯柱。由于模型缺乏学习细微视觉差异的参数,它会危及 AI safety。
- 医疗诊断: 当应用 medical image analysis 来检测肿瘤等异常情况时,过于简单的模型可能会遗漏微小或不规则的生长。如果神经网络太浅,它就无法学习高 sensitivity and specificity 所需的复杂纹理,从而导致漏诊。
Link to this section使用代码解决欠拟合#
在 computer vision 中,欠拟合通常发生在使用的模型变体对于任务难度而言太小的时候(例如在高清无人机图像中检测小物体)。以下 Python 示例展示了如何使用 ultralytics 库从较小的模型切换到更大、能力更强的模型,以解决潜在的欠拟合问题。
from ultralytics import YOLO
# If 'yolo26n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo26l.pt' (Large).
model = YOLO("yolo26l.pt")
# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)通过转向更大的 Ultralytics YOLO26 模型并确保充足的训练时长,系统获得了学习复杂模式所需的参数,从而有效地缓解了欠拟合。要验证你的模型不再欠拟合,请务必使用稳健的 test dataset 进行评估。为了管理数据集和跟踪实验以尽早发现欠拟合,Ultralytics Platform 提供了全面的可视化和分析工具。






