敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

欠拟合

通过专家提示、策略和实际示例,了解如何识别、预防和解决机器学习模型中的欠拟合问题。

欠拟合是 机器学习 (ML) 中常见的问题,其中模型过于简单,无法捕捉训练数据中的潜在模式。这种简单性使其无法学习输入特征和目标变量之间的关系,从而导致在训练数据和新的、未见过的数据上表现不佳。欠拟合模型具有高偏差,这意味着它对数据做出强烈且通常不正确的假设。这导致模型无法达到高准确率并且无法很好地泛化。

欠拟合与过拟合

欠拟合和过拟合是机器学习中的两个关键挑战,它们与模型从训练数据推广到新数据的能力有关。它们代表了模型复杂性谱中的两个极端。

  • 欠拟合: 模型过于简单且具有高偏差。它无法学习数据的底层结构,导致较高的 损失函数 值,并且在训练和验证数据集上的表现都很差。
  • 过拟合: 模型过于复杂且具有高方差。它过度学习训练数据,包括噪声和随机波动。这导致在训练集上表现出色,但在未见过的数据上表现不佳,因为模型实际上是记住了训练示例,而不是学习一般模式。

ML 的最终目标是在这两者之间取得平衡,这种概念被称为偏差-方差权衡,以创建一个可以有效地推广到新的、真实世界场景的模型。分析学习曲线是一种常见的方法,用于诊断模型是欠拟合、过拟合还是拟合良好。

欠拟合的原因和解决方案

识别和解决欠拟合对于构建有效的模型至关重要。该问题通常源于几个常见原因,每个原因都有相应的解决方案。

  • 模型过于简单:对于复杂的非线性问题,使用线性模型是欠拟合的典型原因。
    • 解决方案:增加模型复杂度。这可能涉及切换到更强大的模型架构,例如更深的 神经网络 或更大的预训练模型,例如从较小的 Ultralytics YOLO 模型变体转移到更大的变体。您可以探索各种 YOLO 模型比较,以选择更合适的架构。
  • 特征不足或质量差:如果提供给模型的输入特征不包含足够的信息来进行准确的预测,模型将欠拟合。
  • 训练不足:模型可能没有经过足够的训练 epochs 学习数据中的模式。
  • 过度正则化:诸如以下的技巧 L1 和 L2 正则化 或高 dropout(随机失活) 率用于防止过拟合,但如果过于激进,可能会过度约束模型并导致欠拟合。
    • 解决方案:减少正则化的程度。这可能意味着降低正则化函数中的惩罚项或降低 dropout 率。遵循 模型训练的最佳实践 可以帮助找到正确的平衡。

欠拟合的真实案例

  1. 简单图像分类器: 想象一下,在一个复杂的图像分类任务上训练一个非常基本的卷积神经网络 (CNN),该网络只有一两层,例如识别ImageNet数据集中的数千个对象类别。该模型有限的容量将阻止它学习区分这么多类所需的复杂特征,从而导致在训练和测试数据上的准确性都很低。PyTorchTensorFlow等框架提供了构建更复杂架构以克服这一问题的工具。
  2. 基本预测性维护:考虑使用简单的线性回归模型进行预测建模,以仅根据机器的运行温度来估计机器何时发生故障。如果机器故障实际上受到振动、老化和压力等因素的复杂非线性相互作用的影响,则简单的线性模型将欠拟合。它无法捕捉系统的真实复杂性,从而导致较差的预测性能并且无法准确预测故障。更复杂的模型(如梯度提升机或神经网络)将更合适。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板