深圳Yolo 视觉
深圳
立即加入
词汇表

欠拟合

通过专家提示、策略和实际示例,了解如何识别、预防和解决机器学习模型中的欠拟合问题。

欠拟合发生在 当统计模型或算法过于简单,无法捕捉数据的潜在结构时,机器学习(ML)中就会出现欠拟合现象。 或算法过于简单,无法捕捉数据的底层结构。它描述了模型 无法充分学习输入变量和目标变量之间的关系。由于模型无法 捕捉到数据中的信号,因此在训练数据上表现不佳,对新数据的泛化能力也很差。 训练数据上表现不佳,对未见过的新数据的泛化效果也很差。 数据。欠拟合模型通常具有较高的 偏差,这意味着它对数据做出了强烈的、往往是错误的 假设,导致遗漏模式和低准确率。 准确性

不合适的迹象和症状

在模型评估阶段,检测拟合不足通常很简单。主要指标是 主要指标是在训练集和验证数据中的性能指标得分不佳,如错误率高或精度低。 验证数据。如果 损失函数一直居高不下,并且随着时间的推移 随着时间的推移没有明显下降,则模型很可能是欠拟合的。与过拟合不同,过拟合是指模型在训练数据上表现良好,但在验证数据上表现不佳。 模型在训练数据上表现良好,但在验证数据上表现不佳。 开始。分析学习曲线可以 欠拟合模型的训练和验证曲线会迅速收敛,但误差率较高。 错误率较高。

欠拟合与过拟合

要理解欠拟合,最好将其与相反的对立面进行对比、 过拟合。这两个概念代表了 偏差-方差权衡的两个极端。 这对于构建稳健的人工智能系统至关重要。

  • 拟合不足(高偏差):模型过于简单(例如,非线性数据的线性模型)。它 对训练数据关注太少,过度简化了问题。
  • 过度拟合(高方差):模型过于复杂。它记住了训练数据,包括 噪声和异常值,从而无法泛化到新的输入。

深度学习 (DL)和其他 AI 和其他人工智能学科的目标是在这两个极端之间找到 "甜蜜点",创建一个既足够复杂 能学习模式,但又足够简单以实现泛化的模型。

常见原因和解决方案

导致拟合不足的因素有很多,但通常可以通过调整模型结构或数据 处理管道。

  • 模型简洁: 对复杂的非线性数据集使用线性模型是一个常见原因。
  • 功能不足: 模型可能缺乏必要的输入数据来进行准确预测。
  • 过度正规化: 为防止过度拟合而设计的技术有时会应用得过 过激。
    • 解决方案:减少与 正则化的相关参数或降低 降低模型学习自由度。 学习。
  • 培训时间不足: 过早停止训练过程会阻碍模型收敛 收敛。
    • 解决方案:训练更多的时间、 让优化算法有更多时间将损失降到最低。

真实世界的例子

  1. 房地产价格预测:想象一下,用一个简单的 线性回归模型来预测房价 预测房价。现实世界中的房价受复杂的非线性因素影响,如地理位置、社区质量和市场趋势。 如地理位置、社区质量和市场趋势。线性模型无法捕捉到这些细微差别,从而导致 导致拟合度不足和 预测模型结果 一直不准确。
  2. 医学影像诊断:在医疗保健领域的人工智能中,在核磁共振成像扫描中检测肿瘤 需要识别复杂的形状和纹理。如果开发人员使用浅层网络或参数极少的模型 如果开发人员使用浅层网络或参数很少的模型 模型很可能无法区分肿瘤和健康组织。它缺乏 "能力 "来学习 高灵敏度和特异性所需的详细特征。 灵敏度和特异性

用代码解决欠拟合问题

在计算机视觉领域,当使用的模型变体太小而无法满足任务难度时,往往会出现拟合不足的情况(例如,在高分辨率无人机图像中检测小物体)。 例如,检测高分辨率无人机图像中的小物体)。以下是 Python 该示例演示了如何通过 切换到功能更强的 ultralytics 库,以解决潜在的拟合不足问题。

from ultralytics import YOLO

# If 'yolo11n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo11l.pt' (Large).
model = YOLO("yolo11l.pt")

# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

通过迁移到更大的 Ultralytics YOLO11模型,并确保 系统就能获得学习复杂模式所需的参数,从而有效减少不拟合现象。 减少拟合不足。对于极其复杂的任务,YOLO26(目前正在开发中)等未来架构旨在提供更高的密度和准确性。 目前正在开发中)等未来架构的目标是提供更高的密度和准确性。要验证您的模型是否不再欠拟合,请务必 根据强大的测试数据集进行评估。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入