深圳Yolo 视觉
深圳
立即加入
词汇表

欠拟合

了解如何识别和解决机器学习中的欠拟合问题。探索其原因、指标,以及如何优化 Ultralytics YOLO26 模型以提高准确性。

机器学习 模型过于简单或缺乏捕捉 训练数据 中潜在趋势和模式的能力时,就会发生欠拟合。从概念上讲,这类似于试图用一条直线拟合形成明显曲线的数据点;模型未能理解输入和输出之间关系的复杂性。由于模型未能有效学习数据,它不仅在训练集上表现不佳,在未见过的 验证数据 上也表现糟糕,导致预测 准确率 低下。这种现象通常是由于 AI 中的高偏差 造成的,即算法对目标函数做出了过于简化的假设。

原因和指标

几个因素可能导致模型欠拟合。最常见的原因是使用了对于手头任务而言不够复杂的模型架构,例如将 线性回归 应用于非线性数据。训练时长不足,即模型没有获得足够的 epoch 来收敛,也会阻碍充分学习。此外,过度的 正则化——一种通常用于防止相反问题的技术——可能会过度限制模型,使其无法捕捉重要特征。

工程师可以通过监控训练期间的 损失函数 来识别欠拟合。如果训练误差和验证误差都保持较高水平且没有显著下降,则模型很可能处于欠拟合状态。与有助于模型理解数据的有效 特征工程 相反,提供过少的特征也会使模型缺乏必要的信息。

欠拟合与过拟合

区分欠拟合与其对应物 过拟合 至关重要。这两个概念代表了 偏差-方差权衡 的两个极端。

  • 欠拟合(高偏差): 模型过于僵化。它在训练数据和 测试数据 上都表现不佳,因为它没有学习到基本信号。
  • 过拟合(高方差): 模型过于灵活。它记忆了训练数据,包括噪声,在训练期间表现出色,但未能 泛化 到新示例。

在这两个极端之间找到“最佳点”是 模型优化 的主要目标。

实际应用

理解欠拟合对于在各行各业开发可靠的 AI 系统至关重要。

  • 自动驾驶:自动驾驶车辆的背景下,一个欠拟合的 object detection 模型可能无法在复杂的城市环境中区分行人和路灯。由于模型缺乏学习细微视觉差异的参数,这会危及AI 安全
  • 医疗诊断:在应用医学图像分析来检测肿瘤等异常时,过于简单的模型可能会遗漏微小或不规则的生长物。如果神经网络过浅,它无法学习实现高敏感性和特异性所需的复杂纹理,从而导致漏诊。

用代码解决欠拟合

计算机视觉,当使用的模型变体对于任务难度(例如,在 高分辨率无人机图像中 detect 小目标)而言过小时,通常会发生欠拟合。以下 Python 示例演示了如何使用 ultralytics 库来解决潜在的欠拟合问题。

from ultralytics import YOLO

# If 'yolo26n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo26l.pt' (Large).
model = YOLO("yolo26l.pt")

# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

通过转向更大的 Ultralytics YOLO26 模型并确保充足的训练时长,系统获得了学习复杂模式所需的参数,从而有效缓解了欠拟合。为了验证您的模型不再欠拟合,请务必使用稳健的 测试数据集 对其进行评估。对于数据集管理和实验跟踪,以便及早发现欠拟合,Ultralytics Platform 提供了全面的可视化和分析工具。

让我们一起共建AI的未来!

开启您的机器学习未来之旅