通过专家提示、策略和实际示例,了解如何识别、预防和解决机器学习模型中的欠拟合问题。
欠拟合发生在 当统计模型或算法过于简单,无法捕捉数据的潜在结构时,机器学习(ML)中就会出现欠拟合现象。 或算法过于简单,无法捕捉数据的底层结构。它描述了模型 无法充分学习输入变量和目标变量之间的关系。由于模型无法 捕捉到数据中的信号,因此在训练数据上表现不佳,对新数据的泛化能力也很差。 训练数据上表现不佳,对未见过的新数据的泛化效果也很差。 数据。欠拟合模型通常具有较高的 偏差,这意味着它对数据做出了强烈的、往往是错误的 假设,导致遗漏模式和低准确率。 准确性。
在模型评估阶段,检测拟合不足通常很简单。主要指标是 主要指标是在训练集和验证数据中的性能指标得分不佳,如错误率高或精度低。 验证数据。如果 损失函数一直居高不下,并且随着时间的推移 随着时间的推移没有明显下降,则模型很可能是欠拟合的。与过拟合不同,过拟合是指模型在训练数据上表现良好,但在验证数据上表现不佳。 模型在训练数据上表现良好,但在验证数据上表现不佳。 开始。分析学习曲线可以 欠拟合模型的训练和验证曲线会迅速收敛,但误差率较高。 错误率较高。
要理解欠拟合,最好将其与相反的对立面进行对比、 过拟合。这两个概念代表了 偏差-方差权衡的两个极端。 这对于构建稳健的人工智能系统至关重要。
深度学习 (DL)和其他 AI 和其他人工智能学科的目标是在这两个极端之间找到 "甜蜜点",创建一个既足够复杂 能学习模式,但又足够简单以实现泛化的模型。
导致拟合不足的因素有很多,但通常可以通过调整模型结构或数据 处理管道。
在计算机视觉领域,当使用的模型变体太小而无法满足任务难度时,往往会出现拟合不足的情况(例如,在高分辨率无人机图像中检测小物体)。
例如,检测高分辨率无人机图像中的小物体)。以下是
Python 该示例演示了如何通过
切换到功能更强的 ultralytics 库,以解决潜在的拟合不足问题。
from ultralytics import YOLO
# If 'yolo11n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo11l.pt' (Large).
model = YOLO("yolo11l.pt")
# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
通过迁移到更大的 Ultralytics YOLO11模型,并确保 系统就能获得学习复杂模式所需的参数,从而有效减少不拟合现象。 减少拟合不足。对于极其复杂的任务,YOLO26(目前正在开发中)等未来架构旨在提供更高的密度和准确性。 目前正在开发中)等未来架构的目标是提供更高的密度和准确性。要验证您的模型是否不再欠拟合,请务必 根据强大的测试数据集进行评估。

