了解准确性在机器学习中的重要性、准确性的计算方法、不平衡数据集的局限性以及提高模型性能的方法。
准确度是用于评估机器学习(ML)模型性能的最基本、最直观的指标之一,尤其是在人工智能(AI)和计算机视觉(CV)的分类任务中。它表示人工智能模型做出的正确预测占预测总数的比例。虽然准确率易于理解和计算,但仅靠准确率有时会产生误导,尤其是在处理某些类型的数据集或特定问题要求时。
准确率的计算方法是将正确预测(包括真阳性和真阴性)的数量除以预测总数。例如,如果一个模型在 100 张图像中正确识别了 90 张,那么它的准确率就是 90%。这种简单性使其成为评估模型性能的常用起点。
准确度是对模型总体正确率的直接衡量。它被广泛应用于模型开发和模型训练的初始阶段,以获得对性能的总体感觉。高准确度通常是许多应用的首要目标,它表明模型能很好地泛化到新的、未见过的数据中。许多最先进的模型,如 Ultralytics YOLO等模型,在追求高准确率的同时,还兼顾了速度等其他因素。您可以查看YOLO11 与YOLOv8之类的比较,这些比较通常强调准确性基准。
尽管其直观性很强,但准确性有很大的局限性:
由于精确度的局限性,尤其是在数据不平衡或错误成本不同的情况下,人们通常会选择其他指标或与之并用:
了解了这些不同的YOLO 性能指标,就可以根据具体需求对模型性能进行更细致的评估。
有几种技术可以帮助提高模型的准确性,但往往需要权衡其他指标或计算成本:
Model Training Tips等咨询资源可提供实用指导。Ultralytics HUB等平台允许用户训练模型,并轻松跟踪准确性和其他关键指标,通常使用TensorBoard 等工具实现可视化。通过斯坦福人工智能指数报告等资源或浏览Papers With Code上的数据集,可以跟踪该领域的进展。像 PyTorch(见官方网站)和 TensorFlow(见官方网站)等框架通常用于构建和训练这些模型。
总之,虽然精确度是评估人工智能模型性能的一个宝贵而直观的指标,但它很少应该被单独使用。考虑人工智能任务的具体目标和数据的性质,尤其是潜在的不平衡或不同的错误成本,对于选择最合适的评估指标(如精确度、召回率、F1-分数或 mAP)至关重要。利用可解释人工智能(XAI)技术还能提供超越单一指标值的更深入的见解。