遇见 YOLO26: 下一代视觉 AI。
Ultralytics
视觉 AI

计算机视觉模型在生产中失败的 5 大原因

了解计算机视觉模型为何在生产环境中失败(从数据不匹配到延迟),以及团队如何改进现实世界视觉 AI 系统中的模型性能。

ABAbirami Vina4 min read
计算机视觉模型在生产中失败的原因

计算机视觉现已成为各行各业竞相采用的一项关键人工智能技术,它使机器能够解读和分析视觉数据以完成各类任务。这些系统支持许多现实世界的应用,从医学影像和机器人技术,到制造业和零售自动化,应有尽有。

然而,构建计算机视觉系统并非总是那么简单。它通常涉及开发一个经过训练、能够识别图像和视频模式的视觉 AI 模型,从而支持目标检测和追踪等任务。

目标检测与跟踪示例

图 1. 目标检测和追踪示例 (来源)

尽管计算机视觉模型多年来不断进步,但在开发阶段和部署到现实环境后的表现仍可能大相径庭。这是因为在受控的开发环境之外部署模型,往往会带来一些全新的、意想不到的挑战。

诸如数据集缺乏多样性、模型监控不力以及基础设施限制等因素,都可能导致同一个模型在部署到现实世界后表现出不同的行为。

在本文中,我们将探讨计算机视觉模型可能在生产中表现不佳的五个常见原因。让我们开始吧!

Link to this section模型训练与生产之间的鸿沟#

模型训练通常在受控环境中进行。在此阶段,AI 开发人员使用精心准备的训练数据集进行工作。

这些海量的视觉数据集合包含结构良好的标注,也就是描述每张图像内容的标签。训练过程也在一致的条件下进行,这使得视觉 AI 模型能够有效地学习视觉模式。

为了确保这些模式被正确习得,模型可以在开发过程中通过标准评估指标和基准数据集进行系统性评估。与训练数据集类似,这些基准数据集也是经过精心准备的。

然而,现实世界中的计算机视觉系统所面对的数据可能与训练和评估时使用的数据截然不同。模型一旦部署,就很难再处于受控条件之下。

它们最终可能会处理来自不可预测环境的图像和视频,这些环境中的光照不断变化、拍摄角度在移动、背景也随时间而改变。例如,一个针对交通检测训练的视觉 AI 模型,如果主要是在白天图像上进行训练和评估的,那么它在夜间检测车辆时可能会遇到困难。

对于在白天图像上训练的模型而言,夜间图像依然是个难题

图 2. 即使经过增强,对于在日光图像上训练的模型来说,夜间图像依然难以解读。 (来源)

开发与实际部署之间的这种差异即为训练—生产鸿沟。正是由于这条鸿沟的存在,许多模型失效问题只有在部署后才会显现,因此在构建更可靠、更稳健的计算机视觉系统时,及早意识到这一点至关重要。

Link to this section计算机视觉模型在生产中失效的 5 个常见原因#

接下来,让我们仔细看看计算机视觉模型在生产中失效的五个常见原因。

Link to this section低质量的训练数据集#

数据集在训练计算机视觉模型中起着核心作用,因为它们决定了模型在训练期间学习的内容,以及部署后如何响应现实世界的输入。这在监督学习中尤为重要,模型通过展示每张图像代表什么的带标签示例进行学习。

许多深度学习模型(包括卷积神经网络 (CNNs))都依赖这些带标签的示例来识别视觉数据中的模式。然而,当训练数据集不能反映现实条件时,模型可能会学习到无法完全代表现实中对象外观的模式。

例如,一个在大型裂缝缺陷数据集上训练的模型,可能无法检测到现实生产流程中罕见的微小裂缝。同样,标注质量也会影响模型行为。标签不一致或带标签数据中缺失细节,都可能导致模型在训练期间学到错误的信息。

图像标注概览

图 3. 查看图像标注 (来源)

总之,训练数据的质量和多样性至关重要,它们能决定模型在实际应用中的表现。当数据集具有代表性且标注准确时,模型在部署后通常会运行得更可靠。

Link to this section过拟合与泛化能力#

诸如视觉模型之类的机器学习模型会从训练数据集中学习模式。但有时,模型可能会过度依赖少数几种模式。

它最终可能会记住训练数据中的有限模式,而不是学习更广泛的视觉关联。这种行为被称为过拟合。

过拟合通常发生在训练数据集规模较小或缺乏足够数据多样性的情况下。在这种情况下,模型虽然擅长识别它已经见过的图像,但在解读新数据或陌生输入时却会感到吃力。

正因如此,模型在测试输入上可能表现良好(因为它们与训练数据相似),但在部署后的新条件下表现却可能迥异。这就是为什么泛化能力的概念至关重要。简单来说,它指的就是模型将训练中学到的知识应用到新场景的能力。

为了减少过拟合,AI 爱好者通常会在更多样化的数据集上训练模型,并应用数据增强——这是一种通过轻微修改训练图像来增加数据变体的方法。如果没有这些考虑,一旦系统开始在现实环境中运行,模型性能可能会迅速下降。

数据增强在数据集中创建同一图像的变体

图 4. 数据增强有助于在数据集中创建同一图像的变体。 (来源)

Link to this section现实环境中的隐藏边缘情况#

即使计算机视觉模型能很好地泛化到新数据,现实环境仍可能引入意想不到的边缘情况。这些是不寻常的情况,与模型在训练期间学习的典型模式有所不同。

其中许多场景在开发过程中很难捕捉到,因为它们发生频率低、难以重现,或者作为训练数据收集起来成本昂贵。例如,物体可能会以不寻常的形状出现、不可预测地移动,或部分被其他物体遮挡。

光照、摄像头角度或背景条件的变化也可能产生使识别变得更具挑战性的情况。这些边缘情况往往只有在系统部署到实际应用后才会变得明显。

例如在机器人技术和制造自动化中,物品的摆放或位置可能超出预期,从而产生模型设计之初并未考虑到的情况。最终,测试时看起来可靠的预测,在系统进入现实环境运行后,一致性可能会有所下降。

Link to this section缺乏部署后的监控与调试#

除了开发视觉 AI 模型,监控并改进其性能同样必不可少。然而,系统一旦运行,重点往往会转移到单纯维持其运作,而不是密切跟踪其长期的表现。结果,模型行为的变化往往会被忽略。

与此同时,输入数据、摄像头配置或运行环境的变化等因素,可能会逐渐影响模型识别或分类物体的准确度。这些变化并不总是显而易见的,并且在日常运行中可能保持未被察觉的状态。

监控模型输出和系统整体行为可以帮助团队更早地发现这些问题。定期的检查、验证程序和调试流程能让团队深入调查异常结果,并了解造成这些异常的原因。

制造业等领域,模型在摄像头配置发生改变后,可能会突然错误识别装配线上的物体。跟踪部署后的视觉 AI 系统的行为,可以更轻松地应对这些变化,并保持其在现实环境中的稳定表现。

Link to this section基础设施限制与延迟#

许多计算机视觉系统需要在实时环境中运行,这会对硬件、网络和处理流程带来巨大压力。当资源受限时,可能会出现计算延迟或网络延迟,导致预测反馈过慢,从而影响系统整体性能。

在某些情况下,先进的深度学习模型也可能带来基础设施方面的挑战。例如,基于 Transformer 的架构旨在处理海量视觉数据并学习图像内的复杂关系,但它们通常需要大量的计算资源。运行这些模型可能需要功能更强大或成本更高的硬件。

如果没有进行适当的优化,即使在测试时运行迅速的模型,在部署后也可能会变慢或行为不一致。为了解决这个问题,团队通常会优化处理流程,尽可能降低模型复杂性,并在准确性和速度之间寻求平衡。

这可能涉及将大模型压缩为轻量级版本、使用更高效的架构,或者以更低的分辨率处理图像,从而确保系统在现有硬件上平稳运行。在许多情况下,团队也会选择像Ultralytics YOLO26这样轻量且快速的模型来帮助满足部署限制。

Link to this section防止计算机视觉模型失效的最佳实践#

以下是一些有助于在生产中部署计算机视觉模型时减少失效的最佳实践:

  • 使用阶段性部署策略:逐步将模型引入生产环境,以便团队能够观察其行为并在需要时进行调整。
  • 纳入反馈循环:收集新图像并审查错误的预测,以便利用更新后的数据集重新训练模型,随着时间的推移不断提高性能。
  • 记录模型局限性:清晰地记录模型可能遇到困难的场景,以便团队在部署期间能够预见潜在问题。
  • 为现实环境的多样性而设计:预先规划光照、摄像头角度、物体摆放或背景条件的变化,有助于模型在不同运行场景下保持稳定。

Link to this section关键要点#

计算机视觉模型很少是因为算法本身薄弱而失效的。在大多数情况下,真正的挑战来自于这些系统运行的环境。在训练阶段表现良好的模型,往往会遇到不可预测的现实环境,从而影响其行为。

这就是为什么构建可靠的视觉 AI 系统需要的不仅仅是训练一个模型。它还涉及精心准备数据集、监控模型部署后的表现,以及持续根据现实环境进行系统调整。

想要进一步探索视觉 AI 吗?欢迎加入我们的社区,阅读关于汽车 AI物流计算机视觉等应用的文章。查看我们的许可选项以开启你的计算机视觉项目。访问我们的 GitHub 仓库以了解更多信息。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅