在没有 AI 专业知识的情况下构建基于摄像头的视觉检测系统
了解如何使用 Ultralytics Platform 在无需 AI 专业知识的情况下构建基于摄像头的视觉检测系统,从标注到部署。
我们使用的每一件产品,无论是手机、包装好的商品还是汽车零部件,在到达我们这些终端消费者手中之前,都要经过某种形式的 质量检测。传统上,这都是通过人工检查或简单的基于规则的系统来完成的。虽然这些方法有效,但随着产量的增加,它们往往速度缓慢、缺乏一致性且难以扩展。
为了改进质量检测流程,许多行业正在转向计算机视觉,这是人工智能的一个分支,旨在帮助机器理解图像和视频。例如,像 Ultralytics YOLO26 这样的视觉 AI 模型可以帮助以高精度检测、分类和定位缺陷。
在实际生产环境中,这些模型可用于分析直接从高速流水线上捕获的图像。当产品通过不同阶段时,工业摄像机会对其进行跟踪,系统会检查划痕、缺失部件或错位等问题。这使得缺陷检测更快、更一致,同时支持高吞吐量的检测。
过去,构建这些系统需要多种工具和深厚的技术专长,这使得流程既复杂又耗时。Ultralytics Platform 是我们全新的计算机视觉端到端解决方案,它将数据准备、标注、模型训练和部署集成于一处,从而简化了这一流程。
在本文中,我们将探讨如何使用 Ultralytics Platform 来构建实用的、基于摄像头的视觉检测系统,而无需深入的 AI 专业知识。让我们开始吧!
Link to this section计算机视觉在质量控制中的作用#
在深入了解 Ultralytics Platform 如何简化检测系统构建之前,让我们先退后一步,了解计算机视觉在质量检测中的作用。
检测是制造业的一个关键环节,确保产品符合质量标准且无缺陷。然而,结果可能会因人而异,尤其是在长时间轮班或大批量生产期间。
为了使检测更可靠,许多行业使用计算机视觉(也称为机器视觉)来分析生产线上的图像并识别缺陷。这些系统使用深度学习,通过模型和算法从大量高质量的标注图像中学习模式。
在模型训练期间,模型会看到正常产品和不同类型缺陷的示例。随着时间的推移,它会学会自行识别这些模式。一旦训练完成,模型就可以检测大量产品,并始终应用相同的标准,从而提高准确性。
Link to this section质量检测中常用的计算机视觉任务#
机器视觉应用得益于 Ultralytics YOLO models 等计算机视觉模型,它们可以支持不同类型的视觉任务。以下是这些视觉 AI 任务如何用于自动化检测工作流的概述:
- 图像分类: 此任务用于为整张图像分配一个单一标签,例如“合格”或“缺陷”。它提供对产品质量的高层评估,而无需指出缺陷的具体位置。
- 目标检测: 它有助于识别图像中的缺陷,并使用 bbox 对其进行定位。这使得检测和定位裂缝、划痕或缺失组件等问题成为可能。
- 实例分割: 在目标检测的基础上更进一步,它为每个检测到的缺陷预测像素级的掩码。这支持对缺陷的形状、大小和边界进行精确分析。
- 目标跟踪: 在多帧中跟踪产品时,它会随着物品在生产线上的移动而进行追踪。这保持了一致性,并确保不会漏掉缺陷。
- 旋转目标检测 (OBB): 此任务使用旋转的 bbox 而非轴对齐的 bbox 来检测目标。当缺陷或组件以不同角度出现时,它特别有用,可以实现更准确的定位。
Link to this section各行业质量检测应用概览#
计算机视觉在各行各业中被广泛用于保持产品质量、符合标准并减少对人工检测的需求。它执行诸如缺陷检测、分类、目标识别、测量和异常检测等关键功能。

图 1. 使用机器视觉系统检测和跟踪产品的示例 (来源)
以下是一些应用它的实际用例示例:
- 制造业: 表面缺陷检测通过分析生产线上的产品图像来识别划痕、凹痕、裂缝和变色等问题,用于在线缺陷检测。它还可以实时检测缺失部件或装配错误,支持持续检测。
- 汽车业: 计算机视觉系统分析发动机零件和车身面板,以验证对齐情况并检测损坏。它们对于检查复杂形状和难以触及的区域特别有效,通常与机器人系统配合使用,以实现精确的定位和自动化检测。
- 电子与半导体: 这些系统可以检测印刷电路板 (PCB) 等组件中的微小缺陷,包括焊接问题、微裂纹和损坏的电路。通过高分辨率图像分析,即使是人工检测中经常被漏掉的非常细微的缺陷也能被检测到。
- 包装与物流: 视觉系统执行条形码扫描、读取产品标签并检查包装质量。它们确保产品包装正确、密封且随时可以发货,从而减少错误。
- 食品与饮料: 由视觉摄像头或视觉传感器驱动的检测系统通过分析产品外观来识别问题,例如密封不当、污染风险、标签错误或视觉不一致,从而帮助保持质量和安全性。
- 制药业: 计算机视觉用于检查药片、药瓶和包装,寻找裂缝、污染、标签错误或填充液位不一致等缺陷,确保符合严格的监管标准并保持产品安全。
Link to this section利用 Ultralytics Platform 简化视觉检测工作流#
设想一条生产线,产品通过不同阶段,摄像机持续捕获图像进行检测。这些图像用于检查划痕、缺失部件或错位等缺陷。
到目前为止,构建和管理此类检测系统需要多种工具和相当多的技术专长。
事实上,在 Ultralytics,我们从视觉 AI 社区那里收到了持续的反馈,反映这个过程是多么碎片化且耗时,常见的瓶颈包括工具分散、复杂的环境设置、低效的数据标注工作流、模型训练延迟以及部署方面的挑战。这些反馈在塑造 Ultralytics Platform 的过程中发挥了关键作用。

图 2. Ultralytics Platform 一瞥 (来源)
通过 Ultralytics Platform,整个开发和部署过程可以在一个地方完成。原始数据可以上传并进行标注以创建训练数据集,然后用于训练模型以检测缺陷。训练完成后,这些模型可以被部署以分析来自生产线的新图像,并附带内置工具来监控随时间变化的性能。
除了将整个工作流集成到一个地方外,Ultralytics Platform 还旨在易于使用。即使是机器学习经验有限的用户,也能快速从构思走向生产。
Link to this section使用 Ultralytics Platform 为图像中的缺陷添加标签#
现在我们已经了解了 Ultralytics Platform 如何整合工作流,让我们逐步了解如何在视觉 AI 管道的每个阶段使用它,从数据上传和缺陷标注开始。
Link to this sectionUltralytics Platform 上的检测数据集管理#
第一步是将数据带入平台。你可以上传图像、视频或数据集归档,如 ZIP、TAR 或 GZ 文件。支持 YOLO 和 COCO 等常见数据集格式,因此无需额外步骤即可导入现有数据集。
你也可以通过使用社区共享的数据集来更快上手。这些数据集可以被浏览并克隆到你的工作空间中,让你能够在现有数据的基础上进行构建,而不是从零开始。克隆后,它们可以针对你的特定用例进行更新和扩展。
如果你正在进行各种实验,可以通过导入 NDJSON 文件来重用数据集,从而更容易地重建或共享它们,而无需进行额外转换。
数据上传后,平台会自动进行准备。它会检查文件格式、处理标注、按需调整图像大小并生成基本的数据集统计信息。视频会被分割成帧以便用于训练,图像也会被优化以方便浏览和分析。
Link to this section由 Ultralytics Platform 驱动的数据标注#
一旦数据准备就绪,下一步就是 数据标注。这是对缺陷进行标签化的过程,以便模型学习检测内容。Ultralytics Platform 包含一个内置的标注编辑器,支持目标检测、实例分割、图像分类、姿态估计和旋转目标检测等任务。
你可以根据你的用例,使用 bbox、多边形或关键点等工具手动标注数据。为了加快速度,平台还提供 AI 辅助标注。
例如,基于 SAM 的智能标注允许你通过简单的点击来标注目标。通过选择要包含或排除的区域,系统会实时生成掩码,如有需要,之后还可以进行调整。

图 3. Ultralytics Platform 内的 SAM 驱动智能标注 (来源)
此外,基于 YOLO 的智能标注可以使用模型预测自动生成标签。这些标签可以进行审核和完善,使处理大型数据集变得更容易,而无需手动标注所有内容。
标注编辑器还包括类管理、标注编辑、键盘快捷键以及撤销或重做选项等功能。这些功能使你在数据集增长时更容易保持一致并审查标注。
当你标注数据时,平台会提供诸如类分布和标注计数等见解。这有助于在进入训练之前识别差距、修复不一致并提高数据集质量。
Link to this section在 Ultralytics Platform 上训练 YOLO26 进行缺陷检测#
下一步是 训练模型,利用标注数据自动检测缺陷。Ultralytics Platform 支持使用 Ultralytics YOLO 模型进行训练,包括 YOLO26,它可用于目标检测、实例分割和图像分类等任务。
训练通过统一的仪表板进行管理,你可以在其中配置、运行和监控训练任务。要开始使用,你可以选择一个数据集,包括你上传的、在平台上标注的、从平台上可用的公共数据集中获取的,或从社区克隆的数据集。
一旦选择,数据集会自动链接到训练运行中,从而更轻松地跟踪实验并保持一致性。
接下来,你可以配置训练参数,如 epoch 数量、batch size、图像大小和学习率。这些设置控制模型的学习方式,并直接影响训练时间和性能。
Link to this section运行和监控训练#
然后你可以选择运行训练的方式。平台支持在托管 GPU 上进行 云训练、使用你自己的硬件进行本地训练,以及通过 Google Colab 等环境进行基于浏览器的训练工作流。
使用云训练时,你可以选择一系列 GPU 选项,例如用于小型实验的 RTX 2000 Ada 和 RTX A4500,用于更繁重工作负载的 RTX 4090 或 RTX A6000,以及用于大规模训练的高性能选项,如 A100 或 H100。
当训练开始时,可以直接在平台内监控进度。仪表板提供了对关键指标(如损失曲线和性能指标)的实时可视化,以及系统使用情况和训练日志。这使得理解模型的学习方式并及早发现潜在问题变得无缝衔接。

图 4. 你可以使用 Ultralytics Platform 轻松监控训练进度 (来源)
当你运行多个实验时,平台会在一个地方记录配置、数据集和结果。这使得比较不同的训练运行、使用 precision、recall 和 mAP 等指标评估性能以及选择性能最佳的模型进行部署变得非常简单。
Link to this section通过 Ultralytics Platform 部署视觉模型#
训练完成后,下一步是在进行部署之前,验证训练好的模型在新的、未见数据上的表现。Ultralytics Platform 包含一个内置的 Predict 选项卡,允许你在浏览器中直接测试模型,而无需任何设置。
你可以上传图像、使用样本数据或通过网络摄像头捕获输入,结果会立即显示,并带有视觉叠加和置信度分数。这意味着你可以在将其集成到实际系统之前,快速检查模型性能并识别任何问题。
一旦模型经过验证,就可以根据你的用例使用不同的选项进行部署。以下是 Ultralytics Platform 支持的 模型部署选项 的详细介绍:
- 共享推理: 此选项允许你通过 REST API 访问模型,从而轻松集成到应用程序或工作流中。它在一个多租户系统上运行,跨越几个核心区域,请求会自动路由到最近的可用服务。这使其非常适合在进入生产环境之前的开发、测试和轻量级使用。
- 专用端点: 对于生产环境,模型可以作为拥有自有计算资源的专用端点进行部署。它们作为单租户服务在 43 个全球区域 运行,通过更靠近最终用户部署来帮助降低延迟。它们还支持自动缩放和缩放至零,允许资源根据流量自动调整。
- 模型导出: 模型可以导出并在平台之外的本地系统或边缘设备上运行。平台支持 17 种格式,包括 ONNX、TensorRT、OpenVINO、CoreML 和 TensorFlow Lite。导出选项还支持 FP16 和 INT8 量化等优化,以减小模型尺寸并提高不同硬件环境下的推理速度。
Link to this section使用 Ultralytics Platform 监控已部署的模型#
图像处理或计算机视觉解决方案的生命周期不会随着模型部署而结束。视觉检测系统也是如此。一旦模型在生产环境中运行,就需要对其进行持续监控,以确保它在条件变化时能可靠地运行。
Ultralytics Platform 提供了一个 内置监控 仪表板,可以清晰地查看已部署模型的运行情况。通过一个界面,你可以跟踪请求活动、查看日志并检查每个部署的健康状态。你可以了解模型是如何被使用以及它们随时间的行为方式。
仪表板包括总请求数、错误率和延迟等关键指标,帮助你评估性能和响应能力。这些指标会定期更新,并提供有关使用模式和系统可靠性的见解。
内置的世界地图显示了请求和部署在各区域的分布情况。支持在全球多个地点进行部署,此视图有助于从地理位置上跟踪使用情况,并了解模型在不同环境中的表现。

图 5. 在 Ultralytics Platform 上监控已部署的模型 (来源)
为了进行更深入的分析,每个部署都包含带有时间戳、请求详细信息和错误消息的详细日志。日志可以按严重程度进行过滤,从而轻松调试问题并快速识别故障。此外,健康检查提供实时状态指示器,显示部署是否按预期运行或是否需要关注。
监控在优化中也起着重要作用。随着输入数据、流量或使用模式的变化,性能可能会发生波动。通过跟踪指标和日志,你可以识别高延迟、错误率增加或缩放限制等问题,并采取行动以保持稳定的性能。
Link to this section使用 Ultralytics Platform 构建视觉解决方案的好处#
以下是使用 Ultralytics Platform 构建和扩展视觉检测系统的一些关键优势:
- 针对实际使用优化: 自动缩放端点、边缘部署和模型导出等功能确保系统可以在生产环境中可靠运行。
- 更快的开发周期: 内置工具和默认配置有助于更高效地从原始数据过渡到可工作的系统。
- 易于使用: 直观的界面、简化的工作流和极少的设置要求,使初学者和有经验的用户都能轻松使用该平台。
- 减少人工工作: AI 辅助标注和自动数据处理等功能减少了在重复任务上花费的时间。
- 随时间可扩展: 随着需求的变化,系统可以通过添加新数据和重新训练模型进行更新,从而能够适应新的缺陷类型、条件和多摄像头设置。
Link to this section主要收获#
构建基于摄像头的视觉检测系统不必很复杂,也不需要深厚的 AI 专业知识。使用 Ultralytics Platform,你可以从原始数据一步到位地构建系统并监控其性能,所有操作都在一个地方完成。这简化了在实际环境中构建、改进和运行检测系统的方式。
加入 我们的社区 并浏览我们的 GitHub 仓库 以了解更多关于视觉 AI 的信息。查看 我们的许可选项 以启动你的计算机视觉项目。对 AI 在制造业中的应用 或 汽车行业中的计算机视觉 等创新感兴趣?请访问我们的解决方案页面了解更多信息。






