随着技术的发展,边缘设备越来越普遍。从跟踪心率的智能手表到监控街道的空中无人机,边缘系统都能在设备本身内部实时处理数据。
这种方法通常比将数据发送到云端更快、更安全,特别是对于涉及个人数据的应用,如车牌检测或手势跟踪。这些都是计算机视觉的例子,计算机视觉是人工智能(AI)的一个分支,能让机器解释和理解视觉信息。
然而,一个重要的考虑因素是,此类应用需要能够处理繁重计算、使用最少资源和独立运行的视觉人工智能模型。大多数计算机视觉模型都是为高性能系统开发的,因此不太适合直接部署在边缘设备上。
为了弥补这一差距,开发人员通常会进行有针对性的优化,使模型能够在较小的硬件上高效运行。这些调整对于内存和处理能力有限的实际边缘部署至关重要。
有趣的是,Ultralytics YOLO11等计算机视觉模型在设计时已经考虑到了边缘效率,因此非常适合实时任务。不过,利用剪枝和量化等模型优化技术可以进一步提高它们的性能,从而在受限设备上实现更快的推理和更低的资源使用率。
在本文中,我们将详细介绍什么是剪枝和量化、它们是如何工作的,以及它们如何帮助 YOLO 模型在真实世界的边缘部署中发挥作用。让我们开始吧!
在准备在边缘设备上部署视觉人工智能模型时,关键目标之一是在不牺牲性能的情况下使模型轻便可靠。这通常涉及减少模型的大小和计算需求,使其能够在内存、功率或处理能力有限的硬件上高效运行。实现这一目标的两种常见方法是剪枝和量化。
剪枝是一种人工智能模型优化技术,有助于使神经网络更小、更高效。在许多情况下,模型的某些部分,如某些连接或节点,对最终预测的贡献并不大。剪枝的工作原理是识别并移除这些不太重要的部分,从而缩小模型的规模并加快其性能。
另一方面,量化是一种优化技术,可以降低模型使用数字的精度。模型不再依赖高精度的 32 位浮点数,而是改用更小、更高效的格式,如 8 位整数。这种变化有助于降低内存使用率,加快推理(即模型进行预测的过程)。
既然我们已经对剪枝和量化有了更深入的了解,让我们来看看它们是如何工作的。
剪枝是通过一个称为敏感性分析的过程来完成的。它能确定神经网络模型的哪些部分(如某些权重、神经元或通道)对最终输出预测的贡献最小。删除这些部分对准确性的影响最小。剪枝后,通常会对模型进行重新训练,以微调其性能。这个循环可以重复进行,以在模型的大小和准确性之间找到适当的平衡。
与此同时,模型量化侧重于模型如何处理数据。首先是校准,模型在样本数据上运行,了解需要处理的数值范围。然后将这些值从 32 位浮点转换为 8 位整数等较低精度格式。
有几种工具可以让你在现实世界的人工智能项目中更轻松地使用剪枝和量化技术。PyTorch 和 TensorFlow 等大多数人工智能框架都内置了对这些优化技术的支持,允许开发人员将它们直接集成到模型部署流程中。
模型经过优化后,ONNX Runtime 等工具可以帮助在服务器、台式机和边缘设备等各种硬件平台上高效运行。此外,Ultralytics 还提供集成功能,允许以适合量化的格式导出 YOLO 模型,从而更容易缩小模型尺寸并提高性能。
Ultralytics YOLO 模型(如 YOLO11)因其快速的单步对象检测而广受认可,是实时视觉人工智能任务的理想选择。它们在设计上已经足够轻便高效,适合边缘部署。然而,在推理过程中,负责处理视觉特征的层,即卷积层,仍然需要相当大的计算能力。
您可能会问:既然 YOLO11 已经针对边缘使用进行了优化,为什么还需要进一步优化?简单地说,并非所有的边缘设备都是一样的。有些设备使用的硬件非常简单,比如微型嵌入式处理器的功耗比标准的 LED 灯泡还低。
在这种情况下,即使是像 YOLO11 这样的精简模型,也需要额外的优化才能保证其平稳可靠的性能。剪枝和量化等技术有助于减小模型的大小,加快推理速度,而不会对准确性造成显著影响,因此非常适合这种受限环境。
为了更方便地应用这些优化技术,Ultralytics 支持多种集成,可以将 YOLO 模型导出为多种格式,如 ONNX、TensorRT、OpenVINO、CoreML 和 PaddlePaddle。每种格式都设计用于特定类型的硬件和部署环境。
例如,ONNX 因其与多种工具和平台的兼容性,经常被用于量化工作流程。而 TensorRT 则针对英伟达™(NVIDIA®)设备进行了高度优化,并支持使用 INT8 进行低精度推理,因此非常适合在边缘 GPU 上进行高速部署。
随着计算机视觉不断扩展到现实世界的各种应用中,优化的 YOLO 模型使得在更小、更快的硬件上运行对象检测、实例分割和对象跟踪等任务成为可能。接下来,让我们讨论几个使用案例,在这些案例中,剪枝和量化使这些计算机视觉任务更高效、更实用。
许多工业场所和公共区域都需要实时监控来确保安全。中转站、制造基地和大型户外设施等场所都需要能够快速、准确地检测人员或车辆的视觉人工智能系统。通常情况下,这些场所的连通性和硬件条件有限,很难部署大型模型。
在这种情况下,像 YOLO11 这样的优化 Vision AI 模型是一个很好的解决方案。它体积小巧、性能快速,非常适合在嵌入式摄像头或智能传感器等低功耗边缘设备上运行。这些模型可以直接在设备上处理视觉数据,实现对违反安全规定、未经授权的访问或异常活动的实时检测,而无需依赖持续的云访问。
建筑工地是快节奏和不可预测的环境,到处都是重型机械、移动的工人和持续不断的活动。由于时间表的变动、设备的移动,甚至天气的突变,施工条件也会瞬息万变。在这样一个动态的环境中,工人的安全可能是一个持续的挑战。
实时监控起着至关重要的作用,但传统系统往往依赖于云访问或昂贵的硬件,在现场可能并不实用。这正是 YOLO11 等型号可以发挥重要作用的地方。YOLO11 经过优化,可在小型、高效的边缘设备上运行,这些设备可直接在现场工作,无需互联网连接。
例如,考虑一个大型建筑工地,如横跨数英亩的高速公路扩建工程。在这种情况下,手动跟踪每辆车或每台设备既困难又耗时。配备摄像头和优化 YOLO11 模型的无人机可以自动检测和跟踪车辆、监控交通流量,并识别未经授权的访问或不安全驾驶行为等安全问题。
以下是剪枝和量化等计算机视觉模型优化方法的一些主要优势:
尽管剪枝和量化具有很多优势,但它们也会带来一些权衡,开发人员在优化模型时应加以考虑。以下是一些需要注意的限制:
剪枝和量化是帮助 YOLO 模型在边缘设备上更好地运行的有用技术。它们可以减小模型的大小,降低计算需求,加快预测速度,而所有这些都不会明显降低准确性。
这些优化方法还能让开发人员灵活地针对不同类型的硬件调整模型,而无需完全重建。通过一些调整和测试,在现实世界中应用视觉人工智能变得更加容易。
加入我们不断壮大的社区!探索我们的GitHub 仓库,了解更多有关人工智能的信息。准备好开始您的计算机视觉项目了吗?查看我们的许可选项。访问我们的解决方案页面,了解农业中的人工智能和医疗保健中的视觉人工智能!