使用 OpenVINO™ 无缝部署 Ultralytics YOLO11
了解如何将 Ultralytics YOLO11 导出为 OpenVINO™ 格式,以在 Intel® 硬件上实现超快推理,从而增强速度、可扩展性和准确性。

AI 的普及取决于 AI 解决方案的可访问性,而其中至关重要的一点是让它们能够轻松部署在人们现有的硬件上。在 GPU(图形处理单元)上运行 AI 模型在性能和并行处理能力方面是一个极佳的选择。
然而,现实情况并非每个人都能使用高端 GPU,尤其是在边缘环境或日常笔记本电脑上。因此,优化模型以在更普及的硬件(如中央处理单元 (CPU)、集成 GPU 和神经处理单元 (NPU))上高效运行显得尤为重要。
计算机视觉是 AI 的一个分支,它使机器能够实时分析和理解图像及视频流。诸如 Ultralytics YOLO11 之类的视觉 AI 模型支持诸如目标检测和实例分割等关键任务,为从零售分析到医疗诊断等各种应用提供支持。

图 1. 使用 Ultralytics YOLO11 在零售商店中检测和分割对象。
为了让计算机视觉更具广泛的可访问性,Ultralytics 发布了与 OpenVINO 工具包的更新集成,这是一个用于在 CPU、GPU 和 NPU 上优化及运行 AI 推理的开源项目。
通过此次集成,你可以更轻松地导出和部署 YOLO11 模型,在 CPU 上实现最高 3 倍的推理提速,并在 Intel GPU 和 NPU 上获得性能提升。在本文中,我们将逐步介绍如何使用 Ultralytics Python 软件包将 YOLO11 模型导出为 OpenVINO 格式 并将其用于推理。让我们开始吧!
Link to this sectionUltralytics YOLO11 概览#
在深入了解 Ultralytics 所支持的 OpenVINO 集成细节之前,让我们仔细看看是什么让 YOLO11 成为一个可靠且具有影响力的计算机视觉模型。YOLO11 是 Ultralytics YOLO 系列中的最新模型,在速度和准确性方面均有显著提升。
其主要亮点之一是高效性。例如,Ultralytics YOLO11m 的参数比 Ultralytics YOLOv8m 少 22%,但在 COCO 数据集上却达到了更高的平均精度均值 (mAP)。这意味着它运行速度更快,检测物体也更准确,非常适合性能和响应速度至关重要的实时应用。

图 2. Ultralytics YOLO11 的性能基准测试。
除了目标检测之外,YOLO11 还支持各种高级计算机视觉任务,如实例分割、姿态估计、图像分类、目标跟踪和旋转目标检测。YOLO11 也非常适合开发者,Ultralytics Python 软件包为其提供了用于训练、评估和部署模型的简单一致的接口。
除此之外,Ultralytics Python 软件包还支持各种集成和多种导出格式,包括 OpenVINO、ONNX、TorchScript,使你能够轻松将 YOLO11 集成到各种部署流水线中。无论你的目标是云基础设施、边缘设备还是嵌入式系统,导出过程都非常直观且能适应你的硬件需求。
Link to this section什么是 OpenVINO™?#
OpenVINO™ (Open Visual Inference and Neural Network Optimization) 是一个用于在广泛硬件上优化和部署 AI 推理的开源工具包。它使开发者能够跨各种 Intel 平台(包括 CPU、集成 GPU 和独立 GPU、NPU 以及现场可编程门阵列 (FPGA))高效运行高性能推理应用。
OpenVINO 提供了一个统一的运行时接口,通过特定于设备的插件来抽象化硬件差异。这意味着开发者可以编写一次代码,并通过一致的 API 部署到多个 Intel 硬件目标上。
以下是一些使 OpenVINO 成为部署理想选择的关键特性:
- 模型转换器:此工具可以转换并准备来自流行框架(如 PyTorch、ONNX、TensorFlow、PaddlePaddle 等)的模型,以便对其进行优化,从而在 Intel 硬件上实现高效推理。
- 异构执行:你无需为不同的 Intel 硬件重写代码。OpenVINO 可以轻松地在任何受支持的硬件上运行同一个模型,从 CPU 到 GPU 均可。
- 量化支持:该工具包支持低精度格式,如 FP16(默认)和 INT8,这有助于在不显著影响准确性的前提下减小模型尺寸并加快推理速度。

图 3. OpenVINO 支持多样化的部署选项。
Link to this section探索 Ultralytics x OpenVINO 集成#
现在我们已经了解了 OpenVINO 是什么及其重要性,接下来让我们探讨如何将 YOLO11 模型导出为 OpenVINO 格式并在 Intel 硬件上运行高效推理。
Link to this section第 1 步:安装 Ultralytics Python 软件包#
要将模型导出为 OpenVINO 格式,你首先需要安装 Ultralytics Python 软件包。该软件包提供了训练、评估和导出 YOLO 模型所需的一切,包括 YOLO11。
你可以通过在终端或命令提示符中运行命令“pip install ultralytics”来安装它。如果你在 Jupyter Notebook 或 Google Colab 等交互式环境中使用,只需在该命令前加一个感叹号即可。
此外,如果你在安装或导出过程中遇到任何问题,Ultralytics 文档和故障排除指南是你解决问题的绝佳资源。
Link to this section第 2 步:将你的 YOLO11 模型导出为 OpenVINO 格式#
一旦安装好 Ultralytics 软件包,下一步就是加载你的 YOLO11 模型并将其转换为与 OpenVINO 兼容的格式。
在下方的示例中,我们使用预训练的 YOLO11 模型 (“yolo11n.pt”)。导出功能用于将其转换为 OpenVINO 格式。运行此代码后,转换后的模型将保存在名为 “yolo11n_openvino_model” 的新目录中。
from ultralytics import YOLO
model = YOLO("yolo11n.pt")
model.export(format="openvino")Link to this section第 3 步:使用导出的模型运行推理#
将 YOLO11 模型导出为 OpenVINO 格式后,你可以通过两种方式运行推理:使用 Ultralytics Python 软件包或原生 OpenVINO Runtime。
Link to this section使用 Ultralytics Python 软件包#
导出的 YOLO11 模型可以使用 Ultralytics Python 软件包轻松部署,如下面的代码片段所示。此方法非常适合在 Intel 硬件上进行快速实验和简化部署。
你还可以根据系统中可用的 Intel 硬件,指定用于推理的设备,例如 “intel:cpu”、“intel:gpu” 或 “intel:npu”。
ov_model = YOLO("yolo11n_openvino_model/")
results = ov_model("https://ultralytics.com/images/bus.jpg", device="intel:gpu")运行上述代码后,输出图像将保存在 “runs/detect/predict” 目录中。

图 4. 使用导出的 YOLO11 模型检测图像中的物体。
Link to this section使用原生 OpenVINO Runtime#
如果你正在寻找一种可自定义的推理运行方式,特别是在生产环境中,OpenVINO Runtime 可以让你更精细地控制模型的执行方式。它支持高级功能,例如异步执行(并行运行多个推理请求)和负载均衡(高效地在 Intel 硬件上分配推理工作负载)。
要使用原生 Runtime,你需要导出的模型文件:一个 .xml 文件(定义网络架构)和一个 .bin 文件(存储模型的训练权重)。你还可以根据应用需求配置额外参数,如输入维度或预处理步骤。
典型的部署流程包括初始化 OpenVINO 核心、为目标设备加载并编译模型、准备输入以及执行推理。有关详细示例和分步指导,请参阅官方 Ultralytics OpenVINO 文档。
Link to this section为什么选择 Ultralytics x OpenVINO 集成?#
在探索 Ultralytics 集成时,你会注意到 Ultralytics Python 软件包支持将 YOLO11 模型导出为多种格式,例如 TorchScript、CoreML、TensorRT 和 ONNX。那么,为什么选择 OpenVINO 集成呢?
以下是 OpenVINO 导出格式非常适合在 Intel 硬件上部署模型的几个原因:
- 性能提升: 你可以在 Intel CPU 上获得最高 3 倍的推理提速,并在集成 GPU 和 NPU 上获得额外加速。
- 无需重新训练:你可以直接将现有的 YOLO11 模型导出为 OpenVINO 格式,而无需修改或重新训练它们。
- 为规模化构建:同一个导出的模型可以部署在低功耗边缘设备和大规模云基础设施上,从而简化了可扩展的人工智能部署。
你还可以在 OpenVINO™ Model Hub 上评估 YOLO11 模型在一系列 Intel® 平台上的性能基准。OpenVINO Model Hub 是一个供开发者在 Intel 硬件上评估 AI 模型,并发现 OpenVINO 在 Intel CPU、内置 GPU、NPU 和独立显卡上的性能优势的资源中心。

图 5. OpenVINO™ Model Hub:YOLO11 模型在一系列 Intel® 平台上的性能基准测试。
Link to this sectionYOLO11 和 OpenVINO 导出格式的应用#
借助 OpenVINO 集成,在现实场景中跨 Intel 硬件部署 YOLO11 模型变得简单多了。
一个很好的例子是智慧零售,YOLO11 可以帮助实时检测空货架、跟踪库存短缺的产品,并分析顾客在店内的移动路径。这使零售商能够改善库存管理并优化店内布局,从而提升顾客参与度。
同样,在智慧城市中,YOLO11 可用于监控交通,通过实时计算车辆、跟踪行人和检测红灯违规来实现。这些洞察可以支持优化交通流量、改善道路安全并协助自动执法系统。

图 6. 使用 YOLO11 计算车辆。
另一个有趣的用例是工业检测,YOLO11 可以部署在生产线上,自动检测视觉缺陷,如缺失组件、错位或表面损坏。这不仅能提高效率、降低成本,还能支持更好的产品质量。
Link to this section使用 OpenVINO 工具包时需要考虑的关键因素#
在使用 OpenVINO 部署 YOLO11 模型时,这里有几件重要的事情需要牢记,以获得最佳结果:
- 检查硬件兼容性:确保你的 Intel 硬件(无论是 CPU、集成 GPU 还是 NPU)受到 OpenVINO 的支持,以便模型能够高效运行。
- 安装正确的驱动程序:如果你使用的是 Intel GPU 或 NPU,请仔细检查所有必需的驱动程序是否已正确安装并保持最新。
- 理解精度权衡:OpenVINO 支持 FP32、FP16 和 INT8 模型精度。每种精度在速度和准确性之间都有权衡,因此根据你的性能目标和可用硬件选择正确的选项非常重要。
Link to this section关键要点#
将 Ultralytics YOLO11 导出为 OpenVINO 格式,可以轻松地在 Intel 硬件上运行快速、高效的视觉 AI 模型。你可以在 CPU、GPU 和 NPU 之间进行部署,而无需重新训练或更改你的代码。这是在保持简洁和可扩展性的同时提高性能的绝佳方式。
通过 Ultralytics Python 软件包内置的支持,使用 OpenVINO 导出和运行推理非常简单。只需几个步骤,你就可以优化模型并在各种 Intel 平台上运行它。无论你是在处理智慧零售、交通监控还是工业检测,此工作流都能帮助你快速且自信地完成从开发到部署的跨越。
加入 YOLO 社区并查看 Ultralytics GitHub 存储库以了解更多关于 Ultralytics 支持的强大集成。此外,查看 Ultralytics 许可选项以立即开始使用计算机视觉!
注册参加我们即将举办的网络研讨会,亲眼见证 Ultralytics × OpenVINO 集成的实际效果,并访问 OpenVINO 网站探索用于规模化优化和部署 AI 的工具。






