深圳Yolo 视觉
深圳
立即加入

Ultralytics 平台

在43个全球区域部署计算机视觉模型

只需点击几下,即可将您训练好的模型从浏览器测试环境部署到生产端点,并支持自动扩展、实时监控以及 17 种以上的导出格式。

用户界面显示 PyTorch 模型的导出选项,包括 ONNX、TorchScript、OpenVINO、TensorRT、CoreML、TF Lite、TF SavedModel 和 TF GraphDef,附带一张世界地图,显示 3 个绿色部署点和多个红色位置标记。

43+

部署区域

17+

导出格式

27亿+

日常使用

部署至全球43个区域

将您的模型部署到遍布美洲、欧洲、亚太地区和中东的专用端点上。每个端点均拥有独立的 URL、自动扩展功能和监控机制。
世界地图上标注了美洲、欧洲、亚太地区和中东的部署区域,展示了全球基础设施的覆盖范围。
仪表板显示模型性能指标,其中mAP50为96.2%,mAP50-95为90.1%,精度为87.2%,同时还有一个部署在巴黎的YOLO26s分割模型的日志面板。

匹配您流量的自动扩缩容

专用端点可在流量激增时自动扩展,并在空闲时缩减至零。

默认缩容至零。当您的端点未收到请求时,不产生费用。

无速率限制。专用 端点没有吞吐量上限。

可配置资源。根据您的工作负载,选择CPU 1–8 核)和内存(1–32 GB)。

17+ 种导出格式。您的模型。任何环境。

Ultralytics 支持云端和边缘部署,以实现高性能。所有Ultralytics YOLO 均经过原生优化,可在各种环境中高效运行,即使在计算资源有限的边缘设备上,也能提供高精度、可靠的性能和良好的兼容性。

PyTorch模型的导出格式列表,包括ONNX、TorchScript、OpenVINO、TensorRT GPU、CoreML和TF Lite,并附有各自的图标和格式代码。
仪表板显示过去24小时内总请求数13,959个,活跃部署3个,错误率0%,P95延迟14毫秒。

监控生产环境中的一切

全面实时掌握模型性能。模型上线后,部署仪表盘将为您提供所有运行中端点的集中化概览,并配备您所需的指标和工具集,助您优化模型并确保框架稳定运行。

请求量。 过去 24 小时内所有端点的请求总数

P95 延迟。用于跟踪实际用例性能的第 95 百分位响应时间。

错误率。 当错误率超过 5% 时触发 警报,并通过按严重程度筛选的日志快速诊断问题。

健康检查。支持自动重试的实时端点监控。每次检查均显示延迟。

几分钟内完成集成

每个已部署的端点都附带Python、JavaScript和cURL的自动生成的代码示例,其中预填充了您的实际端点URL和API密钥。复制、粘贴,即可开始从任何应用程序发送推理请求。

用于使用带有授权和推理参数的请求将图像发送到部署端点的Python代码片段。

需要先训练模型吗?

Ultralytics 平台在一个单一平台中连接标注、训练和部署。

1

标注

2

训练

3

部署

常见问题

我可以将相同的模型部署到多个区域吗?

是的。每个模型都可以同时部署到多个区域。您的套餐决定了可用的端点总数,免费版为3个,专业版为10个,企业版则无限制。这使您能够通过每个区域的低延迟端点为全球用户提供服务。

部署费用是多少?

专用端点根据CPU、内存和请求量计费。默认启用零扩展(scale-to-zero),您只需为活跃的推理时间付费,当您的端点未接收请求时,不产生费用。共享推理包含在您的平台套餐中。

共享推理和专属推理有什么区别?

共享推理在3个区域的多租户服务上运行,每分钟请求限制为20次。它最适合开发和快速测试。专用端点是部署到43个区域中任何一个的单租户服务,没有速率限制、延迟一致且资源可配置,专为可扩展的生产工作负载而构建。

部署需要多长时间?

专用端点部署通常需要一到两分钟。这包括容器配置、启动以及验证服务是否就绪的初始健康检查。一旦端点准备就绪,它会立即开始接受推理请求

什么是模型部署?

模型部署是将训练好的计算机视觉模型投入使用,以接收和处理真实世界数据的过程。部署后,计算机视觉应用程序可以通过API向模型发送图像和视频帧并接收预测结果,从而实现从自动化质量检测到生产系统中实时object detection的各种功能。在Ultralytics 平台中,部署直接集成到端到端训练工作流中。模型训练完成后,您可以在浏览器中测试它,将其部署到全球43个区域中的任何一个专用端点,并监控其性能,所有这些都可以在同一个工作区中完成。

立即开始部署!

将您训练好的模型部署到全球43个区域,具备自动扩缩容和实时监控功能。