深圳Yolo 视觉
深圳
立即加入

ultralytics

在全球 43 个区域部署视觉 AI 模型

只需点击几下,即可将您训练好的模型从浏览器测试环境部署到生产端点,并支持自动扩展、实时监控以及 17 种以上的导出格式。这是面向实际应用场景部署的端到端解决方案。

一个显示PyTorch 导出选项的用户界面,包括ONNX、TorchScript、OpenVINO、TensorRT、CoreML、TF 、TF SavedModel 和TF GraphDef,界面中还包含一张世界地图,地图上以绿色标记了 3 个部署点,并标有多个红色位置图钉。

43+

部署区域

17+

导出格式

500+

当前部署

部署到全球43个区域

将您的模型部署到遍布美洲、欧洲、亚太和中东等全球 43 个区域的专用端点上。每个端点都是一个单租户服务,拥有独立的 URL、自动扩展功能和独立监控机制。
世界地图上用彩色图钉标出了北美、欧洲和亚洲的各个地点。
仪表盘显示了模型性能指标:mAP50 96.2mAP50 为 90.1%,精确率为 87.2%;同时还显示了部署在巴黎的 YOLO26s 分割模型的日志面板。

根据流量自动扩展

专用端点会自动扩展以应对流量高峰,并在空闲时缩减至零,因此您无需为未使用的计算资源付费。

默认按零计费。 当您的端点未接收请求时,不产生 费用。

无速率限制。无速率限制。与共享推理不同,专用端点没有吞吐量上限,仅受端点资源的限制。

可配置资源。 根据您的模型需求和流量模式,选择 CPU (1–8)和内存(1–32 GB)。

17 种以上的导出格式。您的模型。任意环境。

Ultralytics 同时支持云端和边缘部署。所有Ultralytics YOLO 均经过原生优化,可在各种环境中高效运行,即使在计算资源有限的硬件上也能提供可靠的性能。

PyTorch 的导出格式列表,包括ONNX、TorchScript、OpenVINO、TensorRT GPU、CoreML 和TF ,并附有相应的图标和格式代码。
仪表盘显示,过去24小时内总请求数为13,959次,活跃部署数为3个,错误率为0%,P95延迟为14毫秒。

监控生产环境中的所有内容

全面实时掌握模型的运行状况。模型上线后,部署仪表盘将为您提供所有运行中端点的集中化概览,并提供确保框架稳定运行所需的各项指标。

请求量。过去 24 小时内所有端点的请求总数。

P95延迟。 用于track 使用场景性能的第95 百分位响应时间。

错误率。 当错误率超过 5% 时,系统会突出显示 相关警报,并提供按严重程度筛选的日志,助您快速诊断问题。

健康检查。实时状态指示器,当端点状态异常时会自动重试。每个检查项旁均显示响应延迟。

几分钟内即可集成

每个部署的端点都附带自动生成的Python、JavaScript 和 cURL 代码示例,其中已预先填入了您的实际端点 URL 和 API 密钥。只需复制、粘贴,即可从任何应用程序开始发送推理请求。

一段Python 片段,演示如何使用 requests 库将图像发送至部署端点,并包含授权和推理参数。

需要先训练模型吗?

Ultralytics 将标注、训练和部署整合于单一平台之中。

常见问题

我可以将同一个模型部署到多个区域吗?

是的。每个模型均可同时 部署到多个区域 。您所使用的套餐决定了可用端点的总数:免费版为 3 个,专业版为 10 个,企业版则不限。这使您能够通过各区域的低延迟端点为全球用户提供服务。

部署需要多少钱?

专用端点的计费基于CPU、内存和请求量。由于默认启用了“按需扩展至零”功能,您只需为活跃的推理时间付费;当端点未接收请求时,则无需支付任何费用。共享推理功能已包含在您的平台套餐中

共享推理和专用推理有什么区别?

共享推理运行于覆盖 3 个区域的多租户服务上,每分钟请求数上限为 20 次。该服务最适合开发和快速测试。专用端点是部署在 43 个区域中的任意一个区域的单租户服务,无速率限制,延迟稳定,且资源可配置,专为可扩展的生产工作负载而设计。

部署需要多长时间?

专用端点的部署通常需要一到两分钟。这包括容器的配置、启动以及初始健康检查,以验证服务是否已就绪。端点就绪后,将立即 开始接受推理请求

什么是模型部署?

模型部署是指将经过训练的计算机视觉模型投入使用,使其能够接收并处理真实世界数据的过程。部署完成后,计算机视觉应用程序可通过API将图像和视频帧发送至模型并获取预测结果,从而在生产系统中实现从自动化质量检测到实时目标检测等各项功能。Ultralytics 部署功能已直接集成到端到端的训练工作流中。模型训练完成后,您可以在同一工作区中直接在浏览器中测试模型、将其部署到全球 43 个区域中的任意一个专用端点,并监控其性能。

立即开始部署

借助自动扩展和实时监控功能,将您训练好的模型部署到全球 43 个地区的生产环境中。