ultralytics
只需点击几下,即可将您训练好的模型从浏览器测试环境部署到生产端点,并支持自动扩展、实时监控以及 17 种以上的导出格式。这是面向实际应用场景部署的端到端解决方案。

43+
部署区域
17+
导出格式
500+
当前部署





专用端点会自动扩展以应对流量高峰,并在空闲时缩减至零,因此您无需为未使用的计算资源付费。
默认按零计费。 当您的端点未接收请求时,不产生 费用。
无速率限制。无速率限制。与共享推理不同,专用端点没有吞吐量上限,仅受端点资源的限制。
可配置资源。 根据您的模型需求和流量模式,选择 CPU (1–8)和内存(1–32 GB)。
Ultralytics 同时支持云端和边缘部署。所有Ultralytics YOLO 均经过原生优化,可在各种环境中高效运行,即使在计算资源有限的硬件上也能提供可靠的性能。


全面实时掌握模型的运行状况。模型上线后,部署仪表盘将为您提供所有运行中端点的集中化概览,并提供确保框架稳定运行所需的各项指标。
请求量。过去 24 小时内所有端点的请求总数。
P95延迟。 用于track 使用场景性能的第95 百分位响应时间。
错误率。 当错误率超过 5% 时,系统会突出显示 相关警报,并提供按严重程度筛选的日志,助您快速诊断问题。
健康检查。实时状态指示器,当端点状态异常时会自动重试。每个检查项旁均显示响应延迟。
每个部署的端点都附带自动生成的Python、JavaScript 和 cURL 代码示例,其中已预先填入了您的实际端点 URL 和 API 密钥。只需复制、粘贴,即可从任何应用程序开始发送推理请求。

专用端点的计费基于CPU、内存和请求量。由于默认启用了“按需扩展至零”功能,您只需为活跃的推理时间付费;当端点未接收请求时,则无需支付任何费用。共享推理功能已包含在您的平台套餐中。
共享推理运行于覆盖 3 个区域的多租户服务上,每分钟请求数上限为 20 次。该服务最适合开发和快速测试。专用端点是部署在 43 个区域中的任意一个区域的单租户服务,无速率限制,延迟稳定,且资源可配置,专为可扩展的生产工作负载而设计。
模型部署是指将经过训练的计算机视觉模型投入使用,使其能够接收并处理真实世界数据的过程。部署完成后,计算机视觉应用程序可通过API将图像和视频帧发送至模型并获取预测结果,从而在生产系统中实现从自动化质量检测到实时目标检测等各项功能。Ultralytics 部署功能已直接集成到端到端的训练工作流中。模型训练完成后,您可以在同一工作区中直接在浏览器中测试模型、将其部署到全球 43 个区域中的任意一个专用端点,并监控其性能。
借助自动扩展和实时监控功能,将您训练好的模型部署到全球 43 个地区的生产环境中。