我可以将同一个模型部署到多个区域吗？

是的。每个模型都可以同时部署到多个区域。你的计划决定了可用的终端总数：免费版 3 个，专业版 10 个，企业版无限。这使你能够通过各区域的低延迟终端为全球用户提供服务。

部署成本是多少？

专用终端根据 CPU、内存和请求量进行计费。默认启用缩减至零（scale-to-zero）功能，你只需为活跃的推理时间付费。当你的终端没有接收到请求时，不会产生费用。共享推理包含在你的平台计划中。

共享推理和专用推理有什么区别？

共享推理在 3 个区域的多租户服务上运行，且请求速率限制为每分钟 20 次。它最适合开发和快速测试。专用终端是部署到 43 个区域中任意一个的单租户服务，无速率限制、延迟一致且资源可配置，专为可扩展的生产工作负载而构建。

部署需要多长时间？

专用终端部署通常需要一到两分钟。这包括容器配置、启动以及初步的健康检查，以验证服务是否就绪。一旦终端就绪，它将立即开始接收推理请求。

什么是模型部署？

模型部署是将已训练的计算机视觉模型设置为可接收和处理现实世界数据的过程。部署后，计算机视觉应用程序可以通过 API 将图像和视频帧发送到模型并接收预测，从而实现从自动化质量检测到生产系统中实时目标检测的所有功能。在 Ultralytics Platform 上，部署直接集成在端到端的训练工作流中。模型训练完成后，你可以在浏览器中测试它，将其部署到 43 个全球区域中的任何一个专用终端，并监控其性能，所有操作都在同一个工作空间内完成。

Ultralytics 平台

在 42 个全球区域部署计算机视觉模型

Q: 我可以将同一个模型部署到多个区域吗？

是的。每个模型都可以同时部署到 多个区域。你的计划决定了可用的终端总数：免费版 3 个，专业版 10 个，企业版无限。这使你能够通过各区域的低延迟终端为全球用户提供服务。

Q: 共享推理和专用推理有什么区别？

共享推理 在 3 个区域的多租户服务上运行，且请求速率限制为每分钟 20 次。它最适合开发和快速测试。专用终端是部署到 43 个区域中任意一个的单租户服务，无速率限制、延迟一致且资源可配置，专为 可扩展的生产工作负载 而构建。

只需点击几下，即可将你训练好的模型从浏览器测试部署到生产端点，并支持自动缩放、实时监控和 20 种导出格式。

申请许可证试用浏览器推理

实现全球生产规模部署

通过全球可用性、广泛的导出支持以及经 Ultralytics 生态系统验证的使用量，将训练好的模型投入生产。

42+

部署区域

19+

导出格式

—

每日使用量

部署到全球 42 个区域

将你的模型部署到美洲、欧洲、亚太地区和中东的专用终端。每个终端都拥有独立的 URL、自动扩缩容和监控功能。

匹配你流量的自动扩缩容

专用终端可随流量高峰进行扩容，并在空闲时缩容至零。

默认缩容至零：当你的终端没有接收请求时，不会产生费用。
无速率限制：专用终端没有吞吐量上限。
可配置资源：选择 CPU（1-8 核）和内存（1-32 GB）以匹配你的工作负载。

用于 ONNX、TensorRT、CoreML、LiteRT 和其他格式的模型导出格式选择器。

20 种导出格式。你的模型。任何环境。

Ultralytics Platform 支持云端和边缘侧高性能部署。所有 Ultralytics YOLO 模型均经过原生优化，可在不同环境中高效运行，即使在计算资源受限的边缘设备上，也能提供高准确度、可靠的性能和兼容性。

监控生产环境中的一切

全面实时了解你模型的表现。一旦模型上线，部署仪表板将为你提供每个运行中终端的集中概览，并配备你所需的指标和工具包，以优化并保持框架运行的可靠性。

请求量：过去 24 小时内所有终端的总请求数。
P95 延迟：第 95 百分位响应时间，用于追踪真实使用场景下的性能。
错误率：当错误率超过 5% 时发出清晰告警，并配有严重程度过滤的日志以快速诊断问题。
健康检查：带有自动重试机制的实时终端监控。显示每次检查的延迟。

几分钟内完成集成

每个部署的终端都随附 Python、JavaScript 和 cURL 的自动生成代码示例，并预填了你实际的终端 URL 和 API 密钥。复制、粘贴，即可开始从任何应用程序发送推理请求。

在浏览器中测试你的模型

每个训练好的模型都包含内置的 Predict（预测）标签页功能。上传图片或打开你的摄像头；边界框会立即显示。

当你上传图片或更改参数时，推理会自动运行最高模型性能。

微调置信度阈值、IoU 设置和图像大小，实时查看它们如何影响预测结果。

目标检测、实例分割、语义分割、分类、姿态估计和 OBB 已经为你各自的任务清晰地呈现出来。

体验 YOLO26 推理

拖放一张图像以查看实时目标检测

实时演示

输入图像

上传图像或选择一个示例进行测试 yolo26n. 预测文档

将图像拖放到此处

或点击浏览

支持 JPEG, PNG, WebP, AVIF, HEIC, JP2, TIFF, BMP 及更多格式（最大 10MB）

或者尝试一个示例

置信度

0.25

IoU

0.70

图像尺寸

640

API 文档

部署你的模型以获取带有 API 密钥身份验证的专用推理端点，然后将下方的占位符 URL 和密钥替换为你部署的值。部署文档

注意： 这是示例代码。请先部署你的模型以获取端点 URL 和 API 密钥。

import requests

# Replace with your deployment URL and API key
url = "https://your-deployment-url.run.app/predict"
api_key = "YOUR_API_KEY"

# Optional inference parameters (conf, iou, imgsz)
args = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

with open("image.jpg", "rb") as f:
    response = requests.post(
        url,
        headers={"Authorization": f"Bearer {api_key}"},
        data=args,
        files={"file": f},
    )

print(response.json())

了解如何部署！

观看如何测试训练好的模型、将其部署到全球终端并监控性能。

探索行业解决方案

了解团队如何将 Ultralytics 计算机视觉应用于生产环境。

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

在 42 个全球区域部署计算机视觉模型

实现全球生产规模部署

部署到全球 42 个区域

匹配你流量的自动扩缩容

20 种导出格式。你的模型。任何环境。

监控生产环境中的一切

几分钟内完成集成

在浏览器中测试你的模型

体验 YOLO26 推理

了解如何部署！

探索行业解决方案

机器人技术中的 AI

物流中的 AI

零售业 AI

医疗保健中的 AI

制造业中的 AI

汽车中的 AI

农业中的 AI

机器人技术中的 AI

物流中的 AI

零售业 AI

医疗保健中的 AI

制造业中的 AI

汽车中的 AI

农业中的 AI

机器人技术中的 AI

物流中的 AI

零售业 AI

医疗保健中的 AI

制造业中的 AI

汽车中的 AI

农业中的 AI

常见问题解答

立即开始部署！