Serverless Computing
探索无服务器计算如何简化 AI 部署。学习使用 Ultralytics YOLO26 构建可扩展、经济高效的工作流,以进行高效的 ML 推理。
无服务器计算是一种云执行模型,它使开发者能够构建和运行应用程序,而无需处理管理基础设施的复杂性。在这种范式中,云服务提供商动态管理服务器的分配和配置,将底层硬件和操作系统从用户视野中抽象出来。代码在由特定事件(例如 HTTP 请求、数据库修改或文件上传)触发的无状态容器中执行。这种方法与现代 cloud computing 策略高度相关,因为它允许组织仅为所消耗的计算时间付费,并根据流量需求从零自动扩展到数千个实例,从而满足 scalability 要求。
Link to this section面向 AI 的无服务器计算机制#
无服务器计算的核心是 Function-as-a-Service (FaaS) 的概念,即将应用程序分解为执行离散任务的独立函数。对于 Machine Learning (ML) 从业者而言,这提供了一条精简的 model deployment 途径。与其维护一个在低流量时期处于空闲状态的专用服务器,不如按需启动无服务器函数来处理数据,并在处理完成后立即关闭。
然而,这种架构中的一个关键考量因素是“冷启动”——即函数在第一次调用或在一段时间不活动后被调用时产生的延迟。为了缓解这一问题,开发者通常使用 YOLO26 等轻量级架构或 model quantization 等技术来确保快速加载时间,这对于维持低 inference latency 至关重要。
Link to this section机器学习中的实际应用#
无服务器架构对于事件驱动的 computer vision (CV) 工作流和数据流水线尤其有效。
- 自动化数据预处理: 当用户将原始数据集上传到 Amazon S3 等存储服务时,它可以触发一个无服务器函数来执行即时的 data preprocessing。该函数可以在数据进入 training data 流水线之前调整图像大小、归一化像素值或验证文件格式,从而在无需人工干预的情况下确保一致性。
- 按需智能监控: 在 AI in Security 应用中,运动传感器可以触发摄像头捕捉画面。此事件会调用一个托管 object detection 模型的云函数。模型分析图像以区分无害动物和潜在入侵者,仅在必要时发送警报。与持续流式传输相比,这极大地减少了带宽和存储成本。
Link to this sectionPython 示例:无服务器推理处理程序#
以下代码演示了一个概念性的无服务器处理程序。它初始化了一个全局模型实例,以利用“热启动”(即容器在请求之间保持活动状态),并处理传入的图像路径。
from ultralytics import YOLO
# Initialize the model outside the handler to cache it for subsequent requests
# YOLO26n is ideal for serverless due to its compact size and speed
model = YOLO("yolo26n.pt")
def lambda_handler(event, context):
"""Simulates a serverless function handler triggered by an event. 'event' represents the input payload containing
the image source.
"""
image_source = event.get("url", "https://ultralytics.com/images/bus.jpg")
# Perform inference
results = model(image_source)
# Return prediction summary
return {
"statusCode": 200,
"body": {
"objects_detected": len(results[0].boxes),
"top_class": results[0].names[int(results[0].boxes.cls[0])] if len(results[0].boxes) > 0 else "None",
},
}Link to this section区分相关技术#
理解无服务器计算需要将其与 MLOps 中经常使用的其他基础设施模型区分开来。
- 无服务器与边缘计算: 虽然两者都旨在优化效率,但它们在不同位置运行。Edge computing 在本地设备(如智能摄像头或 IoT device)上处理数据,以最大限度地减少网络传输时间。无服务器计算则发生在集中的公共云中。混合解决方案通常在边缘处理初始数据,并将复杂的异常情况发送到无服务器云函数,以进行更深度的 medical image analysis 或取证审查。
- 无服务器与 Kubernetes: Kubernetes 是一个用于 containerization 的编排平台,它为开发者提供了对集群环境、网络和 Pod 的细粒度控制。虽然功能强大,但它需要大量的管理开销。像 Google Cloud Functions 或 Azure Functions 这样的无服务器平台完全抽象了这种编排,让团队能够专注于代码逻辑,而不是节点的健康状况。
- 无服务器与 IaaS: Infrastructure-as-a-Service (IaaS) 通过互联网提供虚拟化计算资源,例如 Amazon EC2。使用 IaaS,用户负责修补操作系统和管理中间件。相比之下,无服务器计算消除了这些运营责任,使开发者能够专注于提高 image classification 准确率等更高级的任务。
通过利用无服务器架构,开发者可以部署具有成本效益且能够处理不可预测工作负载的稳健 AI 解决方案,并利用 Ultralytics Platform 等工具在部署前简化模型训练和管理流程。






