了解模型服务的基本要素--部署人工智能模型,实现实时预测、可扩展性和与应用程序的无缝集成。
机器学习 (ML)模型经过训练和验证后,下一个关键步骤就是使其能够对新数据进行预测。这一过程被称为 "模型服务"。它包括将训练好的模型部署到生产环境中,通常是在API(应用编程接口)端点后面,允许应用程序或其他系统实时请求预测。模型服务是开发的模型与其实际应用之间的桥梁,将其从静态文件转变为更广泛的机器学习生命周期中的主动、产生价值的服务。
模型服务是实现 ML 模型可操作性的基础。没有它,即使是最精确的模型,如最先进的 Ultralytics YOLO对象检测器等最精确的模型也会被隔离在开发环境中,无法对现实世界的流程产生影响。有效的模型服务可确保在训练过程中开发的洞察力和自动化能力能够被访问和使用。它可以实现实时推理,使应用程序能够动态响应新数据,这对于从视频中的物体检测到聊天机器人中的自然语言处理(NLP)等任务至关重要。最终,模型服务对于实现人工智能计划的投资回报(ROI)至关重要。
虽然模型服务经常被交替使用,但从技术上讲,模型服务是更广泛的模型部署过程中的一个特定组成部分。模型部署包括将训练有素的模型在实时生产环境中运行所需的所有步骤,包括打包、基础设施设置、集成和监控。模型服务专门关注托管模型和处理传入预测请求的基础设施和软件层,通常通过REST或gRPC 等网络协议将模型的功能作为服务提供。查看我们的模型部署选项指南,了解更多详情。
通过模型服务,我们每天都能使用无数人工智能驱动的功能。这里有两个例子:
实施一个强大的模型服务系统需要多个组成部分共同协作:
Ultralytics HUB等平台旨在简化整个工作流程,为计算机视觉模型的训练、版本化、部署和服务提供集成解决方案,并与MLOps(机器学习运营)最佳实践保持一致。主要考虑因素包括处理负载变化的可扩展性、安全性(数据安全性)和可维护性。