了解人工智能和 ML 的可扩展性如何确保Ultralytics YOLO 等实际应用的一致性能、适应性和效率。
在人工智能(AI)和 在人工智能(AI)和机器学习(ML)中,可扩展性是指系统处理不断增长的工作负载的能力。 系统处理不断增长的工作负载的能力,如增加的数据量、用户流量或计算复 复杂性,而不影响性能的能力。可扩展架构可确保随着需求的增加,系统能够 利用更多资源或优化现有资源,以保持低推理延迟和高吞吐量。 推理延迟和高吞吐量。是否 在单个边缘设备上部署计算机视觉模型 还是通过云服务数百万个请求,规模化设计都是任何人工智能应用取得长期成功的基础。 任何人工智能应用取得长期成功的基础。
可扩展性是强大的 机器学习运营 (MLOps) 的基石。如果没有可扩展性,在原型开发阶段表现优异的模型在接触到生产环境中典型的高速数据流时可能会失败。 生产环境中典型的高速数据流。有效管理 大数据要求系统能够横向扩展(增加更多机器 (增加更多机器)或纵向扩展(为现有机器增加更多动力)的系统。
主要优势包括:
创建可扩展的人工智能解决方案需要优化模型架构和部署基础设施。
在推理过程中,提高可扩展性的一个简单方法是分批而不是按顺序处理输入。 这样可以最大限度地利用GPU ,提高吞吐量。
from ultralytics import YOLO
# Load a scalable YOLO11 model
model = YOLO("yolo11n.pt")
# Define a batch of images (URLs or local paths)
# Processing multiple images at once leverages parallel computation
batch_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]
# Run inference on the batch
results = model(batch_images)
# Results contain predictions for both images
print(f"Processed {len(results)} images.")
可扩展性使人工智能能够从研究实验室过渡到全球产业。
可扩展性与性能和效率虽有关联,但却截然不同。