探索AI中可扩展性的重要性。了解Ultralytics YOLO26和Ultralytics平台如何实现高效、高性能的模型部署。
可扩展性是指系统、网络或流程通过增加资源来处理不断增长的工作量的能力。在人工智能 (AI)和机器学习 (ML)领域,可扩展性描述了模型或基础设施在需求增加时保持性能水平的能力。这种需求通常表现为训练期间更大的数据集、推理期间更高的用户流量,或计算任务中增加的复杂性。可扩展的架构允许无缝扩展——无论是将计算机视觉模型部署到单个嵌入式设备,还是通过云集群服务数百万个 API 请求——确保即使在高负载下,推理延迟也能保持较低水平。
为可扩展性而设计是成功机器学习运维 (MLOps)的关键组成部分。一个在受控研究环境中完美运行的模型,在面对生产环境中高速数据流时可能会失效。有效管理大数据需要能够横向扩展(向集群添加更多机器)或纵向扩展(向现有机器添加更多算力,例如RAM或GPU)的系统。
可扩展人工智能系统的主要优势包括:
创建可扩展的人工智能解决方案需要优化模型架构和部署基础设施。
在推理过程中提高可扩展性的一种有效方法是以批处理而非顺序方式处理输入。这可以最大限度地提高GPU利用率并提高整体吞吐量。
from ultralytics import YOLO
# Load a scalable YOLO26 model (smaller 'n' version for speed)
model = YOLO("yolo26n.pt")
# Define a batch of images (URLs or local paths)
# Processing multiple images at once leverages parallel computation
batch_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]
# Run inference on the batch
results = model(batch_images)
# Print the number of detections for the first image
print(f"Detected {len(results[0].boxes)} objects in the first image.")
可扩展性使人工智能技术能够从理论研究转向全球工业工具。
尽管经常互换使用,但可扩展性与性能和效率是不同的概念。

开启您的机器学习未来之旅