Khám phá cách điện toán phi máy chủ đơn giản hóa việc triển khai AI. Tìm hiểu cách xây dựng quy trình làm việc có khả năng mở rộng và tiết kiệm chi phí bằng cách sử dụng điện toán phi máy chủ. Ultralytics YOLO26 giúp suy luận ML hiệu quả.
Điện toán phi máy chủ (Serverless computing) là một mô hình thực thi đám mây cho phép các nhà phát triển xây dựng và chạy ứng dụng mà không cần phải quản lý cơ sở hạ tầng phức tạp. Trong mô hình này, nhà cung cấp dịch vụ đám mây quản lý động việc phân bổ và cung cấp máy chủ, trừu tượng hóa phần cứng và hệ điều hành bên dưới khỏi người dùng. Mã được thực thi trong các container không trạng thái được kích hoạt bởi các sự kiện cụ thể, chẳng hạn như yêu cầu HTTP, sửa đổi cơ sở dữ liệu hoặc tải lên tệp. Cách tiếp cận này rất phù hợp với các chiến lược điện toán đám mây hiện đại, vì nó cho phép các tổ chức chỉ trả tiền cho thời gian tính toán đã sử dụng, tự động tuân thủ các yêu cầu về khả năng mở rộng bằng cách mở rộng từ 0 lên hàng nghìn phiên bản dựa trên nhu cầu lưu lượng truy cập.
Cốt lõi của điện toán phi máy chủ là khái niệm Chức năng như một dịch vụ (Function-as-a-Service - FaaS) , trong đó các ứng dụng được chia nhỏ thành các chức năng riêng lẻ thực hiện các tác vụ riêng biệt. Đối với những người làm trong lĩnh vực Học máy (Machine Learning - ML) , điều này cung cấp một con đường hợp lý để triển khai mô hình . Thay vì duy trì một máy chủ chuyên dụng hoạt động không hiệu quả trong thời gian lưu lượng truy cập thấp, một chức năng phi máy chủ có thể được khởi tạo theo yêu cầu để xử lý dữ liệu và tắt ngay lập tức sau khi hoàn thành.
Tuy nhiên, một yếu tố quan trọng cần xem xét trong kiến trúc này là "khởi động nguội" - độ trễ phát sinh khi một hàm được gọi lần đầu tiên hoặc sau một khoảng thời gian không hoạt động. Để giảm thiểu điều này, các nhà phát triển thường sử dụng các kiến trúc nhẹ như YOLO26 hoặc các kỹ thuật như lượng tử hóa mô hình để đảm bảo thời gian tải nhanh, điều này rất cần thiết để duy trì độ trễ suy luận thấp.
Kiến trúc không máy chủ đặc biệt hiệu quả đối với các quy trình làm việc thị giác máy tính (CV) hướng sự kiện và các đường dẫn dữ liệu.
Đoạn mã sau đây minh họa một trình xử lý serverless theo khái niệm. Nó khởi tạo một thể hiện mô hình toàn cục để tận dụng "khởi động nóng" (trong đó container vẫn hoạt động giữa các yêu cầu) và xử lý đường dẫn hình ảnh đến.
from ultralytics import YOLO
# Initialize the model outside the handler to cache it for subsequent requests
# YOLO26n is ideal for serverless due to its compact size and speed
model = YOLO("yolo26n.pt")
def lambda_handler(event, context):
"""Simulates a serverless function handler triggered by an event. 'event' represents the input payload containing
the image source.
"""
image_source = event.get("url", "https://ultralytics.com/images/bus.jpg")
# Perform inference
results = model(image_source)
# Return prediction summary
return {
"statusCode": 200,
"body": {
"objects_detected": len(results[0].boxes),
"top_class": results[0].names[int(results[0].boxes.cls[0])] if len(results[0].boxes) > 0 else "None",
},
}
Để hiểu về điện toán phi máy chủ, cần phải phân biệt nó với các mô hình cơ sở hạ tầng khác thường được sử dụng trong MLOps .
Bằng cách tận dụng kiến trúc không máy chủ, các nhà phát triển có thể triển khai các giải pháp AI mạnh mẽ, tiết kiệm chi phí và có khả năng xử lý khối lượng công việc không thể dự đoán trước, sử dụng các công cụ như Nền tảng Ultralytics để tối ưu hóa quy trình huấn luyện và quản lý mô hình trước khi triển khai.