Bảng chú giải thuật ngữ

Điện toán Serverless

Khám phá cách điện toán phi máy chủ đơn giản hóa việc triển khai AI. Tìm hiểu cách xây dựng quy trình làm việc có khả năng mở rộng và tiết kiệm chi phí bằng cách sử dụng điện toán phi máy chủ. Ultralytics YOLO26 giúp suy luận ML hiệu quả.

Điện toán phi máy chủ (Serverless computing) là một mô hình thực thi đám mây cho phép các nhà phát triển xây dựng và chạy ứng dụng mà không cần phải quản lý cơ sở hạ tầng phức tạp. Trong mô hình này, nhà cung cấp dịch vụ đám mây quản lý động việc phân bổ và cung cấp máy chủ, trừu tượng hóa phần cứng và hệ điều hành bên dưới khỏi người dùng. Mã được thực thi trong các container không trạng thái được kích hoạt bởi các sự kiện cụ thể, chẳng hạn như yêu cầu HTTP, sửa đổi cơ sở dữ liệu hoặc tải lên tệp. Cách tiếp cận này rất phù hợp với các chiến lược điện toán đám mây hiện đại, vì nó cho phép các tổ chức chỉ trả tiền cho thời gian tính toán đã sử dụng, tự động tuân thủ các yêu cầu về khả năng mở rộng bằng cách mở rộng từ 0 lên hàng nghìn phiên bản dựa trên nhu cầu lưu lượng truy cập.

Cơ chế hoạt động của điện toán phi máy chủ (Serverless) cho trí tuệ nhân tạo (AI).

Cốt lõi của điện toán phi máy chủ là khái niệm Chức năng như một dịch vụ (Function-as-a-Service - FaaS) , trong đó các ứng dụng được chia nhỏ thành các chức năng riêng lẻ thực hiện các tác vụ riêng biệt. Đối với những người làm trong lĩnh vực Học máy (Machine Learning - ML) , điều này cung cấp một con đường hợp lý để triển khai mô hình . Thay vì duy trì một máy chủ chuyên dụng hoạt động không hiệu quả trong thời gian lưu lượng truy cập thấp, một chức năng phi máy chủ có thể được khởi tạo theo yêu cầu để xử lý dữ liệu và tắt ngay lập tức sau khi hoàn thành.

Tuy nhiên, một yếu tố quan trọng cần xem xét trong kiến trúc này là "khởi động nguội" - độ trễ phát sinh khi một hàm được gọi lần đầu tiên hoặc sau một khoảng thời gian không hoạt động. Để giảm thiểu điều này, các nhà phát triển thường sử dụng các kiến trúc nhẹ như YOLO26 hoặc các kỹ thuật như lượng tử hóa mô hình để đảm bảo thời gian tải nhanh, điều này rất cần thiết để duy trì độ trễ suy luận thấp.

Ứng dụng thực tế trong học máy

Kiến trúc không máy chủ đặc biệt hiệu quả đối với các quy trình làm việc thị giác máy tính (CV) hướng sự kiện và các đường dẫn dữ liệu.

Xử lý dữ liệu tự động: Khi người dùng tải lên một tập dữ liệu thô lên dịch vụ lưu trữ như Amazon S3 , nó có thể kích hoạt một hàm không máy chủ để thực hiện xử lý dữ liệu ngay lập tức. Hàm này có thể thay đổi kích thước hình ảnh, chuẩn hóa giá trị pixel hoặc xác thực định dạng tệp trước khi dữ liệu được đưa vào quy trình xử lý dữ liệu huấn luyện , đảm bảo tính nhất quán mà không cần can thiệp thủ công.
Giám sát thông minh theo yêu cầu: Trong ứng dụng AI trong an ninh , cảm biến chuyển động có thể kích hoạt camera để chụp ảnh. Sự kiện này kích hoạt một hàm đám mây chứa mô hình phát hiện đối tượng . Mô hình sẽ phân tích hình ảnh để phân biệt giữa động vật vô hại và kẻ xâm nhập tiềm năng, chỉ gửi cảnh báo khi cần thiết. Điều này giúp giảm đáng kể chi phí băng thông và lưu trữ so với việc phát trực tuyến liên tục.

Python Ví dụ: Trình xử lý suy luận không có máy chủ

Đoạn mã sau đây minh họa một trình xử lý serverless theo khái niệm. Nó khởi tạo một thể hiện mô hình toàn cục để tận dụng "khởi động nóng" (trong đó container vẫn hoạt động giữa các yêu cầu) và xử lý đường dẫn hình ảnh đến.

from ultralytics import YOLO

# Initialize the model outside the handler to cache it for subsequent requests
# YOLO26n is ideal for serverless due to its compact size and speed
model = YOLO("yolo26n.pt")


def lambda_handler(event, context):
    """Simulates a serverless function handler triggered by an event. 'event' represents the input payload containing
    the image source.
    """
    image_source = event.get("url", "https://ultralytics.com/images/bus.jpg")

    # Perform inference
    results = model(image_source)

    # Return prediction summary
    return {
        "statusCode": 200,
        "body": {
            "objects_detected": len(results[0].boxes),
            "top_class": results[0].names[int(results[0].boxes.cls[0])] if len(results[0].boxes) > 0 else "None",
        },
    }

Phân biệt các công nghệ liên quan

Để hiểu về điện toán phi máy chủ, cần phải phân biệt nó với các mô hình cơ sở hạ tầng khác thường được sử dụng trong MLOps .

Điện toán phi máy chủ so với điện toán biên: Mặc dù cả hai đều hướng đến việc tối ưu hóa hiệu quả, nhưng chúng hoạt động ở các vị trí khác nhau. Điện toán biên xử lý dữ liệu cục bộ trên thiết bị (ví dụ: camera thông minh hoặc thiết bị IoT ) để giảm thiểu thời gian truyền tải qua mạng. Điện toán phi máy chủ diễn ra trên đám mây công cộng tập trung. Các giải pháp lai thường xử lý dữ liệu ban đầu ở biên và gửi các bất thường phức tạp đến các chức năng đám mây phi máy chủ để phân tích hình ảnh y tế chuyên sâu hoặc xem xét pháp y.
Serverless so với Kubernetes: Kubernetes là một nền tảng điều phối cho việc đóng gói container , cung cấp cho các nhà phát triển khả năng kiểm soát chi tiết môi trường cụm, mạng và các pod. Mặc dù mạnh mẽ, nó đòi hỏi chi phí quản lý đáng kể. Các nền tảng serverless, chẳng hạn như Google Cloud Functions hoặc Azure Functions , hoàn toàn trừu tượng hóa việc điều phối này, cho phép các nhóm tập trung hoàn toàn vào logic mã thay vì trạng thái hoạt động của các node.
Điện toán phi máy chủ so với IaaS: Cơ sở hạ tầng dưới dạng dịch vụ (IaaS) cung cấp các tài nguyên điện toán ảo hóa qua internet, ví dụ như Amazon EC2 . Với IaaS, người dùng chịu trách nhiệm vá lỗi hệ điều hành và quản lý phần mềm trung gian. Ngược lại, điện toán phi máy chủ loại bỏ các trách nhiệm vận hành này, cho phép các nhà phát triển tập trung vào các nhiệm vụ cấp cao hơn như cải thiện độ chính xác phân loại hình ảnh .

Bằng cách tận dụng kiến trúc không máy chủ, các nhà phát triển có thể triển khai các giải pháp AI mạnh mẽ, tiết kiệm chi phí và có khả năng xử lý khối lượng công việc không thể dự đoán trước, sử dụng các công cụ như Nền tảng Ultralytics để tối ưu hóa quy trình huấn luyện và quản lý mô hình trước khi triển khai.

Điện toán Serverless

Xe lửa Ultralytics YOLO các mô hình để hợp lý hóa quy trình làm việc trên khắp các ngành công nghiệp

Giải pháp cấp phép doanh nghiệp linh hoạt để thúc đẩy sự đổi mới của bạn

Đào tạo các mô hình AI trong vài giây với Ultralytics YOLO

Cơ chế hoạt động của điện toán phi máy chủ (Serverless) cho trí tuệ nhân tạo (AI).

Ứng dụng thực tế trong học máy

Python Ví dụ: Trình xử lý suy luận không có máy chủ

Phân biệt các công nghệ liên quan

Đọc thêm trong danh mục này

12 trường hợp sử dụng ảnh chụp từ trên không được hỗ trợ bởi thị giác máy tính

Ước lượng độ sâu đơn ảnh là gì? Tổng quan

Một cái nhìn về việc sử dụng Ultralytics YOLO các mô hình để phát hiện mối đe dọa AI

Tham gia Ultralytics cộng đồng