Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024
Bảng chú giải thuật ngữ

Điện toán Serverless

Khám phá cách điện toán serverless cách mạng hóa AI/ML với khả năng mở rộng, hiệu quả chi phí và triển khai nhanh chóng. Xây dựng thông minh hơn, nhanh hơn ngay hôm nay!

Điện toán Serverless là một mô hình thực thi trên đám mây, trong đó nhà cung cấp dịch vụ đám mây quản lý động việc phân bổ và cung cấp máy chủ. Cách tiếp cận này cho phép các nhà phát triển xây dựng và chạy các ứng dụng và dịch vụ mà không cần suy nghĩ về cơ sở hạ tầng máy chủ bên dưới. Thay vì cung cấp và quản lý máy chủ, các nhà phát triển triển khai mã của họ dưới dạng các hàm. Các hàm này được nhà cung cấp thực thi theo yêu cầu, tự động mở rộng quy mô từ một vài yêu cầu mỗi ngày lên hàng nghìn yêu cầu mỗi giây. Mô hình trả tiền theo mức sử dụng này làm cho nó hiệu quả cao đối với khối lượng công việc có lưu lượng truy cập thay đổi hoặc không thể đoán trước, một kịch bản phổ biến trong các ứng dụng Học máy (ML).

Cách thức hoạt động của Điện toán phi máy chủ (Serverless Computing)

Cốt lõi của điện toán serverless là mô hình Function-as-a-Service (FaaS). Trong thiết lập này, logic ứng dụng được chia thành các function nhỏ, đơn mục đích, được kích hoạt bởi các sự kiện cụ thể. Một sự kiện có thể là một yêu cầu HTTP từ một ứng dụng web, một tin nhắn mới trong hàng đợi hoặc một tệp được tải lên bộ nhớ đám mây.

Khi một sự kiện kích hoạt xảy ra, nền tảng đám mây sẽ ngay lập tức thực thi chức năng tương ứng. Nền tảng này xử lý tất cả các khía cạnh của quản lý tài nguyên, bao gồm cung cấp phiên bản tính toán, quản lý hệ điều hành và đảm bảo tính khả dụng cao và khả năng mở rộng. Sau khi chức năng hoàn tất thực thi, các tài nguyên sẽ được giải phóng. Điều này loại bỏ thời gian chờ của máy chủ và đảm bảo rằng bạn chỉ trả tiền cho chính xác các tài nguyên tính toán mà ứng dụng của bạn tiêu thụ. Đây là một nguyên tắc cơ bản của MLOps hiện đại.

Các ứng dụng trong AI và học máy

Kiến trúc serverless đặc biệt phù hợp cho các giai đoạn khác nhau của vòng đời AI/ML, đặc biệt là cho suy luận mô hình (model inference).

  • Quy trình dữ liệu tự động: Các hàm serverless có thể tự động hóa các tác vụ tiền xử lý dữ liệu. Ví dụ: một hàm có thể được kích hoạt mỗi khi một hình ảnh mới được tải lên một dịch vụ lưu trữ như Amazon S3. Hàm này sau đó có thể tự động thay đổi kích thước hình ảnh, chuẩn hóa các giá trị pixel và lưu trữ nó ở định dạng sẵn sàng cho quá trình huấn luyện mô hình.
  • Cung cấp mô hình hiệu quả về chi phí: Nhiều ứng dụng AI không yêu cầu xử lý liên tục, khối lượng lớn. Một điểm cuối serverless cho mô hình Computer Vision (Thị giác máy tính) cho phép bạn triển khai các mô hình như Ultralytics YOLO mà không cần duy trì một máy chủ chạy liên tục và thường tốn kém. Hàm này khởi động theo yêu cầu để xử lý một yêu cầu và tắt sau đó, giảm đáng kể chi phí vận hành. Cách tiếp cận này đơn giản hóa việc triển khai mô hình cho các ứng dụng có kiểu sử dụng không liên tục.

Các ví dụ thực tế

  1. Phân tích hình ảnh theo yêu cầu: Một ứng dụng di động cho phép người dùng tải ảnh cây trồng lên để xác định. Mỗi lần tải ảnh lên sẽ kích hoạt một hàm serverless thông qua API Gateway. Hàm này tải một mô hình phân loại hình ảnh, phân tích ảnh để xác định loài cây và trả về kết quả cho ứng dụng của người dùng. Toàn bộ quá trình này diễn ra trong vài giây mà không cần máy chủ chuyên dụng.
  2. Xử lý chatbot theo thời gian thực: Trong một chatbot dịch vụ khách hàng, mỗi tin nhắn của người dùng là một sự kiện kích hoạt một hàm serverless. Hàm này gọi một mô hình Xử lý ngôn ngữ tự nhiên (NLP) để hiểu ý định của người dùng. Dựa trên phân tích, một hàm khác có thể được kích hoạt để truy vấn cơ sở dữ liệu hoặc gọi một API khác, tuân theo một kiến trúc hướng sự kiện.

Serverless so với các khái niệm liên quan

Điều quan trọng là phải phân biệt serverless computing (điện toán phi máy chủ) với các công nghệ liên quan:

  • Điện toán đám mây so với Serverless: Điện toán đám mây là việc cung cấp rộng rãi các dịch vụ điện toán qua internet. Serverless là một mô hình thực thi cụ thể trong điện toán đám mây, nhấn mạnh việc quản lý tài nguyên tự động, trừu tượng hóa hoàn toàn việc quản lý máy chủ. Các mô hình đám mây khác như Cơ sở hạ tầng như một dịch vụ (IaaS) vẫn yêu cầu người dùng cung cấp và quản lý máy ảo.
  • Container hóa so với Serverless: Các công cụ container hóa như Docker đóng gói các ứng dụng và các phần phụ thuộc của chúng. Các nền tảng điều phối như Kubernetes tự động hóa việc triển khai và mở rộng quy mô của các container này. Mặc dù điều này làm giảm gánh nặng vận hành, nhưng bạn vẫn quản lý cơ sở hạ tầng cụm bên dưới. Các nền tảng serverless trừu tượng hóa hoàn toàn lớp này; bạn chỉ quản lý mã hàm. Xem cách sử dụng Docker với Ultralytics.
  • Điện toán biên (Edge Computing) so với Điện toán phi máy chủ (Serverless): Điện toán biên (Edge Computing) bao gồm việc xử lý dữ liệu cục bộ trên các thiết bị gần nguồn dữ liệu. Ngược lại, điện toán phi máy chủ (serverless computing) chạy các hàm trong các trung tâm dữ liệu đám mây tập trung. Hai điều này có thể bổ sung cho nhau; một thiết bị AI biên (Edge AI) (như một thiết bị chạy trên NVIDIA Jetson) có thể thực hiện lọc ban đầu và sau đó kích hoạt một hàm phi máy chủ (serverless function) trên đám mây để phân tích chuyên sâu hơn.

Các nền tảng serverless hàng đầu bao gồm AWS Lambda, Google Cloud FunctionsAzure Functions. Các dịch vụ này cung cấp cơ sở hạ tầng để xây dựng và chạy các ứng dụng AI/ML serverless một cách hiệu quả. Các nền tảng như Ultralytics HUB có thể giúp đơn giản hóa việc triển khai và quản lý các mô hình trong các kiến trúc khác nhau, bao gồm cả thiết lập serverless.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard