Bảng chú giải thuật ngữ

Khả Năng Mở Rộng

Khám phá tầm quan trọng của khả năng mở rộng trong trí tuệ nhân tạo. Tìm hiểu cách thức thực hiện. Ultralytics YOLO26 và Ultralytics Nền tảng này cho phép triển khai mô hình hiệu quả và hiệu suất cao.

Khả năng mở rộng đề cập đến khả năng của một hệ thống, mạng lưới hoặc quy trình xử lý khối lượng công việc ngày càng tăng bằng cách bổ sung tài nguyên. Trong bối cảnh Trí tuệ Nhân tạo (AI) và Học máy (ML) , khả năng mở rộng mô tả khả năng của một mô hình hoặc cơ sở hạ tầng duy trì mức hiệu suất khi nhu cầu tăng lên. Nhu cầu này thường thể hiện ở các tập dữ liệu lớn hơn trong quá trình huấn luyện, lưu lượng người dùng cao hơn trong quá trình suy luận hoặc độ phức tạp tăng lên trong các tác vụ tính toán. Một kiến trúc có khả năng mở rộng cho phép mở rộng liền mạch—cho dù triển khai mô hình thị giác máy tính cho một thiết bị nhúng duy nhất hay phục vụ hàng triệu yêu cầu API thông qua các cụm đám mây—đảm bảo độ trễ suy luận vẫn thấp ngay cả khi tải nặng.

Tầm quan trọng của khả năng mở rộng trong trí tuệ nhân tạo

Thiết kế hướng đến khả năng mở rộng là một yếu tố quan trọng để vận hành máy học (Machine Learning Operations - MLOps) thành công. Một mô hình hoạt động hoàn hảo trong môi trường nghiên cứu được kiểm soát có thể thất bại khi tiếp xúc với luồng dữ liệu tốc độ cao trong môi trường sản xuất. Quản lý dữ liệu lớn hiệu quả đòi hỏi các hệ thống có thể mở rộng theo chiều ngang (thêm máy vào cụm) hoặc theo chiều dọc (thêm sức mạnh xử lý, chẳng hạn như RAM hoặc GPU, cho các máy hiện có).

Những ưu điểm chính của hệ thống AI có khả năng mở rộng bao gồm:

Độ tin cậy: Hệ thống có khả năng mở rộng đảm bảo thời gian hoạt động ổn định của dịch vụ ngay cả khi lưu lượng truy cập tăng đột biến, ngăn ngừa sự cố đối với các ứng dụng quan trọng.
Hiệu quả về chi phí: Khả năng mở rộng linh hoạt cho phép giảm quy mô tài nguyên trong thời gian sử dụng thấp, một tính năng thường được quản lý bởi các nền tảng điện toán đám mây như AWS hoặc Google Cloud .
Đảm bảo khả năng đáp ứng nhu cầu trong tương lai: Một cơ sở hạ tầng có khả năng mở rộng sẽ đáp ứng được các thuật toán mới hơn, phức tạp hơn, chẳng hạn như bộ chuyển đổi hình ảnh (ViT) , mà không cần phải đại tu hoàn toàn hệ sinh thái phần cứng.

Chiến lược để đạt được khả năng mở rộng

Việc tạo ra các giải pháp AI có khả năng mở rộng liên quan đến việc tối ưu hóa cả kiến trúc mô hình và cơ sở hạ tầng triển khai.

Huấn luyện phân tán: Khi tập dữ liệu huấn luyện trở nên quá lớn đối với một bộ xử lý đơn lẻ, huấn luyện phân tán sẽ chia nhỏ khối lượng công việc cho nhiều Bộ xử lý đồ họa (GPU) . Các framework như PyTorch Distributed cho phép các nhà phát triển song song hóa các phép tính, giảm đáng kể thời gian cần thiết để huấn luyện các mô hình cơ bản. Các công cụ như Ultralytics Platform đơn giản hóa quá trình này bằng cách tự động quản lý các tài nguyên huấn luyện trên đám mây.
Kiến trúc mô hình hiệu quả: Việc lựa chọn kiến trúc mô hình phù hợp là rất quan trọng đối với thông lượng. Ultralytics YOLO26 mới nhất được thiết kế nhỏ gọn và nhanh hơn các phiên bản trước đó, giúp nó có khả năng mở rộng tự nhiên trên nhiều phần cứng khác nhau, từ các thiết bị AI biên đến các trung tâm máy chủ khổng lồ.
Công nghệ container hóa và điều phối: Việc đóng gói ứng dụng bằng Docker đảm bảo chúng hoạt động nhất quán trên các môi trường khác nhau. Để quản lý các cụm container lớn, Kubernetes tự động hóa việc triển khai, mở rộng quy mô và quản lý các ứng dụng được đóng gói trong container.
Tối ưu hóa mô hình: Các kỹ thuật như lượng tử hóa và cắt tỉa mô hình giúp giảm dung lượng bộ nhớ và chi phí tính toán của mô hình. Các công cụ như NVIDIA TensorRT có thể tăng tốc độ suy luận hơn nữa, cho phép đạt được thông lượng cao hơn trên phần cứng hiện có.

Ví dụ mã: Suy luận hàng loạt có khả năng mở rộng

Một phương pháp hiệu quả để cải thiện khả năng mở rộng trong quá trình suy luận là xử lý đầu vào theo lô thay vì tuần tự. Điều này tối đa hóa... GPU và tăng hiệu suất tổng thể.

from ultralytics import YOLO

# Load a scalable YOLO26 model (smaller 'n' version for speed)
model = YOLO("yolo26n.pt")

# Define a batch of images (URLs or local paths)
# Processing multiple images at once leverages parallel computation
batch_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]

# Run inference on the batch
results = model(batch_images)

# Print the number of detections for the first image
print(f"Detected {len(results[0].boxes)} objects in the first image.")

Các Ứng dụng Thực tế

Khả năng mở rộng cho phép các công nghệ AI chuyển đổi từ nghiên cứu lý thuyết sang các công cụ công nghiệp toàn cầu.

Sản xuất thông minh: Trong lĩnh vực trí tuệ nhân tạo ứng dụng trong sản xuất , các hệ thống kiểm tra tự động phải phân tích hàng nghìn linh kiện mỗi giờ trên các dây chuyền lắp ráp tốc độ cao. Một hệ thống phát hiện vật thể có khả năng mở rộng đảm bảo rằng khi tốc độ sản xuất tăng lên, quy trình kiểm soát chất lượng vẫn duy trì độ chính xác cao mà không trở thành điểm nghẽn.
Hệ thống đề xuất sản phẩm bán lẻ: Các nền tảng thương mại điện tử lớn sử dụng hệ thống đề xuất để cung cấp hàng triệu gợi ý sản phẩm được cá nhân hóa ngay lập tức. Cơ sở hạ tầng có khả năng mở rộng cho phép các nền tảng này xử lý các sự kiện lớn như Black Friday, nơi lưu lượng truy cập có thể tăng gấp 100 lần, bằng cách tự động cung cấp thêm các máy chủ thông qua Microsoft Azure hoặc các nhà cung cấp tương tự.