Vận hành Máy học (MLOps)
Khám phá những yếu tố thiết yếu của MLOps để tối ưu hóa việc triển khai AI. Tìm hiểu cách quản lý CI/CD, quản lý phiên bản dữ liệu và giám sát với... Ultralytics YOLO26 và nền tảng của chúng tôi.
Quản trị vận hành máy học (Machine Learning Operations - MLOps) là một tập hợp các phương pháp, nguyên tắc và công nghệ giúp tối ưu hóa quy trình đưa các mô hình máy học (ML) từ giai đoạn phát triển thử nghiệm đến triển khai sản phẩm đáng tin cậy. Bằng cách kết hợp bản chất khám phá của khoa học dữ liệu với kỷ luật nghiêm ngặt của DevOps, MLOps hướng đến việc thống nhất chu kỳ phát hành cho các ứng dụng Trí tuệ nhân tạo (AI) . Trong khi phát triển phần mềm truyền thống chủ yếu tập trung vào việc quản lý phiên bản mã, MLOps lại đưa thêm vào những phức tạp của việc quản lý dữ liệu quy mô lớn và hành vi của mô hình đang phát triển. Cách tiếp cận toàn diện này đảm bảo rằng các hệ thống AI vẫn có khả năng mở rộng, chính xác và được quản lý xuyên suốt toàn bộ vòng đời của chúng.
Các trụ cột của MLOps
Việc triển khai MLOps thành công dựa trên việc thu hẹp khoảng cách giữa ba lĩnh vực riêng biệt: kỹ thuật dữ liệu, học máy và DevOps.
-
Tích hợp và phân phối liên tục (CI/CD): Giống như phần mềm tiêu chuẩn sử dụng các đường dẫn CI/CD để tự động hóa việc kiểm thử và triển khai, các đường dẫn MLOps tự động hóa việc huấn luyện và xác thực mô hình. Điều này đảm bảo rằng các thay đổi đối với mã hoặc dữ liệu sẽ tự động kích hoạt các bước để xác minh hiệu suất của mô hình trước khi các bản cập nhật được đưa vào sản xuất.
-
Quản lý phiên bản dữ liệu và mô hình: Trong lập trình truyền thống, bạn chỉ quản lý phiên bản mã nguồn. Trong MLOps, các nhóm phải sử dụng các công cụ như DVC (Data Version Control) để quản lý phiên bản dữ liệu và mô hình. track Những thay đổi trong dữ liệu huấn luyện song song với các siêu tham số của mô hình. Điều này đảm bảo tính khả thi , cho phép các kỹ sư tái tạo bất kỳ phiên bản mô hình cụ thể nào từ lịch sử.
-
Giám sát liên tục: Sau khi triển khai, các mô hình có thể bị suy giảm do sự thay đổi khái niệm , trong đó các thuộc tính thống kê của biến mục tiêu thay đổi theo thời gian. MLOps bao gồm việc thiết lập các hệ thống quan sát để track Các chỉ số như độ trễ suy luận và độ chính xác sẽ tự động cảnh báo các nhóm khi cần đào tạo lại.
Các Ứng dụng Thực tế
MLOps là xương sống của trí tuệ nhân tạo doanh nghiệp hiện đại, cho phép các công ty mở rộng quy mô từ một mô hình duy nhất đến hàng nghìn điểm cuối được triển khai một cách đáng tin cậy.
-
Bảo trì dự đoán trong sản xuất: Các nhà máy sử dụng thị giác máy tính để xác định lỗi trên dây chuyền lắp ráp. Một quy trình MLOps đảm bảo rằng khi các dây chuyền sản phẩm mới được giới thiệu, các mô hình phát hiện đối tượng được huấn luyện lại với hình ảnh mới, được lưu phiên bản và tự động triển khai đến các thiết bị biên của nhà máy mà không cần ngừng hoạt động. Điều này đảm bảo việc kiểm tra chất lượng vẫn nhất quán ngay cả khi điều kiện sản xuất thay đổi.
-
Quản lý kho hàng thông minh: Các nhà bán lẻ triển khai camera để... track Hàng tồn kho trên kệ. Do ánh sáng trong cửa hàng và bao bì sản phẩm thay đổi thường xuyên, sự sai lệch của mô hình là một rủi ro thường trực. Hệ thống MLOps giám sát điểm tin cậy ; nếu độ tin cậy giảm, hệ thống sẽ gắn cờ các hình ảnh để chú thích và bắt đầu chu kỳ huấn luyện lại trên đám mây, đẩy mô hình được cập nhật đến các cửa hàng để duy trì quản lý hàng tồn kho tự động .
Triển khai MLOps với Ultralytics
Theo dõi thử nghiệm là một bước quan trọng trong bất kỳ quy trình MLOps nào. Điều này đảm bảo rằng mỗi lần chạy huấn luyện đều được ghi lại với cấu hình cụ thể của nó, cho phép các nhóm tái tạo kết quả hoặc quay lại các phiên bản trước đó nếu cần.
Ví dụ sau đây minh họa cách huấn luyện mô hình YOLO26 — mô hình tiên tiến nhất hiện nay. Ultralytics Được khuyến nghị cho tất cả các dự án mới—đồng thời cho phép theo dõi dự án. Điều này tự nhiên tạo ra các thành phần cần thiết cho quy trình sản xuất.
from ultralytics import YOLO
# Load the YOLO26 model (recommended for superior speed and accuracy)
model = YOLO("yolo26n.pt")
# Train the model while specifying project and name for organized logging
# This creates a structured directory of artifacts (weights, charts, args)
# which is essential for reproducibility in MLOps pipelines.
results = model.train(data="coco8.yaml", epochs=10, project="mlops_experiments", name="run_v1")
Bằng cách tổ chức các đợt huấn luyện thành các dự án cụ thể, các nhóm có thể dễ dàng tích hợp các công cụ như MLflow hoặc TensorBoard để trực quan hóa các chỉ số hiệu suất theo thời gian. Khi các tổ chức mở rộng quy mô, họ thường chuyển các quy trình làm việc này sang Nền tảng Ultralytics , nền tảng này cung cấp giao diện thống nhất để quản lý tập dữ liệu, huấn luyện từ xa và triển khai mô hình ở nhiều định dạng khác nhau như TensorRT để tối ưu hóa tốc độ suy luận.
MLOps so với các khái niệm liên quan
Để triển khai các phương pháp này một cách hiệu quả, điều quan trọng là phải phân biệt MLOps với các thuật ngữ liên quan trong hệ sinh thái.
-
MLOps so với DevOps: DevOps tập trung vào việc phân phối liên tục các ứng dụng phần mềm. MLOps mở rộng các nguyên tắc này bằng cách thêm "Dữ liệu" và "Mô hình" như những yếu tố quan trọng hàng đầu. Trong DevOps, một thay đổi trong mã sẽ kích hoạt quá trình biên dịch; trong MLOps, một thay đổi trong phân phối dữ liệu hoặc sự giảm độ chính xác cũng có thể kích hoạt một lần thực thi pipeline mới.
-
MLOps so với Model Serving: Model serving đề cập cụ thể đến cơ sở hạ tầng được sử dụng để lưu trữ mô hình và xử lý các yêu cầu suy luận . MLOps là phạm trù rộng hơn bao gồm cả việc phục vụ, nhưng cũng bao gồm các giai đoạn đào tạo, quản trị và giám sát.
-
MLOps so với AutoML: Học máy tự động (AutoML) tập trung vào việc tự động hóa quy trình tạo mô hình (ví dụ: lựa chọn thuật toán). MLOps quản lý vòng đời của mô hình đó sau khi được tạo và vận hành quy trình chạy các công cụ AutoML.