Thuật ngữ

Hoạt động học máy (MLOps)

Khám phá sức mạnh của MLOps: hợp lý hóa việc triển khai mô hình ML, tự động hóa quy trình làm việc, đảm bảo độ tin cậy và mở rộng quy mô thành công của AI một cách hiệu quả.

Machine Learning Operations (MLOps) là một tập hợp các hoạt động nhằm triển khai và duy trì các mô hình Machine Learning (ML) trong sản xuất một cách đáng tin cậy và hiệu quả. Lấy cảm hứng từ các nguyên tắc DevOps , MLOps thu hẹp khoảng cách giữa phát triển mô hình (Nhà khoa học dữ liệu, Kỹ sư ML) và hoạt động CNTT (Kỹ sư Ops), hợp lý hóa toàn bộ vòng đời ML từ thu thập dữ liệu đến triển khai và giám sát mô hình. Mục tiêu là tự động hóa và chuẩn hóa các quy trình, cho phép thử nghiệm nhanh hơn, triển khai đáng tin cậy hơn và cải tiến liên tục các hệ thống ML trong môi trường sản xuất.

Nguyên tắc cốt lõi của MLOps

MLOps được xây dựng dựa trên một số nguyên tắc chính được thiết kế để quản lý sự phức tạp đặc biệt của hệ thống ML:

Tự động hóa: Tự động hóa các tác vụ lặp đi lặp lại như chuẩn bị dữ liệu, đào tạo mô hình , xác thực và triển khai bằng cách sử dụng các quy trình Tích hợp liên tục/Triển khai liên tục (CI/CD) được điều chỉnh cho ML.
Hợp tác: Thúc đẩy giao tiếp và hợp tác giữa các nhóm khoa học dữ liệu, kỹ thuật phần mềm và vận hành trong suốt vòng đời ML.
Phiên bản: Triển khai kiểm soát phiên bản cho dữ liệu, mã và mô hình để đảm bảo khả năng tái tạo và truy xuất nguồn gốc. Các công cụ như DVC thường được sử dụng cùng với Git.
Giám sát mô hình : Liên tục theo dõi hiệu suất mô hình, chất lượng dữ liệu và tình trạng hoạt động trong quá trình sản xuất để phát hiện các vấn đề như dữ liệu trôi dạt hoặc hiệu suất giảm sút.
Quản trị và tuân thủ: Đảm bảo các mô hình đáp ứng các yêu cầu theo quy định, hướng dẫn đạo đức ( Đạo đức AI ) và chính sách của tổ chức liên quan đến quyền riêng tư và bảo mật dữ liệu .

Vòng đời MLOps

Vòng đời MLOps bao gồm toàn bộ hành trình của mô hình ML:

Quản lý dữ liệu: Thu thập, xác thực, làm sạch ( Làm sạch dữ liệu ) và quản lý phiên bản tập dữ liệu ( Gắn nhãn dữ liệu và hướng dẫn chuẩn bị có thể tìm thấy trong Tài liệu Ultralytics ).
Phát triển mô hình: Thử nghiệm các thuật toán, kỹ thuật tính năng và kiến trúc khác nhau, thường sử dụng các nền tảng như PyTorch hoặc TensorFlow .
Đào tạo mô hình: Đào tạo mô hình ở quy mô lớn, có khả năng sử dụng đào tạo phân tán và quản lý các thử nghiệm bằng các công cụ như Weights & Biases hoặc MLflow . Điều chỉnh siêu tham số thường được tự động hóa.
Xác thực mô hình: Đánh giá hiệu suất của mô hình bằng các số liệu như độ chính xác hoặc mAP trên dữ liệu xác thực .
Triển khai mô hình : Đóng gói ( Đóng gói bằng Docker ) và triển khai mô hình vào môi trường sản xuất, có thể sử dụng các nền tảng phối hợp như Kubernetes .
Giám sát và đào tạo lại mô hình: Theo dõi hiệu suất trực tiếp, phát hiện sự trôi dạt hoặc suy giảm và kích hoạt các đường ống đào tạo lại khi cần thiết. Khả năng quan sát đóng vai trò quan trọng ở đây.

MLOps so với các khái niệm liên quan

MLOps so với AutoML: Trong khi MLOps bao gồm toàn bộ quản lý vòng đời đầu cuối, Automated Machine Learning (AutoML) tập trung cụ thể vào việc tự động hóa các bước xây dựng mô hình (chuẩn bị dữ liệu, thiết kế tính năng, lựa chọn mô hình, điều chỉnh siêu tham số). Các công cụ AutoML có thể là một thành phần trong quy trình làm việc MLOps.
MLOps so với khả năng quan sát: Khả năng quan sát là một khả năng quan trọng trong chiến lược MLOps. Nó cung cấp các công cụ và thực hành (ghi nhật ký, số liệu, theo dõi) cần thiết để hiểu trạng thái và hành vi nội bộ của các hệ thống ML được triển khai, cho phép giám sát và khắc phục sự cố hiệu quả.

Ứng dụng trong thế giới thực

Thực hành MLOps rất cần thiết để quản lý các hệ thống ML phức tạp trong sản xuất:

Hệ thống đề xuất: Các công ty như Netflix hoặc Spotify sử dụng MLOps để liên tục đào tạo lại các mô hình đề xuất dựa trên dữ liệu tương tác người dùng mới, thử nghiệm A/B các phiên bản mô hình khác nhau, theo dõi số liệu tương tác và nhanh chóng khôi phục các mô hình kém hiệu quả. Điều này đảm bảo các đề xuất vẫn phù hợp và được cá nhân hóa.
Phát hiện gian lận: Các tổ chức tài chính triển khai các đường ống MLOps để quản lý các mô hình phát hiện gian lận. Điều này bao gồm việc giám sát dữ liệu giao dịch để phát hiện sự trôi dạt, tự động đào tạo lại các mô hình với các mẫu gian lận mới, đảm bảo độ trễ suy luận thấp để phát hiện theo thời gian thực và duy trì các dấu vết kiểm toán để tuân thủ quy định. Các mô hình YOLO Ultralytics , khi được sử dụng trong các hệ thống kiểm tra trực quan có thể đưa vào phát hiện gian lận, cũng được hưởng lợi từ MLOps để triển khai và giám sát.

Công cụ và Nền tảng

Nhiều công cụ hỗ trợ các giai đoạn khác nhau của vòng đời MLOps:

Theo dõi thử nghiệm và quản lý phiên bản: MLflow , Weights & Biases , DVC , ClearML .
Điều phối quy trình làm việc: Kubeflow Pipelines , Apache Airflow .
Mô hình phục vụ: KFServing , BentoML , NVIDIA Triton Inference Server .
Giám sát: Grafana , Prometheus , WhyLabs .
Nền tảng đầu cuối: Amazon SageMaker , Google Cloud AI Platform , Microsoft Azure Machine Learning , Ultralytics HUB .

Việc triển khai các nguyên tắc MLOps giúp các tổ chức xây dựng, triển khai và quản lý các hệ thống AI hiệu quả hơn, thu hẹp khoảng cách giữa nghiên cứu thử nghiệm và các ứng dụng sản xuất đáng tin cậy.

Hoạt động học máy (MLOps)

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Giải pháp cấp phép doanh nghiệp linh hoạt để thúc đẩy sự đổi mới của bạn

Đào tạo các mô hình AI trong vài giây với Ultralytics YOLO

Xe lửa YOLO mô hình đơn giản với Ultralytics TRUNG TÂM

Nguyên tắc cốt lõi của MLOps

Vòng đời MLOps

MLOps so với các khái niệm liên quan

Ứng dụng trong thế giới thực

Công cụ và Nền tảng

Đọc thêm blog

Tham gia Ultralytics cộng đồng