Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Triển khai mô hình

Tìm hiểu cách triển khai các mô hình học máy lên môi trường đám mây hoặc biên. Khám phá cách thức... Ultralytics Nền tảng này giúp tối ưu hóa quy trình xuất khẩu và sản xuất cho YOLO26.

Triển khai mô hình là giai đoạn quan trọng, nơi một mô hình học máy đã được huấn luyện được tích hợp vào môi trường sản xuất để đưa ra các quyết định hoặc dự đoán thực tế dựa trên dữ liệu mới. Nó thể hiện sự chuyển đổi từ môi trường nghiên cứu hoặc thử nghiệm—thường được thực hiện trong các sổ tay riêng biệt—sang một ứng dụng thực tế, nơi mô hình tương tác với người dùng và hệ thống trong thế giới thực. Quá trình này biến một tệp tĩnh chứa các trọng số và kiến ​​trúc thành một tác nhân AI hoạt động có khả năng tạo ra giá trị, chẳng hạn như nhận dạng đối tượng trong nguồn cấp dữ liệu video hoặc đề xuất sản phẩm trên một trang web.

Việc triển khai hiệu quả đòi hỏi phải giải quyết những thách thức khác biệt so với việc huấn luyện mô hình , bao gồm độ trễ, khả năng mở rộng và khả năng tương thích phần cứng. Các tổ chức thường sử dụng Nền tảng Ultralytics để tối ưu hóa vòng đời này, đảm bảo rằng các mô hình được huấn luyện trên đám mây có thể được triển khai liền mạch đến nhiều môi trường khác nhau, từ các máy chủ mạnh mẽ đến các thiết bị biên có tài nguyên hạn chế.

Bức tranh tổng quan về triển khai

Các chiến lược triển khai thường được chia thành hai loại: triển khai trên đám mây và triển khai ở biên mạng. Việc lựa chọn phụ thuộc rất nhiều vào các yêu cầu cụ thể về tốc độ, quyền riêng tư và khả năng kết nối.

  • Triển khai trên đám mây: Mô hình được lưu trữ trên các máy chủ tập trung, thường được quản lý bởi các dịch vụ như AWS SageMaker hoặc Google Vertex AI . Các ứng dụng gửi dữ liệu qua internet đến mô hình thông qua REST API , API này sẽ xử lý yêu cầu và trả về kết quả. Phương pháp này cung cấp sức mạnh tính toán gần như không giới hạn, lý tưởng cho các mô hình lớn và phức tạp, nhưng lại phụ thuộc vào kết nối internet ổn định.
  • Triển khai tại biên: Mô hình chạy cục bộ trên thiết bị nơi dữ liệu được tạo ra, chẳng hạn như điện thoại thông minh, máy bay không người lái hoặc camera nhà máy. Cách tiếp cận này, được gọi là điện toán biên , giảm thiểu độ trễ và tăng cường quyền riêng tư dữ liệu vì thông tin không rời khỏi thiết bị. Các công cụ như TensorRT thường được sử dụng để tối ưu hóa mô hình cho các môi trường này.

Chuẩn bị mô hình để sản xuất

Trước khi một mô hình có thể được triển khai, nó thường trải qua quá trình tối ưu hóa để đảm bảo hoạt động hiệu quả trên phần cứng mục tiêu. Quá trình này bao gồm việc xuất mô hình , trong đó định dạng huấn luyện (như...) PyTorch ) được chuyển đổi thành định dạng thân thiện với việc triển khai, chẳng hạn như ONNX (Open Neural Network Exchange) hoặc OpenVINO .

Các kỹ thuật tối ưu hóa như lượng tử hóa giúp giảm kích thước và dung lượng bộ nhớ của mô hình mà không làm giảm đáng kể độ chính xác. Để đảm bảo tính nhất quán trên các môi trường tính toán khác nhau, các nhà phát triển thường sử dụng các công cụ đóng gói như Docker, giúp đóng gói mô hình cùng với tất cả các phần mềm phụ thuộc cần thiết.

Dưới đây là ví dụ về cách xuất mô hình YOLO26 sang định dạng khác. ONNX Định dạng, một bước phổ biến trong quá trình chuẩn bị triển khai:

from ultralytics import YOLO

# Load the YOLO26 nano model
model = YOLO("yolo26n.pt")

# Export the model to ONNX format for broad compatibility
# This creates a file suitable for various inference engines
path = model.export(format="onnx")

print(f"Model successfully exported to: {path}")

Các Ứng dụng Thực tế

Việc triển khai mô hình cung cấp sức mạnh cho các hệ thống thị giác máy tính được sử dụng rộng rãi trong nhiều ngành công nghiệp khác nhau.

  • Kiểm soát chất lượng sản xuất: Trong sản xuất thông minh , các mô hình được triển khai giám sát băng chuyền theo thời gian thực. Hệ thống camera chạy mô hình được tối ưu hóa cho thiết bị NVIDIA Jetson có thể ngay lập tức... detect Các lỗi trong sản phẩm, kích hoạt cánh tay robot để loại bỏ các mặt hàng bị lỗi. Điều này đòi hỏi độ trễ cực thấp mà chỉ có triển khai AI tại biên mới có thể cung cấp.
  • Phân tích bán lẻ: Các cửa hàng sử dụng các mô hình được triển khai để phân tích lưu lượng khách hàng và hành vi của họ. Bằng cách tích hợp các mô hình theo dõi đối tượng vào nguồn cấp dữ liệu camera an ninh, các nhà bán lẻ có thể tạo ra bản đồ nhiệt về các lối đi phổ biến. Những hiểu biết này giúp tối ưu hóa bố cục cửa hàng và cải thiện quản lý hàng tồn kho , thường sử dụng triển khai dựa trên điện toán đám mây để tổng hợp dữ liệu từ nhiều địa điểm.

Triển khai so với Suy luận so với Huấn luyện

Điều quan trọng là phải phân biệt Triển khai Mô hình với các thuật ngữ liên quan trong vòng đời học máy:

  • Huấn luyện mô hình là giai đoạn giáo dục trong đó thuật toán học các mẫu từ một tập dữ liệu.
  • Triển khai mô hình là giai đoạn tích hợp, trong đó mô hình đã được huấn luyện được cài đặt vào cơ sở hạ tầng sản xuất (máy chủ, ứng dụng hoặc thiết bị).
  • Suy luận là giai đoạn vận hành—hành động thực tế của mô hình đã triển khai xử lý dữ liệu trực tiếp để đưa ra dự đoán. Ví dụ, công cụ suy luận thực hiện các phép tính được định nghĩa bởi mô hình đã triển khai.

Giám sát và bảo trì

Việc triển khai không phải là điểm kết thúc. Sau khi đi vào hoạt động, các mô hình cần được giám sát liên tục để duy trì hoạt động. detect Các vấn đề như sự thay đổi dữ liệu , trong đó dữ liệu thực tế bắt đầu khác biệt so với dữ liệu huấn luyện. Các công cụ như Prometheus hoặc Grafana thường được tích hợp để giải quyết vấn đề này. track Các chỉ số hiệu suất đảm bảo hệ thống duy trì độ tin cậy theo thời gian. Khi hiệu suất giảm, mô hình có thể cần được huấn luyện lại và triển khai lại, hoàn thành chu trình MLOps .

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay