Tìm hiểu cách xuất và triển khai các mô hình Ultralytics YOLO11 với tích hợp MNN để suy luận nhanh trên các nền tảng di động, nhúng và công suất thấp.

Tìm hiểu cách xuất và triển khai các mô hình Ultralytics YOLO11 với tích hợp MNN để suy luận nhanh trên các nền tảng di động, nhúng và công suất thấp.

Ngày nay, những đổi mới AI đã mở rộng ra ngoài môi trường máy chủ từ xa. Các giải pháp AI đang được tích hợp vào các thiết bị biên như cảm biến và điện thoại thông minh. Nhờ sự thay đổi công nghệ này, dữ liệu hiện có thể được xử lý trực tiếp tại nơi nó được tạo ra, cho phép phản hồi nhanh hơn, cải thiện quyền riêng tư và giảm sự phụ thuộc vào kết nối đám mây liên tục.
Do đó, AI biên đang ngày càng được ưa chuộng trong nhiều ngành công nghiệp. Thị trường phần mềm AI biên dự kiến sẽ đạt 8,88 tỷ đô la vào năm 2031 khi ngày càng có nhiều hệ thống chuyển sang xử lý nhanh hơn và cục bộ hơn.
Đặc biệt, thị giác máy tính, một nhánh của AI tập trung vào việc hiểu hình ảnh và video, đang được áp dụng nhanh chóng ở biên (edge). Từ việc đếm các mặt hàng thực phẩm khi chúng được đóng gói đến việc giúp xe cộ phát hiện người đi bộ, thị giác máy tính hỗ trợ vô số ứng dụng thực tế trong các lĩnh vực khác nhau.
Điều này có thể thực hiện được thông qua các mô hình thị giác máy tính. Ví dụ: Ultralytics YOLO11 là một mô hình hỗ trợ các tác vụ Vision AI khác nhau như phát hiện đối tượng, phân đoạn thể hiện, theo dõi đối tượng và ước tính tư thế. Nó được thiết kế để nhanh chóng và hiệu quả, đồng thời hoạt động tốt trên các thiết bị có tài nguyên phần cứng hạn chế.

Ngoài việc phù hợp để triển khai biên, thông qua các tích hợp khác nhau được hỗ trợ bởi Ultralytics, YOLO11 có thể được xuất sang nhiều định dạng khác nhau phù hợp với các môi trường phần cứng khác nhau.
Một trong những tùy chọn hiệu quả nhất là MNN (Mobile Neural Network), một công cụ suy luận nhẹ được thiết kế cho các thiết bị có tài nguyên thấp. Xuất YOLO11 sang MNN cho phép nó chạy trực tiếp trên điện thoại di động, hệ thống nhúng và các nền tảng biên khác, nơi xử lý nhanh trên thiết bị là rất cần thiết.
Trong bài viết này, chúng ta sẽ khám phá cách tích hợp MNN hoạt động, nêu bật các trường hợp sử dụng phổ biến và hướng dẫn cách bắt đầu chạy suy luận bằng mô hình YOLO11 đã xuất. Hãy cùng bắt đầu!
Việc chạy các mô hình thị giác máy tính trên các thiết bị nhỏ hơn như điện thoại di động, cảm biến công nghiệp và hệ thống di động không phải lúc nào cũng đơn giản. Các thiết bị này thường có bộ nhớ hạn chế, bộ xử lý chậm hơn và giới hạn năng lượng nghiêm ngặt.
Mạng nơ-ron di động (Mobile Neural Network) hay MNN, là một công cụ suy luận hiệu suất cao và nhẹ được phát triển bởi Alibaba để giúp các mô hình AI chạy hiệu quả trên phần cứng có tài nguyên thấp trong khi vẫn duy trì hiệu suất thời gian thực. MNN hỗ trợ nhiều nền tảng, bao gồm Android, iOS và Linux, đồng thời hoạt động trên nhiều loại phần cứng như bộ xử lý trung tâm (CPU) và bộ xử lý đồ họa (GPU).

Việc tích hợp MNN được hỗ trợ bởi Ultralytics giúp bạn có thể dễ dàng xuất các mô hình YOLO11 sang định dạng MNN. Nói một cách đơn giản, điều này có nghĩa là các mô hình có thể được chuyển đổi từ định dạng YOLO sang MNN.
Sau khi được chuyển đổi, chúng có thể được triển khai trên các thiết bị hỗ trợ framework MNN để suy luận hiệu quả trên thiết bị. Một lợi ích chính của việc sử dụng định dạng MNN là nó đơn giản hóa việc triển khai YOLO11 trong các tình huống mà kích thước, tốc độ và hiệu quả tài nguyên là rất quan trọng.
Trước khi chúng ta đi sâu vào cách sử dụng tích hợp MNN, hãy xem xét điều gì làm cho framework MNN trở thành một lựa chọn tuyệt vời để chạy các mô hình AI trên các thiết bị thực tế. Nó được xây dựng để xử lý các ràng buộc riêng của môi trường biên trong khi vẫn mang lại hiệu suất nhanh chóng và đáng tin cậy.
Điều thú vị là, MNN được sử dụng nội bộ tại Alibaba trong hơn 30 ứng dụng, bao gồm Taobao, Tmall, Youku, DingTalk và Xianyu, trên nhiều tình huống khác nhau như video trực tiếp, nội dung dạng ngắn, tìm kiếm hình ảnh và kiểm tra bảo mật trên thiết bị. Nó hỗ trợ triển khai quy mô lớn và chạy hàng triệu suy luận mỗi ngày trong môi trường sản xuất.
Dưới đây là một số tính năng chính của framework MNN:
Tiếp theo, hãy xem xét cách xuất các mô hình YOLO11 sang định dạng MNN.
Bước đầu tiên là cài đặt gói Ultralytics Python, cung cấp mọi thứ cần thiết để xuất các mô hình YOLO11 sang định dạng MNN. Bạn có thể thực hiện việc này bằng cách chạy "pip install ultralytics" trên terminal của bạn hoặc sử dụng dấu nhắc lệnh. Nếu bạn đang sử dụng Jupyter Notebook hoặc Google Colab, hãy thêm dấu chấm than trước lệnh.
Nếu bạn gặp bất kỳ sự cố nào trong quá trình cài đặt, hãy tham khảo hướng dẫn Các vấn đề thường gặp để biết các mẹo khắc phục sự cố.
Sau khi môi trường của bạn được thiết lập, bạn có thể tải mô hình YOLO11 được huấn luyện trước, chẳng hạn như "yolo11n.pt" và xuất nó sang định dạng MNN như được hiển thị trong đoạn mã bên dưới. Nếu bạn đã huấn luyện mô hình YOLO11 tùy chỉnh của riêng mình, bạn có thể xuất nó đơn giản bằng cách thay thế tên tệp bằng đường dẫn đến mô hình của bạn.
from ultralytics import YOLO
model = YOLO("yolo11n.pt")
model.export(format="mnn")Sau khi chuyển đổi mô hình của bạn sang MNN, bạn có thể sử dụng nó trên các nền tảng di động và nhúng khác nhau tùy thuộc vào nhu cầu ứng dụng của bạn.
Ví dụ: giả sử bạn muốn kiểm tra mô hình đã xuất trên một video về giao thông. Trong trường hợp đó, bạn có thể tải mô hình YOLO11 ở định dạng MNN để phát hiện các đối tượng như xe cộ, người đi bộ và biển báo giao thông trực tiếp trên thiết bị, như trong ví dụ bên dưới.
mnn_model = YOLO("yolo11n.mnn")
results = mnn_model("https://videos.pexels.com/video-files/27783817/12223745_1920_1080_24fps.mp4", save=True)Khi quá trình suy luận hoàn tất, video đầu ra với các đối tượng được phát hiện sẽ tự động được lưu trong thư mục 'runs\/detect\/predict'. Ngoài ra, nếu bạn muốn chạy suy luận bằng gói MNN Python trực tiếp, bạn có thể xem tài liệu Ultralytics chính thức để biết thêm chi tiết và ví dụ.

Việc triển khai YOLO11 với MNN cho phép thực hiện các tác vụ nhận diện đối tượng nhanh chóng, hiệu quả, chẳng hạn như trong các môi trường mà việc xử lý dựa trên đám mây không thực tế hoặc không khả thi. Hãy xem cách tích hợp này có thể đặc biệt hữu ích trong các tình huống thực tế.
Các ứng dụng xác định bệnh thực vật sử dụng phân loại hình ảnh đang ngày càng trở nên phổ biến đối với những người làm vườn, nhà nghiên cứu và những người đam mê thiên nhiên. Chỉ với một bức ảnh, người dùng có thể nhanh chóng xác định các dấu hiệu sớm của bệnh, chẳng hạn như đốm lá hoặc sự đổi màu. Vì các ứng dụng này thường được sử dụng ở các khu vực ngoài trời, nơi có thể bị hạn chế hoặc không có quyền truy cập internet, nên việc dựa vào xử lý đám mây có thể không đáng tin cậy.
Sau khi huấn luyện, mô hình YOLO11 có thể được xuất sang định dạng MNN và chạy trực tiếp trên thiết bị di động. Sau đó, mô hình có thể phân loại các loài thực vật và phát hiện các triệu chứng bệnh có thể nhìn thấy tại chỗ mà không cần gửi bất kỳ dữ liệu nào đến máy chủ.

Theo dõi kiện hàng chính xác là điều cần thiết trên các dây chuyền sản xuất bận rộn trong các cơ sở sản xuất. YOLO có thể được sử dụng để theo dõi và đếm từng mặt hàng khi nó di chuyển qua các trạm kiểm soát chính, cập nhật số lượng theo thời gian thực và gắn cờ mọi sự khác biệt. Điều này giúp giảm các lô hàng bị thiếu hoặc không được tính đến và hỗ trợ các hoạt động trơn tru và đáng tin cậy hơn.

Việc tích hợp MNN có thể đặc biệt có tác động trong bối cảnh này. Sau khi mô hình YOLO11 được xuất sang định dạng MNN, nó có thể chạy trực tiếp trên các thiết bị nhỏ gọn, công suất thấp được lắp đặt dọc theo băng tải.
Vì tất cả quá trình xử lý diễn ra cục bộ, hệ thống có thể cung cấp phản hồi tức thì và không yêu cầu kết nối internet. Điều này đảm bảo hiệu suất nhanh chóng, đáng tin cậy trên sàn nhà máy, giúp sản xuất diễn ra hiệu quả đồng thời duy trì độ chính xác và khả năng kiểm soát cao.
Dưới đây là một số lợi ích chính của việc tích hợp MNN do Ultralytics cung cấp:
Trước khi chọn MNN làm framework triển khai, điều quan trọng nữa là phải đánh giá mức độ phù hợp của nó với các yêu cầu của dự án, mục tiêu triển khai và các giới hạn kỹ thuật của bạn. Dưới đây là một số yếu tố chính cần xem xét:
Hỗ trợ của Ultralytics cho tích hợp MNN giúp dễ dàng xuất các mô hình YOLO11 để sử dụng trên các thiết bị di động và nhúng. Đây là một lựa chọn thiết thực cho các ứng dụng yêu cầu phát hiện nhanh chóng, đáng tin cậy mà không phụ thuộc vào truy cập đám mây hoặc kết nối liên tục.
Thiết lập này giúp đơn giản hóa việc triển khai đồng thời duy trì hiệu suất và giữ cho nhu cầu tài nguyên ở mức thấp. Cho dù bạn đang xây dựng hệ thống nhà thông minh, công cụ hiện trường hay các thiết bị công nghiệp nhỏ gọn, việc xuất YOLO11 sang MNN cung cấp một cách linh hoạt và hiệu quả để chạy các tác vụ thị giác máy tính trực tiếp trên các thiết bị edge.
Tham gia cộng đồng đang phát triển của chúng tôi! Khám phá kho lưu trữ GitHub của chúng tôi để tìm hiểu sâu hơn về AI. Bạn đã sẵn sàng bắt đầu các dự án thị giác máy tính của mình chưa? Hãy xem các tùy chọn cấp phép của chúng tôi. Khám phá thêm về AI trong lĩnh vực chăm sóc sức khỏe và thị giác máy tính trong bán lẻ trên các trang giải pháp của chúng tôi!