Triển khai Ultralytics YOLO11 với tích hợp MNN

Ngày nay, những đổi mới AI đã mở rộng ra ngoài môi trường máy chủ từ xa. Các giải pháp AI đang được tích hợp vào các thiết bị biên như cảm biến và điện thoại thông minh. Nhờ sự thay đổi công nghệ này, dữ liệu hiện có thể được xử lý trực tiếp tại nơi nó được tạo ra, cho phép phản hồi nhanh hơn, cải thiện quyền riêng tư và giảm sự phụ thuộc vào kết nối đám mây liên tục.

Do đó, AI biên đang ngày càng được ưa chuộng trong nhiều ngành công nghiệp. Thị trường phần mềm AI biên dự kiến sẽ đạt 8,88 tỷ đô la vào năm 2031 khi ngày càng có nhiều hệ thống chuyển sang xử lý nhanh hơn và cục bộ hơn.

Đặc biệt, thị giác máy tính , một nhánh của AI tập trung vào việc hiểu hình ảnh và video, đang được ứng dụng nhanh chóng tại các khu vực biên giới. Từ việc đếm thực phẩm khi chúng được đóng gói đến hỗ trợ xe cộ detect Đối với người đi bộ, công nghệ thị giác máy tính hỗ trợ vô số ứng dụng thực tế trong nhiều lĩnh vực khác nhau.

Điều này có thể thực hiện được nhờ các mô hình thị giác máy tính. Ví dụ, Ultralytics YOLO11 là một mô hình hỗ trợ nhiều tác vụ AI thị giác khác nhau như phát hiện đối tượng, phân đoạn đối tượng, theo dõi đối tượng và ước tính tư thế. Mô hình này được thiết kế để hoạt động nhanh chóng, hiệu quả và hoạt động tốt trên các thiết bị có tài nguyên phần cứng hạn chế.

Hình 1. Phát hiện và theo dõi thực phẩm được đóng gói bằng YOLO11 ( Nguồn ).

‍

Ngoài việc phù hợp để triển khai biên, thông qua nhiều tích hợp được hỗ trợ bởi Ultralytics , YOLO11 có thể xuất sang nhiều định dạng khác nhau phù hợp với nhiều môi trường phần cứng khác nhau.

Một trong những lựa chọn hiệu quả nhất là MNN (Mạng nơ-ron di động), một công cụ suy luận nhẹ được thiết kế cho các thiết bị có ít tài nguyên. Xuất YOLO11 MNN cho phép nó chạy trực tiếp trên điện thoại di động, hệ thống nhúng và các nền tảng biên khác, nơi mà việc xử lý nhanh trên thiết bị là điều cần thiết.

Trong bài viết này, chúng ta sẽ khám phá cách tích hợp MNN hoạt động, nêu bật các trường hợp sử dụng phổ biến và hướng dẫn cách bắt đầu chạy suy luận bằng cách sử dụng tệp đã xuất. YOLO11 mô hình. Hãy bắt đầu thôi!

Tổng quan về MNN: Một framework học sâu

Việc chạy các mô hình thị giác máy tính trên các thiết bị nhỏ hơn như điện thoại di động, cảm biến công nghiệp và hệ thống di động không phải lúc nào cũng đơn giản. Các thiết bị này thường có bộ nhớ hạn chế, bộ xử lý chậm hơn và giới hạn năng lượng nghiêm ngặt.

Mạng nơ-ron di động, hay MNN, là một công cụ suy luận nhẹ và hiệu suất cao được Alibaba phát triển để giúp các mô hình AI chạy hiệu quả trên phần cứng ít tài nguyên nhưng vẫn duy trì hiệu suất thời gian thực. MNN hỗ trợ nhiều nền tảng, bao gồm Android , iOS và Linux, hoạt động trên nhiều loại phần cứng như bộ xử lý trung tâm (CPU) và bộ xử lý đồ họa (GPU).

Hình 2. Cái nhìn về framework MNN (Nguồn).

‍

Sự tích hợp MNN được hỗ trợ bởi Ultralytics làm cho nó có thể xuất khẩu YOLO11 mô hình dễ dàng sang định dạng MNN. Nói một cách đơn giản, điều này có nghĩa là các mô hình có thể được chuyển đổi từ YOLO định dạng thành MNN.

Sau khi được chuyển đổi, chúng có thể được triển khai trên các thiết bị hỗ trợ khung MNN để suy luận hiệu quả trên thiết bị. Một lợi ích chính của việc sử dụng định dạng MNN là nó đơn giản hóa việc triển khai. YOLO11 trong những tình huống mà kích thước, tốc độ và hiệu quả tài nguyên là rất quan trọng.

Các tính năng chính của backend suy luận MNN

Trước khi chúng ta đi sâu vào cách sử dụng tích hợp MNN, hãy xem xét điều gì làm cho framework MNN trở thành một lựa chọn tuyệt vời để chạy các mô hình AI trên các thiết bị thực tế. Nó được xây dựng để xử lý các ràng buộc riêng của môi trường biên trong khi vẫn mang lại hiệu suất nhanh chóng và đáng tin cậy.

Điều thú vị là, MNN được sử dụng nội bộ tại Alibaba trong hơn 30 ứng dụng, bao gồm Taobao, Tmall, Youku, DingTalk và Xianyu, trên nhiều tình huống khác nhau như video trực tiếp, nội dung dạng ngắn, tìm kiếm hình ảnh và kiểm tra bảo mật trên thiết bị. Nó hỗ trợ triển khai quy mô lớn và chạy hàng triệu suy luận mỗi ngày trong môi trường sản xuất.

Dưới đây là một số tính năng chính của framework MNN:

Tự động lựa chọn phần cuối: MNN có thể tự động lựa chọn phần cuối thực thi phù hợp nhất, chẳng hạn như CPU hoặc GPU , dựa trên phần cứng mà nó đang chạy.
‍
Thực thi đa luồng: Nó hỗ trợ đa luồng, cho phép nó tận dụng tối đa bộ xử lý đa lõi để suy luận nhanh hơn.
‍
Hỗ trợ lượng tử hóa mô hình: Cho phép bạn giảm đáng kể kích thước mô hình bằng cách sử dụng lượng tử hóa FP16 hoặc INT8, giúp cải thiện tốc độ suy luận đồng thời sử dụng ít bộ nhớ hơn.
‍
Nhẹ và nhanh: MNN có kích thước rất nhỏ, với thư viện lõi khoảng 400 KB Android và khoảng 5 MB trên iOS , khiến nó trở nên lý tưởng cho các thiết bị di động và nhúng.

Tìm hiểu cách tích hợp MNN hoạt động

Tiếp theo, chúng ta hãy cùng tìm hiểu cách xuất YOLO11 mô hình theo định dạng MNN.

Bước đầu tiên là cài đặt gói Ultralytics Python , gói này cung cấp mọi thứ cần thiết để xuất YOLO11 mô hình sang định dạng MNN. Bạn có thể thực hiện việc này bằng cách chạy lệnh "pip install ultralytics " trên thiết bị đầu cuối của bạn hoặc sử dụng dấu nhắc lệnh. Nếu bạn đang sử dụng Jupyter Notebook hoặc Google Colab, hãy thêm dấu chấm than trước lệnh.

Nếu bạn gặp bất kỳ sự cố nào trong quá trình cài đặt, hãy tham khảo hướng dẫn Các vấn đề thường gặp để biết các mẹo khắc phục sự cố.

Sau khi môi trường của bạn được thiết lập, bạn có thể tải một YOLO11 chẳng hạn như "yolo11n.pt" và xuất nó sang định dạng MNN như được hiển thị trong đoạn mã bên dưới. Nếu bạn đã đào tạo mô hình tùy chỉnh của riêng mình YOLO11 mô hình, bạn có thể xuất nó chỉ bằng cách thay thế tên tệp bằng đường dẫn mô hình của bạn.

from ultralytics import YOLO
model = YOLO("yolo11n.pt")
model.export(format="mnn")

Sau khi chuyển đổi mô hình của bạn sang MNN, bạn có thể sử dụng nó trên các nền tảng di động và nhúng khác nhau tùy thuộc vào nhu cầu ứng dụng của bạn.

Ví dụ, giả sử bạn muốn kiểm tra mô hình đã xuất trên video giao thông. Trong trường hợp đó, bạn có thể tải YOLO11 mô hình ở định dạng MNN để detect các đối tượng như xe cộ, người đi bộ và biển báo giao thông trực tiếp trên thiết bị, như thể hiện trong ví dụ bên dưới.

mnn_model = YOLO("yolo11n.mnn")
results = mnn_model("https://videos.pexels.com/video-files/27783817/12223745_1920_1080_24fps.mp4", save=True)

Khi quá trình suy luận hoàn tất, video đầu ra với các đối tượng được phát hiện sẽ tự động được lưu trong 'chạy/ detect Thư mục /predict'. Ngoài ra, nếu bạn muốn chạy suy luận bằng MNN Python gói trực tiếp, bạn có thể kiểm tra tài liệu chính thức Ultralytics để biết thêm chi tiết và ví dụ.

Hình 3. Phân tích lưu lượng truy cập bằng cách sử dụng YOLO11 mô hình được xuất sang định dạng MNN. Hình ảnh của tác giả.

‍

Các trường hợp sử dụng triển khai mô hình AI biên được kích hoạt bởi YOLO11 và MNN

Triển khai YOLO11 Với MNN, các tác vụ thị giác máy tính như phát hiện đối tượng được thực hiện nhanh chóng và hiệu quả trong môi trường mà việc xử lý dựa trên đám mây không khả thi hoặc không thực tế. Hãy cùng xem sự tích hợp này có thể đặc biệt hữu ích như thế nào trong các tình huống thực tế.

AI biên di động để xác định bệnh thực vật

Các ứng dụng xác định bệnh thực vật sử dụng phân loại hình ảnh đang ngày càng trở nên phổ biến đối với những người làm vườn, nhà nghiên cứu và những người đam mê thiên nhiên. Chỉ với một bức ảnh, người dùng có thể nhanh chóng xác định các dấu hiệu sớm của bệnh, chẳng hạn như đốm lá hoặc sự đổi màu. Vì các ứng dụng này thường được sử dụng ở các khu vực ngoài trời, nơi có thể bị hạn chế hoặc không có quyền truy cập internet, nên việc dựa vào xử lý đám mây có thể không đáng tin cậy.

Sau khi đào tạo, một YOLO11 Mô hình có thể được xuất sang định dạng MNN và chạy trực tiếp trên thiết bị di động. Sau đó, mô hình có thể classify các loài thực vật và detect các triệu chứng bệnh có thể nhìn thấy tại chỗ mà không cần gửi bất kỳ dữ liệu nào đến máy chủ.

Hình 4. Một ví dụ về việc sử dụng YOLO11 ĐẾN detect dấu hiệu của bệnh gỉ sắt (một loại bệnh thực vật) trên lá ( Nguồn ).

‍

Suy luận trên thiết bị (on-device inferences) hiệu quả trong sản xuất

Việc theo dõi chính xác bao bì là điều cần thiết trên các dây chuyền sản xuất bận rộn trong các cơ sở sản xuất . YOLO11 có thể được sử dụng để track và đếm từng mặt hàng khi chúng di chuyển qua các trạm kiểm soát chính, cập nhật số lượng theo thời gian thực và đánh dấu bất kỳ sai lệch nào. Điều này giúp giảm thiểu tình trạng hàng hóa bị thất lạc hoặc không được kiểm kê, đồng thời hỗ trợ hoạt động trơn tru và đáng tin cậy hơn.

Hình 5. Theo dõi và đếm các gói hàng bằng cách sử dụng YOLO11 ( Nguồn ).

‍

Sự tích hợp MNN có thể đặc biệt có tác động trong bối cảnh này. Một khi YOLO11 mô hình được xuất sang định dạng MNN, có thể chạy trực tiếp trên các thiết bị nhỏ gọn, công suất thấp được lắp dọc theo băng tải.

Vì tất cả quá trình xử lý diễn ra cục bộ, hệ thống có thể cung cấp phản hồi tức thì và không yêu cầu kết nối internet. Điều này đảm bảo hiệu suất nhanh chóng, đáng tin cậy trên sàn nhà máy, giúp sản xuất diễn ra hiệu quả đồng thời duy trì độ chính xác và khả năng kiểm soát cao.

Lợi thế của việc xuất khẩu YOLO11 theo định dạng mô hình MNN

Dưới đây là một số lợi ích chính của tích hợp MNN được cung cấp bởi Ultralytics :

Thời gian phản hồi nhanh hơn: Vì quá trình suy luận (inference) chạy trên thiết bị, các dự đoán diễn ra trong thời gian thực với độ trễ tối thiểu.
‍
Cải thiện quyền riêng tư dữ liệu (data privacy): Dữ liệu ở lại trên thiết bị, giảm nhu cầu gửi hình ảnh hoặc video nhạy cảm lên đám mây.
‍
Mã nguồn mở và được duy trì tích cực: Được hỗ trợ bởi Alibaba và một cộng đồng năng động, MNN rất đáng tin cậy và thường xuyên được cập nhật để cải thiện hiệu suất.

Các yếu tố cần xem xét khi sử dụng framework MNN

Trước khi chọn MNN làm framework triển khai, điều quan trọng nữa là phải đánh giá mức độ phù hợp của nó với các yêu cầu của dự án, mục tiêu triển khai và các giới hạn kỹ thuật của bạn. Dưới đây là một số yếu tố chính cần xem xét:

Khả năng tương thích liên tục: Việc cập nhật khung hoặc thay đổi đối với các nền tảng mục tiêu của bạn có thể yêu cầu kiểm tra lại hoặc điều chỉnh để mọi thứ hoạt động trơn tru.
‍
Ít công cụ gỡ lỗi hơn: So với các framework lớn hơn, MNN có ít công cụ hơn để gỡ lỗi và kiểm tra hành vi của mô hình, điều này có thể gây khó khăn hơn cho việc khắc phục sự cố.
‍
Hiệu suất phụ thuộc vào phần cứng: Tốc độ và hiệu quả của mô hình của bạn sẽ khác nhau tùy thuộc vào thiết bị. Kiểm tra phần cứng mục tiêu của bạn để đảm bảo nó đáp ứng các mục tiêu hiệu suất của bạn.

Những điều cần nhớ

Ultralytics ' hỗ trợ tích hợp MNN giúp dễ dàng xuất khẩu YOLO11 Các mô hình sử dụng trên thiết bị di động và thiết bị nhúng. Đây là lựa chọn thiết thực cho các ứng dụng yêu cầu phát hiện nhanh chóng, đáng tin cậy mà không phụ thuộc vào quyền truy cập đám mây hoặc kết nối liên tục.

Thiết lập này giúp đơn giản hóa việc triển khai, đồng thời duy trì hiệu suất và giảm thiểu nhu cầu tài nguyên. Cho dù bạn đang xây dựng hệ thống nhà thông minh, công cụ hiện trường hay thiết bị công nghiệp nhỏ gọn, việc xuất YOLO11 MNN cung cấp một cách linh hoạt và hiệu quả để chạy các tác vụ thị giác máy tính trực tiếp trên các thiết bị biên.

Tham gia cộng đồng đang phát triển của chúng tôi! Khám phá kho lưu trữ GitHub của chúng tôi để tìm hiểu sâu hơn về AI. Bạn đã sẵn sàng bắt đầu các dự án thị giác máy tính của mình chưa? Hãy xem các tùy chọn cấp phép của chúng tôi. Khám phá thêm về AI trong lĩnh vực chăm sóc sức khỏe và thị giác máy tính trong bán lẻ trên các trang giải pháp của chúng tôi!

Triển khai liền mạch Ultralytics YOLO11 sử dụng tích hợp MNN

Tổng quan về MNN: Một framework học sâu

Các tính năng chính của backend suy luận MNN

Tìm hiểu cách tích hợp MNN hoạt động

Các trường hợp sử dụng triển khai mô hình AI biên được kích hoạt bởi YOLO11 và MNN

AI biên di động để xác định bệnh thực vật

Suy luận trên thiết bị (on-device inferences) hiệu quả trong sản xuất

Lợi thế của việc xuất khẩu YOLO11 theo định dạng mô hình MNN

Các yếu tố cần xem xét khi sử dụng framework MNN

Những điều cần nhớ

Đọc thêm trong danh mục này

Triển khai Ultralytics YOLO các mô hình sử dụng tích hợp ExecuTorch

Hướng dẫn về kiến trúc U-Net và các ứng dụng của nó

Các mô hình OCR mã nguồn mở phổ biến và cách chúng hoạt động

Hãy cùng nhau xây dựng tương lai
của AI!

Triển khai liền mạch Ultralytics YOLO11 sử dụng tích hợp MNN

Tổng quan về MNN: Một framework học sâu

Các tính năng chính của backend suy luận MNN

Tìm hiểu cách tích hợp MNN hoạt động

Các trường hợp sử dụng triển khai mô hình AI biên được kích hoạt bởi YOLO11 và MNN

AI biên di động để xác định bệnh thực vật

Suy luận trên thiết bị (on-device inferences) hiệu quả trong sản xuất

Lợi thế của việc xuất khẩu YOLO11 theo định dạng mô hình MNN

Các yếu tố cần xem xét khi sử dụng framework MNN

Những điều cần nhớ

Đọc thêm trong danh mục này

Triển khai Ultralytics YOLO các mô hình sử dụng tích hợp ExecuTorch

Hướng dẫn về kiến trúc U-Net và các ứng dụng của nó

Các mô hình OCR mã nguồn mở phổ biến và cách chúng hoạt động

Hãy cùng nhau xây dựng tương lai của AI!

Hãy cùng nhau xây dựng tương lai
của AI!