Bằng cách nhấp vào “Chấp nhận tất cả cookie”, bạn đồng ý lưu trữ cookie trên thiết bị của mình để cải thiện khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thông tin thêm
Cài đặt Cookie
Bằng cách nhấp vào “Chấp nhận tất cả cookie”, bạn đồng ý lưu trữ cookie trên thiết bị của mình để cải thiện khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thông tin thêm
Ngày nay, các cải tiến AI đã mở rộng ra ngoài môi trường máy chủ từ xa. Các giải pháp AI đang được tích hợp vào các thiết bị biên như cảm biến và điện thoại thông minh. Nhờ sự thay đổi công nghệ này, dữ liệu hiện có thể được xử lý trực tiếp tại nơi dữ liệu được tạo ra, cho phép phản hồi nhanh hơn, cải thiện quyền riêng tư và giảm sự phụ thuộc vào kết nối đám mây liên tục.
Do đó, AI biên đang thu hút sự chú ý trong nhiều ngành công nghiệp. Thị trường phần mềm AI biên dự kiến sẽ đạt 8,88 tỷ đô la vào năm 2031 khi nhiều hệ thống chuyển sang xử lý nhanh hơn và cục bộ hơn.
Đặc biệt, thị giác máy tính , một nhánh của AI tập trung vào việc hiểu hình ảnh và video, đang được áp dụng nhanh chóng ở biên. Từ việc đếm các mặt hàng thực phẩm khi chúng được đóng gói đến việc giúp xe phát hiện người đi bộ, thị giác máy tính hỗ trợ vô số ứng dụng thực tế trong nhiều lĩnh vực khác nhau.
Điều này có thể thực hiện được thông qua các mô hình thị giác máy tính. Ví dụ, Ultralytics YOLO11 là một mô hình hỗ trợ nhiều tác vụ Vision AI khác nhau như phát hiện đối tượng, phân đoạn thể hiện, theo dõi đối tượng và ước tính tư thế. Nó được thiết kế để nhanh chóng và hiệu quả và hoạt động tốt trên các thiết bị có tài nguyên phần cứng hạn chế.
Hình 1. Phát hiện và theo dõi thực phẩm đang được đóng gói bằng YOLO11 ( Nguồn ).
Ngoài việc phù hợp để triển khai ở biên, thông qua nhiều tích hợp được Ultralytics hỗ trợ, YOLO11 có thể được xuất sang nhiều định dạng phù hợp với nhiều môi trường phần cứng khác nhau.
Một trong những lựa chọn hiệu quả nhất là MNN (Mobile Neural Network), một công cụ suy luận nhẹ được thiết kế cho các thiết bị có ít tài nguyên. Việc xuất YOLO11 sang MNN cho phép nó chạy trực tiếp trên điện thoại di động, hệ thống nhúng và các nền tảng biên khác, nơi xử lý nhanh trên thiết bị là điều cần thiết.
Trong bài viết này, chúng ta sẽ khám phá cách tích hợp MNN hoạt động, nêu bật các trường hợp sử dụng phổ biến và hướng dẫn cách bắt đầu chạy suy luận bằng mô hình YOLO11 đã xuất. Hãy bắt đầu nào!
Tổng quan về MNN: Một khuôn khổ học sâu
Chạy mô hình thị giác máy tính trên các thiết bị nhỏ hơn như điện thoại di động, cảm biến công nghiệp và hệ thống di động không phải lúc nào cũng đơn giản. Các thiết bị này thường có bộ nhớ hạn chế, bộ xử lý chậm hơn và giới hạn công suất nghiêm ngặt.
Mạng nơ-ron di động, hay MNN, là một công cụ suy luận nhẹ và hiệu suất cao do Alibaba phát triển để giúp các mô hình AI chạy hiệu quả trên phần cứng có ít tài nguyên trong khi vẫn duy trì hiệu suất thời gian thực. MNN hỗ trợ nhiều nền tảng, bao gồm Android, iOS và Linux, và hoạt động trên nhiều loại phần cứng như bộ xử lý trung tâm (CPU) và bộ xử lý đồ họa (GPU).
Tích hợp MNN được Ultralytics hỗ trợ giúp xuất các mô hình YOLO11 dễ dàng sang định dạng MNN. Nói một cách đơn giản, điều này có nghĩa là các mô hình có thể được chuyển đổi từ định dạng YOLO sang MNN.
Sau khi chuyển đổi, chúng có thể được triển khai trên các thiết bị hỗ trợ khuôn khổ MNN để suy luận hiệu quả trên thiết bị. Một lợi ích chính của việc sử dụng định dạng MNN là nó đơn giản hóa việc triển khai YOLO11 trong các tình huống mà kích thước, tốc độ và hiệu quả tài nguyên là rất quan trọng.
Các tính năng chính của phần phụ trợ suy luận MNN
Trước khi đi sâu vào cách sử dụng tích hợp MNN, hãy cùng xem điều gì khiến cho khuôn khổ MNN trở thành lựa chọn tuyệt vời để chạy các mô hình AI trên các thiết bị thực tế. Nó được xây dựng để xử lý các hạn chế riêng biệt của môi trường biên trong khi vẫn mang lại hiệu suất nhanh và đáng tin cậy.
Điều thú vị là MNN được sử dụng nội bộ tại Alibaba trong hơn 30 ứng dụng, bao gồm Taobao, Tmall, Youku, DingTalk và Xianyu, trên nhiều tình huống khác nhau như video trực tiếp, nội dung dạng ngắn, tìm kiếm hình ảnh và kiểm tra bảo mật trên thiết bị. Nó hỗ trợ triển khai quy mô lớn và chạy hàng triệu suy luận mỗi ngày trong môi trường sản xuất.
Sau đây là một số tính năng chính của khung MNN:
Tự động chọn phần cuối: MNN có thể tự động chọn phần cuối thực thi phù hợp nhất, chẳng hạn như CPU hoặc GPU, dựa trên phần cứng mà nó đang chạy.
Thực thi đa luồng : Hỗ trợ đa luồng, cho phép tận dụng tối đa bộ xử lý đa lõi để suy luận nhanh hơn.
Hỗ trợ lượng tử hóa mô hình : Cho phép bạn giảm đáng kể kích thước mô hình bằng cách sử dụng lượng tử hóa FP16 hoặc INT8, giúp cải thiện tốc độ suy luận trong khi sử dụng ít bộ nhớ hơn.
Nhẹ và nhanh: MNN có kích thước rất nhỏ, với thư viện cốt lõi khoảng 400 KB trên Android và khoảng 5 MB trên iOS, khiến nó trở nên lý tưởng cho các thiết bị di động và nhúng.
Hiểu cách tích hợp MNN hoạt động
Tiếp theo, chúng ta hãy tìm hiểu cách xuất mô hình YOLO11 sang định dạng MNN.
Bước đầu tiên là cài đặt gói Ultralytics Python , cung cấp mọi thứ cần thiết để xuất mô hình YOLO11 sang định dạng MNN. Bạn có thể thực hiện việc này bằng cách chạy "pip install ultralytics" trên thiết bị đầu cuối của mình hoặc sử dụng dấu nhắc lệnh. Nếu bạn đang sử dụng Jupyter Notebook hoặc Google Colab, hãy thêm dấu chấm than trước lệnh.
Nếu bạn gặp bất kỳ sự cố nào trong quá trình cài đặt, hãy tham khảo hướng dẫn Sự cố thường gặp để biết mẹo khắc phục sự cố.
Sau khi môi trường của bạn được thiết lập, bạn có thể tải mô hình YOLO11 được đào tạo trước như "yolo11n.pt" và xuất nó sang định dạng MNN như được hiển thị trong đoạn mã bên dưới. Nếu bạn đã đào tạo mô hình YOLO11 tùy chỉnh của riêng mình, bạn có thể xuất nó chỉ bằng cách thay thế tên tệp bằng đường dẫn của mô hình.
from ultralytics import YOLO
model = YOLO("yolo11n.pt")
model.export(format="mnn")
Sau khi chuyển đổi mô hình sang MNN, bạn có thể sử dụng nó trên nhiều nền tảng di động và nhúng khác nhau tùy thuộc vào nhu cầu ứng dụng của bạn.
Ví dụ, giả sử bạn muốn kiểm tra mô hình đã xuất trên video giao thông. Trong trường hợp đó, bạn có thể tải mô hình YOLO11 ở định dạng MNN để phát hiện các đối tượng như xe cộ, người đi bộ và biển báo giao thông trực tiếp trên thiết bị, như minh họa trong ví dụ bên dưới.
Khi suy luận hoàn tất, video đầu ra với các đối tượng được phát hiện sẽ tự động được lưu trong thư mục 'runs/detect/predict'. Ngoài ra, nếu bạn muốn chạy suy luận bằng gói MNN Python trực tiếp, bạn có thể xem tài liệu chính thức của Ultralytics để biết thêm chi tiết và ví dụ.
Hình 3. Phân tích lưu lượng truy cập bằng mô hình YOLO11 được xuất sang định dạng MNN. Hình ảnh của tác giả.
Các trường hợp sử dụng triển khai mô hình AI biên được hỗ trợ bởi YOLO11 và MNN
Việc triển khai YOLO11 với MNN cho phép thực hiện các tác vụ thị giác máy tính nhanh chóng, hiệu quả như phát hiện đối tượng trong môi trường mà xử lý dựa trên đám mây không khả thi hoặc không thực tế. Hãy cùng xem cách tích hợp này có thể đặc biệt hữu ích trong các tình huống thực tế như thế nào.
AI biên di động để xác định bệnh thực vật
Các ứng dụng nhận dạng bệnh thực vật sử dụng phân loại hình ảnh đang ngày càng phổ biến trong giới làm vườn, nhà nghiên cứu và những người đam mê thiên nhiên. Chỉ cần một bức ảnh, người dùng có thể nhanh chóng xác định các dấu hiệu ban đầu của bệnh, chẳng hạn như đốm lá hoặc đổi màu. Vì các ứng dụng này thường được sử dụng ở những khu vực ngoài trời, nơi có thể hạn chế hoặc không có kết nối internet, nên việc dựa vào xử lý đám mây có thể không đáng tin cậy.
Sau khi đào tạo, mô hình YOLO11 có thể được xuất sang định dạng MNN và chạy trực tiếp trên thiết bị di động. Sau đó, mô hình có thể phân loại các loài thực vật và phát hiện các triệu chứng bệnh có thể nhìn thấy tại địa phương mà không cần gửi bất kỳ dữ liệu nào đến máy chủ.
Hình 4. Một ví dụ về việc sử dụng YOLO11 để phát hiện dấu hiệu của bệnh gỉ sắt (một loại bệnh thực vật) trên lá ( Nguồn ).
Suy luận hiệu quả trên thiết bị trong sản xuất
Theo dõi gói hàng chính xác là điều cần thiết trên các dây chuyền sản xuất bận rộn trong các cơ sở sản xuất . YOLO11 có thể được sử dụng để theo dõi và đếm từng mặt hàng khi chúng di chuyển qua các điểm kiểm tra chính, cập nhật số lượng theo thời gian thực và đánh dấu bất kỳ sự khác biệt nào. Điều này giúp giảm thiểu các lô hàng bị mất hoặc không được tính và hỗ trợ các hoạt động trơn tru hơn, đáng tin cậy hơn.
Hình 5. Theo dõi và đếm các gói hàng bằng YOLO11 ( Nguồn ).
Tích hợp MNN có thể đặc biệt có tác động trong bối cảnh này. Khi mô hình YOLO11 được xuất sang định dạng MNN, nó có thể chạy trực tiếp trên các thiết bị nhỏ gọn, công suất thấp được lắp dọc theo băng tải.
Vì mọi quá trình xử lý đều diễn ra cục bộ, hệ thống có thể cung cấp phản hồi tức thời và không cần kết nối internet. Điều này đảm bảo hiệu suất nhanh chóng, đáng tin cậy tại nhà máy, duy trì sản xuất hiệu quả trong khi vẫn duy trì độ chính xác và khả năng kiểm soát cao.
Ưu điểm của việc xuất YOLO11 sang định dạng mô hình MNN
Sau đây là một số lợi ích chính của tích hợp MNN do Ultralytics cung cấp:
Thời gian phản hồi nhanh hơn : Vì quá trình suy luận chạy trên thiết bị nên các dự đoán diễn ra theo thời gian thực với độ trễ tối thiểu.
Cải thiệnquyền riêng tư dữ liệu : Dữ liệu được lưu trên thiết bị, giúp giảm nhu cầu gửi hình ảnh hoặc video nhạy cảm lên đám mây.
Mã nguồn mở và được bảo trì tích cực : Được Alibaba hỗ trợ và cộng đồng tích cực hỗ trợ, MNN đáng tin cậy và thường xuyên được cập nhật để cải thiện hiệu suất.
Các yếu tố cần xem xét khi sử dụng khuôn khổ MNN
Trước khi chọn MNN làm khuôn khổ triển khai của bạn, điều quan trọng là phải đánh giá mức độ phù hợp của nó với các yêu cầu, mục tiêu triển khai và hạn chế kỹ thuật của dự án. Sau đây là một số yếu tố chính cần xem xét:
Khả năng tương thích liên tục: Các bản cập nhật hoặc thay đổi của khung đối với nền tảng mục tiêu của bạn có thể yêu cầu kiểm tra lại hoặc điều chỉnh để mọi thứ hoạt động trơn tru.
Ít công cụ gỡ lỗi hơn: So với các khuôn khổ lớn hơn, MNN có ít công cụ gỡ lỗi và kiểm tra hành vi của mô hình hơn, điều này có thể khiến việc khắc phục sự cố trở nên khó khăn hơn.
Hiệu suất phụ thuộc vào phần cứng: Tốc độ và hiệu quả của mô hình của bạn sẽ thay đổi tùy thuộc vào thiết bị. Kiểm tra phần cứng mục tiêu của bạn để đảm bảo nó đáp ứng mục tiêu hiệu suất của bạn.
Những điểm chính
Hỗ trợ tích hợp MNN của Ultralytics giúp dễ dàng xuất các mô hình YOLO11 để sử dụng trên thiết bị di động và nhúng. Đây là một lựa chọn thực tế cho các ứng dụng yêu cầu phát hiện nhanh, đáng tin cậy mà không phụ thuộc vào quyền truy cập đám mây hoặc kết nối liên tục.
Thiết lập này giúp hợp lý hóa việc triển khai trong khi vẫn duy trì hiệu suất và giữ nhu cầu tài nguyên ở mức thấp. Cho dù bạn đang xây dựng hệ thống nhà thông minh, công cụ hiện trường hay thiết bị công nghiệp nhỏ gọn, việc xuất YOLO11 sang MNN cung cấp một cách linh hoạt và hiệu quả để chạy các tác vụ thị giác máy tính trực tiếp trên các thiết bị biên.