Khám phá TinyML và tìm hiểu cách triển khai. Ultralytics Ứng dụng YOLO26 trên vi điều khiển công suất thấp. Khám phá cách tối ưu hóa mô hình cho IoT bằng lượng tử hóa và... Ultralytics Nền tảng.
Máy học siêu nhỏ, thường được gọi là TinyML, là một lĩnh vực chuyên biệt của máy học tập trung vào việc triển khai các mô hình trên các thiết bị tiêu thụ điện năng cực thấp và có tài nguyên hạn chế như bộ vi điều khiển và các thiết bị IoT nhỏ. Không giống như các hệ thống dựa trên đám mây truyền thống dựa vào tài nguyên tính toán khổng lồ, TinyML hoạt động hoàn toàn ở biên. Bằng cách chạy các thuật toán thông minh cục bộ trên các thiết bị có giới hạn năng lượng thường chỉ tính bằng miliwatt, phương pháp này giảm thiểu độ trễ, đảm bảo quyền riêng tư dữ liệu và giảm đáng kể mức sử dụng băng thông, một mô hình được hỗ trợ và phát triển bởi các cộng đồng như TinyML Foundation .
Để tích hợp thành công các kiến trúc mạng nơ-ron phức tạp vào phần cứng có tài nguyên hạn chế như bộ xử lý ARM Cortex-M , các mô hình phải trải qua quá trình tối ưu hóa nghiêm ngặt. Các kỹ thuật như lượng tử hóa mô hình —chuyển đổi trọng số dấu phẩy động 32 bit thành số nguyên 8 bit—và cắt tỉa mô hình được sử dụng để giảm đáng kể dung lượng bộ nhớ tổng thể. Ngày nay, các khung phần mềm chuyên dụng như... Google TensorFlow Lite của 's dành cho bộ vi điều khiển và PyTorch ExecuTorch của hãng này hỗ trợ các quy trình nén chính xác, mang lại khả năng xử lý hình ảnh và âm thanh tiên tiến cho phần cứng nhúng thông thường.
Mặc dù TinyML có liên quan mật thiết đến Edge AI , sự khác biệt chính nằm ở quy mô phần cứng và ngân sách năng lượng. Edge AI là một thuật ngữ rộng hơn bao gồm bất kỳ việc thực thi cục bộ nào của các mô hình AI, thường sử dụng các máy tính bảng đơn như Raspberry Pi hoặc các GPU nhúng mạnh mẽ như NVIDIA Jetson . Ngược lại, TinyML nhắm mục tiêu cụ thể vào các hệ thống nhúng sâu hoạt động bằng pin trong nhiều tháng hoặc nhiều năm, chẳng hạn như bo mạch Arduino hoặc chip STMicroelectronics . Các thiết bị này thường chỉ có vài trăm kilobyte RAM, khiến việc nén mô hình mạnh mẽ trở nên bắt buộc.
Khả năng triển khai trí tuệ nhân tạo trực tiếp lên phần cứng tối thiểu đã mở ra vô số trường hợp sử dụng thực tiễn trong nhiều ngành công nghiệp khác nhau:
Việc chuẩn bị mô hình cho vi điều khiển yêu cầu định dạng xuất nghiêm ngặt. Sử dụng Ultralytics YOLO26 , các nhà phát triển có thể xây dựng các quy trình phát hiện đối tượng mạnh mẽ và nén chúng lại cho các mục tiêu nhúng. Bạn có thể quản lý tập dữ liệu và phiên bản mô hình của mình một cách liền mạch trên Nền tảng Ultralytics trước khi xuất cục bộ. Tích hợp TFLite gốc cho phép chuyển đổi dễ dàng sang định dạng số nguyên 8 bit cần thiết cho vi điều khiển, bổ sung cho các tùy chọn triển khai mô hình dành riêng cho phần cứng khác như CoreML của Apple, Google 's Edge TPU và NVIDIA TensorRT của .
Ví dụ sau đây minh họa cách xuất một mô hình YOLO26 nhẹ được tối ưu hóa đặc biệt với lượng tử hóa INT8, giúp nó phù hợp để triển khai trên các nền tảng biên tương thích với TinyML:
from ultralytics import YOLO
# Initialize the lightweight YOLO26 Nano model for edge use cases
model = YOLO("yolo26n.pt")
# Export to TFLite format with INT8 quantization and a reduced image size
# This minimizes the memory footprint and accelerates inference on microcontrollers
model.export(format="tflite", int8=True, imgsz=160)

Bắt đầu hành trình của bạn với tương lai của học máy