YOLO Vision Thâm Quyến
Thâm Quyến
Tham gia ngay
Thuật ngữ

TinyML

Khám phá TinyML và tìm hiểu cách triển khai. Ultralytics Ứng dụng YOLO26 trên vi điều khiển công suất thấp. Khám phá cách tối ưu hóa mô hình cho IoT bằng lượng tử hóa và... Ultralytics Nền tảng.

Máy học siêu nhỏ, thường được gọi là TinyML, là một lĩnh vực chuyên biệt của máy học tập trung vào việc triển khai các mô hình trên các thiết bị tiêu thụ điện năng cực thấp và có tài nguyên hạn chế như bộ vi điều khiểncác thiết bị IoT nhỏ. Không giống như các hệ thống dựa trên đám mây truyền thống dựa vào tài nguyên tính toán khổng lồ, TinyML hoạt động hoàn toàn ở biên. Bằng cách chạy các thuật toán thông minh cục bộ trên các thiết bị có giới hạn năng lượng thường chỉ tính bằng miliwatt, phương pháp này giảm thiểu độ trễ, đảm bảo quyền riêng tư dữ liệu và giảm đáng kể mức sử dụng băng thông, một mô hình được hỗ trợ và phát triển bởi các cộng đồng như TinyML Foundation .

Để tích hợp thành công các kiến ​​trúc mạng nơ-ron phức tạp vào phần cứng có tài nguyên hạn chế như bộ xử lý ARM Cortex-M , các mô hình phải trải qua quá trình tối ưu hóa nghiêm ngặt. Các kỹ thuật như lượng tử hóa mô hình —chuyển đổi trọng số dấu phẩy động 32 bit thành số nguyên 8 bit—và cắt tỉa mô hình được sử dụng để giảm đáng kể dung lượng bộ nhớ tổng thể. Ngày nay, các khung phần mềm chuyên dụng như... Google TensorFlow Lite của 's dành cho bộ vi điều khiển và PyTorch ExecuTorch của hãng này hỗ trợ các quy trình nén chính xác, mang lại khả năng xử lý hình ảnh và âm thanh tiên tiến cho phần cứng nhúng thông thường.

TinyML so với Trí tuệ nhân tạo biên (Edge AI)

Mặc dù TinyML có liên quan mật thiết đến Edge AI , sự khác biệt chính nằm ở quy mô phần cứng và ngân sách năng lượng. Edge AI là một thuật ngữ rộng hơn bao gồm bất kỳ việc thực thi cục bộ nào của các mô hình AI, thường sử dụng các máy tính bảng đơn như Raspberry Pi hoặc các GPU nhúng mạnh mẽ như NVIDIA Jetson . Ngược lại, TinyML nhắm mục tiêu cụ thể vào các hệ thống nhúng sâu hoạt động bằng pin trong nhiều tháng hoặc nhiều năm, chẳng hạn như bo mạch Arduino hoặc chip STMicroelectronics . Các thiết bị này thường chỉ có vài trăm kilobyte RAM, khiến việc nén mô hình mạnh mẽ trở nên bắt buộc.

Các Ứng dụng Thực tế

Khả năng triển khai trí tuệ nhân tạo trực tiếp lên phần cứng tối thiểu đã mở ra vô số trường hợp sử dụng thực tiễn trong nhiều ngành công nghiệp khác nhau:

  • Bảo trì dự đoán trong sản xuất thông minh : Các nhà máy triển khai các cảm biến rung động và âm thanh siêu tiết kiệm năng lượng trực tiếp lên máy móc. Các cảm biến TinyML này liên tục phân tích tần số động cơ để... detect Những bất thường nhỏ cho thấy nguy cơ hỏng hóc sắp xảy ra, cho phép đội bảo trì giải quyết vấn đề trước khi xảy ra thời gian ngừng hoạt động tốn kém.
  • Nông nghiệp chính xác thông minh : Các thiết bị TinyML chạy bằng pin được bố trí rải rác trên các cánh đồng rộng lớn để theo dõi điều kiện môi trường cục bộ và detect Phát hiện sớm các dấu hiệu của sâu bệnh hoặc dịch bệnh bằng cách sử dụng các mô-đun camera cơ bản, chỉ truyền tải các cảnh báo nhẹ thay vì các tập tin hình ảnh nặng.
  • Giám sát âm thanh bảo tồn động vật hoang dã : Các nhà nghiên cứu sử dụng mảng cảm biến âm thanh ẩn được hỗ trợ bởi TinyML để detect Các thiết bị này có thể nhận diện âm thanh đặc trưng của các loài động vật có nguy cơ tuyệt chủng hoặc các hoạt động khai thác gỗ trái phép (như cưa máy) trong rừng rậm. Hoạt động bằng năng lượng mặt trời hoặc pin, các thiết bị này phân tích âm thanh tại chỗ và ngay lập tức kích hoạt cảnh báo tầm xa.

Xuất mô hình cho TinyML

Việc chuẩn bị mô hình cho vi điều khiển yêu cầu định dạng xuất nghiêm ngặt. Sử dụng Ultralytics YOLO26 , các nhà phát triển có thể xây dựng các quy trình phát hiện đối tượng mạnh mẽ và nén chúng lại cho các mục tiêu nhúng. Bạn có thể quản lý tập dữ liệu và phiên bản mô hình của mình một cách liền mạch trên Nền tảng Ultralytics trước khi xuất cục bộ. Tích hợp TFLite gốc cho phép chuyển đổi dễ dàng sang định dạng số nguyên 8 bit cần thiết cho vi điều khiển, bổ sung cho các tùy chọn triển khai mô hình dành riêng cho phần cứng khác như CoreML của Apple, Google 's Edge TPU và NVIDIA TensorRT của .

Ví dụ sau đây minh họa cách xuất một mô hình YOLO26 nhẹ được tối ưu hóa đặc biệt với lượng tử hóa INT8, giúp nó phù hợp để triển khai trên các nền tảng biên tương thích với TinyML:

from ultralytics import YOLO

# Initialize the lightweight YOLO26 Nano model for edge use cases
model = YOLO("yolo26n.pt")

# Export to TFLite format with INT8 quantization and a reduced image size
# This minimizes the memory footprint and accelerates inference on microcontrollers
model.export(format="tflite", int8=True, imgsz=160)

Hãy cùng nhau xây dựng tương lai của trí tuệ nhân tạo!

Bắt đầu hành trình của bạn với tương lai của học máy