TinyML
Исследуй TinyML и научись развертывать Ultralytics YOLO26 на маломощных микроконтроллерах. Узнай, как оптимизировать модели для IoT с помощью квантования и платформы Ultralytics.
Микромашинное обучение, обычно называемое TinyML, представляет собой специализированную область машинного обучения, сфокусированную на развертывании моделей на устройствах с ультранизким энергопотреблением и ограниченными ресурсами, таких как микроконтроллеры и небольшие IoT-устройства. В отличие от традиционных облачных систем, опирающихся на огромные вычислительные ресурсы, TinyML работает полностью на периферии (edge). Запуская интеллектуальные алгоритмы локально на устройствах с потребляемой мощностью, часто измеряемой всего в милливаттах, этот подход минимизирует задержки, обеспечивает конфиденциальность данных и радикально снижает использование полосы пропускания — парадигма, поддерживаемая и развиваемая такими сообществами, как TinyML Foundation.
Чтобы успешно разместить сложные архитектуры нейронных сетей на высокоограниченном оборудовании, таком как процессоры ARM Cortex-M, модели должны пройти строгую оптимизацию. Такие методы, как квантование модели — преобразование 32-битных весов с плавающей запятой в 8-битные целые числа — и прюнинг модели, используются для значительного уменьшения общего объема памяти. Сегодня специализированные фреймворки, такие как TensorFlow Lite for Microcontrollers от Google и ExecuTorch от PyTorch, упрощают эти точные рабочие процессы сжатия, привнося продвинутый визуальный и аудиоинтеллект в повседневное встраиваемое оборудование.
Link to this sectionTinyML против Edge AI#
Хотя TinyML тесно связан с Edge AI, основное различие заключается в масштабе оборудования и бюджете энергопотребления. Edge AI — это более широкий термин, охватывающий любое локальное выполнение моделей ИИ, часто использующий одноплатные компьютеры, такие как Raspberry Pi, или мощные встроенные GPU, такие как NVIDIA Jetson. Напротив, TinyML специально нацелен на глубоко встроенные системы, работающие от батарей месяцами или годами, такие как платы Arduino или чипы STMicroelectronics. Эти устройства обычно обладают лишь несколькими сотнями килобайт оперативной памяти, что делает агрессивное сжатие моделей обязательным.
Link to this sectionРеальные приложения#
Возможность развертывания интеллекта непосредственно на минимальном оборудовании открыла множество практических сценариев использования в различных отраслях:
- Предиктивное обслуживание в умном производстве: заводы развертывают датчики вибрации и звука с ультранизким энергопотреблением непосредственно на оборудовании. Эти датчики TinyML непрерывно анализируют частоты двигателей для обнаружения тонких аномалий, указывающих на надвигающийся отказ, что позволяет группам технического обслуживания устранять проблемы до того, как произойдет дорогостоящий простой.
- Умное точное земледелие: работающие от батарей устройства TinyML размещаются на обширных полях для мониторинга локальных условий окружающей среды и выявления ранних признаков заражения вредителями или болезней с использованием базовых модулей камер, передавая только легкие уведомления, а не тяжелые файлы изображений.
- Аудиомониторинг для охраны дикой природы: исследователи используют скрытые акустические сенсорные массивы на базе TinyML для обнаружения специфических звуков исчезающих видов или незаконной вырубки леса (например, звуков бензопил) в густых лесах. Работая на солнечной или батарейной энергии, эти устройства анализируют звук локально и мгновенно отправляют уведомления на большие расстояния.
Link to this sectionЭкспорт моделей для TinyML#
Подготовка модели для микроконтроллера требует строгого формата экспорта. Используя Ultralytics YOLO26, разработчики могут создавать надежные конвейеры обнаружения объектов и сжимать их для встраиваемых целей. Ты можешь легко управлять своим набором данных и версионированием моделей на Ultralytics Platform перед локальным экспортом. Нативная TFLite интеграция позволяет без усилий преобразовывать модели в 8-битные целочисленные форматы, необходимые для микроконтроллеров, дополняя другие аппаратные варианты развертывания моделей, такие как CoreML от Apple, Edge TPU от Google и TensorRT от NVIDIA.
Следующий пример демонстрирует, как экспортировать легкую модель YOLO26, специально оптимизированную с помощью INT8 квантования, что делает её подходящей для развертывания на TinyML-совместимых периферийных платформах:
from ultralytics import YOLO
# Initialize the lightweight YOLO26 Nano model for edge use cases
model = YOLO("yolo26n.pt")
# Export to TFLite format with INT8 quantization and a reduced image size
# This minimizes the memory footprint and accelerates inference on microcontrollers
model.export(format="tflite", int8=True, imgsz=160)





