TinyML
Explora TinyML y aprende a implementar Ultralytics YOLO26 en microcontroladores de bajo consumo. Descubre cómo optimizar modelos para el IoT con cuantización y la Ultralytics Platform.
El aprendizaje automático diminuto, conocido comúnmente como TinyML, representa un subcampo especializado del aprendizaje automático que se centra en implementar modelos en dispositivos de potencia ultra baja y recursos limitados como microcontroladores y pequeños dispositivos IoT. A diferencia de los sistemas tradicionales basados en la nube que dependen de inmensos recursos computacionales, TinyML funciona completamente en el borde. Al ejecutar algoritmos inteligentes localmente en dispositivos con restricciones de energía que a menudo se miden en simples milivatios, este enfoque minimiza la latencia, garantiza la privacidad de los datos y reduce drásticamente el uso de ancho de banda, un paradigma respaldado y promovido por comunidades como la TinyML Foundation.
Para ajustar con éxito arquitecturas complejas de redes neuronales en hardware altamente limitado como los procesadores ARM Cortex-M, los modelos deben someterse a una optimización rigurosa. Técnicas como la cuantización de modelos—que convierte pesos de punto flotante de 32 bits a enteros de 8 bits—y la poda de modelos se utilizan para reducir significativamente la huella de memoria general. Hoy en día, marcos especializados como TensorFlow Lite for Microcontrollers de Google y ExecuTorch de PyTorch facilitan estos flujos de trabajo de compresión precisos, aportando inteligencia visual y auditiva avanzada al hardware integrado cotidiano.
Link to this sectionTinyML frente a Edge AI#
Aunque TinyML está estrechamente relacionado con Edge AI, la principal distinción radica en la escala del hardware y el presupuesto energético. Edge AI es un término más amplio que abarca cualquier ejecución local de modelos de IA, utilizando a menudo ordenadores de placa única como una Raspberry Pi o potentes GPUs integradas como una NVIDIA Jetson. Por el contrario, TinyML se dirige específicamente a sistemas profundamente integrados que funcionan con baterías durante meses o años, como placas Arduino o chips de STMicroelectronics. Estos dispositivos suelen poseer solo unos pocos cientos de kilobytes de RAM, lo que hace que la compresión agresiva del modelo sea obligatoria.
Link to this sectionAplicaciones en el mundo real#
La capacidad de desplegar inteligencia directamente en un hardware mínimo ha abierto numerosos casos de uso prácticos en diversas industrias:
- Mantenimiento predictivo en fabricación inteligente: Las fábricas despliegan sensores de vibración y audio de potencia ultra baja directamente en la maquinaria. Estos sensores TinyML analizan continuamente las frecuencias del motor para detectar anomalías sutiles que indican un fallo inminente, lo que permite a los equipos de mantenimiento solucionar los problemas antes de que se produzca un tiempo de inactividad costoso.
- Agricultura de precisión inteligente: Dispositivos TinyML que funcionan con baterías se dispersan por extensos campos de cultivo para monitorear condiciones ambientales localizadas y detectar signos tempranos de infestaciones de plagas o enfermedades utilizando módulos de cámara básicos, transmitiendo solo alertas ligeras en lugar de archivos de imagen pesados.
- Monitoreo de audio para la conservación de la vida silvestre: Los investigadores utilizan matrices de sensores acústicos ocultas alimentadas por TinyML para detectar los sonidos específicos de especies en peligro de extinción o actividades de tala ilegal (como motosierras) en bosques densos. Funcionando con energía solar o batería, estos dispositivos analizan el audio localmente y activan alertas de largo alcance al instante.
Link to this sectionExportación de modelos para TinyML#
Preparar un modelo para un microcontrolador requiere un formato de exportación estricto. Usando Ultralytics YOLO26, los desarrolladores pueden crear tuberías de detección de objetos robustas y comprimirlas para objetivos integrados. Puedes gestionar tu conjunto de datos y el control de versiones del modelo sin problemas en la Ultralytics Platform antes de exportar localmente. La integración nativa de TFLite permite una conversión sencilla a los formatos de enteros de 8 bits requeridos para los microcontroladores, complementando otras opciones de despliegue de modelos específicas de hardware como CoreML de Apple, Edge TPU de Google y TensorRT de NVIDIA.
El siguiente ejemplo demuestra cómo exportar un modelo YOLO26 ligero optimizado específicamente con cuantización INT8, lo que lo hace adecuado para el despliegue en plataformas de borde compatibles con TinyML:
from ultralytics import YOLO
# Initialize the lightweight YOLO26 Nano model for edge use cases
model = YOLO("yolo26n.pt")
# Export to TFLite format with INT8 quantization and a reduced image size
# This minimizes the memory footprint and accelerates inference on microcontrollers
model.export(format="tflite", int8=True, imgsz=160)





