¡Comprenda los FLOPs en el aprendizaje automático! Aprenda cómo miden la complejidad del modelo, impactan la eficiencia y ayudan en la selección del hardware.
Las FLOPs, u Operaciones de Punto Flotante, son una métrica fundamental utilizada en el Aprendizaje Automático (ML) para medir la complejidad computacional de un modelo. Una operación de punto flotante es cualquier cálculo matemático, como la suma, la resta, la multiplicación o la división, que involucra números con decimales, que son estándar en las redes neuronales. Si bien el término puede referirse técnicamente a las operaciones por segundo, en el contexto del aprendizaje profundo, las FLOPs típicamente cuantifican el número total de estas operaciones requeridas para un solo pase hacia adelante de un modelo. Esta métrica proporciona una forma independiente del hardware para estimar cuán computacionalmente intensivo será un modelo durante la inferencia. Los números son a menudo tan grandes que se expresan en GigaFLOPs (GFLOPs), que son miles de millones de operaciones, o TeraFLOPs (TFLOPs), billones de operaciones.
Las FLOPs son un indicador crítico de la eficiencia de un modelo. Un conteo de FLOPs más bajo generalmente sugiere que un modelo será más rápido y requerirá menos potencia computacional para ejecutarse. Esto es especialmente importante para aplicaciones donde los recursos son limitados, como en la IA en el borde y en dispositivos móviles. Al analizar las FLOPs, los desarrolladores pueden:
Las FLOPs son una métrica práctica utilizada diariamente en el desarrollo y la implementación de soluciones de IA.
Aplicaciones de visión móvil: Un desarrollador que crea una función de detección de objetos en tiempo real para una aplicación de smartphone debe elegir un modelo que pueda ejecutarse rápidamente sin agotar la batería. Al comparar los FLOPs de modelos ligeros, como una variante pequeña de Ultralytics YOLO11 con otros, puede seleccionar un modelo que proporcione un buen equilibrio entre velocidad y precisión para la CPU o la GPU del dispositivo.
Vehículos autónomos: En la conducción autónoma, los modelos de percepción deben procesar las imágenes de la cámara con una latencia extremadamente baja. Los ingenieros que diseñan estos sistemas analizan los FLOP de varios modelos para asegurarse de que la arquitectura elegida puede ejecutarse en el hardware especializado del vehículo. Un modelo como YOLO11 podría elegirse en lugar de uno más complejo si sus FLOP más bajos le permiten cumplir los estrictos requisitos de tiempo para un funcionamiento seguro.
Es importante distinguir los FLOPs de otras métricas comunes:
Aunque útiles, los FLOP tienen limitaciones:
Por lo tanto, los FLOP deben considerarse junto con otras métricas de rendimiento, parámetros y puntos de referencia del mundo real para obtener una imagen completa de la eficiencia del modelo. Herramientas como Ultralytics HUB pueden ayudar a administrar modelos y realizar un seguimiento de varios aspectos del rendimiento durante el desarrollo y la implementación.