Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Model Quantization

Aprende cómo la cuantización de modelos optimiza Ultralytics YOLO26 para la IA de borde. Descubre cómo reducir la memoria, disminuir la latencia y exportar modelos INT8 para una inferencia más rápida.

La cuantización de modelos es una técnica sofisticada de optimización de modelos que se utiliza para reducir los costes computacionales y de memoria al ejecutar modelos de aprendizaje profundo. En los flujos de trabajo de entrenamiento estándar, las redes neuronales suelen almacenar parámetros (pesos y sesgos) y mapas de activación utilizando números de punto flotante de 32 bits (FP32). Aunque esta alta precisión garantiza cálculos exactos durante el entrenamiento, a menudo es innecesaria para la inferencia. La cuantización convierte estos valores en formatos de menor precisión, como números de punto flotante de 16 bits (FP16) o enteros de 8 bits (INT8), lo que reduce eficazmente el tamaño del modelo y acelera la velocidad de ejecución sin comprometer significativamente la precisión.

Link to this sectionPor qué es importante la cuantización#

El principal motor de la cuantización es la necesidad de desplegar una IA potente en hardware con recursos limitados. A medida que los modelos de visión artificial, como YOLO26, se vuelven más complejos, sus exigencias computacionales aumentan. La cuantización aborda tres cuellos de botella críticos:

  • Huella de memoria: Al reducir la anchura de bits de los pesos (por ejemplo, de 32 bits a 8 bits), el requisito de almacenamiento del modelo se reduce hasta 4 veces. Esto es vital para las aplicaciones móviles donde el tamaño de la aplicación está restringido.
  • Latencia de inferencia: Las operaciones de menor precisión son computacionalmente más baratas. Los procesadores modernos, especialmente aquellos con unidades de procesamiento neuronal (NPU) especializadas, pueden ejecutar operaciones INT8 mucho más rápido que FP32, reduciendo significativamente la latencia de inferencia.
  • Consumo de energía: Mover menos datos a través de la memoria y realizar operaciones aritméticas más simples consume menos energía, lo que prolonga la duración de la batería en dispositivos portátiles y vehículos autónomos.

Link to this sectionComparación con conceptos relacionados#

Es importante diferenciar la cuantización de otras técnicas de optimización, ya que modifican el modelo de formas distintas:

  • Cuantización frente a poda: Mientras que la cuantización reduce el tamaño del archivo al reducir la anchura de bits de los parámetros, la poda de modelos implica eliminar conexiones (pesos) innecesarias por completo para crear una red dispersa. La poda altera la estructura del modelo, mientras que la cuantización altera la representación de los datos.
  • Cuantización frente a destilación de conocimiento: La destilación de conocimiento es una técnica de entrenamiento en la que un modelo "estudiante" pequeño aprende a imitar a un modelo "profesor" grande. La cuantización a menudo se aplica al modelo estudiante después de la destilación para mejorar aún más el rendimiento de la IA de borde.

Link to this sectionAplicaciones en el mundo real#

La cuantización permite la visión artificial y la IA en diversas industrias donde la eficiencia es fundamental.

  1. Sistemas autónomos: En la industria automotriz, los coches autónomos deben procesar datos visuales de cámaras y LiDAR en tiempo real. Los modelos cuantizados desplegados en motores NVIDIA TensorRT permiten a estos vehículos detectar peatones y obstáculos con una latencia de milisegundos, garantizando la seguridad de los pasajeros.

  2. Agricultura inteligente: Los drones equipados con cámaras multiespectrales utilizan modelos cuantizados de detección de objetos para identificar enfermedades de los cultivos o supervisar las etapas de crecimiento. Ejecutar estos modelos localmente en los sistemas embebidos del dron elimina la necesidad de conexiones celulares poco fiables en campos remotos.

Link to this sectionImplementación de la cuantización con Ultralytics#

La librería Ultralytics simplifica el proceso de exportación, permitiendo a los desarrolladores convertir modelos como el vanguardista YOLO26 a formatos cuantizados. La Plataforma Ultralytics también proporciona herramientas para gestionar estos despliegues sin problemas.

El siguiente ejemplo demuestra cómo exportar un modelo a TFLite con la cuantización INT8 activada. Este proceso implica un paso de calibración donde el modelo observa datos de muestra para determinar el rango dinámico óptimo para los valores cuantizados.

from ultralytics import YOLO

# Load a standard YOLO26 model
model = YOLO("yolo26n.pt")

# Export to TFLite format with INT8 quantization
# The 'int8' argument triggers Post-Training Quantization
# 'data' provides the calibration dataset needed for mapping values
model.export(format="tflite", int8=True, data="coco8.yaml")

Los modelos optimizados se despliegan frecuentemente utilizando estándares interoperables como ONNX o motores de inferencia de alto rendimiento como OpenVINO, asegurando una amplia compatibilidad a través de diversos ecosistemas de hardware.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático