Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Half-Precision

Aprende cómo la media precisión (FP16) acelera la IA. Descubre cómo optimizar Ultralytics YOLO26 para obtener una inferencia más rápida y reducir el uso de memoria en GPU y dispositivos de borde.

La precisión media, a menudo denotada como FP16, es un formato de datos de coma flotante que ocupa 16 bits de memoria informática, a diferencia del formato estándar de precisión simple (FP32) que utiliza 32 bits. En el contexto de la inteligencia artificial y el aprendizaje automático, la precisión media es una técnica de optimización fundamental que se utiliza para acelerar el entrenamiento y la inferencia de modelos, al tiempo que reduce significativamente el consumo de memoria. Al almacenar valores numéricos, como los pesos del modelo y gradientes de una red neuronal, utilizando menos bits, puedes ajustar modelos más grandes en unidades de procesamiento gráfico (GPU) o ejecutar modelos existentes mucho más rápido. Esta ganancia de eficiencia es esencial para desplegar arquitecturas modernas y complejas como YOLO26 en dispositivos con recursos limitados sin sacrificar una precisión sustancial.

Link to this sectionLa mecánica de los formatos de coma flotante#

Para entender la precisión media, ayuda contrastarla con la precisión total. Un número estándar de coma flotante de 32 bits (FP32) dedica más bits al exponente y a la mantisa, proporcionando un rango dinámico muy amplio y una alta precisión numérica. Sin embargo, los modelos de aprendizaje profundo son notoriamente resistentes a pequeños errores numéricos. Las redes neuronales a menudo pueden aprender eficazmente incluso con el rango dinámico y la granularidad reducidos que ofrece el formato de 16 bits.

Pasarse a la precisión media reduce a la mitad el requisito de ancho de banda de memoria. Esto permite tamaños de lote mayores durante el entrenamiento, lo que puede estabilizar las actualizaciones de gradiente y acelerar el proceso de entrenamiento en general. Los aceleradores de hardware modernos, como los Tensor Cores de NVIDIA, están específicamente optimizados para realizar multiplicaciones de matrices en FP16 a velocidades significativamente mayores que en FP32.

Link to this sectionBeneficios clave en los flujos de trabajo de IA#

La adopción de la precisión media ofrece varias ventajas tangibles para los profesionales de la IA:

  • Huella de memoria reducida: Los modelos requieren la mitad de VRAM (memoria de vídeo), lo que permite entrenar redes más grandes o utilizar datos de entrenamiento de mayor resolución en el mismo hardware.
  • Inferencia más rápida: Para aplicaciones en tiempo real, como vehículos autónomos o análisis de vídeo, FP16 puede duplicar el rendimiento (fotogramas por segundo), reduciendo la latencia de inferencia.
  • Eficiencia energética: Procesar menos bits requiere menos energía, lo cual es crucial para dispositivos de IA en el borde y teléfonos móviles donde la duración de la batería es una limitación.
  • Entrenamiento de precisión mixta: Muchos marcos modernos utilizan precisión mixta, donde el modelo mantiene una copia maestra de los pesos en FP32 para la estabilidad, pero realiza cálculos pesados en FP16. Esto proporciona lo mejor de ambos mundos: velocidad y estabilidad de convergencia.

Link to this sectionAplicaciones en el mundo real#

La precisión media es omnipresente en los sistemas de IA de grado de producción. Aquí tienes dos ejemplos concretos:

  1. Detección de objetos en tiempo real en dispositivos de borde: Considera un sistema de cámaras de seguridad que ejecuta Ultralytics YOLO26 para detectar intrusos. Desplegar el modelo en FP16 le permite ejecutarse sin problemas en un chip integrado como un NVIDIA Jetson o un Raspberry Pi AI Kit. La carga computacional reducida garantiza que el sistema pueda procesar transmisiones de vídeo en modo de inferencia en tiempo real sin retrasos, lo cual es vital para alertas oportunas.

  2. Despliegue de grandes modelos de lenguaje (LLM): Los modelos de IA generativa, como GPT-4 o las variantes de Llama, tienen miles de millones de parámetros. Cargar estos modelos en precisión total (FP32) requeriría enormes cantidades de memoria de servidor que a menudo resultan prohibitivas en términos de coste. Al convertir estos modelos a FP16 (o incluso formatos inferiores), los proveedores de nube pueden ofrecer modelos fundacionales a miles de usuarios simultáneamente, haciendo que servicios como los chatbots y la generación automática de contenido sean económicamente viables.

Link to this sectionPrecisión media frente a cuantización#

Aunque ambas técnicas tienen como objetivo reducir el tamaño del modelo, es importante distinguir la "precisión media" de la cuantización de modelos.

  • Precisión media (FP16): Reduce el ancho de bits de 32 a 16, pero mantiene los datos como un número de coma flotante. Conserva un rango dinámico razonable y suele ser la elección por defecto para el entrenamiento en GPU y la inferencia.
  • Cuantización (INT8): Convierte números de coma flotante en enteros (normalmente de 8 bits). Esto ofrece un ahorro aún mayor en velocidad y memoria, pero a veces puede conducir a una caída más notable en la precisión si no se hace con cuidado (por ejemplo, mediante el entrenamiento consciente de la cuantización). FP16 es generalmente más seguro para preservar el rendimiento del modelo, mientras que INT8 se utiliza para una optimización extrema.

Link to this sectionImplementación de la precisión media con Ultralytics#

La biblioteca ultralytics facilita enormemente el uso de la precisión media. Durante la predicción, el modelo puede cambiar automáticamente a precisión media si el hardware lo admite, o se puede solicitar explícitamente.

Aquí tienes un ejemplo en Python que demuestra cómo cargar un modelo YOLO26 y realizar inferencias utilizando precisión media. Ten en cuenta que ejecutarlo con half=True normalmente requiere una GPU compatible con CUDA.

import torch
from ultralytics import YOLO

# Check if CUDA (GPU) is available, as FP16 is primarily for GPU acceleration
device = "cuda" if torch.cuda.is_available() else "cpu"

# Load the latest YOLO26n model
model = YOLO("yolo26n.pt")

# Run inference on an image with half-precision enabled
# The 'half=True' argument tells the engine to use FP16
results = model.predict("https://ultralytics.com/images/bus.jpg", device=device, half=True)

# Print the device and precision status
print(f"Inference device: {results[0].orig_img.shape}, Speed: {results[0].speed}")

Para los usuarios que gestionan conjuntos de datos y procesos de entrenamiento, la Plataforma Ultralytics gestiona muchas de estas optimizaciones automáticamente en la nube, simplificando la transición desde la anotación hasta el despliegue del modelo optimizado.

Link to this sectionLecturas adicionales y recursos#

Para explorar más sobre los formatos numéricos y su impacto en la IA, consulta la Documentación de rendimiento de aprendizaje profundo de NVIDIA sobre los Tensor Cores. Para una comprensión más amplia de cómo encajan estas optimizaciones en el ciclo de vida de desarrollo, lee sobre operaciones de aprendizaje automático (MLOps).

Además, quienes estén interesados en las compensaciones entre diferentes estrategias de optimización podrían investigar la poda, que elimina conexiones en lugar de reducir la precisión de bits, o explorar el Estándar IEEE para la aritmética de coma flotante (IEEE 754) para conocer las especificaciones técnicas de la aritmética digital. Comprender estos fundamentos ayuda a tomar decisiones informadas al exportar modelos a formatos como ONNX o TensorRT para entornos de producción.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático