Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

QLoRA

Descubre cómo QLoRA (Quantized Low-Rank Adaptation) permite un ajuste eficiente de LLM en GPUs de consumo mediante cuantización de 4 bits para ahorrar memoria GPU.

QLoRA (Quantized Low-Rank Adaptation) es una técnica de optimización avanzada utilizada en deep learning diseñada para hacer que el fine-tuning de large language models (LLMs) masivos sea altamente eficiente. Introducida por primera vez en un artículo de investigación en arXiv ampliamente citado, QLoRA reduce drásticamente los requisitos de memoria de GPU necesarios para actualizar modelos que contienen miles de millones de parámetros.

Al aprovechar la model quantization agresiva hasta una precisión de 4 bits, los desarrolladores ahora pueden optimizar potentes modelos base creados originalmente por organizaciones como OpenAI o Anthropic utilizando consumer-grade GPUs estándar. Este avance democratiza el acceso a la generative AI de última generación sin exigir costosos clústeres de servidores de nivel empresarial.

Link to this sectionCómo funciona QLoRA#

La innovación principal de QLoRA reside en sus técnicas de ahorro de memoria, construidas principalmente sobre los conceptos fundamentales que se encuentran en las PyTorch quantization methodologies. Introduce un tipo de datos novedoso llamado 4-bit NormalFloat (NF4), que está optimizado matemáticamente para manejar pesos de modelo distribuidos normalmente sin degradar significativamente las capacidades predictivas de la red.

Además, QLoRA emplea una estrategia conocida como Double Quantization, una técnica reconocida en la machine learning research más amplia que cuantiza las propias constantes de cuantización, eliminando aún más el uso innecesario de memoria. Mientras que el modelo base masivo preentrenado permanece congelado en un estado comprimido de 4 bits, se insertan pequeños adaptadores entrenables en las capas de la red. Cuando ocurre la backpropagation durante el neural network training, los gradientes se pasan a través de los pesos congelados de 4 bits para actualizar solo estos adaptadores pequeños y altamente eficientes.

Link to this sectionQLoRA frente a LoRA: Entendiendo las diferencias#

Al explorar el parameter-efficient fine-tuning (PEFT), los usuarios a menudo se preguntan en qué se diferencia QLoRA del LoRA (Low-Rank Adaptation) tradicional. LoRA estándar congela los pesos originales del modelo y entrena matrices de bajo rango para adaptar el modelo a nuevos datos. Sin embargo, normalmente mantiene el modelo base en una precisión de 16 o 32 bits. QLoRA da un paso crucial más allá al comprimir el modelo base a una precisión de 4 bits antes de aplicar los adaptadores LoRA. Esto reduce drásticamente la huella de memoria, permitiendo que un modelo de 65 mil millones de parámetros quepa en una sola GPU de 48 GB, una hazaña matemáticamente imposible con LoRA estándar.

Link to this sectionAplicaciones en el mundo real#

  • Enterprise Chatbots and Assistants: Las empresas utilizan rutinariamente QLoRA para realizar el fine-tuning de modelos de código abierto como Meta's Llama 3 con datos comerciales propietarios. Esto permite a las organizaciones crear asistentes de IA altamente precisos y específicos del dominio que operan en infraestructura de cloud computing local y segura sin costos de hardware exorbitantes.
  • Edge AI Deployments: A medida que los modelos basados en texto se expanden a dominios visuales a través de vision-language models (VLMs), QLoRA permite a los desarrolladores adaptar arquitecturas multimodales masivas para entornos con restricciones de hardware. Estas optimizaciones ligeras son utilizadas intensamente por equipos de investigación en Google AI para llevar capacidades de razonamiento avanzadas a teléfonos móviles y sensores remotos.

Link to this sectionEntrenamiento eficiente en visión por computadora#

La filosofía subyacente de QLoRA (maximizar la precisión matemática mientras se minimizan las demandas de hardware) se comparte en todos los flujos de trabajo modernos de computer vision (CV). Por ejemplo, Ultralytics YOLO26 está diseñado de forma nativa para aprender de manera eficiente y desplegarse instantáneamente en dispositivos edge de bajo consumo. Los desarrolladores que trabajan con conjuntos de datos de visión complejos pueden aprovechar la Ultralytics Platform para un cloud training fluido, que gestiona inherentemente la optimización de memoria y el tamaño de los lotes.

A continuación se muestra un ejemplo práctico de cómo puedes entrenar un modelo de visión eficiente utilizando Automatic Mixed Precision (AMP), un concepto estrechamente relacionado con los objetivos de ahorro de memoria de QLoRA:

from ultralytics import YOLO

# Load the highly efficient Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model utilizing mixed-precision (amp) to save GPU memory
# Similar to QLoRA, this optimizes hardware resources during training runs
results = model.train(data="coco8.yaml", epochs=10, imgsz=640, amp=True)

Al confiar en un manejo robusto de datos y automatic gradient scaling algorithms, los modelos se entrenan más rápido y encajan fácilmente en GPUs estándar, acelerando el camino para deploying computer vision models exitosamente en entornos de producción empresarial.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático