Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

GGUF

Descubre GGUF, el formato eficiente para la inferencia local de LLM. Aprende cómo permite usar IA en hardware de consumo y se integra con la nueva plataforma Ultralytics.

GPT-Generated Unified Format (GGUF) es un formato de archivo binario altamente eficiente desarrollado específicamente para almacenar y ejecutar Large Language Models (LLMs) y otras arquitecturas de inteligencia artificial. Introducido originalmente por el framework de código abierto llama.cpp framework, GGUF permite una real-time inference rápida en hardware de consumo estándar, incluyendo CPUs estándar y Apple Silicon. Al reducir drásticamente los requisitos de memoria mediante la model quantization, este formato hace que la generative AI compleja sea accesible sin necesidad de costosas GPUs de nivel empresarial.

Link to this sectionGGUF frente a GGML#

Al investigar qué es un archivo GGUF, los profesionales a menudo lo comparan con su predecesor, GGML. Si bien GGML fue fundamental para llevar los modelos de lenguaje al edge, tuvo dificultades con la compatibilidad con versiones anteriores. La diferencia principal es que GGUF resuelve esto utilizando una estructura de clave-valor para los metadatos, asegurando que a medida que se añaden nuevas funcionalidades de modelo, las aplicaciones antiguas no fallen. Esta ventaja estructural permite una model deployment fluida en diversos entornos, de forma muy parecida a como los ingenieros evalúan diferentes model deployment options para garantizar la estabilidad en sistemas de producción.

Link to this sectionAplicaciones en el mundo real#

GGUF se ha convertido rápidamente en un estándar para el desarrollo local de IA. Aquí tienes dos formas concretas en las que se utiliza hoy en día:

  • Local LLM Execution with Ollama: Un caso de uso generalizado es aprovechar GGUF con Ollama, una aplicación ligera que simplifica la ejecución de modelos de pesos abiertos de forma local. Al cargar un modelo GGUF, los desarrolladores pueden construir agentes conversacionales centrados en la privacidad que operan completamente sin conexión, lo cual es muy beneficioso para aplicaciones seguras de edge computing.
  • Image Generation via ComfyUI: En el espacio de la IA visual, la comunidad ha adoptado en gran medida el cargador UNet de ComfyUI para GGUF con el fin de ejecutar modelos de difusión grandes. Esta innovación permite a los creadores generar imágenes de alta calidad en hardware de consumo con menor VRAM, salvando sin problemas la brecha entre los modelos de machine learning basados en texto y los pipelines de generación visual construidos sobre librerías estructurales como PyTorch y TensorFlow.

Link to this sectionImplementación técnica y ejemplo de código#

Cargar e interactuar con un archivo GGUF mediante programación es sencillo utilizando la librería llama-cpp-python library. De forma similar a como inicializarías un modelo de visión artificial de última generación como Ultralytics YOLO26 utilizando un inference engine dedicado, los modelos GGUF pueden cargarse directamente en la memoria para la ejecución inmediata de tareas.

from llama_cpp import Llama

# Load a quantized GGUF model for local CPU or GPU inference
llm = Llama(model_path="./model-q4_k_m.gguf", n_ctx=2048)

# Generate a response based on a prompt
output = llm("What is edge AI?", max_tokens=32)

# Print the generated text
print(output["choices"][0]["text"])

Link to this sectionPerspectivas futuras y optimización#

La industria de la IA en general, desde la investigación de vanguardia líder en OpenAI y Anthropic hasta las comunidades de desarrolladores de código abierto, sigue superando los límites de la eficiencia de inferencia. Para aquellos que trabajan tanto con modalidades de texto como visuales, gestionar estos modelos altamente optimizados de manera eficiente es primordial. El uso de sistemas MLOps de extremo a extremo como Ultralytics Platform garantiza que los desarrolladores puedan manejar todo, desde la anotación automatizada de datasets y el entrenamiento en la nube hasta la fase final de despliegue, maximizando el rendimiento de las aplicaciones modernas de edge AI.

Para obtener más antecedentes técnicos fundamentales sobre cómo funcionan estas arquitecturas de lenguaje a gran escala, considera leer la Wikipedia page on Large Language Models o explorar los mecanismos de servicio avanzados descritos en la vLLM documentation oficial.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático