Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

GGUF

Scopri GGUF, il formato efficiente per l'inferenza LLM locale. Impara come abilita l'IA su hardware consumer e si integra con la nuova Ultralytics Platform.

Il GPT-Generated Unified Format (GGUF) è un formato di file binario altamente efficiente sviluppato specificamente per archiviare ed eseguire Large Language Models (LLMs) e altre architetture di intelligenza artificiale. Originariamente introdotto dal framework llama.cpp open-source, GGUF abilita una rapida inferenza in tempo reale su hardware consumer standard, inclusi CPU comuni e Apple Silicon. Riducendo drasticamente i requisiti di memoria tramite la quantizzazione del modello, questo formato rende accessibile la generative AI complessa senza richiedere costose GPU di livello enterprise.

Link to this sectionGGUF contro GGML#

Quando cerchi di capire cosa sia un file GGUF, spesso lo confronterai con il suo predecessore, GGML. Sebbene GGML sia stato fondamentale per portare i modelli linguistici sull'edge, ha avuto difficoltà con la retrocompatibilità. La differenza principale è che GGUF risolve questo problema utilizzando una struttura chiave-valore per i metadati, assicurando che, man mano che vengono aggiunte nuove funzionalità al modello, le applicazioni meno recenti non smettano di funzionare. Questo vantaggio strutturale consente un deployment del modello fluido in vari ambienti, proprio come gli ingegneri valutano diverse opzioni di deployment del modello per garantire stabilità nei sistemi di produzione.

Link to this sectionApplicazioni nel mondo reale#

GGUF è diventato rapidamente uno standard per lo sviluppo di IA locale. Ecco due modi concreti in cui viene utilizzato oggi:

  • Esecuzione locale di LLM con Ollama: Un caso d'uso diffuso è sfruttare GGUF con Ollama, un'applicazione leggera che semplifica l'esecuzione locale di modelli open-weight. Caricando un modello GGUF, puoi creare agenti conversazionali focalizzati sulla privacy che operano completamente offline, il che è estremamente vantaggioso per applicazioni di edge computing sicure.
  • Generazione di immagini tramite ComfyUI: Nello spazio dell'IA visiva, la community ha adottato pesantemente il caricatore UNet di ComfyUI per GGUF per eseguire modelli di diffusione di grandi dimensioni. Questa innovazione consente ai creatori di generare immagini di alta qualità su hardware consumer con VRAM limitata, colmando perfettamente il divario tra modelli di machine learning basati su testo e pipeline di generazione visiva costruite su librerie strutturali come PyTorch e TensorFlow.

Link to this sectionImplementazione tecnica ed esempio di codice#

Caricare e interagire con un file GGUF a livello programmatico è semplice utilizzando la libreria llama-cpp-python. Proprio come inizializzeresti un modello di computer vision all'avanguardia come Ultralytics YOLO26 utilizzando un motore di inferenza dedicato, i modelli GGUF possono essere caricati direttamente in memoria per l'esecuzione immediata dei task.

from llama_cpp import Llama

# Load a quantized GGUF model for local CPU or GPU inference
llm = Llama(model_path="./model-q4_k_m.gguf", n_ctx=2048)

# Generate a response based on a prompt
output = llm("What is edge AI?", max_tokens=32)

# Print the generated text
print(output["choices"][0]["text"])

Link to this sectionProspettive future e ottimizzazione#

L'industria dell'IA nel suo complesso, dalla ricerca di frontiera condotta da OpenAI e Anthropic alle community di sviluppatori open-source, continua a spingere i confini dell'efficienza dell'inferenza. Per chi lavora sia con modalità testuali che visive, gestire questi modelli altamente ottimizzati in modo efficiente è fondamentale. L'utilizzo di sistemi MLOps end-to-end come la Ultralytics Platform assicura che tu possa gestire tutto, dall'annotazione automatizzata dei dataset e l'addestramento in cloud fino alla fase finale di deployment, massimizzando le prestazioni delle moderne applicazioni di edge AI.

Per un background tecnico più approfondito su come funzionano queste architetture linguistiche su larga scala, considera la lettura della pagina Wikipedia sui Large Language Models o l'esplorazione dei meccanismi di serving avanzati descritti nella documentazione ufficiale di vLLM.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning