Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

GGUF

Découvre GGUF, le format efficace pour l'inférence LLM locale. Apprends comment il permet l'IA sur le matériel grand public et s'intègre avec la nouvelle Ultralytics Platform.

Le format GPT-Generated Unified Format (GGUF) est un format de fichier binaire hautement efficace, développé spécifiquement pour stocker et exécuter des Large Language Models (LLMs) ainsi que d'autres architectures d'artificial intelligence. Introduit à l'origine par le llama.cpp framework open-source, le GGUF permet une real-time inference rapide sur le matériel grand public standard, y compris les processeurs classiques et Apple Silicon. En réduisant considérablement les besoins en mémoire grâce à la model quantization, ce format rend la generative AI complexe accessible sans nécessiter de GPU de qualité entreprise coûteux.

Link to this sectionGGUF contre GGML#

Lorsque tu recherches ce qu'est un fichier GGUF, les praticiens le comparent souvent à son prédécesseur, le GGML. Bien que le GGML ait été fondamental pour apporter les modèles de langage à la périphérie, il souffrait d'un manque de rétrocompatibilité. La différence principale est que le GGUF résout ce problème en utilisant une structure clé-valeur pour les métadonnées, garantissant qu'à mesure que de nouvelles fonctionnalités de modèle sont ajoutées, les anciennes applications ne cessent pas de fonctionner. Cet avantage structurel permet un model deployment fluide dans divers environnements, tout comme les ingénieurs évaluent différentes model deployment options pour assurer la stabilité des systèmes en production.

Link to this sectionApplications concrètes#

Le GGUF est rapidement devenu une norme pour le développement d'IA locale. Voici deux façons concrètes dont il est utilisé aujourd'hui :

  • Local LLM Execution with Ollama : Un cas d'utilisation répandu consiste à exploiter le GGUF avec Ollama, une application légère qui simplifie l'exécution locale de modèles à poids ouverts. En chargeant un modèle GGUF, les développeurs peuvent créer des agents conversationnels axés sur la confidentialité qui fonctionnent entièrement hors ligne, ce qui est très bénéfique pour les applications d'edge computing sécurisées.
  • Image Generation via ComfyUI : Dans l'espace de l'IA visuelle, la communauté a largement adopté le chargeur UNet de ComfyUI pour le GGUF afin d'exécuter de grands modèles de diffusion. Cette innovation permet aux créateurs de générer des images de haute qualité sur du matériel grand public avec moins de VRAM, comblant ainsi de manière transparente le fossé entre les modèles de machine learning textuels et les pipelines de génération visuelle construits sur des bibliothèques structurelles comme PyTorch et TensorFlow.

Link to this sectionMise en œuvre technique et exemple de code#

Charger et interagir avec un fichier GGUF par programmation est simple en utilisant la bibliothèque llama-cpp-python library. Tout comme tu initialiserais un modèle de vision par ordinateur de pointe comme Ultralytics YOLO26 en utilisant un inference engine dédié, les modèles GGUF peuvent être chargés directement en mémoire pour une exécution immédiate des tâches.

from llama_cpp import Llama

# Load a quantized GGUF model for local CPU or GPU inference
llm = Llama(model_path="./model-q4_k_m.gguf", n_ctx=2048)

# Generate a response based on a prompt
output = llm("What is edge AI?", max_tokens=32)

# Print the generated text
print(output["choices"][0]["text"])

Link to this sectionPerspectives d'avenir et optimisation#

L'industrie de l'IA dans son ensemble, de la recherche de pointe menée par OpenAI et Anthropic jusqu'aux communautés de développeurs open-source, continue de repousser les limites de l'efficacité de l'inférence. Pour ceux qui travaillent à la fois sur des modalités textuelles et visuelles, gérer efficacement ces modèles fortement optimisés est primordial. L'utilisation de systèmes MLOps de bout en bout comme la Ultralytics Platform garantit que les développeurs peuvent tout gérer, de l'annotation automatisée des jeux de données et de l'entraînement dans le cloud jusqu'à l'étape finale de déploiement, maximisant ainsi les performances des applications modernes d'edge AI.

Pour obtenir des informations techniques plus fondamentales sur le fonctionnement de ces architectures linguistiques à grande échelle, envisage de lire la Wikipedia page on Large Language Models ou d'explorer les mécanismes de service avancés décrits dans la documentation officielle de vLLM documentation.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique