Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

ControlNet

Explore comment ControlNet fournit un contrôle spatial précis sur l'IA générative. Apprends à utiliser Ultralytics YOLO26 pour extraire des poses afin de guider la génération d'images dès aujourd'hui.

ControlNet est une architecture de réseau de neurones avancée conçue pour offrir un contrôle spatial précis sur les modèles d'IA générative de conversion de texte en image. Initialement introduite pour améliorer des modèles comme Stable Diffusion, elle permet aux utilisateurs de guider la génération d'images en utilisant des conditions d'entrée supplémentaires au-delà des simples invites textuelles. En alimentant le réseau avec des guides visuels spécifiques — tels que des cartes de contours, des cartes de profondeur ou des squelettes humains — les praticiens peuvent dicter la composition, la posture ou la structure exacte du résultat généré, comblant ainsi l'écart entre les descriptions en langage naturel et l'exécution visuelle précise.

Link to this sectionComment fonctionne l'architecture#

L'innovation fondamentale de ControlNet réside dans sa capacité à préserver les vastes connaissances pré-entraînées d'un modèle de fondation de base tout en apprenant de nouvelles tâches de conditionnement. Il y parvient en verrouillant les paramètres du bloc de réseau de neurones original et en créant un clone entraînable. Ce clone est connecté au modèle verrouillé à l'aide de couches de « convolution zéro » spécialisées, qui s'initialisent avec des poids nuls pour garantir qu'aucun bruit n'est ajouté pendant les premières étapes du fine-tuning. Tu peux en apprendre davantage sur la théorie mathématique et structurelle dans la publication de recherche originale sur ControlNet sur arXiv.

Cette structure unique permet aux développeurs d'entraîner des contrôles de conditionnement robustes sur du matériel grand public, ce qui le rend très accessible par rapport à l'entraînement d'un modèle de deep learning massif à partir de zéro.

Link to this sectionControlNet vs modèles de diffusion et LoRA#

Lorsque tu discutes d'intelligence artificielle générative, il est utile de distinguer ControlNet des concepts associés :

  • Modèles de diffusion : Ce sont les moteurs de base sous-jacents qui génèrent des images en éliminant itérativement le bruit. Ils reposent presque exclusivement sur des invites textuelles.
  • LoRA (Low-Rank Adaptation) : LoRA est une méthode pour enseigner rapidement à un modèle un nouveau style ou sujet (comme un personnage spécifique ou un style artistique). À l'inverse, ControlNet dicte l'agencement spatial exact de l'image.

Link to this sectionApplications concrètes#

ControlNet a considérablement élargi l'utilité de la computer vision et de l'IA générative dans les flux de travail professionnels.

  • Rendu de concept architectural : Les architectes et les designers d'intérieur utilisent ControlNet pour transformer des plans de conception assistée par ordinateur (CAO) de base en noir et blanc ou des croquis dessinés à la main en rendus photoréalistes de bâtiments et de pièces.
  • Pose de personnages dans le développement de jeux vidéo : Les animateurs exploitent des modèles d'estimation de pose humaine pour extraire des structures squelettiques à partir d'une vidéo de référence. Ces squelettes sont introduits dans ControlNet pour générer des sprites de personnages stylisés et cohérents conservant des poses exactes pour les ressources de jeux vidéo, réduisant ainsi considérablement le temps d'illustration manuelle.

Link to this sectionPréparation des conditions pour ControlNet#

Pour utiliser ControlNet efficacement, tu dois d'abord extraire la condition spatiale souhaitée à partir d'une image source. Par exemple, tu peux utiliser Ultralytics YOLO26, le dernier modèle de vision à la pointe de la technologie, pour extraire un squelette de pose humaine. Ce squelette est ensuite enregistré et utilisé comme entrée de conditionnement pour un pipeline de conversion de texte en image compatible avec ControlNet.

from ultralytics import YOLO

# Load the Ultralytics YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Perform inference to extract the human pose skeleton
results = model("character_reference.jpg")

# Save the resulting plotted skeleton to use as ControlNet input
results[0].save("pose_conditioning.jpg")

Que tu prépares des contours Canny à l'aide de fonctions OpenCV standard ou que tu extraies des masques de segmentation avancés, la préparation d'entrées de haute qualité est essentielle. Pour la gestion de jeux de données basés sur le cloud et l'annotation de données nécessaires pour entraîner des conditions ControlNet personnalisées, des plateformes comme l'Ultralytics Platform fournissent un environnement transparent et complet pour les équipes IA modernes.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique