Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

Representation Engineering (RepE)

Explore la Representation Engineering (RepE) pour surveiller et contrôler le comportement de l'IA. Apprends à manipuler les états internes de Ultralytics YOLO26 pour obtenir des modèles plus sûrs et pilotables.

La Representation Engineering (RepE) est une méthodologie avancée en machine learning qui consiste à analyser et à manipuler directement les états cognitifs internes — ou représentations — des réseaux de neurones pour surveiller et contrôler leur comportement. Présentée comme une approche descendante de la sécurité de l'IA et de l'alignement, la RepE déplace l'attention de la simple modification des entrées ou sorties d'un modèle. Au lieu de cela, elle lit et modifie les états cachés internes des grands modèles de langage et des systèmes de vision pendant l'inférence en temps réel, permettant aux développeurs de diriger le modèle vers des concepts souhaités tels que l'honnêteté, l'absence de danger ou des caractéristiques visuelles spécifiques sans avoir à réentraîner le réseau.

Link to this sectionComment fonctionne la Representation Engineering#

Le concept central de la RepE, détaillé de manière approfondie dans le document fondateur Representation Engineering paper by the Center for AI Safety, est divisé en deux phases principales : la lecture et le contrôle.

Pendant la phase de « lecture », les chercheurs analysent la manière dont les couches cachées d'un modèle encodent des concepts spécifiques. En observant les sorties de la fonction d'activation pour différents prompts ou images, les ingénieurs peuvent isoler la « direction » spécifique dans l'espace latent qui correspond à un concept, comme la véracité ou une classe d'objet spécifique. Cela s'appuie fortement sur les recherches en interprétabilité mécaniste d'Anthropic, qui cherchent à effectuer une rétro-ingénierie des réseaux de neurones.

Dans la phase de « contrôle », ces représentations isolées sont artificiellement amplifiées ou supprimées pendant la propagation avant. Cette intervention modifie efficacement le comportement du modèle à la volée, une technique qui s'aligne étroitement sur les directives d'alignement et de sécurité d'OpenAI pour la création de systèmes d'IA pilotables et prévisibles.

Link to this sectionDifférencier la RepE des concepts associés#

Pour comprendre pleinement la RepE, il est important de la distinguer d'autres techniques couramment utilisées en vision par ordinateur et en traitement du langage naturel :

  • Prompt Engineering : Cela implique l'élaboration d'entrées textuelles ou visuelles spécifiques pour guider la sortie du modèle. La RepE ne modifie pas l'entrée ; elle change la manière dont le modèle traite l'entrée en interne.
  • Fine-Tuning : Le fine-tuning met à jour de façon permanente les poids du modèle en utilisant un jeu de données personnalisé, souvent géré via des outils tels que la plateforme Ultralytics. La RepE laisse les poids originaux intacts, appliquant plutôt des transformations dynamiques aux activations lors de l'exécution.
  • Feature Engineering : Une étape traditionnelle de préparation des données où des experts humains sélectionnent manuellement les entrées de données. Comme noté dans l'entrée Wikipedia sur l'apprentissage des caractéristiques, la RepE travaille sur les caractéristiques que le modèle a déjà apprises de manière autonome.

Link to this sectionApplications concrètes#

La RepE favorise des avancées significatives dans la création d'une IA robuste et contrôlable dans de multiples domaines, soutenue par les recherches d'institutions comme les recherches du MIT CSAIL sur l'interprétabilité des réseaux de neurones :

  • Atténuer les hallucinations de l'IA : En identifiant la représentation interne de la « véracité », les ingénieurs peuvent amplifier artificiellement ce signal pendant l'inférence. Ceci est activement utilisé pour réduire les hallucinations dans les LLM, en garantissant que les chatbots fournissent des informations factuelles plutôt que de fabriquer des réponses.
  • Piloter des systèmes de vision multimodaux : Dans les modèles multimodaux, la RepE peut être utilisée pour contrôler la mise au point visuelle d'un agent IA. Par exemple, dans la conduite autonome, amplifier la représentation interne des « dangers liés aux piétons » peut forcer le modèle à prioriser les détections critiques pour la sécurité dans des environnements complexes, une zone de focalisation soulignée dans les publications de l'IEEE sur la transparence de l'IA.

Link to this sectionMise en œuvre de l'extraction de concepts dans les modèles de vision#

Bien que la modification directe des activations nécessite des interventions mathématiques avancées, la première étape de la RepE — la lecture des représentations — peut être effectuée en utilisant des frameworks de deep learning modernes. En utilisant la documentation des forward hooks de PyTorch, les développeurs peuvent extraire les états internes de modèles comme Ultralytics YOLO26 pour analyser comment les concepts visuels sont encodés.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for state-of-the-art vision tasks
model = YOLO("yolo26n.pt")

# Access the underlying PyTorch model to register a forward hook
pytorch_model = model.model
internal_representations = []


# Define a hook function to capture the output of a specific hidden layer
def hook_fn(module, input, output):
    internal_representations.append(output)


# Attach the hook to a middle layer (e.g., layer index 5) to read representations
handle = pytorch_model.model[5].register_forward_hook(hook_fn)

# Run inference on an image to capture the cognitive state of the model
results = model("https://ultralytics.com/images/bus.jpg")

# The captured representations can now be analyzed for RepE steering
print(f"Captured latent representation shape: {internal_representations[0].shape}")

# Remove the hook to clean up memory
handle.remove()

À mesure que les modèles deviennent plus complexes, les techniques décrites dans le guide de TensorFlow sur l'apprentissage par représentation et les recherches sur la sécurité de Google DeepMind soulignent que la compréhension et l'ingénierie de ces états internes seront essentielles pour la prochaine génération d'architectures d'IA sûres et fiables.

Explore solutions

Real-time AI tailored to your operation

L'IA dans l'agriculture

Apporte l'IA visuelle à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your operation

L'IA dans le secteur automobile

Applique la vision par ordinateur au secteur automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance au conducteur et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI that works with your team

L'IA dans le secteur de la santé

Crée tes solutions de santé avec les modèles Ultralytics YOLO. L'IA visuelle dans le secteur de la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et un meilleur suivi des patients.

En savoir plus
Real-time AI that works with your team

L'IA dans le secteur du commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. L'IA visuelle propulse le suivi des stocks, la surveillance des rayons, la gestion des files d'attente et des analyses client plus intelligentes.

En savoir plus
Real-time AI that works with your team

L'IA en robotique

Booste tes machines intelligentes avec les modèles Ultralytics YOLO. L'IA visuelle en robotique permet la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. L'IA visuelle permet le contrôle qualité, la détection de défauts, la conformité des EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Optimise ta logistique avec les modèles Ultralytics YOLO. L'IA par vision permet l'inspection de colis, le tri, le suivi de véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI tailored to your operation

L'IA dans l'agriculture

Apporte l'IA visuelle à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your operation

L'IA dans le secteur automobile

Applique la vision par ordinateur au secteur automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance au conducteur et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI that works with your team

L'IA dans le secteur de la santé

Crée tes solutions de santé avec les modèles Ultralytics YOLO. L'IA visuelle dans le secteur de la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et un meilleur suivi des patients.

En savoir plus
Real-time AI that works with your team

L'IA dans le secteur du commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. L'IA visuelle propulse le suivi des stocks, la surveillance des rayons, la gestion des files d'attente et des analyses client plus intelligentes.

En savoir plus
Real-time AI that works with your team

L'IA en robotique

Booste tes machines intelligentes avec les modèles Ultralytics YOLO. L'IA visuelle en robotique permet la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. L'IA visuelle permet le contrôle qualité, la détection de défauts, la conformité des EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Optimise ta logistique avec les modèles Ultralytics YOLO. L'IA par vision permet l'inspection de colis, le tri, le suivi de véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI tailored to your operation

L'IA dans l'agriculture

Apporte l'IA visuelle à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your operation

L'IA dans le secteur automobile

Applique la vision par ordinateur au secteur automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance au conducteur et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI that works with your team

L'IA dans le secteur de la santé

Crée tes solutions de santé avec les modèles Ultralytics YOLO. L'IA visuelle dans le secteur de la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et un meilleur suivi des patients.

En savoir plus
Real-time AI that works with your team

L'IA dans le secteur du commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. L'IA visuelle propulse le suivi des stocks, la surveillance des rayons, la gestion des files d'attente et des analyses client plus intelligentes.

En savoir plus
Real-time AI that works with your team

L'IA en robotique

Booste tes machines intelligentes avec les modèles Ultralytics YOLO. L'IA visuelle en robotique permet la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. L'IA visuelle permet le contrôle qualité, la détection de défauts, la conformité des EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Optimise ta logistique avec les modèles Ultralytics YOLO. L'IA par vision permet l'inspection de colis, le tri, le suivi de véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique