Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

Representation Engineering (RepE)

Esplora la Representation Engineering (RepE) per monitorare e controllare il comportamento dell'IA. Scopri come manipolare gli stati interni di Ultralytics YOLO26 per modelli più sicuri e controllabili.

La Representation Engineering (RepE) è una metodologia avanzata nel machine learning che prevede l'analisi e la manipolazione diretta degli stati cognitivi interni, o rappresentazioni, delle reti neurali per monitorare e controllare il loro comportamento. Introdotta come approccio top-down alla AI safety e all'allineamento, la RepE sposta l'attenzione dalla semplice modifica degli input o degli output di un modello. Invece, legge e altera gli stati nascosti interni di large language models e sistemi di visione durante la real-time inference, consentendo agli sviluppatori di orientare il modello verso concetti desiderati come onestà, innocuità o caratteristiche visive specifiche senza dover riaddestrare la rete.

Link to this sectionCome funziona la Representation Engineering#

Il concetto fondamentale della RepE, ampiamente dettagliato nel Representation Engineering paper by the Center for AI Safety, si divide in due fasi principali: lettura e controllo.

Durante la fase di "lettura", i ricercatori analizzano come i livelli nascosti di un modello codificano concetti specifici. Osservando gli output della activation function attraverso diversi prompt o immagini, gli ingegneri possono isolare la specifica "direzione" nello spazio latente che corrisponde a un concetto, come la veridicità o una specifica classe di oggetti. Questo si basa pesantemente sulla Anthropic's mechanistic interpretability research, che cerca di decodificare le reti neurali.

Nella fase di "controllo", queste rappresentazioni isolate vengono amplificate o soppresse artificialmente durante il forward pass. Questo intervento altera efficacemente il comportamento del modello al volo, una tecnica che si allinea strettamente con le OpenAI's alignment and safety guidelines per la creazione di sistemi di IA controllabili e prevedibili.

Link to this sectionDifferenziare la RepE dai concetti correlati#

Per comprendere appieno la RepE, è importante distinguerla da altre tecniche comuni utilizzate nella computer vision e nel natural language processing:

  • Prompt Engineering: Questo comporta l'elaborazione di input testuali o visivi specifici per guidare l'output del modello. La RepE non cambia l'input; altera il modo in cui il modello elabora l'input internamente.
  • Fine-Tuning: Il fine-tuning aggiorna permanentemente i model weights utilizzando un dataset personalizzato, spesso gestito tramite strumenti come la Ultralytics Platform. La RepE lascia intatti i pesi originali, applicando invece trasformazioni dinamiche alle attivazioni durante il runtime.
  • Feature Engineering: Un tradizionale passaggio di preparazione dei dati in cui esperti umani selezionano manualmente gli input dei dati. Come notato nella Wikipedia's entry on feature learning, la RepE lavora sulle caratteristiche che il modello ha già appreso autonomamente.

Link to this sectionApplicazioni nel mondo reale#

La RepE sta guidando progressi significativi nella creazione di un'IA robusta e controllabile in molteplici domini, supportata dalla ricerca di istituzioni come MIT CSAIL's research on neural network interpretability:

  • Mitigare le allucinazioni dell'IA: Identificando la rappresentazione interna di "veridicità", gli ingegneri possono potenziare artificialmente questo segnale durante l'inferenza. Questo viene utilizzato attivamente per ridurre l'hallucination in LLMs, assicurando che i chatbot forniscano informazioni fattuali invece di inventare risposte.
  • Controllare i sistemi di visione multimodali: Nei multi-modal models, la RepE può essere utilizzata per controllare il focus visivo di un agente IA. Ad esempio, nella guida autonoma, amplificare la rappresentazione interna dei "pericoli pedonali" può forzare il modello a dare priorità alle rilevazioni critiche per la sicurezza in ambienti complessi, un'area di interesse evidenziata nelle IEEE's publications on AI transparency.

Link to this sectionImplementare l'estrazione di concetti nei modelli di visione#

Sebbene la modifica diretta delle attivazioni richieda interventi matematici avanzati, il primo passo della RepE, ovvero la lettura delle rappresentazioni, può essere eseguito utilizzando moderni framework di deep learning. Utilizzando la PyTorch forward hooks documentation, gli sviluppatori possono estrarre gli stati interni di modelli come Ultralytics YOLO26 per analizzare come vengono codificati i concetti visivi.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for state-of-the-art vision tasks
model = YOLO("yolo26n.pt")

# Access the underlying PyTorch model to register a forward hook
pytorch_model = model.model
internal_representations = []


# Define a hook function to capture the output of a specific hidden layer
def hook_fn(module, input, output):
    internal_representations.append(output)


# Attach the hook to a middle layer (e.g., layer index 5) to read representations
handle = pytorch_model.model[5].register_forward_hook(hook_fn)

# Run inference on an image to capture the cognitive state of the model
results = model("https://ultralytics.com/images/bus.jpg")

# The captured representations can now be analyzed for RepE steering
print(f"Captured latent representation shape: {internal_representations[0].shape}")

# Remove the hook to clean up memory
handle.remove()

Man mano che i modelli diventano più complessi, le tecniche descritte nella TensorFlow's guide on representation learning e nella Google DeepMind's safety research sottolineano che comprendere e progettare questi stati interni sarà fondamentale per la prossima generazione di architetture di IA sicure e affidabili.

Explore solutions

Real-time AI tailored to your operation

IA in agricoltura

Porta l'IA visiva nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per raccolti più elevati e intelligenti.

Scopri di più
Real-time AI that works with your operation

IA nel settore automobilistico

Applica la computer vision nel settore automobilistico con i modelli Ultralytics YOLO. La Vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI that works with your team

IA nell'assistenza sanitaria

Sviluppa soluzioni sanitarie con i modelli Ultralytics YOLO. L'IA di visione nell'assistenza sanitaria potenzia l'imaging medico, la diagnostica più intelligente e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

AI nel settore retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI potenzia il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e offre insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

L'AI nella robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI potenzia il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della catena di montaggio.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. L'IA basata sulla visione artificiale consente l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio in tempo reale della sicurezza nei magazzini.

Scopri di più
Real-time AI tailored to your operation

IA in agricoltura

Porta l'IA visiva nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per raccolti più elevati e intelligenti.

Scopri di più
Real-time AI that works with your operation

IA nel settore automobilistico

Applica la computer vision nel settore automobilistico con i modelli Ultralytics YOLO. La Vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI that works with your team

IA nell'assistenza sanitaria

Sviluppa soluzioni sanitarie con i modelli Ultralytics YOLO. L'IA di visione nell'assistenza sanitaria potenzia l'imaging medico, la diagnostica più intelligente e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

AI nel settore retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI potenzia il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e offre insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

L'AI nella robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI potenzia il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della catena di montaggio.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. L'IA basata sulla visione artificiale consente l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio in tempo reale della sicurezza nei magazzini.

Scopri di più
Real-time AI tailored to your operation

IA in agricoltura

Porta l'IA visiva nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per raccolti più elevati e intelligenti.

Scopri di più
Real-time AI that works with your operation

IA nel settore automobilistico

Applica la computer vision nel settore automobilistico con i modelli Ultralytics YOLO. La Vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI that works with your team

IA nell'assistenza sanitaria

Sviluppa soluzioni sanitarie con i modelli Ultralytics YOLO. L'IA di visione nell'assistenza sanitaria potenzia l'imaging medico, la diagnostica più intelligente e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

AI nel settore retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI potenzia il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e offre insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

L'AI nella robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI potenzia il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della catena di montaggio.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. L'IA basata sulla visione artificiale consente l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio in tempo reale della sicurezza nei magazzini.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning