Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Representation Engineering (RepE)

Explora la Ingeniería de representaciones (RepE) para supervisar y controlar el comportamiento de la IA. Aprende a manipular los estados internos de Ultralytics YOLO26 para obtener modelos más seguros y dirigibles.

La Ingeniería de representaciones (RepE) es una metodología avanzada en aprendizaje automático que consiste en analizar y manipular directamente los estados cognitivos internos —o representaciones— de las redes neuronales para supervisar y controlar su comportamiento. Presentada como un enfoque de arriba hacia abajo para la seguridad de la IA y la alineación, RepE desplaza el enfoque de simplemente modificar las entradas o salidas de un modelo. En su lugar, lee y altera los estados ocultos internos de los grandes modelos de lenguaje y sistemas de visión durante la inferencia en tiempo real, lo que permite a los desarrolladores dirigir el modelo hacia conceptos deseados como la honestidad, la inocuidad o características visuales específicas sin necesidad de volver a entrenar la red.

Link to this sectionCómo funciona la Ingeniería de representaciones#

El concepto central de RepE, detallado exhaustivamente en el artículo sobre Ingeniería de representaciones del Center for AI Safety, se divide en dos fases principales: lectura y control.

Durante la fase de "lectura", los investigadores analizan cómo las capas ocultas de un modelo codifican conceptos específicos. Al observar las salidas de la función de activación en diferentes prompts o imágenes, los ingenieros pueden aislar la "dirección" específica en el espacio latente que corresponde a un concepto, como la veracidad o una clase de objeto concreta. Esto se basa en gran medida en la investigación sobre interpretabilidad mecánica de Anthropic, que busca realizar ingeniería inversa en redes neuronales.

En la fase de "control", estas representaciones aisladas se amplifican o suprimen artificialmente durante el pase hacia adelante (forward pass). Esta intervención altera eficazmente el comportamiento del modelo sobre la marcha, una técnica que se alinea estrechamente con las directrices de alineación y seguridad de OpenAI para crear sistemas de IA dirigibles y predecibles.

Link to this sectionDiferenciación de RepE respecto a conceptos relacionados#

Para entender RepE por completo, es importante distinguirla de otras técnicas comunes utilizadas en visión artificial y procesamiento de lenguaje natural:

Link to this sectionAplicaciones en el mundo real#

RepE está impulsando avances significativos en la creación de una IA robusta y controlable en múltiples dominios, respaldada por investigaciones de instituciones como la investigación del MIT CSAIL sobre interpretabilidad de redes neuronales:

  • Mitigación de alucinaciones en la IA: Al identificar la representación interna de la "veracidad", los ingenieros pueden potenciar artificialmente esta señal durante la inferencia. Esto se utiliza activamente para reducir la alucinación en LLM, asegurando que los chatbots proporcionen información factual en lugar de inventar respuestas.
  • Dirección de sistemas de visión multimodales: En modelos multimodales, RepE puede utilizarse para controlar el enfoque visual de un agente de IA. Por ejemplo, en la conducción autónoma, amplificar la representación interna de "peligros para peatones" puede obligar al modelo a priorizar detecciones críticas para la seguridad en entornos complejos, un área de enfoque destacada en las publicaciones del IEEE sobre transparencia de la IA.

Link to this sectionImplementación de la extracción de conceptos en modelos de visión#

Si bien la edición directa de activaciones requiere intervenciones matemáticas avanzadas, el primer paso de RepE (leer representaciones) puede realizarse utilizando marcos de trabajo de aprendizaje profundo modernos. Mediante el uso de la documentación de forward hooks de PyTorch, los desarrolladores pueden extraer los estados internos de modelos como Ultralytics YOLO26 para analizar cómo se codifican los conceptos visuales.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for state-of-the-art vision tasks
model = YOLO("yolo26n.pt")

# Access the underlying PyTorch model to register a forward hook
pytorch_model = model.model
internal_representations = []


# Define a hook function to capture the output of a specific hidden layer
def hook_fn(module, input, output):
    internal_representations.append(output)


# Attach the hook to a middle layer (e.g., layer index 5) to read representations
handle = pytorch_model.model[5].register_forward_hook(hook_fn)

# Run inference on an image to capture the cognitive state of the model
results = model("https://ultralytics.com/images/bus.jpg")

# The captured representations can now be analyzed for RepE steering
print(f"Captured latent representation shape: {internal_representations[0].shape}")

# Remove the hook to clean up memory
handle.remove()

A medida que los modelos se vuelven más complejos, las técnicas descritas en la guía de TensorFlow sobre aprendizaje de representaciones y la investigación de seguridad de Google DeepMind enfatizan que comprender y aplicar ingeniería a estos estados internos será fundamental para la próxima generación de arquitecturas de IA seguras y fiables.

Explore solutions

Real-time AI tailored to your operation

IA en la agricultura

Lleva la IA de visión a la agricultura inteligente con los modelos Ultralytics YOLO. Potencia el seguimiento de cultivos, el control de ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your operation

IA en la automoción

Aplica la visión artificial en la automoción con los modelos Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para lograr carreteras más inteligentes.

Más información
Real-time AI that works with your team

IA en el sector sanitario

Crea soluciones sanitarias con los modelos Ultralytics YOLO. La IA de visión en el sector sanitario potencia imágenes médicas más rápidas, diagnósticos más inteligentes y el seguimiento de pacientes.

Más información
Real-time AI that works with your team

IA en el comercio minorista

Reimagina el comercio minorista con los modelos Ultralytics YOLO. La IA de visión potencia el seguimiento de inventario, la supervisión de estanterías, la gestión de colas y conocimientos más inteligentes sobre los clientes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos YOLO de Ultralytics. La IA de visión impulsa el control de calidad, la detección de defectos, el cumplimiento de los EPI y la automatización de la línea de montaje.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial permite la inspección de paquetes, la clasificación, el seguimiento de vehículos y la supervisión de la seguridad en almacenes en tiempo real.

Más información
Real-time AI tailored to your operation

IA en la agricultura

Lleva la IA de visión a la agricultura inteligente con los modelos Ultralytics YOLO. Potencia el seguimiento de cultivos, el control de ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your operation

IA en la automoción

Aplica la visión artificial en la automoción con los modelos Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para lograr carreteras más inteligentes.

Más información
Real-time AI that works with your team

IA en el sector sanitario

Crea soluciones sanitarias con los modelos Ultralytics YOLO. La IA de visión en el sector sanitario potencia imágenes médicas más rápidas, diagnósticos más inteligentes y el seguimiento de pacientes.

Más información
Real-time AI that works with your team

IA en el comercio minorista

Reimagina el comercio minorista con los modelos Ultralytics YOLO. La IA de visión potencia el seguimiento de inventario, la supervisión de estanterías, la gestión de colas y conocimientos más inteligentes sobre los clientes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos YOLO de Ultralytics. La IA de visión impulsa el control de calidad, la detección de defectos, el cumplimiento de los EPI y la automatización de la línea de montaje.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial permite la inspección de paquetes, la clasificación, el seguimiento de vehículos y la supervisión de la seguridad en almacenes en tiempo real.

Más información
Real-time AI tailored to your operation

IA en la agricultura

Lleva la IA de visión a la agricultura inteligente con los modelos Ultralytics YOLO. Potencia el seguimiento de cultivos, el control de ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your operation

IA en la automoción

Aplica la visión artificial en la automoción con los modelos Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para lograr carreteras más inteligentes.

Más información
Real-time AI that works with your team

IA en el sector sanitario

Crea soluciones sanitarias con los modelos Ultralytics YOLO. La IA de visión en el sector sanitario potencia imágenes médicas más rápidas, diagnósticos más inteligentes y el seguimiento de pacientes.

Más información
Real-time AI that works with your team

IA en el comercio minorista

Reimagina el comercio minorista con los modelos Ultralytics YOLO. La IA de visión potencia el seguimiento de inventario, la supervisión de estanterías, la gestión de colas y conocimientos más inteligentes sobre los clientes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos YOLO de Ultralytics. La IA de visión impulsa el control de calidad, la detección de defectos, el cumplimiento de los EPI y la automatización de la línea de montaje.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial permite la inspección de paquetes, la clasificación, el seguimiento de vehículos y la supervisión de la seguridad en almacenes en tiempo real.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático