Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Representation Engineering (RepE)

Изучай Representation Engineering (RepE), чтобы отслеживать и контролировать поведение ИИ. Узнай, как управлять внутренними состояниями Ultralytics YOLO26 для создания более безопасных и управляемых моделей.

Representation Engineering (RepE) — это передовая методология в машинном обучении, которая включает анализ и прямое манипулирование внутренними когнитивными состояниями (или представлениями) нейронных сетей для мониторинга и контроля их поведения. Введенный как подход «сверху вниз» к AI safety и согласованию, RepE смещает фокус с простого изменения входных или выходных данных модели. Вместо этого он считывает и изменяет внутренние скрытые состояния large language models и систем компьютерного зрения во время real-time inference, позволяя разработчикам направлять модель к желаемым концепциям, таким как честность, безвредность или специфические визуальные признаки, без переобучения сети.

Link to this sectionКак работает Representation Engineering#

Основная концепция RepE, подробно описанная в фундаментальной Representation Engineering paper by the Center for AI Safety, делится на две основные фазы: чтение и управление.

Во время фазы «чтения» исследователи анализируют, как скрытые слои модели кодируют конкретные концепции. Наблюдая за выходными данными activation function для различных промптов или изображений, инженеры могут выделить специфическое «направление» в латентном пространстве, которое соответствует концепции, например, правдивости или конкретному классу объектов. Это основывается на Anthropic's mechanistic interpretability research, которая стремится к обратному проектированию нейронных сетей.

На фазе «управления» эти изолированные представления искусственно усиливаются или подавляются во время прямого прохода. Такое вмешательство эффективно меняет поведение модели «на лету» — метод, который тесно перекликается с OpenAI's alignment and safety guidelines по созданию управляемых и предсказуемых ИИ-систем.

Link to this sectionОтличие RepE от смежных концепций#

Чтобы полностью понять RepE, важно отличать его от других распространенных методов, используемых в computer vision и обработке естественного языка:

  • Prompt Engineering: Этот метод включает создание специфических текстовых или визуальных входных данных для управления выводом модели. RepE не меняет входные данные; он изменяет то, как модель обрабатывает их внутри.
  • Fine-Tuning: Fine-tuning постоянно обновляет model weights с использованием пользовательского набора данных, часто управляемого с помощью таких инструментов, как Ultralytics Platform. RepE оставляет исходные веса нетронутыми, вместо этого применяя динамические преобразования к активациям во время выполнения.
  • Feature Engineering: Традиционный этап подготовки данных, на котором эксперты вручную отбирают входные данные. Как отмечено в Wikipedia's entry on feature learning, RepE работает с признаками, которые модель уже выучила автономно.

Link to this sectionРеальные применения#

RepE способствует значительным достижениям в создании надежного и контролируемого ИИ во многих областях, что подтверждается исследованиями таких институтов, как MIT CSAIL's research on neural network interpretability:

  • Смягчение галлюцинаций ИИ: Идентифицируя внутреннее представление «правдивости», инженеры могут искусственно усиливать этот сигнал во время вывода. Это активно используется для уменьшения hallucination in LLMs, гарантируя, что чат-боты предоставляют фактическую информацию, а не выдумывают ответы.
  • Управление мультимодальными системами компьютерного зрения: В multi-modal models RepE можно использовать для контроля визуального фокуса ИИ-агента. Например, в автономном вождении усиление внутреннего представления «пешеходной опасности» может заставить модель приоритизировать критически важные для безопасности обнаружения в сложных средах, что является важной темой, освещенной в IEEE's publications on AI transparency.

Link to this sectionРеализация извлечения концепций в моделях компьютерного зрения#

Хотя прямое редактирование активаций требует продвинутых математических вмешательств, первый этап RepE — чтение представлений — можно выполнить с помощью современных фреймворков глубокого обучения. Используя PyTorch forward hooks documentation, разработчики могут извлекать внутренние состояния таких моделей, как Ultralytics YOLO26, чтобы анализировать, как кодируются визуальные концепции.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for state-of-the-art vision tasks
model = YOLO("yolo26n.pt")

# Access the underlying PyTorch model to register a forward hook
pytorch_model = model.model
internal_representations = []


# Define a hook function to capture the output of a specific hidden layer
def hook_fn(module, input, output):
    internal_representations.append(output)


# Attach the hook to a middle layer (e.g., layer index 5) to read representations
handle = pytorch_model.model[5].register_forward_hook(hook_fn)

# Run inference on an image to capture the cognitive state of the model
results = model("https://ultralytics.com/images/bus.jpg")

# The captured representations can now be analyzed for RepE steering
print(f"Captured latent representation shape: {internal_representations[0].shape}")

# Remove the hook to clean up memory
handle.remove()

По мере усложнения моделей методы, описанные в TensorFlow's guide on representation learning и Google DeepMind's safety research, подчеркивают, что понимание и проектирование этих внутренних состояний будут критически важны для следующего поколения безопасных и надежных ИИ-архитектур.

Explore solutions

Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ машинного зрения в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной индустрии

Применяй компьютерное зрение в автомобильной сфере с помощью моделей Ultralytics YOLO. ИИ для обработки изображений повышает безопасность дорожного движения, эффективность систем помощи водителю и автоматизацию транспортных средств, делая дороги умнее.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для компьютерного зрения в медицине ускоряет анализ медицинских изображений, делает диагностику точнее, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли розничную торговлю с моделями Ultralytics YOLO. ИИ машинного зрения обеспечивает отслеживание запасов, мониторинг полок, управление очередями и более глубокое понимание потребностей клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Расширяй возможности интеллектуальных машин с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с моделями Ultralytics YOLO. ИИ машинного зрения обеспечивает контроль качества, обнаружение дефектов, соблюдение требований к СИЗ и автоматизацию сборочных линий.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. ИИ для компьютерного зрения позволяет проверять посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность склада в реальном времени.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ машинного зрения в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной индустрии

Применяй компьютерное зрение в автомобильной сфере с помощью моделей Ultralytics YOLO. ИИ для обработки изображений повышает безопасность дорожного движения, эффективность систем помощи водителю и автоматизацию транспортных средств, делая дороги умнее.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для компьютерного зрения в медицине ускоряет анализ медицинских изображений, делает диагностику точнее, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли розничную торговлю с моделями Ultralytics YOLO. ИИ машинного зрения обеспечивает отслеживание запасов, мониторинг полок, управление очередями и более глубокое понимание потребностей клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Расширяй возможности интеллектуальных машин с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с моделями Ultralytics YOLO. ИИ машинного зрения обеспечивает контроль качества, обнаружение дефектов, соблюдение требований к СИЗ и автоматизацию сборочных линий.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. ИИ для компьютерного зрения позволяет проверять посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность склада в реальном времени.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ машинного зрения в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной индустрии

Применяй компьютерное зрение в автомобильной сфере с помощью моделей Ultralytics YOLO. ИИ для обработки изображений повышает безопасность дорожного движения, эффективность систем помощи водителю и автоматизацию транспортных средств, делая дороги умнее.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для компьютерного зрения в медицине ускоряет анализ медицинских изображений, делает диагностику точнее, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли розничную торговлю с моделями Ultralytics YOLO. ИИ машинного зрения обеспечивает отслеживание запасов, мониторинг полок, управление очередями и более глубокое понимание потребностей клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Расширяй возможности интеллектуальных машин с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с моделями Ultralytics YOLO. ИИ машинного зрения обеспечивает контроль качества, обнаружение дефектов, соблюдение требований к СИЗ и автоматизацию сборочных линий.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. ИИ для компьютерного зрения позволяет проверять посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность склада в реальном времени.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения