Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Reformer

Изучи архитектуру Reformer, эффективный вариант Transformer для длинных последовательностей. Узнай, как внимание LSH и RevNets оптимизируют память для исследований в области ИИ.

Reformer — это эффективная вариация архитектуры Transformer, предназначенная для обработки очень длинных последовательностей данных, которые были бы вычислительно непосильны для стандартных моделей. Разработанный для решения проблем с памятью, свойственных традиционным системам deep learning, Reformer снижает сложность attention mechanism с квадратичной до линейно-логарифмической. Это нововведение позволяет исследователям в области artificial intelligence обучать модели на контекстных окнах, охватывающих десятки тысяч токенов — например, целые книги, изображения высокого разрешения или длинные музыкальные произведения — на одном GPU.

Link to this sectionОсновные инновации Reformer#

Reformer достигает своей эффективности за счет двух основных архитектурных изменений, которые отличают его от таких моделей, как BERT, или оригинальной серии GPT. Эти методы решают проблему огромного объема памяти, необходимого для хранения активаций во время model training.

  • Locality-Sensitive Hashing (LSH) Attention: В стандартном Transformer каждый элемент в последовательности взаимодействует с каждым другим элементом, создавая огромную вычислительную нагрузку. Reformer использует Locality-Sensitive Hashing для группировки похожих векторов. Вместо вычисления оценок внимания для всех пар модель вычисляет их только для небольшой подгруппы nearest neighbors, что значительно ускоряет работу inference engine.
  • Reversible Residual Layers (RevNets): Традиционные neural networks должны сохранять активации для каждого слоя, чтобы вычислять градиенты во время backpropagation. Reformer использует обратимые нейронные сети, которые позволяют перевычислять входные данные слоя из его выходных данных во время обратного прохода. Этот метод устраняет необходимость кэширования промежуточных активаций, освобождая memory for larger batch sizes.

Link to this sectionReformer против стандартного Transformer#

Хотя обе архитектуры опираются на механизм self-attention, они выполняют разные задачи в экосистеме machine learning.

  • Стандартный Transformer: Отлично подходит для последовательностей короткой и средней длины. Однако его потребление памяти растет квадратично ($O(L^2)$) в зависимости от длины последовательности ($L$). Это основа многих Large Language Models (LLMs), используемых для таких задач, как sentiment analysis или чат-боты.
  • Reformer: Оптимизирован для экстремальных длин ($O(L \log L)$). Он жертвует небольшой частью accuracy в некоторых контекстах ради возможности обрабатывать входные данные, которые не под силу стандартным Transformer, например, обработка данных крайне длинных time series analysis или создание изображений попиксельно.

Link to this sectionРеальные приложения#

Способность Reformer работать с огромными контекстными окнами открывает новые возможности в областях, где данные сложно фрагментировать.

  1. Геномный анализ: ДНК-последовательности состоят из миллионов пар оснований. Reformer может анализировать эти длинные цепочки для выявления паттернов в bioinformatics без потери широкого контекста, помогая в предсказании структуры белков.

  2. Генерация длинных текстов: В отличие от стандартных моделей text generation, которые могут терять связность после нескольких абзацев, Reformer способен сохранять последовательность на протяжении тысяч слов, что делает его пригодным для создания сводок длинных юридических контрактов или целых глав романов.

Link to this sectionЭффективность в компьютерном зрении#

Хотя Reformer чаще ассоциируется с текстом, принцип эффективности критически важен в computer vision. Точно так же, как Reformer оптимизирует Transformer, современные модели компьютерного зрения, такие как YOLO26, оптимизируют сверточные нейронные сети (CNN) для real-time inference. Понимание ограничений памяти жизненно важно при развертывании моделей на периферийных устройствах через Ultralytics Platform, где аппаратные ресурсы ограничены.

Следующий код демонстрирует, как проверить использование памяти моделью с помощью PyTorch — концепция, занимающая центральное место в разработке энергоэффективных архитектур, таких как Reformer.

import torch
import torch.nn as nn

# Define a simple Transformer layer (Standard, not Reformer optimized)
layer = nn.TransformerEncoderLayer(d_model=512, nhead=8)
model = nn.TransformerEncoder(layer, num_layers=6)

# Create a long sequence input (Sequence Length: 2000, Batch: 1, Features: 512)
# Standard Transformers struggle as this length increases.
input_data = torch.rand(2000, 1, 512)

# Check parameter count to understand model complexity
params = sum(p.numel() for p in model.parameters())
print(f"Model Parameters: {params:,}")

# Perform a forward pass
output = model(input_data)
print(f"Output shape: {output.shape}")

Link to this sectionСвязанные концепции#

  • Sparse Attention: Более широкая категория методов, включая LSH, при которых модель обращает внимание только на подмножество токенов для экономии вычислительных ресурсов.
  • Gradient Checkpointing: Метод, похожий на использование обратимых слоев, применяемый для обмена вычислительного времени на память во время model training.
  • Model Optimization: Общая практика повышения эффективности моделей, которая включает в себя квантование, прунинг и архитектурные изменения, подобные тем, что реализованы в Reformer.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения