Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Linear Attention

Узнай, как линейное внимание оптимизирует модели глубокого обучения, снижая сложность Transformer до O(N). Пойми, как оно повышает эффективность для AI-приложений.

Линейное внимание — это фундаментальный метод оптимизации, разработанный для значительного повышения вычислительной эффективности современных моделей глубинного обучения (DL). В традиционных архитектурах Transformer стандартные механизмы внимания обрабатывают последовательности, сравнивая каждый токен с каждым другим. Это создает серьезное ограничение по вычислительным ресурсам и памяти, известное как квадратичная временная сложность, или O(N в квадрате), где N — длина последовательности. Линейное внимание меняет эту базовую математическую операцию так, что она масштабируется линейно, или O(N). Этот прорыв позволяет моделям в искусственном интеллекте (AI) обрабатывать огромные наборы данных, такие как целые книги или гигапиксельные изображения, не исчерпывая память оборудования.

Link to this sectionКак работает линейное внимание#

В стандартном внимании нейронные сети обрабатывают три основных вектора: запросы (Queries, Q), ключи (Keys, K) и значения (Values, V). Классическая формула вычисляет сходство между всеми запросами и ключами с помощью функции softmax, создавая массивную матрицу N x N перед умножением её на значения.

Линейное внимание позволяет избежать создания этой массивной промежуточной матрицы. Вместо этого оно опирается на ассоциативное свойство умножения матриц. Отбрасывая или аппроксимируя слой softmax с помощью специализированных ядерных функций, модель группирует умножение иначе. Сначала она перемножает ключи и значения, чтобы создать контекстную матрицу фиксированного размера, а затем умножает запросы на эту новую сжатую матрицу. Такая простая перестановка значительно снижает вычислительную сложность, освобождая оборудование, например GPU (графический процессор), для нативной обработки гораздо более длинных входных данных.

Link to this sectionПоследние разработки и DeltaNet#

Сообщество исследователей AI под руководством таких институтов, как Стэнфордский университет, и технологических гигантов, таких как Google DeepMind, постоянно внедряет инновации в линейные формулировки для повышения точности. В 2024 и 2025 годах исследователи представили DeltaNet — новую архитектуру, которая заменяет стандартные аддитивные обновления в линейных трансформерах на «Delta Rule». Это позволяет сети обновлять внутреннюю память относительно того, что уже сохранено, а не вычислять абсолютные значения с нуля.

Последующие достижения, такие как архитектуры Gated DeltaNet, вводят поканальные коэффициенты затухания, позволяя моделям избирательно забывать или сохранять специфические ключевые признаки с течением времени. Эти эффективные с точки зрения оборудования инновации сокращают разрыв в производительности между линейными трансформерами и традиционным вниманием softmax, особенно в сложных задачах поиска в контексте.

Link to this sectionЛинейное внимание в сравнении с другими механизмами внимания#

Понимание того, чем этот метод отличается от связанных концепций внутри более широкого семейства механизмов внимания, критически важно для AI-инженеров, оптимизирующих свои сети:

  • Self-Attention: Базовый механизм, который использует полную, вычислительно затратную матрицу softmax сO(N в квадрате) для захвата идеального глобального контекста.
  • Flash Attention: Оптимизация, учитывающая особенности ввода-вывода (IO-aware), которая ускоряет точные вычисления self-attention O(N в квадрате) за счет эффективного перемещения данных между уровнями памяти GPU. В отличие от линейного внимания, Flash Attention не меняет лежащую в основе математическую формулу.
  • Sparse Attention: Метод, который экономит память, заставляя сеть смотреть только на локализованное окно соседних токенов, в то время как линейное внимание математически сжимает весь глобальный обзор в фиксированное состояние.

Link to this sectionРеальные приложения#

Преодоление барьера длины последовательности открывает мощные возможности в различных областях AI:

Link to this sectionПример кода#

Современные фреймворки, такие как PyTorch и TensorFlow, делают реализацию этих математических концепций простой. Ниже приведен концептуальный фрагмент PyTorch, демонстрирующий, как линейное внимание меняет порядок умножения матриц для достижения эффективности O(N).

import torch
import torch.nn as nn
import torch.nn.functional as F


class SimpleLinearAttention(nn.Module):
    def __init__(self, dim):
        super().__init__()
        self.qkv = nn.Linear(dim, dim * 3)

    def forward(self, x):
        # x shape: (Batch, Sequence Length, Channels)
        q, k, v = self.qkv(x).chunk(3, dim=-1)

        # Apply an activation function as a kernel approximation (replaces softmax)
        q = F.elu(q) + 1.0
        k = F.elu(k) + 1.0

        # Associative trick: Multiply Key and Value first (O(N) complexity)
        # k^T @ v yields a fixed (Batch, Channels, Channels) matrix
        kv_context = torch.matmul(k.transpose(-2, -1), v)

        # Multiply Query by the fixed context matrix to get the final output
        return torch.matmul(q, kv_context)


# Example: Processing a sequence of 1024 tokens
model = SimpleLinearAttention(dim=64)
dummy_input = torch.randn(1, 1024, 64)
output = model(dummy_input)
print(f"Output shape: {output.shape}")

Хотя экспериментальные модели сообщества могут включать различные слои линейного или разреженного внимания, они часто страдают от низкой скорости CPU или нестабильности обучения. Для надежных, готовых к эксплуатации решений в области компьютерного зрения рекомендуется стандарт Ultralytics YOLO26. Он оснащен высокооптимизированной архитектурой, работающей нативно от начала до конца (end-to-end), что максимизирует скорость и точность для критически важных задач, таких как обнаружение объектов, без использования тяжелых слоев внимания. Ты можешь легко размечать наборы данных, обучать, развертывать и отслеживать эти передовые модели с помощью комплексной платформы Ultralytics.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения