Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Flash Attention

Узнай, как Flash Attention оптимизирует память и ускоряет модели трансформеров. Пойми, как это улучшает компьютерное зрение и почему Ultralytics YOLO26 — лучший выбор.

Flash Attention — это высокооптимизированный алгоритм, разработанный для ускорения обучения и вывода моделей Transformer за счет более эффективного управления доступом к памяти. В современном глубоком обучении (DL), особенно при работе с большими моделями, основным «бутылочным горлышком» зачастую является не скорость вычислений процессора, а время, затрачиваемое на перемещение данных между памятью и вычислительными блоками. Flash Attention решает проблему этого «барьера памяти», реорганизуя обработку данных механизмами внимания, что приводит к повышению производительности и снижению потребления памяти без ущерба для точности.

Link to this sectionКак работает Flash Attention#

Чтобы понять Flash Attention, полезно рассмотреть архитектуру GPU (графического процессора). У GPU есть высокоемкая, но медленная память HBM и малоемкая, но невероятно быстрая встроенная память SRAM. Стандартные реализации механизмов внимания постоянно читают и записывают большие матрицы в медленную HBM, что создает очередь операций.

Flash Attention использует метод «тайлинга» (tiling), чтобы разбивать большую матрицу внимания на блоки меньшего размера, которые полностью помещаются в быструю память SRAM. Сохраняя эти блоки в быстрой памяти и выполняя там больше вычислений перед записью результата обратно, алгоритм значительно сокращает количество операций чтения/записи в HBM. Это нововведение, представленное исследователями из Стэнфордского университета, делает процесс «IO-aware», то есть он учитывает затраты на перемещение данных. Ты можешь изучить технические детали в оригинальной исследовательской работе.

Link to this sectionОтличие от похожих терминов#

Важно отличать Flash Attention от похожих понятий в глоссарии искусственного интеллекта (AI):

  • Стандартное внимание: традиционная реализация, которая вычисляет полную матрицу внимания. Математически она идентична Flash Attention по результату, но зачастую работает медленнее и потребляет больше памяти, так как не оптимизирует ввод-вывод данных.
  • Flash Attention: точная оптимизация стандартного внимания. Она не дает приближенных результатов; ты получаешь точно такие же числовые значения, просто значительно быстрее.
  • Разреженное внимание (Sparse Attention): метод аппроксимации, который игнорирует определенные связи для экономии вычислительной мощности. В отличие от Flash Attention, методы разреженного внимания жертвуют частью точности ради скорости.

Link to this sectionАктуальность в Computer Vision и YOLO#

Хотя Flash Attention был изначально разработан для обработки естественного языка (NLP) для работы с длинными последовательностями текста, он стал критически важным в computer vision (CV). Изображения высокого разрешения создают огромные последовательности данных при обработке Vision Transformers (ViT).

Эта технология влияет на разработку детекторов объектов. Например, некоторые экспериментальные модели, такие как YOLO12, созданная сообществом, внедрили слои внимания, использующие эти принципы. Однако чисто архитектуры на основе внимания могут страдать от нестабильности при обучении и низкой скорости на CPU. Для большинства профессиональных задач рекомендуется стандарт Ultralytics YOLO26. YOLO26 использует высокооптимизированную архитектуру, которая балансирует скорость и точность для полноценного обнаружения объектов и сегментации изображений, избегая накладных расходов, часто связанных с тяжелыми слоями внимания на периферийных устройствах (edge devices).

Link to this sectionРеальные приложения#

Прирост эффективности от Flash Attention открывает возможности для приложений, которые раньше были слишком дорогими или медленными для запуска.

  1. Генеративный AI с длинным контекстом: В мире больших языковых моделей (LLM), таких как GPT-4, Flash Attention позволяет модели «запоминать» огромные объемы информации. Это обеспечивает массивное контекстное окно, позволяя тебе загружать целые книги или базы программного кода для суммаризации текста, не опасаясь, что модель «упадет» из-за ограничений памяти.

  2. Медицинская диагностика высокого разрешения: В анализе медицинских изображений детали имеют значение. Патологоанатомы анализируют гигапиксельные сканы образцов тканей. Flash Attention позволяет моделям обрабатывать эти огромные изображения в их исходном разрешении, идентифицируя крошечные аномалии, такие как опухоли головного мозга на ранней стадии, без уменьшения размера изображения и потери жизненно важных данных.

Link to this sectionПример кода#

Хотя Flash Attention часто является внутренней оптимизацией в библиотеках вроде PyTorch, ты можешь легко использовать модели на основе внимания с помощью Ultralytics. Следующий фрагмент кода показывает, как загрузить модель RT-DETR, которая использует механизмы внимания, для выполнения вывода на изображении.

from ultralytics import RTDETR

# Load a pre-trained RT-DETR model which utilizes transformer attention
model = RTDETR("rtdetr-l.pt")

# Perform inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the number of detected objects
print(f"Detected {len(results[0].boxes)} objects.")

Используя такие инструменты, как Ultralytics Platform, разработчики могут обучать и развертывать эти сложные модели, не внедряя вручную сложные ядра GPU. Платформа берет на себя всю инфраструктуру, позволяя твоей команде сосредоточиться на подготовке качественных наборов данных и интерпретации результатов.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения