Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Attention Mechanism

Исследуй, как механизмы внимания революционизируют ИИ, имитируя человеческую фокусировку. Узнай, как компоненты Query, Key и Value повышают точность в Ultralytics YOLO26.

Механизм внимания — это фундаментальная технология в искусственном интеллекте (ИИ), имитирующая когнитивную способность человека фокусироваться на конкретных деталях, игнорируя нерелевантную информацию. В контексте глубокого обучения (DL) этот механизм позволяет нейронной сети (NN) динамически назначать разные уровни важности, или «веса», различным частям входных данных. Вместо того чтобы обрабатывать всё изображение или предложение с одинаковым акцентом, модель учится фокусироваться на наиболее значимых признаках — например, на конкретном слове в предложении для понимания контекста или на отдельном объекте в сложной визуальной сцене. Этот прорыв стал движущей силой архитектуры Transformer, которая произвела революцию в областях от обработки естественного языка (NLP) до продвинутого компьютерного зрения (CV).

Link to this sectionКак работает внимание#

Изначально разработанные для решения проблем нехватки памяти в рекуррентных нейронных сетях (RNN), механизмы внимания решают проблему исчезающего градиента, создавая прямые связи между удаленными частями последовательности данных. Этот процесс часто описывают с помощью аналогии поиска, включающей три компонента: Запросы (Queries), Ключи (Keys) и Значения (Values).

  • Запрос (Q): Представляет то, что модель ищет в данный момент (например, подлежащее в предложении).
  • Ключ (K): Выступает в роли идентификатора для информации, доступной во входных данных.
  • Значение (V): Содержит фактическое информационное наполнение.

Сравнивая запрос с различными ключами, модель вычисляет оценку внимания. Эта оценка определяет, какая часть значения будет извлечена и использована для формирования выходных данных. Это позволяет моделям эффективно обрабатывать дальние зависимости, понимая связи между точками данных независимо от расстояния между ними.

Link to this sectionРеальные приложения#

Механизмы внимания позволили достичь некоторых из самых заметных успехов в современных технологиях.

  • Машинный перевод: Системы вроде Google Translate полагаются на внимание для сопоставления слов между языками. При переводе «The black cat» (английский) на «Le chat noir» (французский), модель должна поменять порядок прилагательного и существительного. Внимание позволяет декодеру фокусироваться на «black» при генерации «noir» и на «cat» при генерации «chat», обеспечивая грамматическую точность.
  • Анализ медицинских изображений: В здравоохранении карты внимания помогают рентгенологам, выделяя подозрительные области на рентгеновских снимках или МРТ. Например, при диагностике аномалий в наборах данных опухолей головного мозга модель фокусирует вычислительную мощность на ткани опухоли, отфильтровывая здоровую мозговую ткань, что повышает точность диагностики.
  • Автономные транспортные средства: Беспилотные автомобили используют визуальное внимание, чтобы расставлять приоритеты для критически важных дорожных элементов. На оживленной улице система делает основной упор на пешеходов и сигналы светофора, рассматривая их как высокоприоритетные сигналы, в то время как статичным фоновым элементам, таким как небо или здания, уделяется меньше внимания.

Link to this sectionВнимание против свертки#

Важно отличать внимание от сверточных нейронных сетей (CNN). В то время как CNN обрабатывают данные локально, используя фиксированное окно (ядро) для обнаружения границ и текстур, механизмы внимания обрабатывают данные глобально, связывая каждую часть входных данных с любой другой.

  • Self-Attention (самовнимание): Особый тип внимания, при котором модель анализирует сама себя для понимания контекста внутри одной последовательности.
  • Эффективность: Модели на основе чистого внимания могут быть вычислительно затратными (квадратичная сложность). Современные методы оптимизации, такие как Flash Attention, более эффективно используют оборудование GPU для ускорения обучения.

Хотя передовые модели, такие как Ultralytics YOLO26, оптимизированы для инференса в реальном времени с использованием продвинутых структур CNN, гибридные архитектуры, такие как RT-DETR (Real-Time Detection Transformer), явно используют внимание для достижения высокой точности. Оба типа моделей можно легко обучать и развертывать с помощью Ultralytics Platform.

Link to this sectionПример кода#

Следующий пример на Python демонстрирует, как выполнять инференс с использованием RT-DETR, архитектуры модели, которая фундаментально опирается на механизмы внимания для обнаружения объектов.

from ultralytics import RTDETR

# Load a pre-trained RT-DETR model which uses attention mechanisms
# This model captures global context effectively compared to pure CNNs
model = RTDETR("rtdetr-l.pt")

# Perform inference on an image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Print the number of detections found via transformer attention
print(f"Detected {len(results[0].boxes)} objects using attention-based detection.")

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения