Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

ReLU (Rectified Linear Unit)

Изучи функцию активации ReLU (Rectified Linear Unit). Узнай, как она повышает эффективность нейронных сетей, предотвращает затухание градиентов и питает модели ИИ.

Rectified Linear Unit, обычно называемая ReLU, является одной из самых фундаментальных и широко используемых функций активации в области глубокого обучения. Выступая в роли математического привратника внутри нейронной сети (НС), ReLU определяет выход нейрона путем применения простого нелинейного преобразования: она пропускает положительные входные значения без изменений, одновременно преобразуя все отрицательные входные значения в ноль. Этот прямолинейный, но мощный механизм привносит в модели необходимую нелинейность, позволяя им изучать сложные закономерности и структуры в данных — то, чего не может достичь базовая линейная модель. Благодаря своей вычислительной эффективности и способности смягчать проблемы обучения, такие как проблема исчезающего градиента, ReLU стала выбором по умолчанию для скрытых слоев во многих современных архитектурах, включая сверточные нейронные сети (CNN).

Link to this sectionКак работает ReLU#

Основная логика ReLU удивительно проста по сравнению с другими математическими операциями, используемыми в машинном обучении (ML). Концептуально она действует как фильтр, который вносит разреженность в сеть. Принудительно обнуляя отрицательные входные данные, ReLU гарантирует, что в любой момент времени активна лишь часть нейронов. Эта разреженность имитирует то, как биологические нейроны срабатывают в человеческом мозге, и делает процесс обработки в сети более эффективным.

Преимущества использования ReLU:

  • Вычислительная эффективность: В отличие от функций, включающих сложные экспоненциальные вычисления, таких как Sigmoid или Tanh, ReLU требует лишь простой операции порогового значения. Эта скорость критически важна при обучении больших моделей на высокопроизводительном оборудовании, таком как GPU.
  • Улучшенный поток градиентов: Во время обратного распространения ошибки ReLU помогает поддерживать здоровый поток градиентов для положительных входных данных. Это решает проблему исчезающего градиента, при которой сигналы ошибки становятся слишком малы для эффективного обновления весов модели в глубоких сетях.
  • Разреженная активация: Выводя настоящий ноль для отрицательных значений, ReLU создает разреженные представления данных, что может упростить модель и снизить вероятность переобучения в некоторых контекстах.

Link to this sectionРеальные приложения#

ReLU служит двигателем для бесчисленных AI-приложений, особенно тех, которые требуют быстрой обработки высокоразмерных данных, таких как изображения и видео.

Link to this sectionВосприятие автономных транспортных средств#

В области автономных транспортных средств безопасность зависит от способности обнаруживать и классифицировать объекты в режиме реального времени. Системы восприятия полагаются на глубокие архитектуры (backbones) для идентификации пешеходов, светофоров и других автомобилей. ReLU широко используется в этих сетях для быстрого извлечения признаков, что способствует низкой задержке вывода. Эта скорость позволяет AI автомобиля мгновенно принимать критические решения во время движения.

Link to this sectionАнализ медицинских изображений#

AI в здравоохранении использует глубокое обучение для помощи радиологам в выявлении аномалий. Например, при анализе медицинских изображений модели анализируют МРТ-сканы для обнаружения опухолей. Нелинейность, обеспечиваемая ReLU, позволяет этим сетям с высокой точностью различать здоровую ткань и отклонения. Эта способность жизненно важна для таких наборов данных, как Brain Tumor Detection, где ранняя и точная диагностика улучшает результаты лечения пациентов.

Link to this sectionРеализация ReLU с помощью PyTorch#

Следующий пример демонстрирует, как применить активацию ReLU с помощью библиотеки torch, стандартного инструмента для глубокого обучения (DL). Заметь, как отрицательные значения во входном тензоре «выпрямляются» до нуля, в то время как положительные значения остаются линейными.

import torch
import torch.nn as nn

# Initialize the ReLU function
relu = nn.ReLU()

# Input data with a mix of positive and negative values
data = torch.tensor([-5.0, 0.0, 5.0, -1.2])

# Apply activation: Negatives become 0, Positives stay linear
output = relu(data)

print(f"Input:  {data}")
print(f"Output: {output}")
# Output: tensor([0., 0., 5., 0.])

Link to this sectionСравнение с родственными функциями активации#

Хотя ReLU является стандартом для многих задач, существуют специфические вариации и альтернативы, призванные устранить ее ограничения или оптимизировать производительность для конкретных сценариев.

  • ReLU против Leaky ReLU: Стандартная ReLU может страдать от проблемы «умирающей ReLU», когда нейрон застревает, выдавая ноль, и полностью перестает обучаться. Leaky ReLU решает эту проблему, допуская небольшой ненулевой градиент для отрицательных входных данных (например, умножение на 0.01), что гарантирует, что нейрон остается «живым» во время обучения.
  • ReLU против Sigmoid: Sigmoid сжимает выходные значения в диапазон от 0 до 1. Хотя это полезно для предсказания вероятностей на конечном выходном слое, сегодня ее редко используют в скрытых слоях, поскольку она вызывает исчезновение градиентов, замедляя обучение модели.
  • ReLU vs. SiLU (Sigmoid Linear Unit): SiLU is a smoother, probabilistic approximation of ReLU. It is often used in state-of-the-art architectures like YOLO26 because its smoothness can lead to better accuracy in deep layers, though it is slightly more computationally expensive than ReLU.

Link to this sectionДополнительные материалы и ресурсы#

Understanding activation functions is a key step in mastering neural network design. For those looking to dive deeper, the PyTorch documentation on ReLU offers technical specifications for implementation. Additionally, the original AlexNet paper provides historical context on how ReLU revolutionized computer vision. To experiment with training your own models using advanced activations, explore the Ultralytics Platform, which simplifies the workflow for annotating, training, and deploying vision models.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения