Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Leaky ReLU

Изучи, как Leaky ReLU решает проблему «умирающего ReLU» в нейронных сетях. Узнай о преимуществах для GAN, граничного ИИ (edge AI) и о том, как это соотносится с моделями Ultralytics YOLO26.

Leaky ReLU — это специализированный вариант стандартной функции активации Rectified Linear Unit, используемый в моделях глубокого обучения. В то время как стандартная ReLU приравнивает все отрицательные входные значения ровно к нулю, Leaky ReLU вводит небольшой ненулевой наклон для отрицательных входных данных. Эта тонкая модификация позволяет небольшому количеству информации проходить через сеть, даже когда нейрон не активен, что решает критическую проблему, известную как «умирающая ReLU». Поддерживая непрерывный градиент, эта функция помогает нейронным сетям обучаться более устойчиво на этапе обучения, особенно в глубоких архитектурах, используемых для таких сложных задач, как распознавание изображений и обработка естественного языка.

Link to this sectionРешение проблемы «умирающей» ReLU#

Чтобы понять необходимость Leaky ReLU, полезно сначала взглянуть на ограничения стандартной функции активации ReLU. В стандартной настройке, если нейрон получает отрицательный вход, он выдает ноль. В результате градиент функции становится равным нулю во время обратного распространения ошибки. Если нейрон фактически «застревает» в этом состоянии для всех входных данных, он полностью перестает обновлять свои веса, становясь «мертвым».

Leaky ReLU решает эту проблему, допуская небольшой положительный градиент для отрицательных значений — часто это постоянный наклон, например 0.01. Это гарантирует, что алгоритм оптимизации всегда может продолжить корректировку весов, предотвращая постоянную неактивность нейронов. Эта характеристика особенно ценна при обучении глубоких сетей, где сохранение величины сигнала имеет решающее значение для предотвращения феномена исчезающего градиента.

Link to this sectionРеальные приложения#

Leaky ReLU широко применяется в сценариях, где стабильность обучения и градиентный поток имеют первостепенное значение.

  • Генеративно-состязательные сети (GANs): Одно из самых заметных применений Leaky ReLU — это Генеративно-состязательные сети (GANs). В дискриминаторной сети GAN разреженные градиенты от стандартной ReLU могут помешать эффективному обучению модели. Использование Leaky ReLU гарантирует, что градиенты проходят через всю архитектуру, помогая генератору создавать синтетические изображения более высокого качества, что подробно описано в ключевых исследованиях, таких как статья о DCGAN.
  • Легковесное обнаружение объектов: Хотя современные модели, такие как YOLO26, часто полагаются на более плавные функции, такие как SiLU, Leaky ReLU остается популярным выбором для кастомных легковесных архитектур, развертываемых на оборудовании для граничных вычислений (edge AI). Её математическая простота (кусочно-линейная функция) означает, что она требует меньше вычислительной мощности, чем экспоненциальные функции, что делает её идеальной для обнаружения объектов в реальном времени на устройствах с ограниченными возможностями обработки, таких как старые мобильные телефоны или встроенные микроконтроллеры.

Link to this sectionСравнение со смежными концепциями#

Выбор правильной функции активации — важный шаг при настройке гиперпараметров. Важно отличать Leaky ReLU от её аналогов:

  • Leaky ReLU против стандартной ReLU: Стандартная ReLU принудительно обнуляет отрицательные выходы, создавая «разреженную» сеть, которая может быть эффективной, но несет риск потери информации. Leaky ReLU жертвует этой чистой разреженностью, чтобы обеспечить доступность градиента.
  • Leaky ReLU против SiLU (Sigmoid Linear Unit): В современных архитектурах, таких как Ultralytics YOLO26, используется SiLU. В отличие от острого угла Leaky ReLU, SiLU — это плавная непрерывная кривая. Эта плавность часто приводит к лучшей обобщающей способности и точности в глубоких слоях, хотя Leaky ReLU выполняется вычислительно быстрее.
  • Leaky ReLU против параметрической ReLU (PReLU): В Leaky ReLU отрицательный наклон является фиксированным гиперпараметром (например, 0.01). В Parametric ReLU (PReLU) этот наклон становится обучаемым параметром, который сеть корректирует во время тренировки, позволяя модели адаптировать форму активации под конкретный набор данных.

Link to this sectionРеализация Leaky ReLU на Python#

Следующий пример демонстрирует, как реализовать слой Leaky ReLU с помощью библиотеки PyTorch. Этот фрагмент кода инициализирует функцию и пропускает через неё тензор, содержащий как положительные, так и отрицательные значения.

import torch
import torch.nn as nn

# Initialize Leaky ReLU with a negative slope of 0.1
# This means negative input x becomes 0.1 * x
leaky_relu = nn.LeakyReLU(negative_slope=0.1)

# Input data with positive and negative values
data = torch.tensor([10.0, -5.0, 0.0])

# Apply activation
output = leaky_relu(data)

print(f"Input: {data}")
print(f"Output: {output}")
# Output: tensor([10.0000, -0.5000,  0.0000])

Понимание этих нюансов необходимо при разработке кастомных архитектур или использовании платформы Ultralytics для аннотирования, обучения и развертывания твоих моделей компьютерного зрения. Выбор подходящей функции активации гарантирует, что твоя модель будет сходиться быстрее и достигнет более высокой точности в твоих конкретных задачах.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения