Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

SiLU (Sigmoid Linear Unit)

Изучи, как функция активации SiLU (Sigmoid Linear Unit) улучшает глубокое обучение. Узнай, почему SiLU является стандартом для Ultralytics YOLO26 для повышения точности.

Sigmoid Linear Unit, часто называемый SiLU, — это высокоэффективная функция активации, используемая в современных архитектурах глубокого обучения для внесения нелинейности в нейронные сети. Определяя, как нейроны обрабатывают и передают информацию через слои модели, SiLU позволяет системам обучаться сложным закономерностям в данных, функционируя как более плавная и совершенная альтернатива традиционным ступенчатым функциям. Часто ассоциируемая с термином «Swish» из первоначальных исследований по автоматическому поиску активаций, SiLU стала стандартом в высокопроизводительных моделях компьютерного зрения, включая современную архитектуру YOLO26.

Link to this sectionКак работает SiLU#

По своей сути функция SiLU работает путем умножения входного значения на его собственное сигмоидное преобразование. В отличие от простых пороговых функций, которые резко переключают нейрон между состояниями «включено» и «выключено», SiLU обеспечивает плавную кривую, что позволяет выполнять более тонкую обработку сигналов. Эта математическая структура создает особые характеристики, которые приносят пользу процессу обучения модели:

  • Плавность: Кривая непрерывна и дифференцируема везде. Это свойство помогает алгоритмам оптимизации, таким как градиентный спуск, обеспечивая последовательный ландшафт для настройки весов модели, что часто приводит к более быстрой сходимости во время обучения.
  • Немонотонность: В отличие от стандартных линейных единиц, SiLU является немонотонной, что означает, что ее выходные данные могут уменьшаться, даже когда входные данные увеличиваются в определенных отрицательных диапазонах. Это позволяет сети захватывать сложные признаки и сохранять отрицательные значения, которые в противном случае могли бы быть отброшены, помогая предотвратить проблему затухающего градиента в глубоких сетях.
  • Самостробирование (Self-Gating): SiLU действует как собственный затвор, регулируя, какая часть входных данных проходит дальше, исходя из величины самих входных данных. Это имитирует механизмы стробирования, обнаруженные в сетях Long Short-Term Memory (LSTM), но в вычислительно эффективной форме, подходящей для сверточных нейронных сетей (CNN).

Link to this sectionРеальные приложения#

SiLU является неотъемлемой частью многих передовых ИИ-решений, где точность и эффективность имеют первостепенное значение.

  • Восприятие автономных транспортных средств: В критически важной области безопасности автономных транспортных средств системы восприятия должны мгновенно распознавать пешеходов, дорожные знаки и препятствия. Модели, использующие SiLU в своих магистральных сетях (backbones), могут поддерживать высокую скорость вывода при точном выполнении обнаружения объектов в различных условиях освещения, обеспечивая безопасную реакцию транспортного средства на окружающую среду.
  • Диагностика медицинской визуализации: При анализе медицинских изображений нейронным сетям необходимо различать тонкие различия в текстуре на МРТ или КТ-сканах. Сохраняющая градиент природа SiLU помогает этим сетям изучать мелкозернистые детали, необходимые для раннего обнаружения опухолей, значительно повышая надежность автоматизированных диагностических инструментов, используемых рентгенологами.

Link to this sectionСравнение с родственными концепциями#

Чтобы полностью оценить SiLU, полезно отличить ее от других функций активации, представленных в глоссарии Ultralytics.

  • SiLU vs. ReLU (Rectified Linear Unit): ReLU известна своей скоростью и простотой, выдавая ноль для всех отрицательных входных значений. Несмотря на эффективность, это может привести к «мертвым нейронам», которые перестают обучаться. SiLU избегает этого, позволяя небольшому нелинейному градиенту проходить через отрицательные значения, что часто приводит к лучшей точности для глубоких архитектур, обученных на платформе Ultralytics.
  • SiLU vs. GELU (Gaussian Error Linear Unit): Эти две функции визуально и функционально схожи. GELU является стандартом для моделей Transformer, таких как BERT и GPT, в то время как SiLU часто предпочитают для задач компьютерного зрения (CV) и детекторов объектов на основе CNN.
  • SiLU vs. Sigmoid: Хотя SiLU использует функцию Sigmoid внутри, они выполняют разные роли. Sigmoid обычно используется в финальном выходном слое для бинарной классификации для представления вероятностей, тогда как SiLU используется в скрытых слоях для облегчения извлечения признаков.

Link to this sectionПример реализации#

Ты можешь визуализировать, как различные функции активации преобразуют данные, используя библиотеку PyTorch. Следующий фрагмент кода демонстрирует разницу между ReLU (которая обнуляет отрицательные значения) и SiLU (которая обеспечивает плавный поток отрицательных значений).

import torch
import torch.nn as nn

# Input data: negative, zero, and positive values
data = torch.tensor([-2.0, 0.0, 2.0])

# Apply ReLU: Negatives become 0, positives stay unchanged
relu_out = nn.ReLU()(data)
print(f"ReLU: {relu_out}")
# Output: tensor([0., 0., 2.])

# Apply SiLU: Smooth curve, small negative value retained
silu_out = nn.SiLU()(data)
print(f"SiLU: {silu_out}")
# Output: tensor([-0.2384,  0.0000,  1.7616])

Сохраняя информацию в отрицательных значениях и обеспечивая плавный градиент, SiLU играет ключевую роль в успехе современных нейронных сетей. Ее внедрение в такие архитектуры, как YOLO26, подчеркивает ее важность для достижения передовой производительности в различных задачах компьютерного зрения.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения