Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

SwiGLU

Изучи SwiGLU — передовую функцию активации, используемую в LLM и Ultralytics YOLO26. Узнай, как её механизм гейтирования повышает эффективность обучения нейронных сетей.

SwiGLU (Swish Gated Linear Unit) — это передовая функция активации и архитектурный блок нейронной сети, который улучшает традиционную полносвязную сеть (FFN), используемую в глубоком машинном обучении. Сочетая гладкие, немонотонные свойства функции активации Swish с механизмом Gated Linear Unit (GLU), SwiGLU обеспечивает динамическую маршрутизацию признаков, зависящую от данных. Применяя линейную проекцию к входным данным, пропуская одну ветвь через активацию Swish и умножая её поэлементно на другую линейную ветвь, сеть получает превосходную выразительную мощность. Это позволяет современным архитектурам ИИ улавливать сложные, нелинейные зависимости гораздо эффективнее, чем стандартные статические слои, используемые в более старых моделях глубокого обучения.

Link to this sectionКак работает SwiGLU#

В отличие от традиционных полносвязных сетей, которые просто отображают входные данные в более высокую размерность, применяют базовую нелинейность и проецируют их обратно, SwiGLU вводит мультипликативный механизм гейтирования. Входные данные разделяются на две параметризованные проекции: «гейт» (вентиль) и «значение». Ветвь гейта активируется с помощью функции SiLU / Swish, которая сохраняет небольшие отрицательные значения и обеспечивает гладкие, ненулевые производные почти везде. Этот активированный гейт затем поэлементно умножается на ветвь значения. Такая динамическая фильтрация позволяет нейронной сети интеллектуально контролировать поток информации, избегая проблем «мертвых нейронов», распространенных в старых архитектурах, и стабилизируя градиентный сигнал в процессе обучения модели — концепция, широко изученная в механизмах внимания.

Link to this sectionОтличие SwiGLU от других функций активации#

В то время как стандартные функции активации, такие как ReLU, используют фиксированный порог для отсечения отрицательных значений до нуля, SwiGLU динамически корректирует активации на основе самих входных данных. По сравнению с GELU, которая взвешивает входные данные по их вероятности в рамках гауссовского распределения, SwiGLU специально использует параметризованные линейные слои, чтобы научиться тому, как управлять потоком информации (гейтировать). По сути, SwiGLU — это не просто поэлементное математическое вычисление; она функционирует как полноценный структурный компонент, который часто заменяет весь механизм скрытого слоя внутри блока Transformer. Для детального сравнения математических свойств исследователи часто обращаются к комплексным руководствам по функциям активации.

Link to this sectionРеальные применения#

Благодаря своей вычислительной эффективности и значительному приросту производительности SwiGLU стала фундаментальным компонентом современных ИИ-систем.

Link to this sectionРеализация SwiGLU в PyTorch#

Для разработчиков, создающих собственные сети или адаптирующих модели компьютерного зрения для периферийных устройств с использованием платформы Ultralytics, реализация SwiGLU через документацию PyTorch не составит труда. (Альтернативно, разработчики в других экосистемах могут использовать реализации TensorFlow). Следующий краткий фрагмент кода на Python демонстрирует базовый модуль SwiGLU с использованием встроенной функции F.silu в PyTorch:

import torch
import torch.nn as nn
import torch.nn.functional as F


class SwiGLU(nn.Module):
    def __init__(self, in_features, hidden_features):
        super().__init__()
        # SwiGLU requires two projections: one for the gate, one for the value
        self.gate_proj = nn.Linear(in_features, hidden_features)
        self.value_proj = nn.Linear(in_features, hidden_features)
        self.out_proj = nn.Linear(hidden_features, in_features)

    def forward(self, x):
        # Element-wise multiplication of the SiLU-activated gate and the linear value
        hidden = F.silu(self.gate_proj(x)) * self.value_proj(x)
        return self.out_proj(hidden)


# Example usage with a dummy input tensor
module = SwiGLU(in_features=512, hidden_features=1365)
output = module(torch.randn(1, 512))

Такой структурный подход к блокам активации гарантирует, что передовые нейронные архитектуры извлекают более богатые представления из сложных обучающих данных, независимо от того, применяются ли они к обработке естественного языка (NLP) или пространственному анализу в реальном времени. Для более глубокого понимания того, как создавать и ускорять эффективные модели, разработчики часто обращаются к фундаментальным исследованиям оригинальных вариантов GLU на arXiv, репозиториям Meta с открытым исходным кодом и документации по оптимизации PyTorch для максимизации пропускной способности оборудования.

Explore solutions

Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ машинного зрения в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной индустрии

Применяй компьютерное зрение в автомобильной сфере с помощью моделей Ultralytics YOLO. ИИ для обработки изображений повышает безопасность дорожного движения, эффективность систем помощи водителю и автоматизацию транспортных средств, делая дороги умнее.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для компьютерного зрения в медицине ускоряет анализ медицинских изображений, делает диагностику точнее, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли розничную торговлю с моделями Ultralytics YOLO. ИИ машинного зрения обеспечивает отслеживание запасов, мониторинг полок, управление очередями и более глубокое понимание потребностей клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Расширяй возможности интеллектуальных машин с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с моделями Ultralytics YOLO. ИИ машинного зрения обеспечивает контроль качества, обнаружение дефектов, соблюдение требований к СИЗ и автоматизацию сборочных линий.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. ИИ для компьютерного зрения позволяет проверять посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность склада в реальном времени.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ машинного зрения в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной индустрии

Применяй компьютерное зрение в автомобильной сфере с помощью моделей Ultralytics YOLO. ИИ для обработки изображений повышает безопасность дорожного движения, эффективность систем помощи водителю и автоматизацию транспортных средств, делая дороги умнее.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для компьютерного зрения в медицине ускоряет анализ медицинских изображений, делает диагностику точнее, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли розничную торговлю с моделями Ultralytics YOLO. ИИ машинного зрения обеспечивает отслеживание запасов, мониторинг полок, управление очередями и более глубокое понимание потребностей клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Расширяй возможности интеллектуальных машин с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с моделями Ultralytics YOLO. ИИ машинного зрения обеспечивает контроль качества, обнаружение дефектов, соблюдение требований к СИЗ и автоматизацию сборочных линий.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. ИИ для компьютерного зрения позволяет проверять посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность склада в реальном времени.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ машинного зрения в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной индустрии

Применяй компьютерное зрение в автомобильной сфере с помощью моделей Ultralytics YOLO. ИИ для обработки изображений повышает безопасность дорожного движения, эффективность систем помощи водителю и автоматизацию транспортных средств, делая дороги умнее.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для компьютерного зрения в медицине ускоряет анализ медицинских изображений, делает диагностику точнее, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли розничную торговлю с моделями Ultralytics YOLO. ИИ машинного зрения обеспечивает отслеживание запасов, мониторинг полок, управление очередями и более глубокое понимание потребностей клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Расширяй возможности интеллектуальных машин с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с моделями Ultralytics YOLO. ИИ машинного зрения обеспечивает контроль качества, обнаружение дефектов, соблюдение требований к СИЗ и автоматизацию сборочных линий.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. ИИ для компьютерного зрения позволяет проверять посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность склада в реальном времени.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения