Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

SwiGLU

Explora a SwiGLU, a função de ativação avançada utilizada em LLMs e no Ultralytics YOLO26. Aprende como o seu mecanismo de gating melhora o treino e a eficiência das redes neuronais.

A SwiGLU (Swish Gated Linear Unit) é uma função de ativação avançada e um bloco arquitetural de rede neuronal que melhora a tradicional Feed-Forward Network (FFN) usada em deep machine learning. Ao combinar as propriedades suaves e não monotónicas da função de ativação Swish com um mecanismo de Gated Linear Unit (GLU), a SwiGLU proporciona um encaminhamento de características dinâmico e dependente dos dados. Ao aplicar uma projeção linear a uma entrada, passando um ramo por uma ativação Swish e multiplicando-o elemento a elemento com outro ramo linear, a rede obtém um poder expressivo superior. Isto permite que as arquiteturas de IA modernas capturem dependências complexas e não lineares de forma muito mais eficaz do que as camadas estáticas padrão usadas em modelos de deep learning mais antigos.

Link to this sectionComo funciona a SwiGLU#

Ao contrário das redes feed-forward tradicionais que mapeiam simplesmente uma entrada para uma dimensão superior, aplicam uma não linearidade básica e projetam-na de volta, a SwiGLU introduz um mecanismo de gating multiplicativo. A entrada é dividida em duas projeções parametrizadas: um "gate" (portão) e um "valor". O ramo do gate é ativado usando a função SiLU / Swish, que preserva pequenos valores negativos e assegura derivadas suaves e diferentes de zero em quase toda a parte. Este gate ativado é então multiplicado elemento a elemento com o ramo do valor. Esta filtragem dinâmica permite que a rede neuronal controle inteligentemente o fluxo de informação, evitando os problemas de "neurónio morto" comuns em arquiteturas mais antigas, ao mesmo tempo que estabiliza o sinal do gradiente durante o processo de treino do modelo, um conceito amplamente estudado em mecanismos de atenção.

Link to this sectionDiferenciar a SwiGLU de outras Funções de Ativação#

Enquanto Funções de Ativação padrão como a ReLU usam um limite fixo para cortar valores negativos para zero, a SwiGLU ajusta dinamicamente as ativações com base nos próprios dados de entrada. Comparada com a GELU, que pondera entradas pela sua probabilidade sob uma distribuição Gaussiana, a SwiGLU utiliza especificamente camadas lineares parametrizadas para aprender como controlar a informação. Em essência, a SwiGLU não é apenas um cálculo matemático elemento a elemento; ela funciona como um componente estrutural abrangente que frequentemente substitui todo o mecanismo da camada oculta dentro de um bloco Transformer. Para uma comparação exaustiva das propriedades matemáticas, os investigadores consultam frequentemente guias de funções de ativação abrangentes.

Link to this sectionAplicações no Mundo Real#

Devido à sua eficiência computacional e ganhos de desempenho significativos, a SwiGLU tornou-se um componente fundamental nos sistemas de IA modernos.

Link to this sectionImplementar a SwiGLU em PyTorch#

Para desenvolvedores que constroem redes personalizadas ou adaptam modelos de visão para dispositivos edge usando a Ultralytics Platform, implementar a SwiGLU através da documentação do PyTorch é simples. (Alternativamente, desenvolvedores em outros ecossistemas podem usar implementações TensorFlow). O seguinte pequeno excerto em Python demonstra um módulo básico de SwiGLU usando a função incorporada F.silu do PyTorch:

import torch
import torch.nn as nn
import torch.nn.functional as F


class SwiGLU(nn.Module):
    def __init__(self, in_features, hidden_features):
        super().__init__()
        # SwiGLU requires two projections: one for the gate, one for the value
        self.gate_proj = nn.Linear(in_features, hidden_features)
        self.value_proj = nn.Linear(in_features, hidden_features)
        self.out_proj = nn.Linear(hidden_features, in_features)

    def forward(self, x):
        # Element-wise multiplication of the SiLU-activated gate and the linear value
        hidden = F.silu(self.gate_proj(x)) * self.value_proj(x)
        return self.out_proj(hidden)


# Example usage with a dummy input tensor
module = SwiGLU(in_features=512, hidden_features=1365)
output = module(torch.randn(1, 512))

Esta abordagem estrutural aos blocos de ativação garante que as arquiteturas neuronais de ponta extraiam representações mais ricas de dados de treino complexos, seja aplicada a Processamento de Linguagem Natural (NLP) ou análise espacial em tempo real. Para uma compreensão mais profunda da construção e aceleração de modelos eficientes, os desenvolvedores consultam frequentemente a investigação fundamental sobre variantes originais de GLU no arXiv, repositórios open-source da Meta e a documentação de otimização do PyTorch para maximizar o rendimento do hardware.

Explore solutions

Real-time AI tailored to your operation

IA na Agricultura

Leve a IA de visão para a agricultura inteligente com os modelos Ultralytics YOLO. Potencialize o monitoramento de colheitas, rastreamento de gado e agricultura de precisão para obter rendimentos maiores e mais inteligentes.

Saiba mais
Real-time AI that works with your operation

IA no Setor Automotivo

Aplica visão computacional no setor automotivo com modelos Ultralytics YOLO. A IA de visão eleva a segurança viária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Saiba mais
Real-time AI that works with your team

IA na Saúde

Crie soluções para a saúde com modelos Ultralytics YOLO. A IA de visão na saúde potencializa diagnósticos mais inteligentes, monitoramento de pacientes e exames médicos mais rápidos.

Saiba mais
Real-time AI that works with your team

IA no Varejo

Reinvente o varejo com os modelos YOLO da Ultralytics. A IA de visão potencializa o rastreamento de inventário, o monitoramento de prateleiras, a gestão de filas e insights mais inteligentes sobre os clientes.

Saiba mais
Real-time AI that works with your team

IA em Robótica

Impulsione máquinas mais inteligentes com os modelos Ultralytics YOLO. A visão computacional por IA na robótica impulsiona a navegação autônoma, a percepção, o rastreamento de objetos e o controle em tempo real.

Saiba mais
Real-time AI that works with your team

IA na Manufatura

Otimize a manufatura com os modelos Ultralytics YOLO. A visão computacional impulsiona o controle de qualidade, a detecção de defeitos, a conformidade com EPIs e a automação de linhas de montagem.

Saiba mais
Real-time AI that works with your team

IA na logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Saiba mais
Real-time AI tailored to your operation

IA na Agricultura

Leve a IA de visão para a agricultura inteligente com os modelos Ultralytics YOLO. Potencialize o monitoramento de colheitas, rastreamento de gado e agricultura de precisão para obter rendimentos maiores e mais inteligentes.

Saiba mais
Real-time AI that works with your operation

IA no Setor Automotivo

Aplica visão computacional no setor automotivo com modelos Ultralytics YOLO. A IA de visão eleva a segurança viária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Saiba mais
Real-time AI that works with your team

IA na Saúde

Crie soluções para a saúde com modelos Ultralytics YOLO. A IA de visão na saúde potencializa diagnósticos mais inteligentes, monitoramento de pacientes e exames médicos mais rápidos.

Saiba mais
Real-time AI that works with your team

IA no Varejo

Reinvente o varejo com os modelos YOLO da Ultralytics. A IA de visão potencializa o rastreamento de inventário, o monitoramento de prateleiras, a gestão de filas e insights mais inteligentes sobre os clientes.

Saiba mais
Real-time AI that works with your team

IA em Robótica

Impulsione máquinas mais inteligentes com os modelos Ultralytics YOLO. A visão computacional por IA na robótica impulsiona a navegação autônoma, a percepção, o rastreamento de objetos e o controle em tempo real.

Saiba mais
Real-time AI that works with your team

IA na Manufatura

Otimize a manufatura com os modelos Ultralytics YOLO. A visão computacional impulsiona o controle de qualidade, a detecção de defeitos, a conformidade com EPIs e a automação de linhas de montagem.

Saiba mais
Real-time AI that works with your team

IA na logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Saiba mais
Real-time AI tailored to your operation

IA na Agricultura

Leve a IA de visão para a agricultura inteligente com os modelos Ultralytics YOLO. Potencialize o monitoramento de colheitas, rastreamento de gado e agricultura de precisão para obter rendimentos maiores e mais inteligentes.

Saiba mais
Real-time AI that works with your operation

IA no Setor Automotivo

Aplica visão computacional no setor automotivo com modelos Ultralytics YOLO. A IA de visão eleva a segurança viária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Saiba mais
Real-time AI that works with your team

IA na Saúde

Crie soluções para a saúde com modelos Ultralytics YOLO. A IA de visão na saúde potencializa diagnósticos mais inteligentes, monitoramento de pacientes e exames médicos mais rápidos.

Saiba mais
Real-time AI that works with your team

IA no Varejo

Reinvente o varejo com os modelos YOLO da Ultralytics. A IA de visão potencializa o rastreamento de inventário, o monitoramento de prateleiras, a gestão de filas e insights mais inteligentes sobre os clientes.

Saiba mais
Real-time AI that works with your team

IA em Robótica

Impulsione máquinas mais inteligentes com os modelos Ultralytics YOLO. A visão computacional por IA na robótica impulsiona a navegação autônoma, a percepção, o rastreamento de objetos e o controle em tempo real.

Saiba mais
Real-time AI that works with your team

IA na Manufatura

Otimize a manufatura com os modelos Ultralytics YOLO. A visão computacional impulsiona o controle de qualidade, a detecção de defeitos, a conformidade com EPIs e a automação de linhas de montagem.

Saiba mais
Real-time AI that works with your team

IA na logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Saiba mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática