遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

SwiGLU

探索 SwiGLU,这是一种在 LLM 和 Ultralytics YOLO26 中使用的高级激活函数。了解它的门控机制如何提高神经网络的训练效率。

SwiGLU(Swish Gated Linear Unit)是一种高级激活函数神经网络架构模块,它增强了深度机器学习中常用的前馈网络(FFN)。通过将 Swish 激活函数的平滑、非单调特性与门控线性单元(GLU)机制相结合,SwiGLU 提供了动态的、依赖于数据的特征路由。通过对输入应用线性投影,使其中一个分支通过 Swish 激活,并将其与另一个线性分支进行逐元素相乘,网络获得了更强的表达能力。这使得现代 AI 架构能够比旧版深度学习模型中使用的标准静态层更有效地捕捉复杂的非线性依赖关系。

Link to this sectionSwiGLU 的工作原理#

与传统的前馈网络(简单地将输入映射到更高维度,应用基本非线性,然后投影回原始维度)不同,SwiGLU 引入了乘法门控机制。输入被分为两个参数化投影:“门(gate)”和“值(value)”。门分支使用 SiLU / Swish 函数进行激活,该函数保留了较小的负值,并确保在几乎所有地方都有平滑、非零的导数。然后,此激活后的门与值分支进行逐元素相乘。这种动态过滤允许神经网络智能地控制信息流,避免了旧架构中常见的“死神经元”问题,同时在模型训练过程中稳定了梯度信号,这是一个在注意力机制中被广泛研究的概念。

Link to this section区分 SwiGLU 与其他激活函数#

While standard Activation Functions like ReLU use a fixed threshold to clip negative values to zero, SwiGLU dynamically adjusts activations based on the input data itself. Compared to GELU, which weights inputs by their probability under a Gaussian distribution, SwiGLU specifically leverages parameterized linear layers to learn how to gate information. In essence, SwiGLU is not just an element-wise mathematical calculation; it functions as a comprehensive structural component that often replaces the entire hidden layer mechanism inside a Transformer block. For an extensive comparison of mathematical properties, researchers often refer to comprehensive activation function guides.

Link to this section实际应用#

由于其计算效率和显著的性能提升,SwiGLU 已成为现代 AI 系统中的基础组件。

Link to this section在 PyTorch 中实现 SwiGLU#

对于使用 Ultralytics Platform 构建自定义网络或为边缘设备适配视觉模型的开发者来说,通过 PyTorch 文档 实现 SwiGLU 非常简单。(或者,其他生态系统中的开发者可能会使用 TensorFlow 实现)。以下简洁的 Python 代码片段演示了使用 PyTorch 内置的 F.silu 函数的基本 SwiGLU 模块:

import torch
import torch.nn as nn
import torch.nn.functional as F


class SwiGLU(nn.Module):
    def __init__(self, in_features, hidden_features):
        super().__init__()
        # SwiGLU requires two projections: one for the gate, one for the value
        self.gate_proj = nn.Linear(in_features, hidden_features)
        self.value_proj = nn.Linear(in_features, hidden_features)
        self.out_proj = nn.Linear(hidden_features, in_features)

    def forward(self, x):
        # Element-wise multiplication of the SiLU-activated gate and the linear value
        hidden = F.silu(self.gate_proj(x)) * self.value_proj(x)
        return self.out_proj(hidden)


# Example usage with a dummy input tensor
module = SwiGLU(in_features=512, hidden_features=1365)
output = module(torch.randn(1, 512))

这种针对激活块的结构化方法确保了尖端的神经网络架构能够从复杂的训练数据中提取更丰富的表示,无论是应用于自然语言处理 (NLP) 还是实时空间分析。为了更深入地了解如何构建和加速高效模型,开发者通常会参考 arXiv 上原始 GLU 变体的研究Meta 的开源仓库 以及 PyTorch 的优化文档,以最大化硬件吞吐量。

Explore solutions

Real-time AI tailored to your operation

农业中的 AI

利用 Ultralytics YOLO 模型将视觉 AI 引入智慧农业。为农作物监测、牲畜追踪和精准农业提供支持,实现更高、更智能的产量。

了解详情
Real-time AI that works with your operation

汽车领域的 AI

利用 Ultralytics YOLO 模型将计算机视觉应用于汽车领域。视觉 AI 能提升道路安全、驾驶辅助和车辆自动化水平,从而打造更智能的道路。

了解详情
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗解决方案。医疗保健中的视觉 AI 可加速医学影像处理、实现更智能的诊断并改善患者监护。

了解详情
Real-time AI that works with your team

零售业中的AI

利用Ultralytics YOLO模型重塑零售业。视觉AI助力库存追踪、货架监控、排队管理和更智能的客户洞察。

了解详情
Real-time AI that works with your team

机器人领域的 AI

利用 Ultralytics YOLO 模型为更智能的机器提供动力。机器人领域的视觉 AI 可驱动自主导航、感知、物体跟踪和实时控制。

了解详情
Real-time AI that works with your team

制造业中的 AI

利用 Ultralytics YOLO 模型优化制造业。视觉 AI 助力质量控制、缺陷检测、PPE 合规性监控以及装配线自动化。

了解详情
Real-time AI that works with your team

物流中的 AI

利用 Ultralytics YOLO 模型简化物流。视觉 AI 支持包裹检测、分类、车辆追踪和实时仓库安全监控。

了解详情
Real-time AI tailored to your operation

农业中的 AI

利用 Ultralytics YOLO 模型将视觉 AI 引入智慧农业。为农作物监测、牲畜追踪和精准农业提供支持,实现更高、更智能的产量。

了解详情
Real-time AI that works with your operation

汽车领域的 AI

利用 Ultralytics YOLO 模型将计算机视觉应用于汽车领域。视觉 AI 能提升道路安全、驾驶辅助和车辆自动化水平,从而打造更智能的道路。

了解详情
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗解决方案。医疗保健中的视觉 AI 可加速医学影像处理、实现更智能的诊断并改善患者监护。

了解详情
Real-time AI that works with your team

零售业中的AI

利用Ultralytics YOLO模型重塑零售业。视觉AI助力库存追踪、货架监控、排队管理和更智能的客户洞察。

了解详情
Real-time AI that works with your team

机器人领域的 AI

利用 Ultralytics YOLO 模型为更智能的机器提供动力。机器人领域的视觉 AI 可驱动自主导航、感知、物体跟踪和实时控制。

了解详情
Real-time AI that works with your team

制造业中的 AI

利用 Ultralytics YOLO 模型优化制造业。视觉 AI 助力质量控制、缺陷检测、PPE 合规性监控以及装配线自动化。

了解详情
Real-time AI that works with your team

物流中的 AI

利用 Ultralytics YOLO 模型简化物流。视觉 AI 支持包裹检测、分类、车辆追踪和实时仓库安全监控。

了解详情
Real-time AI tailored to your operation

农业中的 AI

利用 Ultralytics YOLO 模型将视觉 AI 引入智慧农业。为农作物监测、牲畜追踪和精准农业提供支持,实现更高、更智能的产量。

了解详情
Real-time AI that works with your operation

汽车领域的 AI

利用 Ultralytics YOLO 模型将计算机视觉应用于汽车领域。视觉 AI 能提升道路安全、驾驶辅助和车辆自动化水平,从而打造更智能的道路。

了解详情
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗解决方案。医疗保健中的视觉 AI 可加速医学影像处理、实现更智能的诊断并改善患者监护。

了解详情
Real-time AI that works with your team

零售业中的AI

利用Ultralytics YOLO模型重塑零售业。视觉AI助力库存追踪、货架监控、排队管理和更智能的客户洞察。

了解详情
Real-time AI that works with your team

机器人领域的 AI

利用 Ultralytics YOLO 模型为更智能的机器提供动力。机器人领域的视觉 AI 可驱动自主导航、感知、物体跟踪和实时控制。

了解详情
Real-time AI that works with your team

制造业中的 AI

利用 Ultralytics YOLO 模型优化制造业。视觉 AI 助力质量控制、缺陷检测、PPE 合规性监控以及装配线自动化。

了解详情
Real-time AI that works with your team

物流中的 AI

利用 Ultralytics YOLO 模型简化物流。视觉 AI 支持包裹检测、分类、车辆追踪和实时仓库安全监控。

了解详情

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅