用語集

SiLU（Sigmoid Linear Unit）

SiLU（Swish）活性化関数が、物体検出や自然言語処理（NLP）などのAIタスクにおいて、ディープラーニングのパフォーマンスをどのように向上させるかをご覧ください。

一般にSiLUとして知られるシグモイド線形ユニットは、効率と性能で人気を集めているニューラルネットワークで使用される活性化関数です。これは、シグモイド関数とReLU（Rectified Linear Unit）関数の特性をエレガントに組み合わせた自己ゲーテッド関数です。SiLUは論文「活性化関数の探索」で紹介され、元々はSwishと呼ばれていました。滑らかさや非単調性などの独自の特性により、多くの場合、深層モデルでReLUなどの従来の活性化関数よりも優れた性能を発揮し、精度の向上とモデル学習中の収束の高速化につながります。

SiLU関数はどのように機能するか

SiLUは、入力値にシグモイド関数を掛けることによって定義されます。この自己ゲーティングメカニズムにより、関数は正の入力に対して線形から、大きな負の入力に対してほぼゼロにスムーズに移行でき、ネットワークを介した情報の流れを調整するのに役立ちます。SiLUの重要な特徴は、その非単調性です。小さな負の入力に対してゼロに向かって戻る前に、わずかにゼロを下回ることがあります。この特性は、より豊かな勾配の地形を作り出し、深いアーキテクチャでの学習プロセスを遅らせたり停止させたりする可能性のある勾配消失問題を防ぐことにより、ニューラルネットワークの表現力を向上させると考えられています。SiLU曲線の滑らかさは、勾配降下法などの最適化アルゴリズムにスムーズな勾配を保証するため、大きな利点でもあります。

SiLUと他の活性化関数との比較

SiLUは、他の一般的に使用される活性化関数に比べていくつかの利点があり、最新の深層学習（DL）アーキテクチャにとって魅力的な選択肢となっています。

ReLU（Rectified Linear Unit）: ReLUとは異なり、ゼロで急激な変化があり、すべての負の入力に対して勾配がゼロになるのに対し、SiLUは滑らかで連続的な関数です。この滑らかさは、バックプロパゲーションプロセス中に役立ちます。さらに、SiLUは、ニューロンが負の入力を一貫して受信した場合に永続的に非アクティブになる「dying ReLU」問題を回避します。
Leaky ReLU: Leaky ReLUも、負の入力に対して小さい非ゼロの勾配を許可することにより、ニューロンの消失問題を解決しますが、SiLUのスムーズな非単調曲線は、非常に深いネットワークでより優れた汎化と最適化につながる場合があります。
シグモイド: シグモイド関数はSiLUのコアコンポーネントですが、それらのアプリケーションは大きく異なります。シグモイドは通常、バイナリ分類タスクの出力層、またはRNNのゲーティングメカニズムとして使用されます。対照的に、SiLUは隠れ層用に設計されており、畳み込みニューラルネットワーク（CNN）のパフォーマンスを向上させることが示されています。
GELU（Gaussian Error Linear Unit）: SiLUは、特にTransformerモデルにおいて優れた性能を発揮する、別の滑らかな活性化関数であるGELUとしばしば比較されます。どちらの関数も同様の形状と性能特性を持ち、どちらを選択するかは、多くの場合、ハイパーパラメータ調整による経験的な結果に帰着します。

AIと機械学習における応用

効率とパフォーマンスのバランスにより、SiLUはさまざまな最先端モデルで人気のある選択肢となっています。

物体検出: Ultralytics YOLOのバージョンを含む高度な物体検出モデルは、隠れ層でSiLUを使用します。たとえば、リアルタイム検出に依存する自動運転車のようなアプリケーションでは、SiLUはモデルがセンサーデータから複雑な特徴をより効果的に学習するのに役立ち、歩行者、交通標識、および他の車両の検出精度を向上させます。この改善された特徴学習は、COCOのような大規模なデータセットでトレーニングする場合に、安全性と信頼性にとって非常に重要です。
画像分類: SiLUは、EfficientNetファミリーのモデルなど、効率的で強力な分類モデルの重要な要素です。医療画像解析などの分野では、SiLUの勾配フローを維持する能力が、モデルが微妙なテクスチャやパターンを学習するのに役立ちます。これは、MRIスキャンから腫瘍を分類したり、胸部X線写真から疾患を特定したりするタスクに役立ち、高い精度が不可欠です。

実装

SiLUは主要な深層学習フレームワークですぐに利用できるため、新規または既存のモデルに簡単に組み込むことができます。

PyTorch: 実装形式 torch.nn.SiLUと、公式の SiLUに関するPyTorchのドキュメント利用可能です。
TensorFlow: 利用可能 tf.keras.activations.swish など）は、 tf.keras.activations.siluに記載されています。 SiLUに関するTensorFlowのドキュメント.

Ultralytics HUBのようなプラットフォームは、SiLUのような高度なコンポーネントを利用するモデルのトレーニングモデルとさまざまなデプロイオプションの検討をサポートします。DeepLearning.AIのような組織からの継続的な研究とリソースは、実践者がそのような関数を効果的に活用するのに役立ちます。活性化関数の選択は、効果的なニューラルネットワークアーキテクチャの設計において依然として重要な部分であり、SiLUはこの分野における重要な進歩を表しています。

SiLU（Sigmoid Linear Unit）

Ultralytics YOLOモデルをトレーニングして、業界全体のワークフローを効率化

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOでAIモデルを数秒でトレーニング

SiLU関数はどのように機能するか

SiLUと他の活性化関数との比較

AIと機械学習における応用

実装

このカテゴリの関連記事

ビットから量子ビットへ：量子最適化がAIをどう変えるか

初心者のためのAIモデルのトレーニング方法クイックガイド

洞察に満ちたドバイから：GDG MENA-Tサミット2025の要点

Ultralyticsコミュニティに参加しませんか？