用語集

ドロップアウト層

汎化性、ロバスト性、モデル性能を向上させることで、ニューラルネットワークのオーバーフィッティングを防ぐドロップアウト層の仕組みをご紹介します。

ドロップアウト層は、オーバーフィッティングに対抗するためにニューラルネットワーク(NN)で使用される、強力かつシンプルな正則化テクニックである。オーバーフィッティングとは、モデルがノイズや特異性を含めて学習データを学習しすぎてしまい、新しい未知のデータに汎化する能力が損なわれることである。2014年の画期的な論文でGeoffrey Hintonらによって紹介されたドロップアウトの核となるアイデアは、各トレーニングステップにおいて、ニューロンとその接続をランダムに「ドロップアウト」、つまり一時的に削除することである。これにより、ニューロン同士が過度に依存し合うのを防ぎ、ネットワークがよりロバストで冗長な表現を学習するようになる。

ドロップアウト・レイヤーの仕組み

モデルの学習過程で、ドロップアウト層は、前の層のニューロンの何割かのアクティブ度 をランダムにゼロにする。ドロップアウト率」は、ニュー ロンがドロップアウトされる確率を定義するハイパーパラメータである。例えば、ドロップアウト率0.5は、各ニューロンが、ある学習反復中に50%の確率で無視されることを意味する。このプロセスは、重みを共有する多数の間引かれたネットワークを訓練すると考えることができる。

ネットワークのアーキテクチャを常に変化させることで、ドロップアウトは、ニューロンの出力が他の数個の特定のニューロンの存在に大きく依存するような、複雑な共適応を防ぐ。その代わりに、各ニューロンはより独立した有用な特徴検出器となるように促される。テストまたは推論の段階では、ドロップアウト層はオフにされ、すべてのニューロンが使用される。学習時よりも多くのニューロンがアクティブになるという事実を補うため、レイヤーの出力はドロップアウト率によってスケールダウンされる。これにより、各ニューロンから期待される出力が訓練時とテスト時で一貫性を保つことができる。PyTorchや TensorFlowのようなフレームワークは、ドロップアウト層の実装でこのスケーリングを自動的に処理する。

実世界での応用

ドロップアウトは、人工知能(AI)や機械学習(ML)のさまざまな領域で広く使われている:

  1. コンピュータビジョン コンピュータビジョン(CV)において、ドロップアウトは、Ultralytics YOLOのようなモデルが、物体検出画像分類インスタンスセグメンテーションなどのタスクでより優れたパフォーマンスを発揮するのに役立ちます。例えば、自律走行システムにおいて、ドロップアウトは照明、天候、オクルージョンの変化に対して検出モデルをよりロバストにし、安全性と信頼性を向上させます。このようなモデルのトレーニングは、Ultralytics HUBのようなプラットフォームを使用して効果的に管理することができます。
  2. 自然言語処理(NLP):ドロップアウトは、Transformersや BERTのようなNLPモデルで一般的に適用されている。機械翻訳や 感情分析のようなアプリケーションでは、ドロップアウトによって、モデルが学習データから特定のフレーズや文構造を記憶するのを防ぐことができる。これにより、新規テキストのより良い理解と生成が可能になり、チャットボットや テキスト要約ツールのパフォーマンスが向上する。

関連概念と区別

ドロップアウトは、ディープラーニングで正則化に使われるいくつかのテクニックのひとつである。他には以下のようなものがある:

  • L1およびL2正則化:これらの方法は、モデルの重みの大きさに基づいて損失関数にペナルティを追加し、モデルの複雑さを軽減するために重みを小さくすることを促します。L1/L2正則化についてはこちらをご覧ください。これに対してドロップアウトは、単に重みにペナルティを与えるのではなく、学習中にネットワークの構造を直接修正します。
  • バッチ正規化: バッチ正規化(BN)はレイヤー内の活性を正規化することで、学習を安定させ、時にはマイルドな正則化効果をもたらし、強力なドロップアウトの必要性を減らす可能性がある。BNが内部の共変量シフトに対処するのに対して、ドロップアウトは冗長性を強制することでモデルの複雑性を直接ターゲットにする。
  • データ増強:画像を回転させたり、拡大縮小したり、切り取ったりする技術(データ増強)は、学習データセットの多様性を人為的に増加させる。これはオーバーフィッティングを防ぎ、汎化を改善するのにも役立つ。ドロップアウトとデータ補強は、よりロバストな結果を得るために併用されることが多い。

要約すると、ドロップアウト層は、高度なコンピュータビジョンからNLPに至るまで、様々なアプリケーションでロバストなディープラーニングモデルをトレーニングするために不可欠な、シンプルかつ強力な正則化テクニックである。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク