用語集

最適化アルゴリズム

最適化アルゴリズムが、ニューラルネットワークのトレーニングからヘルスケアや農業における現実世界のアプリケーションまで、AIとMLのパフォーマンスをどのように向上させるかをご覧ください。

最適化アルゴリズムは、機械学習（ML）と深層学習における学習プロセスを推進するエンジンです。その主な役割は、重みとバイアスなどのモデルの内部パラメータを反復的に調整して、損失関数を最小化することです。これは、モデルの予測を最も正確にする最適なパラメータセットを見つけるための体系的な方法と考えることができます。このプロセスは、一般的なモデルを、物体検出や画像セグメンテーションなどの特定のタスクを解決できる特殊なツールに変換するため、モデルのトレーニングに不可欠です。

最適化アルゴリズムの仕組み

最適化アルゴリズムは、本質的に「損失地形」をナビゲートします。これは、各点がモデルパラメータのセットを表し、点の高さがモデルのエラーに対応する高次元空間です。目標は、この地形の最も低い点、つまり「最小値」を見つけることです。アルゴリズムは、ランダムなパラメータの初期セットから開始し、各ステップ（またはエポック）で、損失関数の勾配を計算します。この勾配は、最も急な上昇方向を指すため、アルゴリズムは反対方向にステップを実行して地形を下降します。

このステップのサイズは、学習率と呼ばれる重要なハイパーパラメータによって制御されます。適切に選択された学習率により、モデルは最小値をオーバーシュートしたり、行き詰まったりすることなく、効率的に学習できます。勾配を計算してパラメータを更新するこの反復プロセスは、バックプロパゲーションと呼ばれ、検証データセットでのモデルの性能が向上しなくなるまで、つまり収束を示すまで継続されます。

一般的な最適化アルゴリズム

いくつかの最適化アルゴリズムが開発されており、それぞれに異なる特性があります。深層学習で最も広く使用されているものには、以下が含まれます。

Stochastic Gradient Descent (SGD): 確率的勾配降下法（SGD）は、トレーニングデータの小さなサブセット（バッチ）からの勾配を使用してパラメータを更新する、古典的で広く使用されている最適化手法です。効果的ですが、その性能は学習率の選択に左右される可能性があります。モメンタム付きSGDなどのバリエーションは、収束を加速するのに役立ちます。
Adamオプティマイザー: Adaptive Moment Estimation（Adam）オプティマイザーは、SGDの他の2つの拡張機能であるAdaGradとRMSPropの利点を組み合わせているため、非常に人気があります。各パラメーターの適応学習率を計算し、堅牢であり、多くの問題に適したデフォルトの選択肢となります。拡張機能であるAdamWは、最新のトランスフォーマーモデルで一般的に使用されています。PyTorchやTensorFlowなどのフレームワークは、これらの一般的なオプティマイザーの実装を提供しています。

オプティマイザの選択は、トレーニング速度とモデルの最終的なパフォーマンスの両方に大きな影響を与える可能性があります。Ultralyticsのエコシステムでは、ユーザーはトレーニング設定中にオプティマイザを簡単に構成できます。

実際のアプリケーション

最適化アルゴリズムは、数え切れないほどのAIアプリケーションの舞台裏で機能しています。

医用画像解析: 脳スキャンで腫瘍を検出するために畳み込みニューラルネットワーク (CNN)をトレーニングする場合、Adam などの最適化アルゴリズムは、ネットワークのフィルターを体系的に調整します。モデルが予測した腫瘍の位置と、放射線科医が提供する正解のアノテーションとの間の差を最小限に抑え、モデルの診断精度を向上させるように機能します。これは、効果的なヘルスケア AI ソリューションを構築するための重要なコンポーネントです。
自動運転車: Ultralytics YOLOモデルのような自動運転車の物体検出モデルは、歩行者、他の車両、および交通標識を確実に識別する必要があります。トレーニング中、オプティマイザは数百万枚の画像にわたってモデルのパラメータを微調整し、検出エラー（例：オブジェクトの見逃しや誤った分類）を減らします。これは、自動車向けAIシステムの安全性を確保するために重要です。

最適化アルゴリズムと関連概念

最適化アルゴリズムを関連するML概念と区別することが重要です。

最適化アルゴリズム vs. ハイパーパラメータチューニング： 最適化アルゴリズムは、 内部パラメータ （重みとバイアス）を トレーニング中に トレーニング。対照的に、ハイパーパラメータの調整は、最適なものを見つけることに重点を置いています。 外部構成設定 （学習率、バッチサイズ、またはオプティマイザ自体の選択など） 学習が開始される 学習が開始されます。 Ultralytics Tuner クラスこのようなプロセスを自動化するために、以下のような手法が用いられます。進化的アルゴリズム.
最適化アルゴリズム vs. 損失関数: 損失関数はモデルの誤差を定量化します。最適化アルゴリズムは、この誤差を最小化するために使用されるメカニズムです。損失関数が目標を提供し、最適化アルゴリズムがそこに到達するための戦略を提供します。
最適化アルゴリズム vs. モデルアーキテクチャ: モデルアーキテクチャは、ニューラルネットワークの構造（レイヤーや接続など）を定義します。最適化アルゴリズムは、この定義済みの構造内で、学習可能なパラメータを訓練するために機能します。Neural Architecture Search (NAS)は、アーキテクチャ自体の設計を自動化する関連分野です。

最適化アルゴリズム

Ultralytics YOLOモデルをトレーニングして、業界全体のワークフローを効率化

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOでAIモデルを数秒でトレーニング

最適化アルゴリズムの仕組み

一般的な最適化アルゴリズム

実際のアプリケーション

最適化アルゴリズムと関連概念

このカテゴリの関連記事

自己教師付き学習による画像のノイズ除去

ビジョンAIがドライバーの注意力監視システムを強化

ビットから量子ビットへ：量子最適化がAIをどう変えるか

Ultralyticsコミュニティに参加しませんか？