Yolo 深圳
深セン
今すぐ参加
用語集

正規化

機械学習における正規化のパワーをご覧ください。モデルの学習をどのように強化し、パフォーマンスを向上させ、堅牢なAIソリューションを保証するかを学びます。

正規化は データの前処理の基本的テクニックである。 データセット内の数値特徴を共通の尺度に変換するために使われる基本的なデータ前処理技術である。 値の範囲の違いを歪めることなく、また情報を失うことなく。機械学習(ML)や 機械学習(ML)や ディープラーニング(DL)の文脈では、このプロセスは、入力データが次のような形式であることを保証するために重要である。 入力データをアルゴリズムが効率的に処理できる形式にするために、このプロセスは非常に重要である。値を調整することで、多くの場合 正規化によって、大きな数値スケールを持つ特徴がモデルの学習プロセスを支配するのを防ぐことができる。 これにより、モデル学習中にすべての入力から一貫した寄与が得られるようになります。 モデル学習中のすべての入力からの一貫した寄与を保証します。

AIで正規化が重要な理由

正規化の主な目的は、最適化アルゴリズムの安定性とスピードを向上させることである。 最適化アルゴリズムを容易にすることである。多くのアルゴリズム のような 確率的勾配降下法(SGD)、 は、データ点間の距離や勾配の計算に依存しています。ある特徴が0から100,000の範囲にあり(例:住宅価格 例えば、住宅価格)と別の特徴が0から10(例えば、部屋数)の範囲にある場合、オプティマイザは損失関数を効果的にナビゲートするのに苦労します。 効果的にナビゲートするのに苦労することになる。

適切な正規化には、いくつかの重要な利点がある:

  • より速いコンバージェンス:これにより 勾配降下アルゴリズムが最適解に向かってより早く収束することを可能にする。 最適解への収束が早くなり、必要な計算資源が削減されます。
  • 数値の安定性:値を小さく保つことで、大きな誤差が生じる勾配の爆発などの数値的な問題を防ぐことができます。 大きな誤差勾配が蓄積、ネットワークの更新が不安定になる 大きな誤差勾配が蓄積され、不安定なネットワーク更新につながる。
  • 均等な特徴の重要性:これは、モデルがすべての特徴を等しく重要なものとして扱うことを保証します。 これは、ロバストなモデルの重要な側面である。これは、ロバスト 特徴工学の核となる側面です。

一般的な正規化テクニック

データを正規化する方法はいくつかあり、それぞれ異なる分布やアルゴリズムに適している。

  • 最小-最大スケーリング:これは正規化の最も一般的な形式である。これはデータを一定の 通常は[0, 1]である。これは最小値を引き、範囲(最大値から最小値を引いた値)で割ることで実行される。 最小値)で割る。数学的な実装は Scikit-Learn MinMaxScaler ドキュメントを参照してください。
  • Z-Scoreの標準化:しばしば正規化と混同される、 標準化(またはZスコア正規化)はデータを平均0、標準偏差1に変換する。 これはデータがガウス分布に従う場合に有効である。 ガウス分布に従う場合に有効である。
  • 対数スケーリング:重い末尾や極端な異常値を持つデータには、対数変換を適用する 対数変換を適用すると、値の範囲が圧縮され、分布がより扱いやすくなります。 ニューラルネットワーク(NN)にとって扱いやすい分布になります。

正規化とバッチ正規化の比較

入力データの正規化と、入力データの正規化を区別することは重要である。 バッチ正規化.

  • データの正規化:注釈付きデータの前処理段階で 注釈付きデータの前処理段階で行われる。 生入力(画像や表データなど)がモデルに入る前に適用される。
  • バッチ正規化:ディープ・ニューラル・ネットワークの内部で使用される特定のレイヤー技術である。これは 学習中のミニバッチごとにレイヤーのアクティブ度を正規化する。データの正規化が バッチ正規化は内部学習プロセスを安定させ、次のようなディープ・アーキテクチャを支援する。 YOLO11のようなディープ・アーキテクチャがより深く、より速く学習できるようにする。

実際のアプリケーション

正規化は、人工知能のさまざまな領域でいたるところに見られる。

  1. コンピュータビジョン(CV):物体検出や オブジェクト検出画像分類のようなタスクでは、画像は 0から255までのピクセル値で構成される。このような大きな整数を直接ネットワークに入力すると、学習が遅くなる可能性がある。A 標準的な前処理では、ピクセル値を255.0で割って[0, 1]の範囲に正規化する。これにより のようなモデルの入力を標準化する。 YOLO11YOLO26のようなモデルの入力を標準化する。
  2. 医療画像分析:医療AIで使用されるような医療用スキャン画像は 医療用AIに使用されるような医療用スキャン画像は、多くの場合 強度のスケールはさまざまです。正規化により、MRIやCTスキャンのピクセル強度が異なる患者間で同等になります。 これは正確な腫瘍の検出に不可欠です。 腫瘍の正確な検出には不可欠です。

実施例

のような高度なライブラリは ultralytics トレーニングパイプライン内で画像の正規化を自動的に処理する そのロジックを理解することは有用である。以下はその例である。 Python 使用例 numpy を手動で正規化する方法を説明する。 画像ピクセルデータを0-255の範囲から0-1に手動で正規化する方法を示す。

import numpy as np

# Simulate a 2x2 pixel image with 3 color channels (RGB)
# Values range from 0 to 255
raw_image = np.array([[[10, 255, 128], [0, 50, 200]], [[255, 255, 255], [100, 100, 100]]], dtype=np.float32)

# Apply Min-Max normalization to scale values to [0, 1]
# Since the known min is 0 and max is 255, we simply divide by 255.0
normalized_image = raw_image / 255.0

print(f"Original Max: {raw_image.max()}")
print(f"Normalized Max: {normalized_image.max()}")
print(f"Normalized Data Sample:\n{normalized_image[0][0]}")

この単純な操作で、ニューラルネットワークが取り込む 層内の数学演算が最適に機能するようにする。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加