Yolo 深圳
深セン
今すぐ参加
用語集

特徴マップ

フィーチャーマップがUltralytics YOLO モデルにどのようにパワーを与え、正確な物体検出や自律走行などの高度なAIアプリケーションを可能にしているかをご覧ください。

特徴マップは、畳み込みフィルターが入力画像または入力画像に作用したときに生成される基本的な出力である。 畳み込みフィルタが入力画像あるいは に対して畳み込みフィルタが作用したときに生成される基本的な出力である。 Convolutional Neural Network (CNN)と呼ばれる。コンピュータビジョン(CV)の文脈では、これらのマップはニューラルネットワークの「目」として機能する。 マップはニューラルネットワークの "目 "として機能し、エッジ、テクスチャ、テクスチャのような学習された特徴の存在と位置を強調する。 エッジ、テクスチャ、コーナー、複雑な幾何学的形状などの学習された特徴の存在と位置を強調する。生のピクセルデータを 特徴マップによって、洗練されたモデルが、画像の分類からリアルタイムでの処理まで、さまざまなタスクを実行できるようになります。 画像分類からリアルタイムの オブジェクト検出まで、幅広いタスクを実行することができます。

フィーチャーマップの作成方法

特徴マップの生成には、次のような数学的プロセスが含まれる。 コンボリューション学習可能な重みの カーネルまたはフィルタと呼ばれる、学習可能な重みの特殊な行列が、入力データ上をスライドする。 入力データを横切る。各位置で、カーネルは要素ごとの乗算と合計を行い、出力行列に1つの値を生成する。 出力行列に1つの値を生成する。

  • 活性化:結果の値は通常 ReLUのような活性化関数を通過する。 のような活性化関数を通過する。
  • 空間的保存:完全に連結されたレイヤーとは異なり、フィーチャーマップは空間的な関係を保持する、 つまり、特定の座標で高い値が検出された場合、元の画像の同じ相対位置で検出された特徴に対応します。 で検出された特徴に対応します。
  • 深度:1つの畳み込みレイヤーが複数のフィルターを利用することが多く、その結果得られる2Dアレイを積み重ねる。 ディープラーニング(DL)のアーキテクチャ図でよく可視化される。 ディープラーニング(DL)アーキテクチャ図によく可視化される。

階層的特徴学習

多くのシステムで使われている 多くのシステムで使われているResNetバックボーン は、特徴マップの階層的な性質を利用している。データがネットワークを通過するにつれて、抽象化レベル が高まる:

  1. 浅いレイヤー:初期のフィーチャーマップは、垂直線、カラーグラデーション、単純な曲線など、低レベルの詳細をキャプチャする。 グラデーションや単純な曲線など、低レベルの詳細をキャプチャします。これらは 視覚認識の基礎となる。
  2. 深い層:ネットワークの深層部では、これらの基本要素が組み合わされる。その結果、マップは 車のホイールの形や犬の顔など、高レベルの意味概念を表す。この階層構造は のような最先端モデルのパフォーマンスにとって重要である。 YOLO11, この階層構造は、YOLO11のような最先端のモデルの性能にとって非常に重要である。 この階層構造は、YOLO11のような最先端のモデルの性能にとって非常に重要である。

ネットワーク・インテリジェンスの可視化

開発者は、モデルが学習したことを解釈するためにフィーチャーマップを視覚化することが多い。 これは説明可能なAI(XAI)の重要なプラクティスである。これは、説明可能なAI(XAI)の重要な実践方法です。 TensorBoardのようなツールは、エンジニアがこれらの内部状態を検査することを可能にする。 内部状態を検査することができる。車のdetect 目的とした特徴マップが背景の木々でアクティブになっている場合、モデルがノイズに過剰適合している可能性がある。 がノイズに過剰適合している可能性を示している。この検査は、デバッグやモデルのロバスト性を向上させるために不可欠である。 モデルのロバスト性を向上させるために不可欠です。

次のPython コードは、次のように使ってフィーチャーマップの寸法にアクセスする方法を示しています。 ultralytics ライブラリ フックを畳み込みレイヤーに登録する。

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")


# Define a hook to print the shape of the feature map from the first layer
def hook_fn(module, input, output):
    print(f"Feature Map Output Shape: {output.shape}")


# Register the hook to the first convolutional layer of the model
model.model.model[0].register_forward_hook(hook_fn)

# Run inference on a dummy image to trigger the hook
model("https://ultralytics.com/images/bus.jpg")

実際のアプリケーション

フィーチャーマップは、多くの革新的なテクノロジーを支えるエンジンである:

  • 自律走行車自律走行システムでは 自律走行システム ウェイモが開発したような自律走行システムでは、フィーチャーマップがカメラの映像を処理して車線や歩行者、交通標識を識別する、 歩行者、交通標識を識別します。これらのマップの空間的忠実性により、車両は道路上に何があるかだけでなく 道路上に何があるかだけでなく、それが車に対してどの位置にあるかを正確に把握することができる。
  • 医療診断医療画像解析において 医療画像分析では、ディープラーニング モデルはMRIやCTスキャンを分析する。これらのネットワークの特徴マップは、腫瘍や骨折のような異常を強調するように訓練される。 骨折のような異常を強調するように学習される。Nature Medicineなどのジャーナルに掲載された研究では、以下のことが実証されている。 Nature Medicine』誌などで発表された研究では、これらの特異的な活性化が、関心領域に高い精度でフラグを立てることで、放射線科医をどのように支援できるかを実証している。

関連概念の区別

ニューラルネットワークアーキテクチャを完全に理解するためには、フィーチャーマップを関連用語と区別することが役に立つ:

  • フィーチャーマップとフィーチャー抽出の比較特徴抽出とは 生の入力から有益なデータを導き出すプロセスである。特徴マップは、CNNレイヤーの中でこのプロセス データ構造である
  • フィーチャーマップとエンベッディングの比較:特徴マップが空間的な次元(高さと幅)を保持するのに対して、埋め込みは一般的に平坦化された低次元である、 エンベッディングは一般的に平坦化された低次元 ベクトルです。エンベッディングは、画像やオブジェクト全体の意味的な本質を表し、多くの場合、以下のような類似検索に使用されます。 ベクトルデータベースの類似検索 ベクトルデータベースの類似性検索によく使われます。 特徴マップは、画像セグメンテーションのような空間的な位置特定を必要とするタスクに使用されます。 画像セグメンテーション

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加