Yolo 深圳
深セン
今すぐ参加
用語集

Residual Networks (ResNet)

ResNetが、勾配消失問題を解決し、画像分析、NLPなどのための超深層ネットワークを可能にすることで、深層学習に革命をもたらす様子をご覧ください。

ResNetsとして広く認知されているResidual Networksは、人工知能(AI)の分野における極めて重要な進歩である。 人工知能(AI)と コンピュータ・ビジョン(CV)の分野における極めて重要な進歩である。2015年にマイクロソフトリサーチ Microsoft リサーチの研究者によって2015年に発表されたこのアーキテクチャは ディープラーニング ディープラーニング(DL)における 消失勾配問題だ。ResNetの登場以前は ResNetの登場以前は ニューラル・ネットワーク(NN)の深さを増やすと、多くの場合、収穫が逓減する。 レイヤーを増やすと学習誤差が増大するのだ。ResNetは「スキップ接続 を導入することで、この問題を解決しました。 高い精度を維持しながら、何百、何千もの層を持つネットワークの訓練を成功させることができる。 精度を維持することができる。

コア・イノベーション残留ブロック

ResNetの特徴は残差ブロックである。従来の 従来の畳み込みニューラルネットワーク(CNN)では、層は順次積み重ねられ、各層は入力から出力へのマッピングを直接学習しようとする。 しかし、ネットワークが深くなるにつれて、入力データからの信号はネットワークの末端に到達する前に劣化してしまうことがある。

ResNetは、レイヤーの入力を直接出力に追加できる「ショートカット」またはスキップ接続を導入している。 に直接追加することができる。このメカニズムは、基本的にネットワークに、入力と最適出力の間の「残差」(差)を学習するように指示する。 を学習するようにネットワークに指示する。このアーキテクチャは は情報の流れを維持し、より良い特徴抽出を促進する。 特徴抽出が容易になり 元の入力データを失うことなく、テクスチャーや形状のような複雑なパターンを捉えることができる。オリジナルの Deep Residual Learning for Image Recognition(ディープ・レジデュアル・ラーニング・フォー・イメージ・レコグニション)」の論文を読んで、数学的基礎を理解してください。 数学的基礎を理解してください。

機械学習でResNetが重要な理由

ResNetは多くの最新ビジョン・システムの基礎的なバックボーンと考えられている。 ResNetは、多くの最新ビジョン・システムの基礎的バックボーンとみなされています。ResNetは非常に深いネットワークを学習することができるため、以下のような大規模なデータセットで優れた性能を発揮する、非常にロバストなモデルを作成することができます。 のような大規模データセットで優れた性能を発揮します。 ImageNet.

このアーキテクチャは 伝達学習にとって特に重要である。なぜなら モデルは膨大なデータから豊富な特徴マップを学習している 比較的小さなデータセットで特定のタスクのために微調整することができる。この汎用性により ResNetは画像分類から複雑なビデオ分類まで 画像分類から複雑なビデオ解析 分析まで、さまざまなタスクの標準的な選択肢となっています。

実際のアプリケーション

ResNetが提供する安定性と奥行きの深さは、重要な、大きなリスクを伴う環境での使用を可能にしている。

  • 医療診断医療診断 医療のAI分野では、ResNetアーキテクチャは 医療画像解析に 医療画像解析によく使用される。例えば ディープResNetモデルを用いてMRIスキャンやX線画像を解析し、腫瘍を検出したり 腫瘍検出 このモデルでは、より浅いネットワークでは見落とされる可能性のある組織構造の微細な異常を識別する必要があります。
  • 自律走行: 自律走行車は、安全なナビゲーションを行うため 知覚システムに依存している。ResNetの変種はしばしば、以下のような物体検出システムの特徴抽出器として機能します。 物体検出システム 歩行者、交通標識、他の車両を識別する物体検出システムの特徴抽出器として使用されます。ResNetの深さにより、車は様々な照明や天候の下でも物体を認識することができます。 自動車安全におけるAIの重要な要素である 自動車安全におけるAIの重要な要素である。

ResNetと他のアーキテクチャの比較

ResNetを、次のような深層学習ライブラリに見られる他の一般的なアーキテクチャと区別することは有益である。 PyTorchTensorFlow:

  • ResNetとVGGの比較:VGG(Visual Geometry Group)ネットワークは、3x3の畳み込みのみを使用するシンプルさで人気があった。 3x3畳み込みだけである。しかし、VGGモデルは計算量が多く、19層を超える効果的な学習には苦労します。 ResNetはスキップ接続を使用し、より深い層(例えば50層、101層、152層)まで、その深さに対してより低い推論レイテンシで学習することができる。 推論のレイテンシはその深さに比べて低い。
  • ResNetとYOLO11比較:ResNetは主に分類器のバックボーンである、 YOLO11は最先端の物体検出器である。しかし YOLO11 ような最新の検出器は、学習時の効率的な勾配フローを確保するために、ResNetから進化したアーキテクチャの概念、例えばクロスステージ部分接続 のようなResNetから発展したアーキテクチャの概念を取り入れている。

Ultralytics実装

ResNetモデルを分類タスクに活用するには ultralytics Python パッケージ。これにより を使えば、最小限のコードで事前に訓練された重みにアクセスし、推論を実行することができる。

from ultralytics import YOLO

# Load a pre-trained ResNet50 model capable of classifying images
model = YOLO("resnet50.pt")  # Downloads the model weights automatically

# Perform inference on an image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top classification result
print(f"Top class: {results[0].names[results[0].probs.top1]}")

より深い理論を理解することに興味がある人には、次のようなコースがある。 スタンフォード大学のCS231nのようなコースは、CNNアーキテクチャに関する優れた学術リソースを提供している。 単純な分類器を作るにせよ、スマート製造のための複雑なシステムを作るにせよ ResNetを理解することは を理解することが不可欠です。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加