Residual Networks (ResNet) の能力を探りましょう。スキップ接続が勾配消失問題を解決し、コンピュータビジョンのためのディープラーニングを可能にする方法を学びましょう。
Residual Networks、広くResNetsとして知られるものは、非常に深いネットワークのトレーニングを可能にするように設計された、特定の種類の人工ニューラルネットワーク (ANN)アーキテクチャです。2015年にMicrosoftの研究者によって導入されたResNetは、ディープラーニングにおける勾配消失問題として知られる重要なボトルネックを解決しました。従来のネットワークでは、より多くの層を積み重ねると、モデルの重みを更新するために必要な信号が層を逆伝播するにつれて薄れていくため、性能の飽和または劣化につながることがよくありました。ResNetは、「スキップ接続」(または残差接続)を導入し、データが1つ以上の層をバイパスして後続の処理段階に直接流れることを可能にしました。この革新により、より深いネットワークが効果的にトレーニングできることが証明され、コンピュータービジョン (CV)における大きなブレークスルーにつながり、現代のアーキテクチャの基礎概念となりました。
ResNetの決定的な特徴は「残差ブロック」です。標準的な畳み込みニューラルネットワーク(CNN)では、各層は入力から出力への直接マッピングを学習しようとします。ネットワークが深くなるにつれて、この直接マッピングの学習はますます困難になります。
ResNetは、学習目標を異なる方法で定式化することでこのアプローチを変更します。各層のスタックが基盤となるマッピング全体を学習することを期待する代わりに、残差ブロックは層に入力と望ましい出力との「残差」、つまり差を学習させます。その後、元の入力はスキップ接続を介して学習された残差に再び追加されます。この構造的な変更は、恒等写像(入力を変更せずに渡すこと)が最適である場合、ネットワークが残差をゼロに押し出すことを容易に学習できることを意味します。これにより、ディープラーニング (DL)モデルははるかに最適化しやすくなり、数十層から数百層、あるいは数千層にまでスケールアップできるようになります。
その発足以来、ResNetのいくつかのバリエーションはAIコミュニティにおける標準的なベンチマークとなっています。
ResNetアーキテクチャの堅牢性は、幅広い視覚タスクにおいて頼りになる選択肢となっています。
ResNetを他の一般的なアーキテクチャと区別することは、その特定の有用性を理解するために有用です。
PyTorchのような現代の深層学習ライブラリは、事前学習済みResNetモデルへのアクセスを容易にします。これらのモデルは、ImageNetのような大規模データセットでトレーニングされたモデルが特定のタスク向けにファインチューニングされる転移学習にとって非常に貴重です。
以下のpythonスニペットは、事前トレーニング済みのResNet-50モデルをロードする方法を示しています。
torchvision (PyTorchエコシステムの一部)であり、シンプルな順伝播を実行します。一方、〜のユーザーは
Ultralyticsプラットフォーム よく使用される場合があります。
YOLO26 detectにおいて、ResNetのような基盤となるバックボーンの概念を理解することは、高度なカスタマイズにとって不可欠です。
import torch
import torchvision.models as models
# Load a pre-trained ResNet-50 model
resnet50 = models.resnet50(weights=models.ResNet50_Weights.DEFAULT)
resnet50.eval() # Set model to evaluation mode
# Create a dummy input tensor (batch_size, channels, height, width)
input_tensor = torch.randn(1, 3, 224, 224)
# Perform a forward pass to get predictions
with torch.no_grad():
output = resnet50(input_tensor)
print(f"Output shape: {output.shape}") # Expect [1, 1000] for ImageNet classes
YOLO26のような新しいアーキテクチャは、最高の速度と精度を実現するために高度に最適化された構造を採用していますが、残差学習の原則は依然として普遍的です。スキップ接続の概念は、自然言語処理(NLP)で使用されるトランスフォーマーや最新の物体検出モデルを含む多くの高度なネットワークで標準的なコンポーネントとなっています。ネットワークを通じて情報がより自由に流れるようにすることで、ResNetは今日の人工知能を支える深く複雑なモデルへの道を開きました。
未来の機械学習で、新たな一歩を踏み出しましょう。