ディープラーニングにおけるバックボーンの役割をご覧ください。ResNetやViTなどの主要なアーキテクチャを探索し、それらの現実世界のAIアプリケーションを学びます。
バックボーンは ディープラーニングモデル、特に 特にコンピュータ・ビジョン(CV)においてバックボーンは 特徴抽出ネットワークとして機能する。 画像のような生の入力データを受け取り、高レベルの特徴量に変換するように設計されている。これらの 特徴マップは、エッジ、テクスチャ、形状などの本質的なパターンを捉えます、 テクスチャ、形状などの重要なパターンを捉える。この豊富な表現は、次のようなタスクを実行するために、ネットワークの後続部分によって使用される。 オブジェクト検出 画像セグメンテーション 画像分類などのタスクを実行する。バックボーンは ニューラルネットワーク(NN)の基礎である。 画像内の基本的な視覚要素を「見る」。
通常、バックボーンとは 畳み込みニューラルネットワーク(CNN) などの大規模な分類データセットで事前にトレーニングされたものである。 ImageNet.この事前学習は 伝達学習の一種であるこの事前学習によって、ネットワークは 一般的な視覚的特徴の膨大なライブラリを学習することができる。新しい特定のタスクのためにモデルを開発するとき、開発者は多くの場合、ゼロから始めるのではなく、事前に訓練されたバックボーンを使用する。 を使うことが多い。このアプローチは、カスタムモデルの学習に必要な時間を大幅に短縮し カスタムモデルのトレーニングに必要な時間を大幅に短縮し、必要なデータ量を削減します。 パフォーマンスが向上する。バックボーンによって抽出された特徴は、次にネットワークの「ネック」と「ヘッド」に渡される。 「ヘッド "に渡され、さらに改良が加えられ、最終的な出力が生成される。バックボーンの選択は バックボーンの選択は、多くの場合、精度、モデルサイズ、推論レイテンシーのトレードオフとなる。 を達成するための重要な要素である。 リアルタイム性能を リアルタイム性能を達成するための重要な要素である。
次のコードは、事前に訓練された Ultralytics YOLO11モデル(効率的な バックボーンを含むモデルをロードし、画像に対する推論に使用する方法を示します。
from ultralytics import YOLO
# Load a pre-trained YOLO11 model. Its architecture includes a powerful backbone.
model = YOLO("yolo11n.pt")
# Run inference. The backbone processes the image to extract features for detection.
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detection results
results[0].show()
バックボーンの設計は大幅に進化しており、新しいアーキテクチャが登場するたびに、性能と効率が向上している。 バックボーンの設計は大きく進化してきた。最も影響力のあるバックボーン・アーキテクチャには、次のようなものがある:
最新の オブジェクト検出アーキテクチャでは モデルは通常3つの主要な部分に分かれている:
したがって、バックボーンはモデル全体の基本的な構成要素である。様々な YOLO モデルのさまざまな比較を検討し、アーキテクチャの選択が性能にどのように影響するか 性能にどのような影響を与えるかを見ることができます。
バックボーンは、さまざまな業界にわたる無数のAIアプリケーションに不可欠なコンポーネントである:


