Yolo 深圳
深セン
今すぐ参加
用語集

バックボーン

ディープラーニングにおけるバックボーンの役割をご覧ください。ResNetやViTなどの主要なアーキテクチャを探索し、それらの現実世界のAIアプリケーションを学びます。

バックボーンは ディープラーニングモデル、特に 特にコンピュータ・ビジョン(CV)においてバックボーンは 特徴抽出ネットワークとして機能する。 画像のような生の入力データを受け取り、高レベルの特徴量に変換するように設計されている。これらの 特徴マップは、エッジ、テクスチャ、形状などの本質的なパターンを捉えます、 テクスチャ、形状などの重要なパターンを捉える。この豊富な表現は、次のようなタスクを実行するために、ネットワークの後続部分によって使用される。 オブジェクト検出 画像セグメンテーション 画像分類などのタスクを実行する。バックボーンは ニューラルネットワーク(NN)の基礎である。 画像内の基本的な視覚要素を「見る」。

バックボーンの仕組み

通常、バックボーンとは 畳み込みニューラルネットワーク(CNN) などの大規模な分類データセットで事前にトレーニングされたものである。 ImageNet.この事前学習は 伝達学習の一種であるこの事前学習によって、ネットワークは 一般的な視覚的特徴の膨大なライブラリを学習することができる。新しい特定のタスクのためにモデルを開発するとき、開発者は多くの場合、ゼロから始めるのではなく、事前に訓練されたバックボーンを使用する。 を使うことが多い。このアプローチは、カスタムモデルの学習に必要な時間を大幅に短縮し カスタムモデルのトレーニングに必要な時間を大幅に短縮し、必要なデータ量を削減します。 パフォーマンスが向上する。バックボーンによって抽出された特徴は、次にネットワークの「ネック」と「ヘッド」に渡される。 「ヘッド "に渡され、さらに改良が加えられ、最終的な出力が生成される。バックボーンの選択は バックボーンの選択は、多くの場合、精度、モデルサイズ、推論レイテンシーのトレードオフとなる。 達成するための重要な要素である。 リアルタイム性能を リアルタイム性能を達成するための重要な要素である。

次のコードは、事前に訓練された Ultralytics YOLO11モデル(効率的な バックボーンを含むモデルをロードし、画像に対する推論に使用する方法を示します。

from ultralytics import YOLO

# Load a pre-trained YOLO11 model. Its architecture includes a powerful backbone.
model = YOLO("yolo11n.pt")

# Run inference. The backbone processes the image to extract features for detection.
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detection results
results[0].show()

一般的なバックボーンアーキテクチャ

バックボーンの設計は大幅に進化しており、新しいアーキテクチャが登場するたびに、性能と効率が向上している。 バックボーンの設計は大きく進化してきた。最も影響力のあるバックボーン・アーキテクチャには、次のようなものがある:

  • 残留ネットワーク(ResNet): Microsoft Researchによって導入されたResNetモデルは、「スキップ接続」を使用している。 「スキップ接続」を使用し、勾配の消失問題を緩和することで、より深いネットワークの学習を可能にする。 問題を軽減する。
  • EfficientNet: Google AIが開発したこのモデル・ファミリーは、ネットワークの深さと幅と解像度を一様にバランスさせる複合スケーリング手法を採用している。 ネットワークの深さ、幅、解像度を一様にバランスさせる複合的なスケーリング方法を採用し、高精度と計算効率を両立させたモデルを作成する。 高精度で計算効率の高いモデルを作成する。
  • ヴィジョン・トランスフォーマー(ViT) このアーキテクチャは トランスフォーマーモデルを 自然言語処理(NLP) このアーキテクチャは、自然言語処理(NLP)で大きな成功を収めたTransformerモデルを視覚タスクに適応させたものだ。ViTは画像をパッチのシーケンスとして処理し 従来のCNNの局所的な受容野とは異なり 従来のCNNの局所的な受容野とは異なる。
  • CSPNet(クロスステージ・パーシャルネットワーク):原著論文で詳述されているように このアーキテクチャは計算ボトルネックを減らすために特徴マップを分割することで学習効率を向上させる。 特徴マップを分割して計算ボトルネックを削減する。多くのUltralytics YOLO モデルの重要な構成要素である。

バックボーンとヘッド・アンド・ネック

最新の オブジェクト検出アーキテクチャでは モデルは通常3つの主要な部分に分かれている:

  1. バックボーン:バックボーンの役割は、入力画像からさまざまなスケールの特徴マップを抽出することである。 画像から様々なスケールの特徴マップを抽出することである。
  2. 首:背骨と頭部をつなぐコンポーネント。このコンポーネントは、バックボーンからの特徴を絞り込み、集約する。 多くの場合、異なるレイヤーの情報を組み合わせて、より豊かな表現を作成する。一般的な例として はFeature Pyramid Network (FPN)である。
  3. 検出ヘッドこれはネットワークの最終部分である ネットワークの最後の部分である。ネックから精緻化された特徴を受け取り、主なタスクを実行する。 各オブジェクトのバウンディングボックス、クラスラベル、信頼度スコア を実行する。

したがって、バックボーンはモデル全体の基本的な構成要素である。様々な YOLO モデルのさまざまな比較を検討し、アーキテクチャの選択が性能にどのように影響するか 性能にどのような影響を与えるかを見ることができます。

実際のアプリケーション

バックボーンは、さまざまな業界にわたる無数のAIアプリケーションに不可欠なコンポーネントである:

  1. 自律走行車自動運転車では 自動運転車では、ResNet やEfficientNetのようなロバストなバックボーンは、カメラからの画像を処理して、他の車両、歩行者、交通detect ・classify します。 信号などを検出・分類します。この特徴抽出は、車両のナビゲーションと意思決定に不可欠です。 Waymoのような企業が開発したシステムで実証されている。
  2. 医療画像解析 ヘルスケアAIソリューションでは、X線やMRIのような医療スキャンを解析するバックボーンが使用される。 X線やMRIのような医療スキャンを分析するために使用される。例えば、バックボーンは胸部X線から特徴を抽出して、肺炎の兆候を特定したり、CTスキャンから腫瘍の可能性を発見したりすることができる。 例えば、バックボーンは胸部X線から特徴を抽出し、肺炎の兆候を特定したり、CTスキャンから潜在的な腫瘍を発見したりすることができる。 Radiology:人工知能これは放射線科医を次のように支援する。 YOLO11 ようなモデルは、腫瘍検出のような特殊なタスクのために微調整することができる。 腫瘍検出

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加