YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

物体検出アーキテクチャ

物体検出アーキテクチャのパワーをご覧ください。画像理解のためのAIバックボーンです。種類、ツール、そして今日の実際の応用事例を学びましょう。

物体検出アーキテクチャは、物体検出を実行する深層学習モデルの基本的な設計図です。このコンピュータビジョン(CV)タスクでは、画像またはビデオ内の物体の存在と位置を識別します。通常は、物体の周りにバウンディングボックスを描画し、クラスラベルを割り当てることによって行われます。アーキテクチャは、視覚情報を処理し、予測を行う方法など、モデルの構造を定義します。アーキテクチャの選択は、モデルの速度、精度、および計算要件に直接影響するため、非常に重要です。

物体検出アーキテクチャの仕組み

最新の物体検出アーキテクチャのほとんどは、順番に動作する3つの主要なコンポーネントで構成されています。

  • バックボーン: これは畳み込みニューラルネットワーク(CNN)であり、多くの場合、ImageNetのような大規模な画像分類データセットで事前トレーニングされています。その主な役割は、特徴抽出器として機能し、入力画像を階層的な視覚情報を捉える一連の特徴マップに変換することです。一般的なバックボーンネットワークには、ResNetや、多くのYOLOモデルで使用されているCSPDarknetなどがあります。CNNの基礎については、IBMの詳細な概要などのソースから学ぶことができます。
  • ネック: このオプションのコンポーネントは、バックボーンとヘッドの間に位置します。バックボーンによって生成された特徴マップを集約および洗練し、多くの場合、異なるスケールの特徴を組み合わせて、さまざまなサイズのオブジェクトの検出を改善します。例としては、Feature Pyramid Networks(FPN)などがあります。
  • 検出ヘッド: ヘッドは、予測を行う最終コンポーネントです。ネック(またはバックボーンから直接)から処理された特徴マップを取得し、検出された各オブジェクトのクラス確率とバウンディングボックスの座標を出力します。

アーキテクチャの種類

物体検出アーキテクチャは、予測へのアプローチに基づいて大きく分類され、速度と精度のトレードオフが生じます。詳細なモデル比較で、これらのトレードオフの実際を確認できます。

  • Two-Stage Object Detectors: R-CNNファミリーのようなこれらのモデルは、まず候補となるオブジェクト領域(領域提案)のセットを識別し、次に各領域を分類します。この2段階のプロセスは高い精度を達成できますが、多くの場合、より低速です。
  • One-Stage Object Detectors: Ultralytics YOLO(You Only Look Once)ファミリーのようなアーキテクチャは、物体検出を単一の回帰問題として扱います。バウンディングボックスとクラスの確率を、1回のパスで画像全体から直接予測し、リアルタイム推論を可能にします。
  • アンカーフリー検出器: ワンステージ検出器内のより最近の進化であるUltralytics YOLO11のようなアンカーフリーアーキテクチャは、事前定義されたアンカーボックスの必要性を排除します。これにより、トレーニングプロセスが簡素化され、多くの場合、より高速で効率的なモデルにつながります。

実際のアプリケーション

物体検出アーキテクチャは、多様な分野にわたる多数のAIアプリケーションを強化します。

ツールとテクノロジー

これらのアーキテクチャに基づくモデルの開発と展開には、多くの場合、特殊なツールとフレームワークが必要です。

  • 深層学習フレームワーク: PyTorch(公式のPyTorchウェブサイトをご覧ください)やTensorFlowTensorFlowウェブサイトをご覧ください)のようなライブラリは、コアとなる構成要素を提供します。
  • コンピュータビジョンライブラリ: OpenCV(公式サイト:OpenCV.org)は、画像処理と操作のための幅広い機能を提供します。
  • モデルとプラットフォーム: Ultralyticsは、最先端のUltralytics YOLOモデルUltralytics HUBプラットフォームを提供し、カスタムモデルのトレーニング、(COCOのような)データセットの管理、ソリューションのデプロイのプロセスを簡素化します。
  • オープンソース: 多くの物体検出アーキテクチャとツールは、オープンソースライセンスの下で開発されており、AIコミュニティ内でのコラボレーションとイノベーションを促進しています。GitHubのようなリソースは、この分野の多数のプロジェクトをホストしています。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました