用語集

物体検出

YOLOのような最先端のモデルを使って、画像やビデオ内のオブジェクトを識別し、位置を特定します。実世界での応用例をご覧ください！

物体検出は、コンピュータビジョン（CV）の基本的なタスクであり、画像やビデオ内の1つまたは複数の物体を識別し、位置を特定することを含む。その目的は、物体が何であるかを分類するだけでなく、通常、それぞれの物体の周囲にバウンディングボックスを描くことによって、その位置を決定することである。この技術は、多くの高度な人工知能（AI）アプリケーションの礎石として機能し、機械が物理的な周囲環境を高度に理解して解釈することを可能にする。

物体検出の仕組み

物体検出モデルは通常、ディープラーニング（DL）、特に畳み込みニューラルネットワーク（CNN）を使って構築される。このプロセスでは、画像をネットワークに入力し、検出された物体のリストを出力する。ネットワークは、それぞれにクラスラベル（「人」、「車」、「犬」など）、信頼度スコア、バウンディングボックスの座標を付ける。

すなわち、入力画像から特徴を抽出するためのバックボーンと、バウンディングボックスとクラスを予測するための検出ヘッドである。これらのアーキテクチャは、しばしば1段検出器と2段検出器に分類される。

ワンステージ物体検出器： Ultralytics YOLOファミリーのようなモデルはシングルパスで検出を行うため、非常に高速でリアルタイムの推論に適している。これらのモデルは、すべてのバウンディングボックスとクラス確率を同時に予測します。
2段階の物体検出：R-CNNやその亜種のようなアーキテクチャは、まず関心領域を提案し、次にその領域内の物体を分類する。非常に正確であることが多いが、1段検出器よりも遅いことがある。

物体検出とその他のCVタスクの比較

物体検出を他の関連するコンピュータ・ビジョン・タスクと区別することは重要である：

画像の分類：画像全体に1つのラベルを割り当てる（例：「これは猫の写真です」）。対象物の位置は特定しない。
画像分割：画像内の各ピクセルを分類し、オブジェクトの正確な輪郭を提供する。インスタンスセグメンテーションは、同じオブジェクトクラスの異なるインスタンスを区別するが、セマンティックセグメンテーションは、クラスのすべてのインスタンスを1つのエンティティとして扱う。
オブジェクトトラッキング：オブジェクト検出の拡張機能で、ビデオ内の複数のフレームにわたって特定のオブジェクトを追跡し、時間の経過とともにその同一性を維持します。詳しくは、動画内の動くオブジェクトのトラッキングに関するガイドをご覧ください。

実世界での応用

物体検出は、多くの産業で使用されている革新的な技術である。

自律走行車自動運転車では、歩行者、自転車、他の車両、交通信号を識別して安全にナビゲートするために、物体検出が重要である。ウェイモやテスラのような企業は、自律走行システムを動かすためにこの技術に多額の投資を行っている。
製造業におけるAI：組立ラインでは、検出モデルが自動的に欠陥を発見したり、部品が正しく組み立てられているかどうかを確認したりする。これにより品質管理が強化され、生産効率が向上する。
セキュリティと監視自動化されたシステムは、セキュリティアラームシステム構築のためのガイドに詳述されているように、物体検出を使用して、無許可の個人、放置された荷物、または異常な活動をリアルタイムで識別します。
ヘルスケアにおけるAI 医療画像分析では、X線やCTスキャンで腫瘍や骨折のような異常を検出し強調することで、放射線科医をモデルが支援します。YOLO11を使った腫瘍検出については、当社のブログをご覧ください。
農業におけるAI：物体検出機能を備えたドローンや地上ロボットは、作物の健康状態を監視し、害虫を識別し、高精度で収穫量を推定することができる。

ツールとトレーニング

オブジェクト検出モデルの開発と展開には、ツールやテクニックの豊富なエコシステムが関わっている。

フレームワーク： PyTorchや TensorFlowのような人気のあるディープラーニングフレームワークは、モデルを構築するためのコアライブラリを提供する。
モデルUltralyticsは、スピードと精度のバランスに最適化されたYOLOv8や YOLO11といった最先端のモデルを提供しています。他のモデルとの比較はモデル比較ページでご覧いただけます。
プラットフォーム Ultralytics HUBは、人気の高いCOCOデータセットのようなデータセットの管理から、カスタムモデルのトレーニング、モデルの展開の促進まで、ワークフロー全体を簡素化します。
テクニックトレーニング・プロセスでは、堅牢性を向上させるためのデータ増強や、事前にトレーニングされたモデルの知識を活用するための転移学習などのテクニックがしばしば活用されます。モデルのパフォーマンスは、パフォーマンス・メトリクス・ガイドで説明されているように、mAPや IoUなどのメトリクスを使用して評価されます。

物体検出

柔軟なエンタープライズライセンシングソリューションでイノベーションを促進

Ultralytics YOLOでAIモデルを数秒でトレーニング

Ultralytics HUBでYOLOモデルを簡単にトレーニング

物体検出の仕組み

物体検出とその他のCVタスクの比較

実世界での応用

ツールとトレーニング

このカテゴリの続きを読む

製造業ERPガイド

製造実行システム（MES）：AI主導の生産

アディティブ・マニュファクチャリングを理解する技術と使用例

Ultralyticsコミュニティに参加する