Yolo 深圳
深セン
今すぐ参加
用語集

物体検出

YOLOような最先端のモデルを使って、画像やビデオ内のオブジェクトを識別し、位置を特定します。実世界での応用例をご覧ください!

物体検出は、コンピュータビジョン(CV)の中でも極めて重要な機能である。 コンピュータビジョン ソフトウェアシステムは、画像が何を表しているかを認識するだけでなく、画像内のアイテムの特定のインスタンスを見つけることができます。一方 標準的な分類は、視覚入力全体に単一のラベルを割り当てますが、オブジェクト検出は、各アイテムの周囲の境界ボックスを予測することにより、より詳細な理解を提供します。 な理解を提供する。 特定のクラス・ラベルと信頼スコア 信頼度スコア。この技術は 高度な 人工知能 機械が物理世界の複雑さを認識し、解釈し、相互作用することを可能にする。工場の自動品質管理から高度な監視まで 工場の自動品質管理から高度な監視まで、非構造化ピクセルデータを実用的な洞察に変換します。

物体検出のメカニズム

最新の検出器は主に ディープラーニング(DL)アーキテクチャ、特に 畳み込みニューラルネットワーク(CNN)を用いて、特徴の空間階層を学習する。典型的なアーキテクチャは ResNetやCSPNetなどのバックボーンから構成される。 入力画像から重要な視覚的特徴を抽出する。これらの特徴は次に 検出ヘッドによって処理される。 バウンディングボックスの座標とクラスメンバーシップの確率を出力する。

高性能を達成するために、モデルはCOCOデータセットのような大規模なラベル付きコレクションで学習される。 COCO データセットはベンチマークの基準となる。推論中、 アルゴリズムは同じオブジェクトに対して複数の重複するボックスを生成することが多い。以下のようなテクニックがある。 非最大抑制(NMS) のような技術が適用され、これらの冗長性をフィルタリングし、最も信頼度が高く、最適なボックスのみを保持する。 IoU持つボックスのみを保持する。 を保持する。

モデルは一般的に2つのタイプに分類される:

  • 2段階の物体検出 Faster R-CNNのようなシステムは、まず関心領域を提案し、次にそれらをclassify 。歴史的には正確だが 計算コストがかかる。
  • 1段式物体検出器 以下を含む最新のアーキテクチャ Ultralytics YOLO11, は、バウンディングボックスとクラス確率を1回のパスで予測する。このアプローチは リアルタイム推論に最適化されており スピードと精度の理想的なバランスを提供する。Ultralytics 現在、次のものを開発している。 YOLO26を開発中である。 を開発している。

関連するCVタスクとの区別

物体検出を類似のコンピュータ・ビジョン・タスクと区別することは極めて重要である。 コンピュータビジョンタスクと区別することが重要である。

  • 画像の分類 画像に何が写っているか(例えば「犬」)を識別するが、どこに何があるか、いくつあるかは識別しない。
  • インスタンス・セグメンテーション 検出と同様、オブジェクトの位置を特定するが、ボックスの代わりに、オブジェクトの正確な形状を輪郭で示すピクセルパーフェクトなマスクを生成する。 正確な形状。
  • 物体追跡これは、検出を時間領域へと拡張する。 検出された物体に一意のIDを割り当て、ビデオフレームを横断してその軌跡を追跡する。 を追跡する。

実際のアプリケーション

物体検出は、様々な業界において多くの革新的な技術を支えるエンジンである。

  • 自律システム:自動車産業では 自律走行車は検出モデル を活用し、歩行者、交通標識、他の車をミリ秒単位で識別する。この分野のリーダーである ウェイモや テスラ・オートパイロットは、複雑な環境を安全にナビゲートするため 複雑な環境を安全にナビゲートするために、これらの機能を活用している。
  • 医療診断医療AIでは ヘルスケアAIでは X線やCTスキャンで腫瘍や骨折などの関心領域をハイライトすることで、放射線科医を支援します。米国国立衛生研究所(NIH)のような組織 米国国立衛生研究所(NIH)のような組織は、医療画像解析がどのように患者数の増加を抑えることができるかを積極的に研究している。 医療画像解析による 診断ミスを減らす方法を積極的に研究している。
  • リテール・アナリティクス店舗がAIを活用 小売業におけるAIの活用:店舗はAIを活用し、チェックアウトプロセスの自動化や在庫の監視を行っている。 在庫を監視する。アマゾン・ゴーのようなシステムは のようなシステムは、顧客が棚からどの商品を手に取るかをtrack するために検知を使用する。

実施例

次のコード・スニペットは、事前にトレーニングされたYOLO11 モデルを使用して、オブジェクト検出を実行する方法を示しています。 ultralytics パッケージを使用する。このシンプルなワークフローは、モデルをロードし、画像上で推論を実行し、バスや人のようなオブジェクトを識別する。 を実行する。

from ultralytics import YOLO

# Load a pretrained YOLO11 model (n-scale for speed)
model = YOLO("yolo11n.pt")

# Run inference on a remote image source
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results with bounding boxes and labels
results[0].show()

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加