Yolo 深圳
深セン
今すぐ参加
用語集

インスタンスセグメンテーション

Instance Segmentationが、ピクセルレベルの精度で物体検出を洗練し、AIアプリケーション向けの詳細なオブジェクトマスクを可能にする様子をご覧ください。

インスタンスセグメンテーションは コンピュータビジョン(CV)技術である、 画像内の個々のオブジェクトをピクセルレベルで特定し、区切る高度なコンピュータビジョン(CV)技術である。オブジェクト検出とは異なり オブジェクト検出とは異なり 矩形のバウンディングボックスで位置を近似するオブジェクト検出とは異なり、インスタンス セグメンテーションは、各個別のオブジェクトの正確な形状の輪郭を描く正確なマスクを生成する。このきめ細かいレベル システムは、同じクラスの複数のインスタンスを区別することができる。 の重要な要素となっている。 人工知能(AI) アプリケーションに不可欠な要素となっている。

関連業務との違い

インスタンス分割を完全に理解するには、他の基本的なコンピュータビジョンタスクと比較することが役立ちます。 タスクと比較することが役立ちます:

  • セマンティック・セグメンテーション:このタスクは、画像内のすべてのピクセルをあるカテゴリー(例えば、"空"、"道路"、"人物")に分類するが、個々の物体は区別しない。 人")に分類するが、個々のオブジェクトを区別しない。に属するすべてのピクセルは 車 "クラスに属するすべてのピクセルは一緒にグループ化される。
  • オブジェクト検出:このタスクはオブジェクトの存在と位置を検出し、バウンディングボックスで囲む。個々のインスタンス(例:車A対車B 個々のインスタンス(例えば、車A対車B)を区別するが、形状や境界を捉えることはできない。
  • パノプティック・セグメンテーション:これは両方の長所を組み合わせたもので、すべてのピクセルにクラスラベルを割り当てる(セマンティック)と同時に、個々のオブジェクトのインスタンス(インスタンス)を一意に識別し、包括的なシーン理解を提供する。 個々のオブジェクトのインスタンスを識別し(インスタンス)、包括的なシーン理解を提供する。

インスタンス・セグメンテーションは、オブジェクト検出のローカライゼーション機能と、セマンティック・セグメンテーションのピクセル・レベルの精度を効果的に融合させる。 セマンティックセグメンテーションの精度とを融合させる。

仕組み

インスタンスのセグメンテーションモデルは、一般的に ディープラーニング(DL)アーキテクチャ、特に 特に、畳み込みニューラルネットワーク(CNN)を使用して、画像から特徴を抽出する。このプロセスには通常、2つの並行ステップが含まれる:

  1. ローカライゼーション:モデルは各オブジェクトのクラスとバウンディングボックスの座標を予測する。
  2. マスク生成:同時に、モデルは検出された領域内のバイナリマスクを予測する、 どのピクセルがオブジェクトに属するかを正確に決定します。

マスクR-CNNのような初期のアプローチは、2段階のプロセスを利用していた。 領域プロポーザルを生成し、それを改良する。最新のアーキテクチャは Ultralytics YOLO11のような最新のアーキテクチャは 検出とセグメンテーションを1つのステージで実行することで、これに革命をもたらしている。これにより リアルタイム推論が可能になり ライブ・ビデオ・ストリームのオブジェクトを高速かつ高精度にsegment ことが可能になる。

実際のアプリケーション

インスタンス・セグメンテーションが提供する正確な境界検出は、さまざまな産業で不可欠である:

  • 医用画像解析:医療では、異常の正確な体積と形状を特定することが重要です。インスタンス・セグメンテーションは MRIスキャンにおける腫瘍の描出や、顕微鏡検査における個々の細胞 正確な診断と治療計画に役立ちます。
  • 自律走行車:自動運転車は、複雑な道路シーンを理解するためにこの技術を利用する。例えば シティスケープなどのデータセットで訓練することで、車両は走行可能な路面 混雑した環境でも安全なナビゲーションを保証する。
  • 精密農業:農家は作物の健康状態を監視するためにセグメンテーションを使用する。ビジョン・システムを搭載したロボットは、作物の中から個々の雑草を識別し 除草剤を散布するために作物の中の雑草を識別したり、イチゴのような果物を収穫するためにロボットアームを誘導したりすることができる。 を誘導することができる。
  • ロボット工学:ロボットが環境と相互作用するためには、例えば、ビンの中から特定の物体をつかむには、物体の向きや形状を理解する必要がある。 物体の向きと形状を理解する必要があります。インスタンスのセグメンテーションは、操作を成功させるために必要な幾何学的データを提供する。 操作に必要な幾何学的データを提供します。

インスタンス・セグメンテーションの実装

開発者は、インスタンスのセグメンテーションを簡単に実装できます。 ultralytics Python パッケージ。このライブラリは サポート YOLO11 で事前に訓練されたモデルである。 COCO データセット80の一般的なオブジェクト・カテゴリーをdetect し、segment することができる。 を検出することができます。

以下は、モデルをロードして画像に対してセグメンテーションを実行する方法の簡潔な例である:

from ultralytics import YOLO

# Load a pre-trained YOLO11 instance segmentation model
model = YOLO("yolo11n-seg.pt")

# Run inference on an image
# The model predicts classes, boxes, and masks simultaneously
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Visualize the results with masks plotted
results[0].show()

これを自分のデータに適用したいユーザーのために、フレームワークは以下をサポートしている。 カスタムデータセットでの学習もサポートしており、ニッチなアプリケーションに特化した クラスを学習することができる。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加