Yolo 深圳
深セン
今すぐ参加
用語集

全景セグメンテーション

Panoptic segmentationが、AIアプリケーションにおける正確なピクセルレベルのシーン理解のために、セマンティックセグメンテーションとインスタンスセグメンテーションを統合する様子をご覧ください。

パノプティックセグメンテーションは コンピュータビジョン(CV)タスクである。 セグメンテーションを行う。 セグメンテーションとインスタンスセグメンテーションという 画像のピクセルレベルでの包括的な理解を提供する。他の手法では、オブジェクトを識別したり、領域を分類したりすることだけに重点を置くことができる。 パノプティックセグメンテーションは、ビジュアルシーンのすべてのピクセルに一意のラベルを割り当てる。この処理によって この処理では、「もの」(空、道路、草のようなアモルファスな背景領域)と「もの」(数えられる物体)を区別する。 「を区別する。これらの技術を橋渡しすることで 人工知能(AI)システム は、人間の視覚の詳細な知覚を模倣することで、環境の全体像を把握することができる。

セグメンテーション技術の違い

パノプティック・セグメンテーションの価値を十分に理解するためには、関連する画像セグメンテーションのタスクと区別することが役に立つ。 画像セグメンテーションタスクと区別する必要がある:

  • セマンティック・セグメンテーション この方法は、すべてのピクセルにクラスラベルを割り当てるが、同じカテゴリの複数のオブジェクトを1つのエンティティとして扱う。 として扱う。例えば、人の群れは、個々のメンバーを区別することなく、統一された「人」領域としてラベル付けされる。 としてラベル付けされる。
  • インスタンス分割 この技法は、カウント可能な明確なオブジェクト(「モノ」)の識別と区切りにのみ焦点を当てる。 それぞれの「車」や「歩行者」に対して、正確なバウンディングボックスとマスクを生成する。 各「車」や「歩行者」の正確なバウンディングボックスとマスクを生成するが、通常は背景要素を無視する。
  • パノプティック・セグメンテーション:このアプローチは2つを統合し、分類されないピクセルを残さないようにする。また 前景の物体("モノ")のユニークな識別性を維持しながら、背景("モノ")のコンテキストを提供する。 オブジェクト("モノ")のユニークな識別性を維持しながら、背景("モノ")のコンテキストを提供する。このコンセプトは、FAIR(Meta AI)による画期的な論文で正式に発表された。 FAIR (Meta AI)による画期的な論文で公式化され、シーン全体の解析のための厳密な基準を確立した。 構文解析。

パノプティックの仕組み

最新のパノプティック・アーキテクチャは通常、強力な ディープラーニング(DL)フレームワークを活用している。多くの場合 共有された特徴抽出器(バックボーン)、例えば 畳み込みニューラルネットワーク(CNN) またはVision Transformer (ViT)のような共有特徴抽出器(バックボーン)を採用することが多い。ネットワーク は、意味解析用とインスタンス識別用の2つの専門ヘッドに分かれる。高度な 高度なアルゴリズムはこれらの出力を融合させ、重複する予測などの矛盾を解決する。 地図

これらのモデルのトレーニングには、包括的な 注釈付きデータセットが必要である。よく使われるベンチマークには COCO データセットは、日常的なオブジェクトの多様な配列を提供する、 や、自動車研究に不可欠な都市のストリートシーンに特化したCityscapes などがある。

実際のアプリケーション

パノプティック・セグメンテーションが提供するきめ細かな情報は、機械学習(ML)に依存する業界に変革をもたらしつつある。 機械学習(ML)に依存する業界を変革している。 業界を変革しています。

  • 自律走行車 ウェイモやテスラなどの自動運転車は テスラなどの自動運転車は、シーンの総合的な理解に依存している。パノプティックモデルにより、車両は 運転可能な路面(意味的な「もの」)を定義すると同時に、個々の歩行者や他の車両(インスタンスの「もの」)の軌跡を追跡することができる。 同時に個々の歩行者や他の車両(インスタンス「モノ」)の軌跡を追跡する。
  • 医療画像解析 医療では正確さが重要です。分析 MRIスキャン 一般的な組織タイプと特定の異常を区別する必要があります。パノプティック・セグメンテーションは 放射線技師は、背景臓器を識別する一方で、個々の腫瘍細胞を計数・測定し、正確な腫瘍検出を支援します。 腫瘍の正確な検出に役立ちます。
  • ロボット工学と農業非構造化環境におけるロボットは 非構造化環境におけるロボットは、操作とナビゲーションのためにこの技術を使用する。精密農業では 精密農業では、自動収穫機は 作物の列(背景)と個々の熟した果実(インスタンス)を区別し、作物を傷つけることなく収穫することができる。 植物を傷つけることなく収穫できる。

YOLOインスタンス分割

完全なパノプティック・アーキテクチャは計算集約的である可能性があるが、「モノ」の構成要素である個別のオブジェクト・インスタンスの識別は効率的に処理される。 によって効率的に処理される。 Ultralytics YOLO11.YOLO11 、最先端のリアルタイム推論を提供します。 リアルタイム推論を実現し スピードと精度が要求されるアプリケーションに最適です。

以下の通りである。 Python の使い方を示している。 ultralytics パッケージを使ってインスタンスのセグメンテーションを行う:

from ultralytics import YOLO

# Load a pretrained YOLO11 instance segmentation model
model = YOLO("yolo11n-seg.pt")

# Run inference to detect and segment individual objects ('things')
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting image with segmentation masks
results[0].show()

複雑なパイプラインを構築する開発者のために、次のようなフレームワークがあります。 PyTorchやライブラリ のような OpenCVなどのライブラリを使用すると、セグメンテーションマップをさらに処理できます。 詳細は カスタムセグメンテーションモデルのトレーニングについては Ultralytics ドキュメントを参照してください。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加