Panoptic segmentationが、AIアプリケーションにおける正確なピクセルレベルのシーン理解のために、セマンティックセグメンテーションとインスタンスセグメンテーションを統合する様子をご覧ください。
パノプティックセグメンテーションは コンピュータビジョン(CV)タスクである。 セグメンテーションを行う。 セグメンテーションとインスタンスセグメンテーションという 画像のピクセルレベルでの包括的な理解を提供する。他の手法では、オブジェクトを識別したり、領域を分類したりすることだけに重点を置くことができる。 パノプティックセグメンテーションは、ビジュアルシーンのすべてのピクセルに一意のラベルを割り当てる。この処理によって この処理では、「もの」(空、道路、草のようなアモルファスな背景領域)と「もの」(数えられる物体)を区別する。 「を区別する。これらの技術を橋渡しすることで 人工知能(AI)システム は、人間の視覚の詳細な知覚を模倣することで、環境の全体像を把握することができる。
パノプティック・セグメンテーションの価値を十分に理解するためには、関連する画像セグメンテーションのタスクと区別することが役に立つ。 画像セグメンテーションタスクと区別する必要がある:
最新のパノプティック・アーキテクチャは通常、強力な ディープラーニング(DL)フレームワークを活用している。多くの場合 共有された特徴抽出器(バックボーン)、例えば 畳み込みニューラルネットワーク(CNN) またはVision Transformer (ViT)のような共有特徴抽出器(バックボーン)を採用することが多い。ネットワーク は、意味解析用とインスタンス識別用の2つの専門ヘッドに分かれる。高度な 高度なアルゴリズムはこれらの出力を融合させ、重複する予測などの矛盾を解決する。 地図
これらのモデルのトレーニングには、包括的な 注釈付きデータセットが必要である。よく使われるベンチマークには COCO データセットは、日常的なオブジェクトの多様な配列を提供する、 や、自動車研究に不可欠な都市のストリートシーンに特化したCityscapes などがある。
パノプティック・セグメンテーションが提供するきめ細かな情報は、機械学習(ML)に依存する業界に変革をもたらしつつある。 機械学習(ML)に依存する業界を変革している。 業界を変革しています。
完全なパノプティック・アーキテクチャは計算集約的である可能性があるが、「モノ」の構成要素である個別のオブジェクト・インスタンスの識別は効率的に処理される。 によって効率的に処理される。 Ultralytics YOLO11.YOLO11 、最先端のリアルタイム推論を提供します。 リアルタイム推論を実現し スピードと精度が要求されるアプリケーションに最適です。
以下の通りである。 Python の使い方を示している。
ultralytics パッケージを使ってインスタンスのセグメンテーションを行う:
from ultralytics import YOLO
# Load a pretrained YOLO11 instance segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference to detect and segment individual objects ('things')
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting image with segmentation masks
results[0].show()
複雑なパイプラインを構築する開発者のために、次のようなフレームワークがあります。 PyTorchやライブラリ のような OpenCVなどのライブラリを使用すると、セグメンテーションマップをさらに処理できます。 詳細は カスタムセグメンテーションモデルのトレーニングについては Ultralytics ドキュメントを参照してください。


