Yolo 深圳
深セン
今すぐ参加
用語集

画像セグメンテーション

コンピュータビジョンにおける画像セグメンテーションを探求しましょう。Ultralytics 、インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションに対して、ピクセルレベルの精密なマスクを提供する方法を学びます。

画像セグメンテーションは、コンピュータビジョン(CV)における高度な技術であり、デジタル画像を複数のピクセルのサブグループ(画像セグメントまたは領域と呼ばれることが多い)に分割する。標準的な画像分類が画像全体に単一のラベルを割り当てるのとは異なり、セグメンテーションは個々のピクセルごとに特定のクラスラベルを割り当てることで、視覚データをはるかに細分化されたレベルで分析します。このプロセスにより精密なピクセルレベルのマップが生成され、人工知能(AI)モデルは単に存在する物体を認識するだけでなく、それらの正確な位置や具体的な境界を把握することが可能になります。

ピクセルレベル解析の仕組み

この高精度の理解を実現するため、セグメンテーションモデルは通常、深層学習(DL)アーキテクチャ、特に畳み込みニューラルネットワーク(CNN)を活用する。これらのネットワークは強力な特徴抽出器として機能し、エッジ、テクスチャ、複雑な形状などのパターンを識別する。古典的なU-Netのような従来のセグメンテーションアーキテクチャは、エンコーダ-デコーダ構造を採用することが多い。エンコーダは入力画像を圧縮して意味的文脈を捉え、デコーダは空間的詳細を再構築して最終的なセグメンテーションマスクを出力する。 U-Netなどの従来のセグメンテーションアーキテクチャは、エンコーダ-デコーダ構造を採用することが多い。エンコーダは入力画像を圧縮して意味的文脈を捕捉し、デコーダは空間的詳細を再構築して最終的なセグメンテーションマスクを出力する。

近年の進歩により、2026年1月に発表されたYOLO26のようなリアルタイムアーキテクチャが実現した。これらのモデルはセグメンテーション機能をエンドツーエンドのパイプラインに直接統合し、クラウドGPUからエッジデバイスまで様々なハードウェア上で高速処理を可能にしている。

セグメンテーションの主な種類

プロジェクトの具体的な目標に応じて、開発者は一般的に3つの主要なセグメンテーション手法から選択します:

  • セマンティックセグメンテーション この手法はピクセルをカテゴリに基づいて分類するが、同一カテゴリ内の個別のオブジェクトを区別しない。 例えば衛星画像解析では、 「森林」を表すすべてのピクセルが緑色に塗られ、森林全体が単一のエンティティとして扱われる。
  • インスタンスセグメンテーション この技術は、関心のある個別のオブジェクトを識別し分離します。混雑した街路シーンでは、インスタンスセグメンテーションにより「車A」「車B」「歩行者A」に対して固有のマスクが生成され、システムがtrack エンティティをカウントおよびtrack 可能にします。Ultralytics ファミリーのコア機能です。
  • パノプティックセグメンテーション 意味的セグメンテーションの網羅性とインスタンスセグメンテーションの精度を組み合わせたハイブリッド手法。 各ピクセルにラベルを付与し、不定形の背景要素(空や道路など)を識別すると同時に、 数え上げ可能な前景オブジェクトを一意に特定する。

物体検出との区別

セグメンテーションと物体検出を区別することは極めて重要です。検出アルゴリズムは矩形バウンディングボックスを用いて物体を特定しますが、そのボックス内には背景ピクセルが必然的に含まれます。 セグメンテーションは、物体の正確な輪郭や多角形をトレースすることで、より厳密で正確な表現を提供する。この違いは、ロボットアームが衝突せずに操作するために物体の正確な形状を把握しなければならないロボット把持などの応用において極めて重要である。

実際のアプリケーション

画像セグメンテーションが提供する精度は、多様な産業分野におけるイノベーションを推進します:

  • 医療診断: 医療画像解析の分野において、 解剖学的構造の輪郭を描くためにセグメンテーションは不可欠である。 アルゴリズムはMRIスキャンを分析し、 腫瘍や臓器境界を明示することで、 外科医が正確な体積を計算し、 命を救う精度で手術計画を立案することを可能にする。
  • 自動運転:自動運転車は安全な走行のためにセグメンテーションに依存する。映像データを処理することで、車両のコンピューターは走行可能な車線と歩道や障害物を識別できる。SAEインターナショナルなどの標準化団体は、この高精度の環境認識を必要とする自動運転レベルを定義している。
  • 精密農業: 農業分野におけるAIでは、セグメンテーション技術が作物の間に生える雑草をロボットシステムが識別するのに役立ちます。特定の植物の葉のマスクを生成することで、自動散布機は侵入種のみを標的とでき、除草剤の使用量を大幅に削減します。

YOLO26を用いたセグメンテーションの実装

開発者は、インスタンスセグメンテーションを効率的に実装できます。 ultralytics Python 。 以下の例では、最先端の YOLO26モデル速度と精度の両方に最適化されています。

from ultralytics import YOLO

# Load a pre-trained YOLO26 segmentation model
# 'n' denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")

# Run inference on an image to generate masks
# The model identifies objects and outlines their shape
results = model("https://ultralytics.com/images/bus.jpg")

# Display the image with segmentation overlays
results[0].show()

カスタムタスクで高いパフォーマンスを達成するには、チームが高品質なトレーニングデータを厳選する必要がある場合が多い。Ultralytics 、画像にポリゴンマスクを付与するアノテーションツール、データセット管理ツール、クラウド上でのモデルトレーニングツールを提供することでこのプロセスを簡素化し、機械学習運用(MLOps)ライフサイクル全体を効率化する。ライブラリとしては OpenCV などのライブラリも、画像の前処理や生成されたマスクの後処理のために、これらのモデルと併用されることが多い。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加