Image Segmentation
コンピュータビジョンにおける画像セグメンテーションを探究します。Ultralytics YOLO26がインスタンス、セマンティック、パノプティックセグメンテーションのために、いかに正確なピクセルレベルのマスクを提供するかを学びましょう。
画像セグメンテーションとは、コンピュータビジョン (CV) における高度な技術であり、デジタル画像を画像セグメントまたは領域と呼ばれる複数のピクセルサブグループに分割するものです。画像全体に単一のラベルを割り当てる一般的な画像分類とは異なり、セグメンテーションは、個々のピクセルすべてに特定のクラスラベルを割り当てることで、より粒度の細かいレベルで視覚データを解析します。このプロセスにより、正確なピクセルレベルのマップが作成され、人工知能 (AI) モデルは、どのようなオブジェクトが存在するのかだけでなく、正確にどこに位置し、どのような境界線を持っているのかを理解できるようになります。
Link to this sectionピクセルレベル解析の仕組み#
このような高精度の理解を実現するために、セグメンテーションモデルでは通常、ディープラーニング (DL) アーキテクチャ、特に畳み込みニューラルネットワーク (CNN) が活用されます。これらのネットワークは、エッジ、テクスチャ、複雑な形状などのパターンを識別する強力な特徴抽出器として機能します。古典的なU-Netのような従来のセグメンテーションアーキテクチャでは、多くの場合、エンコーダー・デコーダー構造が採用されています。エンコーダーは入力画像を圧縮してセマンティックコンテキストを捉え、デコーダーは空間的詳細を再構築して最終的なセグメンテーションマスクを出力します。
近年の進歩により、2026年1月にリリースされたYOLO26のようなリアルタイムアーキテクチャが登場しました。これらのモデルは、セグメンテーション機能をエンドツーエンドのパイプラインに直接統合しており、クラウド上のGPUからエッジデバイスまで、さまざまなハードウェアで高速処理を実現します。
Link to this section主要なセグメンテーションの種類#
プロジェクトの具体的な目標に応じて、開発者は一般的に以下の3つの主要なセグメンテーション技術を選択します。
- セマンティックセグメンテーション: この手法は、ピクセルをそのカテゴリに基づいて分類しますが、同じクラスの個別のオブジェクトを区別しません。例えば、衛星画像解析において、「森」を表すピクセルはすべて緑色に色付けされ、森全体を単一のエンティティとして扱います。
- インスタンスセグメンテーション: この技術は、関心のある別々の個々のオブジェクトを識別および分離します。混雑した街中のシーンにおいて、インスタンスセグメンテーションは「車A」「車B」「歩行者A」に対してそれぞれ固有のマスクを生成し、システムが特定のエンティティをカウントおよび追跡することを可能にします。これは、Ultralytics YOLO26 モデルファミリーのコア機能です。
- パノプティックセグメンテーション: セマンティックセグメンテーションの網羅性と、インスタンスセグメンテーションの精度を組み合わせたハイブリッドアプローチです。すべてのピクセルにラベルを割り当て、空や道路のような不定形の背景要素を区別しながら、カウント可能な前景オブジェクトを個別に識別します。
Link to this sectionオブジェクト検出との違い#
セグメンテーションをオブジェクト検出と区別することは重要です。検出アルゴリズムは、長方形のバウンディングボックスを使用してアイテムの位置を特定しますが、そのボックス内にはどうしても背景のピクセルが含まれてしまいます。セグメンテーションは、オブジェクトの正確な輪郭やポリゴンをトレースすることで、よりタイトで正確な表現を提供します。この違いは、ロボットアームによる把持のようなアプリケーションにとって極めて重要であり、ロボットアームが衝突を避けながら操作を行うためには、アイテムの正確な形状を把握する必要があります。
Link to this section実社会での応用#
画像セグメンテーションが提供する精度は、さまざまな業界でイノベーションを推進しています。
- 医療診断: 医療画像解析の分野において、セグメンテーションは解剖学的構造を輪郭線で示すために不可欠です。アルゴリズムがMRIスキャンを解析して腫瘍や臓器の境界を特定することで、外科医は正確な体積を計算し、命を救うための精度で手術計画を立てることができます。
- 自動運転: 自動運転車は、安全に走行するためにセグメンテーションに依存しています。ビデオフィードを処理することで、車両のコンピュータは走行可能な車線と歩道や障害物を識別できます。SAE Internationalのような標準化団体は、この高忠実度の環境認識を必要とする自動運転レベルを定義しています。
- 精密農業: 農業におけるAIにおいて、セグメンテーションはロボットシステムが作物の中から雑草を特定するのに役立ちます。特定の植物の葉に対してマスクを生成することで、自動散布機は侵入種のみを標的にすることができ、除草剤の使用量を大幅に削減できます。
Link to this sectionYOLO26によるセグメンテーションの実装#
開発者は、ultralytics Pythonパッケージを使用して効率的にインスタンスセグメンテーションを実装できます。以下の例では、速度と精度の両面で最適化された最先端のYOLO26モデルを使用しています。
from ultralytics import YOLO
# Load a pre-trained YOLO26 segmentation model
# 'n' denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image to generate masks
# The model identifies objects and outlines their shape
results = model("https://ultralytics.com/images/bus.jpg")
# Display the image with segmentation overlays
results[0].show()カスタムタスクで高いパフォーマンスを達成するために、チームは高品質な学習データをキュレートする必要があります。Ultralytics Platformは、ポリゴンマスクによる画像の注釈付け、データセットの管理、クラウドでのモデルトレーニングを行うツールを提供することで、このプロセスを簡素化し、機械学習運用 (MLOps) のライフサイクル全体を効率化します。OpenCVのようなライブラリも、画像の前処理や生成されたマスクの後処理のために、これらのモデルと併せて頻繁に使用されます。






