YOLO Vision Shenzhen
深セン
今すぐ参加
用語集

画像セグメンテーション

コンピュータビジョンにおける画像segmentationを探ります。Ultralytics YOLO26が、インスタンスsegmentation、セマンティックsegmentation、パノプティックsegmentationのために、いかに正確なピクセルレベルのマスクを提供するのかを学びましょう。

画像セグメンテーションは、コンピュータービジョン (CV)における高度な技術であり、デジタル画像を複数のピクセルサブグループ(画像セグメントまたは領域と呼ばれることが多い)に分割するものです。画像全体に単一のラベルを割り当てる標準的な画像分類とは異なり、セグメンテーションは個々のすべてのピクセルに特定のクラスラベルを割り当てることで、はるかにきめ細かいレベルで視覚データを分析します。このプロセスにより、正確なピクセルレベルのマップが作成され、人工知能 (AI)モデルが、どのようなオブジェクトが存在するかだけでなく、それらが正確にどこに位置し、具体的な境界が何であるかを理解できるようになります。

ピクセルレベル解析の仕組み

この高精度な理解を達成するために、segmentationモデルは通常、深層学習 (DL)アーキテクチャ、特に畳み込みニューラルネットワーク (CNN)を活用します。これらのネットワークは強力な特徴抽出器として機能し、エッジ、テクスチャ、複雑な形状などのパターンを識別します。古典的なU-Netのような従来のsegmentationアーキテクチャは、しばしばエンコーダ・デコーダ構造を採用しています。エンコーダは入力画像を圧縮してセマンティックコンテキストを捉え、デコーダは空間的な詳細を再構築して最終的なsegmentation maskを出力します。

現代の進歩により、2026年1月にリリースされたYOLO26のようなリアルタイムアーキテクチャが誕生しました。これらのモデルは、segmentation機能をエンドツーエンドのパイプラインに直接統合し、クラウドGPUからエッジデバイスまで、さまざまなハードウェアで高速処理を可能にします。

segmentationの主な種類

プロジェクトの具体的な目標に応じて、開発者は通常、主に3つのセグメンテーション技術の中から選択します。

  • セマンティックセグメンテーション: この手法は、ピクセルをカテゴリに基づいて分類しますが、同じクラスの別々のオブジェクトを区別しません。例えば、衛星画像解析では、「森林」を表すすべてのピクセルが緑色に塗られ、森林全体が単一のエンティティとして扱われます。
  • インスタンスセグメンテーション: この手法は、関心のある個々のオブジェクトを識別し、分離します。混雑した街のシーンでは、インスタンスセグメンテーションは「車A」、「車B」、「歩行者A」に対して一意のマスクを生成し、システムが特定のエンティティをカウントし、trackできるようにします。これは、Ultralytics YOLO26モデルファミリーの主要な機能です。
  • パノプティックセグメンテーション: セマンティックセグメンテーションの網羅性とインスタンスセグメンテーションの精度を組み合わせたハイブリッドアプローチです。すべてのピクセルにラベルを割り当て、不定形の背景要素(空や道路など)を区別しつつ、数えられる前景オブジェクトを一意に識別します。

物体検出との区別

segmentationをobject detectionと区別することが重要です。detectionアルゴリズムは長方形のbounding boxを使用してアイテムを特定しますが、そのボックス内に背景ピクセルを必然的に含んでしまいます。segmentationは、オブジェクトの正確な輪郭またはポリゴンをトレースすることによって、より厳密で正確な表現を提供します。この違いは、ロボットアームが衝突せずにアイテムを操作するために、その正確な形状を知る必要があるロボットによる把持のようなアプリケーションにとって極めて重要です。

実際のアプリケーション

画像セグメンテーションが提供する精度は、多様な産業でイノベーションを推進します。

  • 医療診断: 医用画像解析の分野では、解剖学的構造の輪郭を抽出するためにセグメンテーションが不可欠です。アルゴリズムはMRIスキャンを解析し、腫瘍や臓器の境界線を明確にすることで、外科医が正確な体積を計算し、命を救う精度で手術を計画できるようにします。
  • 自動運転: 自動運転車は、安全に走行するためにセグメンテーションに依存しています。動画フィードを処理することで、車両のコンピューターは走行可能な車線を歩道や障害物と区別できます。SAE Internationalのような標準化団体は、この高忠実度な環境認識を必要とする自動運転レベルを定義しています。
  • 精密農業: 農業AIにおいて、segmentationはロボットシステムが作物中の雑草を識別するのに役立ちます。特定の植物の葉にマスクを生成することで、自動噴霧器は侵入種のみを標的にでき、除草剤の使用量を大幅に削減します。

YOLO26を用いたセグメンテーションの実装

開発者は、インスタンスセグメンテーションを効率的に実装できます。 ultralytics Python 。 以下の例では、最先端の YOLO26モデルは、速度と精度の両方で最適化されています。

from ultralytics import YOLO

# Load a pre-trained YOLO26 segmentation model
# 'n' denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")

# Run inference on an image to generate masks
# The model identifies objects and outlines their shape
results = model("https://ultralytics.com/images/bus.jpg")

# Display the image with segmentation overlays
results[0].show()

カスタムタスクで高いパフォーマンスを達成するために、チームはしばしば高品質の学習データをキュレートする必要があります。Ultralytics Platformは、ポリゴンマスクで画像をアノテーションし、データセットを管理し、クラウドでモデルを学習するためのツールを提供することで、機械学習オペレーション (MLOps)のライフサイクル全体を効率化します。OpenCVのようなライブラリも、画像の事前処理や結果のマスクの事後処理のために、これらのモデルと併用されることがよくあります。

共にAIの未来を築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。