Yolo 深圳
深セン
今すぐ参加
用語集

セマンティックセグメンテーション

セマンティック・classify パワーを発見してください。アプリケーションとツールをご覧ください!

セマンティック・セグメンテーションは、コンピュータ・ビジョン(CV)の基礎技術である。 コンピュータビジョン(CV)の基礎技術である。 画像内の個々のピクセルに特定のクラスラベルを割り当てる。画像全体を分類したり、物体の周囲に境界ボックスを配置したりするような単純な作業とは異なり セマンティックセグメンテーションは、画像全体を分類したり、オブジェクトの周囲にバウンディングボックスを配置するような単純なタスクとは異なり、シーンのピクセルの完全なマップを提供する。この この詳細なレベルにより、機械は物体の正確な境界と形状を理解することができ、「道路」、「車道」、「車道」といった異なる領域を分類することができる。 道路"、"人"、"空"、"腫瘍 "などの明確な領域を分類する。画像を 画像を単なるオブジェクトの総和ではなく、分類されたピクセルの集合体として扱うことで、この方法は視覚的コンテキストの包括的な理解を提供する。 高度な人工知能(AI)システムに不可欠な、視覚的コンテキストの包括的な理解を提供する。 人工知能(AI)システム これは、複雑な環境と相互作用する高度な人工知能(AI)システムにとって不可欠である。

ピクセルレベル分類の核となるメカニズム

セマンティックセグメンテーションのプロセスは、ディープラーニング(DL)モデルに大きく依存している。 深層学習(DL)モデル、特に 特に 特に、畳み込みニューラルネットワーク(CNN)に基づくアーキテクチャ。これらのモデルは データセットで学習される。 で学習される。訓練中、ネットワークはテクスチャやエッジのような低レベルの特徴を高レベルの意味概念と関連付けることを学習する。 を高レベルの意味概念に関連付けることを学習する。

一般的なアーキテクチャパターンは、エンコーダーとデコーダーの構造を含む:

  • エンコーダー:入力画像をダウンサンプリングして、意味的な文脈を取り込み、空間的な次元を縮小する。
  • デコーダー:予測マップを生成するために、エンコードされた特徴を元の画像解像度にアップサンプルする。 予測マップを生成します。

完全畳み込みネットワーク(FCN)のような先駆的なアーキテクチャは、空間マップを出力するために完全連結層を畳み込み層に置き換えることで、その基礎を築いた のような先駆的なアーキテクチャは、空間マップを出力するために完全連結層を畳み込み層に置き換えることで、その基礎を築いた。より特化した U-Netのような、より特殊なデザインは、スキップ接続を利用することで、きめ細かいディテールを保持する。 U-Netのような、より特殊な設計は、スキップ接続を利用して、高精度を必要とするタスクに非常に効果的である。

セマンティック・セグメンテーションと関連タスクの区別

プロジェクトに適したツールを選択するには、セマンティックセグメンテーションを他のコンピュータビジョンタスクと区別することが重要です。 コンピュータビジョンタスクと区別することが重要である:

  • 物体検出物体の識別 オブジェクトを識別し、矩形のバウンディングボックス バウンディングボックスを使用します。物体はどこにあるか? オブジェクトの正確な形状は無視されます。
  • インスタンスのセグメンテーション セマンティック・セグメンテーションと似ているが、同じクラスの個々のインスタンスを区別する。たとえば セマンティックセグメンテーションでは、すべての「car」ピクセルを同じ色でラベリングしますが、インスタンスセグメンテーションでは、「car 1」、「car 2」などに一意のIDを割り当てます。 に一意のIDを割り当てる。
  • 画像の分類 特定の要素の位置を特定することなく、画像全体(例えば「ビーチシーン」)に単一のラベルを割り当てる。 特定の要素の位置を特定することなく

実際のアプリケーション

シーンをピクセル単位で解析する能力は、さまざまな業界のイノベーションを牽引してきた:

  • 自律走行車 自動運転車はセマンティック・セグメンテーションを使って、走行可能な路面(道路)、交通標識、歩行者、障害物を識別する。 障害物を識別する。Cityscapesのようなデータセットは、都市環境を安全にナビゲートするモデル モデルを訓練するために広く使用されている。
  • 医療画像解析 医療では精度が命です。臓器、病変、腫瘍をsegment モデルは MRIやCT 装置で撮影された画像の臓器や病変、腫瘍をセグメント化します。これは、放射線科医が組織量を定量化し、手術を計画する際に役立ちます。
  • 衛星画像解析 セマンティック・セグメンテーションは、土地被覆の分類、森林伐採の追跡、都市計画に役立つ。NASAのような組織 NASAのような機関は、地球規模の環境変化を監視するためにこれらの技術を利用している。 地球規模の環境変化を監視するために利用されている。
  • 精密農業 農家はセグメンテーションを使って作物と雑草を区別し、的を絞った除草剤散布を可能にすることで、化学薬品の使用量を減らし、コストを削減する。 化学薬品の使用量とコストを削減。

セマンティック・セグメンテーションの実装

最新のフレームワーク PyTorchTensorFlowのような最新のフレームワークは、セグメンテーションモデルを構築するためのツールを提供している。しかし 高レベルのライブラリは、プロセスを大幅に簡素化する。その Ultralytics YOLO11モデルは セグメンテーションタスクをすぐにサポートし リアルタイム推論に適した リアルタイム推論に適しています。

次の例では、事前にトレーニングされたYOLO11 セグメンテーションモデルをロードし、それを使用して画像に対して推論を実行する方法を示します。 モデルを使用して ultralytics python パッケージ。

from ultralytics import YOLO

# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the segmentation mask results
results[0].show()

カスタムソリューションを作りたい開発者には、以下のような注釈ツールがある。 LabelMeや CVATのようなアノテーションツールは のようなアノテーション・ツールは、トレーニング・データの準備に不可欠である。一度トレーニングすれば これらのモデルは OpenCVまたは最適化された ONNX ような最適化された形式を使用することで、実稼働環境で効率的なパフォーマンスを発揮します。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加