セマンティック・classify パワーを発見してください。アプリケーションとツールをご覧ください!
セマンティック・セグメンテーションは、コンピュータ・ビジョン(CV)の基礎技術である。 コンピュータビジョン(CV)の基礎技術である。 画像内の個々のピクセルに特定のクラスラベルを割り当てる。画像全体を分類したり、物体の周囲に境界ボックスを配置したりするような単純な作業とは異なり セマンティックセグメンテーションは、画像全体を分類したり、オブジェクトの周囲にバウンディングボックスを配置するような単純なタスクとは異なり、シーンのピクセルの完全なマップを提供する。この この詳細なレベルにより、機械は物体の正確な境界と形状を理解することができ、「道路」、「車道」、「車道」といった異なる領域を分類することができる。 道路"、"人"、"空"、"腫瘍 "などの明確な領域を分類する。画像を 画像を単なるオブジェクトの総和ではなく、分類されたピクセルの集合体として扱うことで、この方法は視覚的コンテキストの包括的な理解を提供する。 高度な人工知能(AI)システムに不可欠な、視覚的コンテキストの包括的な理解を提供する。 人工知能(AI)システム これは、複雑な環境と相互作用する高度な人工知能(AI)システムにとって不可欠である。
セマンティックセグメンテーションのプロセスは、ディープラーニング(DL)モデルに大きく依存している。 深層学習(DL)モデル、特に 特に 特に、畳み込みニューラルネットワーク(CNN)に基づくアーキテクチャ。これらのモデルは データセットで学習される。 で学習される。訓練中、ネットワークはテクスチャやエッジのような低レベルの特徴を高レベルの意味概念と関連付けることを学習する。 を高レベルの意味概念に関連付けることを学習する。
一般的なアーキテクチャパターンは、エンコーダーとデコーダーの構造を含む:
完全畳み込みネットワーク(FCN)のような先駆的なアーキテクチャは、空間マップを出力するために完全連結層を畳み込み層に置き換えることで、その基礎を築いた。 のような先駆的なアーキテクチャは、空間マップを出力するために完全連結層を畳み込み層に置き換えることで、その基礎を築いた。より特化した U-Netのような、より特殊なデザインは、スキップ接続を利用することで、きめ細かいディテールを保持する。 U-Netのような、より特殊な設計は、スキップ接続を利用して、高精度を必要とするタスクに非常に効果的である。
プロジェクトに適したツールを選択するには、セマンティックセグメンテーションを他のコンピュータビジョンタスクと区別することが重要です。 コンピュータビジョンタスクと区別することが重要である:
シーンをピクセル単位で解析する能力は、さまざまな業界のイノベーションを牽引してきた:
最新のフレームワーク PyTorchや TensorFlowのような最新のフレームワークは、セグメンテーションモデルを構築するためのツールを提供している。しかし 高レベルのライブラリは、プロセスを大幅に簡素化する。その Ultralytics YOLO11モデルは セグメンテーションタスクをすぐにサポートし リアルタイム推論に適した リアルタイム推論に適しています。
次の例では、事前にトレーニングされたYOLO11 セグメンテーションモデルをロードし、それを使用して画像に対して推論を実行する方法を示します。
モデルを使用して ultralytics python パッケージ。
from ultralytics import YOLO
# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the segmentation mask results
results[0].show()
カスタムソリューションを作りたい開発者には、以下のような注釈ツールがある。 LabelMeや CVATのようなアノテーションツールは のようなアノテーション・ツールは、トレーニング・データの準備に不可欠である。一度トレーニングすれば これらのモデルは OpenCVまたは最適化された ONNX ような最適化された形式を使用することで、実稼働環境で効率的なパフォーマンスを発揮します。