Yolo 深圳
深セン
今すぐ参加
用語集

U-Net

セマンティックセグメンテーションのための強力なCNNアーキテクチャであるU-Netをご覧ください。医療、衛星、および自律イメージングにおけるそのアプリケーションを学びます。

U-Netは、以下の用途に特化したアーキテクチャである。 畳み込みニューラルネットワーク(CNN) として知られる、ピクセルレベルでの正確な分類を行うように設計されている。 セマンティック・セグメンテーション.画像全体に単一のラベルを割り当てる従来の分類モデルとは異なり、U-Netはすべてのピクセルに対してクラスを予測する。 物体の正確な形と位置を示す詳細なマップを作成する。もともとは の分野で基礎となる構造となっている。 コンピュータ・ビジョンその 限られた 学習データとともに 高解像度の結果を得ることができます。

U字型建築

U-Net "という名前は、その対称的なU字型ダイアグラムに由来する。 オートエンコーダデザインに由来する。アーキテクチャ は、3つの主要なセクションで構成され、それらが連携して特徴を抽出し、詳細なセグメンテーションマスクで画像を再構成する。 セグメンテーションマスクで画像を再構成する。

  • 収縮パス(エンコーダー):U "の左側は従来のCNNとして機能する。 バックボーン.繰り返し コンボリューションプーリング演算 を繰り返し、画像の空間次元を徐々に縮小していく。この処理は ダウンサンプリングの数を増やす。 特徴マップを増やす、 これによってモデルは、画像に「何が」写っているかという複雑でハイレベルなコンテキストを学習できるようになる。
  • 拡張パス(デコーダー):このアーキテクチャーの右側はエンコーダーと同じだが、逆の動作を行う。 逆演算を行う。アップコンボリューション層を使い、特徴量の解像度を元の入力サイズに戻す。 入力サイズに戻す。この アップサンプリングステップは このアップサンプリングステップは、コンテキストをより高い解像度のレイヤーに伝え、ネットワークがオブジェクトの「位置」を理解するのに役立つ。 を理解するのに役立つ。
  • 接続をスキップするU-Netの革新的な点は、次のものを使用することである。 スキップ接続.これらの接続は、縮小パスから高解像度の特徴マップを直接拡大パスの対応するレイヤーに連結する。 に直接連結する。このメカニズムにより、ダウンサンプリング時に通常失われる、きめの細かい空間情報が保持される。 シャープで正確な境界の生成が可能になります。

実際のアプリケーション

U-Netは、次の論文で紹介された。 "U-Net:Convolutional Networks for Biomedical Image Segmentation" で紹介された。 で紹介され、以来、精密なセグメンテーションを必要とする多くの産業で採用されている。 ローカリゼーション.

医用画像解析

医療では正確さが重要です。U-Netは以下の分野で広く使用されています。 医療画像解析に広く使用されています。 異常の検出を自動化します。例えば、MRIスキャンで腫瘍をセグメンテーションしたり、顕微鏡画像で個々の細胞をカウントしたりすることで、放射線科医のワークフローを支援します。 の進歩の原動力となる。 ヘルスケアにおけるAI.

地理空間と衛星モニタリング

このアーキテクチャは、次のような点でも重要である。 衛星画像の解析.U-Netモデルは、土地被覆の種類をsegment し、水域、森林、市街地を区別して、森林track したり、農作物の健全性を監視したりすることができる。 森林伐採を追跡したり、農作物の健全性を監視したりすることができる。 スマート農業.

関連用語との区別

U-Netを理解するには、他のビジョンタスクと区別する必要がある:

  • U-Netと物体検出の比較:一方 オブジェクト検出モデルは 矩形 バウンディング・ボックスU-Netは、オブジェクトの輪郭を正確にトレースするピクセルパーフェクトなマスクを生成する。
  • U-Netとインスタンス・セグメンテーションの比較:標準的なU-Netはセマンティック・セグメンテーションを行い、同じクラスのすべてのオブジェクト(たとえばすべての車)を1つの領域として扱う。 標準的なU-Netは意味的なセグメンテーションを行う。これに対して インスタンス・セグメンテーション は、同じクラスの個々のオブジェクトを区別します。最近の YOLO11のような最新のアーキテクチャは 検出とセグメンテーションの両方のタスクを高い効率で処理できるように進化している。

Ultralytics最新のセグメンテーション

生のU-Netを実装するには、次のようなフレームワークで冗長なコードを書く必要がある。 PyTorchTensorFlowなど、最新のライブラリはこのプロセスを簡素化します。Ultralytics エコシステムは、最適化されたセグメンテーションモデルを提供します。 最適化されたセグメンテーションモデルを提供します。

以下の例では、事前に訓練された セグメンテーションモデルを使用して ピクセルレベルのマスクを生成する方法を示します:

from ultralytics import YOLO

# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")

# Run inference on an image to detect and segment objects
results = model("path/to/image.jpg")

# Display the results with segmentation masks overlaid
results[0].show()

この合理化されたワークフローにより、開発者は複雑なセグメンテーション機能を以下のようなアプリケーションに統合することができます。 モデル展開アプリケーションに組み込むことができる。 カスタムデータセットでこれらのモデルをトレーニングする場合 データ増強を採用することを強く 推奨される。 オーバーフィッティング正確なピクセルレベルのアノテーションを扱う際によくある課題です。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加