YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

インスタンスセグメンテーション

Instance Segmentationが、ピクセルレベルの精度で物体検出を洗練し、AIアプリケーション向けの詳細なオブジェクトマスクを可能にする様子をご覧ください。

インスタンスセグメンテーションは、画像内の個々のオブジェクトをピクセルレベルで識別し、区別する高度なコンピュータビジョン(CV)タスクです。他のビジョンタスクとは異なり、画像を分類したり、オブジェクトの周りにバウンディングボックスを描画したりするだけでなく、個々のオブジェクトインスタンスごとに正確なピクセル単位のマスクを生成します。この技術は、同じクラスの重複するオブジェクトを区別できるため、シーンをより深く理解することができます。

インスタンス vs. セマンティックおよびオブジェクト検出

インスタンスセグメンテーションを、他の関連するコンピュータビジョンタスクと区別することが重要です。

  • 物体検出: このタスクは、物体の存在と位置を識別するもので、通常は物体の周りに長方形のバウンディングボックスを描画し、クラスラベルを割り当てることによって行われます。「画像に何が、どこにあるのか?」という問いに答えますが、形状に関する情報は提供しません。
  • セマンティックセグメンテーション: このタスクは、画像内の各ピクセルを特定のカテゴリに分類します。たとえば、車に属するすべてのピクセルを「車」としてラベル付けしますが、画像内の2つの異なる車を区別しません。「各ピクセルはどのカテゴリに属していますか?」に答えます。
  • インスタンスセグメンテーション: これは、オブジェクト検出とセマンティックセグメンテーションの機能を組み合わせたものです。各オブジェクトインスタンスを検出し、それに対して一意のセグメンテーションマスクを生成します。3台の車がある画像では、インスタンスセグメンテーションは3つの個別のマスクを出力し、それぞれが特定の車に対応します。
  • Panoptic Segmentation: これは、セマンティックセグメンテーションとインスタンスセグメンテーションを統合した、最も包括的なセグメンテーションタスクです。すべてのピクセルにクラスラベルと一意のインスタンスIDを割り当て、シーンの完全で統一された理解を提供します。

インスタンスセグメンテーションの仕組み

インスタンスセグメンテーションモデルは通常、2つの主な機能を実行します。1つ目は、画像内のすべてのオブジェクトインスタンスを検出し、2つ目は、検出された各インスタンスのセグメンテーションマスクを生成することです。このプロセスは、Faster R-CNNのようなオブジェクト検出器を拡張し、各関心領域のバイナリマスクを予測する並列ブランチを追加するMask R-CNNのようなアーキテクチャによって広く普及しました。最新のモデルは、速度と精度を向上させるためにこのプロセスをさらに改良し、多くのアプリケーションでリアルタイム推論を可能にしています。開発は、深層学習フレームワーク(PyTorchTensorFlowなど)に依存することがよくあります。

実際のアプリケーション

インスタンスセグメンテーションによって提供される詳細なオブジェクトのアウトラインは、多くの分野で価値があります。

  • 自動運転車: 自動運転車は、個々の歩行者、車両、自転車の形状と位置を正確に特定するために、インスタンスセグメンテーションに依存しています。この詳細な情報は、特に多くのオブジェクトが重複する複雑な都市環境において、安全なナビゲーションと経路計画に不可欠です。Cityscapesのようなデータセットは、この分野の進歩に貢献しています。
  • 医用画像解析: 放射線医学では、Instance Segmentation は、CT または MRI スキャンから腫瘍、病変、および臓器を高精度で区別するために使用されます。これは、医師が腫瘍のサイズを測定し、手術を計画し、治療効果をモニタリングするのに役立ちます。詳細については、YOLO11 を用いた腫瘍検出に関するブログ記事をご覧ください。
  • ロボティクス: ロボットはインスタンスセグメンテーションを使用して環境を理解し、把握する特定のオブジェクトを識別し、より高い精度で障害物を回避します。これは、製造およびロジスティクスのタスクに不可欠です。
  • 衛星画像解析: この技術は、森林内の個々の木の数を数えたり、都市内の建物を地図にしたり、NASAのような機関からのデータを使用して、経時的な土地利用の変化を追跡したりするために使用されます。
  • 農業: 収量推定のために個々の果実を識別して数えたり、精密農業の重要な部分である標的除草剤散布のために特定の雑草を検出したりするために使用できます。

Ultralytics YOLOによるインスタンスセグメンテーション

Ultralyticsは、効率的なインスタンスセグメンテーションを実行できる最先端のモデルを提供します。YOLOv8や最新のYOLO11のようなモデルは、インスタンスセグメンテーションを含むさまざまなビジョンタスクで高いパフォーマンスを発揮するように設計されています。詳細については、セグメンテーションタスクに関するドキュメントをご覧ください。ユーザーは、事前学習済みモデルを活用したり、COCOのようなカスタムデータセットファインチューニングを実行したりできます。Ultralytics HUBプラットフォームのようなツールを使用すると、データ管理からモデルのデプロイまで、機械学習(ML)ワークフローを簡素化できます。具体的な実装については、事前学習済みのUltralytics YOLOv8モデルを使用したセグメンテーションに関するチュートリアルや、セグメンテーションオブジェクトの分離に関するガイドなどのリソースをご利用いただけます。Ultralytics YOLO11をインスタンスセグメンテーションに使用する方法も学ぶことができます。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました