用語集

インスタンスのセグメンテーション

インスタンス・セグメンテーションがピクセル・レベルの精度でオブジェクト検出を精緻化し、AIアプリケーション用の詳細なオブジェクト・マスクを実現する方法をご覧ください。

インスタンスセグメンテーションは、画像内の個々のオブジェクトをピクセルレベルで識別し、区別する高度なコンピュータビジョン(CV)タスクである。他の視覚タスクとは異なり、単に画像を分類したり、オブジェクトの周囲にバウンディングボックスを描いたりするのではなく、各個別のオブジェクトインスタンスに対して正確なピクセル単位のマスクを生成する。この技術は、同じクラスの重なり合うオブジェクトを区別できるため、シーンをより深く理解することができる。

インスタンスとセマンティックおよびオブジェクト検出の比較

インスタンスのセグメンテーションを、他の関連するコンピュータビジョンのタスクと区別することは重要である。

  • オブジェクト検出このタスクは物体の存在と位置を特定するもので、通常は物体の周囲に矩形のバウンディングボックスを描き、クラスラベルを割り当てる。このタスクは「画像内のどこに何があるか」に答えるが、形状情報は提供しない。
  • セマンティック・セグメンテーションこのタスクは画像内の各ピクセルを特定のカテゴリーに分類する。例えば、車に属するすべてのピクセルを「車」とラベル付けするが、画像内の2つの異なる車を区別することはない。これは "各ピクセルがどのカテゴリーに属するか?"に答えるものである。
  • インスタンス・セグメンテーションこれは、オブジェクト検出とセマンティックセグメンテーションの機能を組み合わせたものである。各オブジェクトのインスタンスを検出し、一意のセグメンテーションマスクを生成する。3台の車が写っている画像では、インスタンス・セグメンテーションは3つの別々のマスクを出力し、それぞれが特定の車に対応する。
  • パノプティックセグメンテーションセマンティックセグメンテーションとインスタンスセグメンテーションを統合した、セグメンテーションタスクの中で最も包括的なタスクである。すべてのピクセルにクラスラベルと一意のインスタンスIDを割り当て、シーンの完全で統一された理解を提供する。

インスタンス・セグメンテーションの仕組み

インスタンス分割モデルは通常、2つの主要な機能を実行する。1つ目は、画像内のすべてのオブジェクトインスタンスを検出すること、2つ目は、検出された各インスタンスに対して分割マスクを生成することである。このプロセスは、Faster R-CNNのようなオブジェクト検出器を、関心領域ごとにバイナリマスクを予測する並列ブランチを追加することで拡張した、Mask R-CNNのようなアーキテクチャによって有名になった。現代のモデルは、より優れた速度と精度のためにこのプロセスをさらに改良し、多くのアプリケーションでリアルタイムの推論を可能にしている。開発にはPyTorchや TensorFlowのような強力なディープラーニングフレームワークを使用することが多い。

実世界での応用

インスタンスセグメンテーションによって得られる詳細なオブジェクトのアウトラインは、多くの分野で価値がある。

  • 自律走行車自動運転車は、個々の歩行者、車両、自転車の形状と位置を正確に識別するために、インスタンス分割に依存している。このような詳細な情報は、特に多くのオブジェクトが重なり合う複雑な都市環境において、安全なナビゲーションと経路計画に不可欠です。Cityscapesのようなデータセットは、この分野の発展に役立っています。
  • 医療画像解析放射線学では、CTやMRIスキャンから腫瘍、病変、臓器を高精度で描出するためにインスタンス・セグメンテーションが使用される。これは、医師が腫瘍の大きさを測定し、手術を計画し、治療効果をモニターするのに役立ちます。これについては、YOLO11を使った腫瘍検出についてのブログ記事で詳しく説明しています。
  • ロボット工学:ロボットはインスタンスセグメンテーションを利用して環境を理解し、把握すべき特定の物体を識別し、より高い精度で障害物を回避する。これは、製造や ロジスティクスのタスクにおいて極めて重要である。
  • 衛星画像分析この技術は、NASAのような組織からのデータを使って、森林の個々の木を数えたり、都市の建物をマッピングしたり、土地利用の経年変化を追跡したりするのに使われる。
  • 農業 精密農業の重要な部分である、収穫量推定のための個々の果実の識別と計数、あるいは標的を絞った除草剤散布のための特定の雑草の検出に使用できる。

Ultralytics YOLOによるインスタンスのセグメンテーション

Ultralyticsは、効率的なインスタンスセグメンテーションを実行できる最先端のモデルを提供しています。YOLOv8や最新のYOLO11のようなモデルは、インスタンスセグメンテーションを含む様々なビジョンタスクで高いパフォーマンスを発揮するように設計されています。詳しくは、セグメンテーションタスクのドキュメントをご覧ください。ユーザーは、データ管理からモデル展開までの 機械学習(ML)ワークフローを簡素化するUltralytics HUBプラットフォームのようなツールを使用して、事前に訓練されたモデルを活用したり、COCOのようなカスタムデータセットで 微調整を行ったりすることができます。実践的な実装については、事前にトレーニングされたUltralytics YOLOv8モデルを使用したセグメンテーションに関するチュートリアルや、セグメンテーションオブジェクトの分離に関するガイドなどのリソースをご利用いただけます。また、Ultralytics YOLO11をインスタンスセグメンテーションに使用する方法もご紹介しています。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク