セマンティック・セグメンテーション
セマンティックセグメンテーションの威力を実感してください。画像のすべてのピクセルを分類し、シーンを正確に理解します。アプリケーションとツールをご覧ください!
セマンティックセグメンテーションは、画像内のすべてのピクセルに特定のクラスラベルを割り当てる、コンピュータビジョンの基本的なタスクである。オブジェクトをボックスで識別したり、画像全体に単一のラベルを割り当てる他の手法とは異なり、セマンティックセグメンテーションは、存在するさまざまな意味的カテゴリの高密度で完璧なマップをピクセル単位で作成する。これにより、"道路"、"空"、"建物"、"人物 "などの各カテゴリの正確な形と位置が示され、画像内容の豊かで詳細な理解が得られる。これは、コンテキストやレイアウトを理解することが、個々のオブジェクトを識別することと同じくらい重要なシーンにおいて、中核となるテクニックである。
実世界での応用
セマンティックセグメンテーションによってもたらされる詳細なシーン理解は、多くの分野で極めて重要である:
- 自律走行車:自動運転車が安全にナビゲートするためには、環境を完全に理解する必要がある。セマンティックセグメンテーションは、走行可能エリア(道路)、走行不可能エリア(歩道、建物)、歩行者、自転車、他の車両の位置をピクセルレベルの精度で識別するために使用される。これにより、より安全な進路計画と意思決定が可能になる。自律走行車におけるAIの役割については、こちらをご覧ください。
- 医療画像解析:医療では精度が最も重要である。セマンティックセグメンテーションは、MRIやCTスキャンなどのスキャン画像から、臓器、腫瘍、病変、その他の解剖学的構造を自動的に描き出すのに役立つ。これにより、放射線科医は診断、治療計画、病気の進行のモニタリングに役立ちます。医用画像診断におけるAIの応用について、さらに詳しくご覧ください。
- 衛星画像解析:地理空間アプリケーションでは、衛星画像から土地被覆を分類するためにセマンティック・セグメンテーションが使用される。これは都市計画(建物、道路、緑地の特定)、環境モニタリング(森林伐採や水域の追跡)、精密農業などに利用できる。
- ロボット工学ロボットはセマンティック・セグメンテーションを使用して動作環境を理解し、床、壁、相互作用する物体、避けるべき障害物を区別できるようにする。これは、倉庫や家庭のような複雑な環境でのナビゲーションや操作タスクに不可欠です。ロボット工学におけるコンピュータビジョンの統合について詳しく知る。
他の仕事との主な違い
セマンティック・セグメンテーションを、関連するコンピュータ・ビジョンのタスクと区別することは重要である:
- インスタンスのセグメンテーション:これは最も密接に関連するタスクである。どちらもピクセルレベルの分類を行うが、インスタンスセグメンテーションは、同じオブジェクトクラスの個々のインスタンスを区別することで、さらに一歩進んだ分類を行う。たとえば、3 台の車が写っている画像の場合、セマンティックセグメンテーションでは、すべての車のピクセルを単に "car" とラベル付けします。対照的に、インスタンスセグメンテーションでは、"car 1"、"car 2"、および "car 3" を別々のオブジェクトとして識別する。
- オブジェクト検出:このタスクは、各オブジェクトの周囲にバウンディングボックスを描き、クラスラベルを割り当てることによって、画像内のオブジェクトの存在と位置を特定する。オブジェクトの形状やどのピクセルがオブジェクトに属するかについての情報は提供しない。
- パノプティックセグメンテーション:このタスクは、セマンティックセグメンテーションとインスタンスセグメンテーションを統合したものとみなすことができる。セマンティックセグメンテーションのように)すべてのピクセルにクラスラベルを割り当てることで、包括的なシーン理解を提供することを目的とし、同時に(インスタンスセグメンテーションのように)各オブジェクトインスタンスを一意に識別する。