画像セグメンテーション
Ultralytics YOLOによる画像セグメンテーションのパワーを発見してください。ピクセルレベルの精度、種類、応用、および実際のAIユースケースについて解説します。
画像セグメンテーションは、デジタル画像を複数の異なる領域またはセグメントに分割する基本的なコンピュータビジョン(CV)タスクです。その目的は、画像内のすべてのピクセルに特定のラベルを割り当て、オブジェクトと背景のピクセルレベルのマップを効果的に作成することです。単純なボックスでオブジェクトの位置を識別する可能性のある他のCVタスクとは異なり、画像セグメンテーションは各オブジェクトの正確な形状を概説することにより、はるかに詳細な理解を提供します。この詳細な情報は、シーンのジオメトリと構成を深く理解する必要があるアプリケーションにとって非常に重要です。このプロセスは、多くの高度なAIアプリケーションの基礎となります。
画像セグメンテーションの種類
画像セグメンテーションは、3つの主要なタイプに分類でき、それぞれが異なるレベルの詳細を提供し、明確な目的に役立ちます。
- セマンティックセグメンテーション: この手法は、画像内の各ピクセルを、「車」、「道路」、「空」のような事前定義されたカテゴリに分類します。同じオブジェクトクラスのすべてのインスタンスは、単一のラベルの下にグループ化されます。例えば、複数の車がある画像では、セマンティックセグメンテーションは、どの車に属するすべてのピクセルも、単に「車」としてラベル付けし、1つの車を別の車と区別しません。
- インスタンスセグメンテーション: この手法は、各ピクセルを分類するだけでなく、同じクラスの個々のインスタンスを区別することにより、セグメンテーションをさらに一歩進めます。同じ街路のシーンでは、インスタンスセグメンテーションは各車を個別のオブジェクトとして識別し、「車1」、「車2」などに個別のマスクを割り当てます。これは、個々のオブジェクトをカウントまたは追跡する必要がある場合に特に役立ちます。
- Panoptic Segmentation: Panoptic segmentationは、ハイブリッドなアプローチとして、セマンティックセグメンテーションとインスタンスセグメンテーションの両方の長所を兼ね備えています。セマンティックセグメンテーションのようにすべてのピクセルにクラスラベルを割り当てながら、インスタンスセグメンテーションのように各オブジェクトインスタンスを一意に識別することにより、シーンの完全かつ統一的な理解を目的としています。これにより、利用可能な最も包括的なシーン分析が実現します。
画像セグメンテーションは他のCVタスクとどう違うのですか?
画像セグメンテーションを他の一般的なコンピュータビジョンタスクと区別することが重要です。
- 画像分類: 画像全体に単一のラベルを割り当てることに焦点を当てます(例:「これはビーチの写真です」)。画像に何が含まれているかは理解できますが、場所は理解できません。
- 物体検出: 画像内の物体を識別して位置を特定します。通常、バウンディングボックスをそれらの周りに描画します。これにより、どのような物体が存在するか、およびそれらのおおよその位置がわかりますが、正確な形状はわかりません。
- 画像セグメンテーション: ピクセルレベルで各オブジェクトの正確な境界を概説することにより、最も詳細な情報を提供し、オブジェクトの形状と位置を正確に把握できます。
アプリケーションとユースケース
画像セグメンテーションの詳細な出力は、多くの分野で非常に役立ちます。
- 自動運転車: 自動運転車が安全に走行するためには、周囲の環境を正確に理解する必要があります。セグメンテーションモデルは、道路、車線、歩行者、他の車両、障害物の正確な境界を識別し、より良い経路計画と意思決定を可能にします。自動車産業におけるAIの役割について、詳細はこちらをご覧ください。
- 医用画像解析: ヘルスケアでは、セグメンテーションはMRIやCTスキャンなどの医療スキャンを分析するために使用されます。腫瘍、臓器、または異常を正確にアウトライン化し、医師が正確な診断、手術計画、および疾患の進行のモニタリングを支援します。これは、生物医学の分野で優れた性能を発揮するU-Netのようなアーキテクチャの重要な応用となっています。
- 衛星画像解析: セグメンテーションモデルは、森林破壊や都市化などの環境変化を監視するために衛星画像を処理します。土地被覆(例えば、森林、水、都市部)を分類し、地図作成や情報収集のために建物や船舶のような個々の物体を検出できます。
- 製造業とロボット工学: 自動化された工場では、セグメンテーションは、ロボットが組み立てのためにコンベヤーベルト上の特定の部品を識別したり、高精度で欠陥を検出して品質管理を実行したりするのに役立ちます。亀裂セグメンテーションでの使用について詳しく学ぶことができます。
画像セグメンテーションとUltralytics YOLO
現代の深層学習モデル、特に畳み込みニューラルネットワーク(CNN)に基づくモデルは、画像セグメンテーションの標準です。Ultralytics YOLOモデル(YOLOv8や最新のYOLO11を含む)は、高性能なリアルタイムセグメンテーション機能を提供します。これらのモデルは、COCOのような標準的なデータセットや、特殊なタスクのためのカスタムデータセットで簡単にトレーニングできます。
Ultralyticsフレームワークは、モデルのトレーニングからパフォーマンスの検証、推論のためのデプロイまで、ワークフロー全体を簡素化します。実践的なガイドについては、Google ColabでのYOLO11を使用した画像セグメンテーションに関するチュートリアルに従うか、セグメント化されたオブジェクトを分離する方法を学ぶことができます。Ultralytics HUBのようなツールは、データセットの管理、クラウドリソースを使用したモデルのトレーニング、および実際のアプリケーションへのデプロイのためのノーコードソリューションを提供します。