新しいUltralytics YOLO11モデルをインスタンスセグメンテーションに使用して、廃棄物管理やフレア監視などのアプリケーションでより高い精度を達成する方法について解説します。

新しいUltralytics YOLO11モデルをインスタンスセグメンテーションに使用して、廃棄物管理やフレア監視などのアプリケーションでより高い精度を達成する方法について解説します。
コンピュータビジョンは、人工知能(AI)の分野であり、機械が視覚情報を解釈および理解するのに役立ち、インスタンスセグメンテーションなどのタスクを可能にします。インスタンスセグメンテーションは、画像またはビデオフレームを分析して、画像内の個々のオブジェクトの正確な境界をマークするために使用できます。これは、同じタイプの複数のオブジェクトが存在する場合でも可能です。インスタンスセグメンテーションはその高い精度により、自動運転車が道路上の障害物を検出するのを支援したり、医療スキャンで腫瘍を特定したりするなど、幅広いアプリケーションがあります。
長年にわたり、インスタンスセグメンテーションは大きく進化してきました。最近の開発は、Ultralyticsの年次ハイブリッドイベントであるYOLO Vision 2024(YV24)で、Ultralytics YOLO11モデルの形で紹介されました。新しいモデルは、Ultralytics YOLOv8モデルと同じコンピュータビジョンタスク(インスタンスセグメンテーションを含む)をサポートしているため、以前のバージョンに慣れているユーザーは、新しいモデルをシームレスに採用できます。
この記事では、インスタンスセグメンテーションと、それがセマンティックセグメンテーションのような他のコンピュータビジョンタスクとどのように異なるかを探り、そのアプリケーションのいくつかについて説明します。また、Ultralytics PythonパッケージとUltralytics HUBプラットフォームを使用して、YOLO11インスタンスセグメンテーションモデルを使用する方法についても説明します。それでは始めましょう。
インスタンスセグメンテーションを使用して、画像内のオブジェクトを識別し、ピクセルレベルでそれらの輪郭を描くことができます。このプロセスでは通常、最初にオブジェクトを検出し、それらの周りにバウンディングボックスを描画します。次に、セグメンテーションアルゴリズムがバウンディングボックス内の各ピクセルを分類して、各オブジェクトの正確なマスクを作成します。
インスタンスセグメンテーションは、セマンティックセグメンテーションやパノプティックセグメンテーションなどのタスクとも異なります。セマンティックセグメンテーションは、個々のインスタンスを区別せずに、オブジェクトの一般的なカテゴリに基づいて各ピクセルにラベルを付けます。一方、パノプティックセグメンテーションは、クラスとインスタンスIDの両方で各ピクセルにラベルを付けることにより、インスタンスセグメンテーションとセマンティックセグメンテーションを組み合わせ、各カテゴリ内の個々のオブジェクトを識別します。
インスタンスセグメンテーションの機能は、異なるモデルを必要とする可能性のあるさまざまなシナリオに適用できます。たとえば、モバイルアプリケーションでのリアルタイム処理には軽量モデルが理想的かもしれませんが、より複雑なモデルは、製造業における品質管理のような高精度タスクに使用できます。
以前のモデルと同様に、YOLO11インスタンスセグメンテーションモデルにも、ニーズに応じていくつかのバリエーションがあります。これらのバリエーションには、YOLO11n-seg(Nano)、YOLO11s-seg(Small)、YOLO11m-seg(Medium)、YOLO11l-seg(Large)、YOLO11x-seg(Extra Large)が含まれます。これらのモデルは、サイズ、処理速度、精度、および必要な計算能力の点で異なります。特定の要件に基づいて、アプリケーションに最適なモデルを選択できます。
YOLO11の高度なインスタンスセグメンテーション機能は、さまざまな業界で幅広いアプリケーションを開きます。これらのアプリケーションのいくつかについて詳しく見ていきましょう。
石油およびガスの抽出には、圧力の極端な変動の管理が伴います。ガスフレアリングなどの技術は、石油抽出中に生成される天然ガスを燃焼させるのに役立ちます。これは安全上の理由で必要です。たとえば、原油抽出では、突然または大幅な圧力スパイクが爆発につながる可能性があります。まれですが、石油およびガス製造部門での産業事故は、封じ込めと制御が困難な激しい火災を引き起こす可能性があります。ガスフレアリングは、オペレーターが機器を安全に減圧し、過剰なガスを燃焼させることによって、予測不可能で大きな圧力変動を管理するのに役立ちます。
AIシステムは、この監視プロセスを改善でき、インスタンスセグメンテーションベースのフレア監視システムを使用することで、事故のリスクを軽減できます。ガスフレアリングの監視は、環境上の理由からも重要です。フレアリングが多すぎると、環境に悪影響を与える可能性があるためです。
Ultralytics YOLO11のインスタンスセグメンテーションモデルは、フレアリングによる火災と煙の量を監視するために使用できます。検出およびセグメント化されたフレアと煙のピクセル領域を計算できます。この情報を使用することで、オペレーターはフレアリングによるフレアと煙に関するリアルタイムの洞察を得ることができ、事故や環境への悪影響を防ぐのに役立ちます。
廃棄物管理およびリサイクル施設の作業員は、YOLO11インスタンスセグメンテーションベースのシステムを使用して、プラスチック廃棄物を識別できます。YOLO11は、段ボールやプラスチック(個別に処理される)などのさまざまな廃棄物を正確に識別するために、ロボット選別システムと統合できます。世界中で発生する70億トンのプラスチック廃棄物のうち、リサイクルされるのは約10%にすぎないことを考えると、これは特に重要です。
プラスチック廃棄物の識別と分別を自動化することで、作業員が手作業で分別する従来の方法に比べて、必要な時間を大幅に短縮できます。コンピュータビジョンモデルは、絡まりやすいラップや袋などの軟質プラスチックもセグメント化できます。YOLOv11モデルは、さまざまな種類のプラスチックをセグメント化するためにカスタムトレーニングすることもできます。YOLOv11モデルをカスタムトレーニングする方法については、次のセクションで詳しく説明します。
インスタンスセグメンテーションのもう一つの興味深いユースケースは、自動運転車です。YOLO11を使用すると、自動運転車は、ピクセルレベルでオブジェクトを正確に認識することで、乗客の安全と道路上の他の人の安全を向上させることができます。車のオンボードカメラシステムは、周囲の画像をキャプチャし、YOLO11とインスタンスセグメンテーションを使用して分析できます。画像内の各オブジェクト(歩行者、信号機、他の車両など)がセグメント化され、ラベルが付けられます。このようなレベルの精度により、自動運転車は周囲のすべてのオブジェクトを識別できます。
インスタンスセグメンテーションについて説明し、その応用についていくつか説明したところで、Ultralytics YOLO11モデルを使用してそれを試す方法を見てみましょう。
これを行うには、Ultralytics PythonパッケージまたはUltralytics HUBを使用する2つの方法があります。ここではまず、Pythonパッケージから見ていきましょう。
推論の実行とは、モデルを使用して、新しい、これまでに見られなかったデータを分析することです。コードを通じてYOLO11インスタンスセグメンテーションモデルを使用して推論を実行するには、pip、conda、またはdockerを使用してUltralytics Pythonパッケージをインストールする必要があります。インストール中に問題が発生した場合は、一般的な問題ガイドを参照して、トラブルシューティングの支援を受けてください。パッケージがインストールされたら、以下のコードを実行してYOLO11インスタンスセグメンテーションモデルをロードし、画像に対する予測を実行できます。
同じコード設定で、カスタムYOLO11モデルをトレーニングすることもできます。YOLO11モデルを微調整することで、特定のプロジェクト要件をより満たすカスタムバージョンのモデルを作成できます。たとえば、小売業者は、カスタムモデルを使用して顧客の身体的特徴を正確にセグメント化し、適切にフィットする服を推奨できます。以下のコードスニペットは、インスタンスセグメンテーションのためにYOLO11モデルをロードしてトレーニングする方法を示しています。YAML構成または事前トレーニング済みのモデルから開始し、重みを転送し、COCOのようなデータセットでトレーニングして、効果的なセグメンテーションを実現できます。
完了すると、特定のアプリケーションに合わせてカスタムモデルを使用して推論を実行できます。エクスポートオプションを使用すると、カスタムモデルを別の形式にエクスポートすることもできます。
コードを通じてYOLO11インスタンスセグメンテーションモデルの推論の実行とカスタムトレーニングについて説明したところで、ノーコードの代替手段であるUltralytics HUBを見てみましょう。Ultralytics HUBは、YOLO11インスタンスセグメンテーションモデルを含む、YOLOモデルのトレーニングとデプロイのプロセスを簡素化する直感的なVision AIプラットフォームです。
画像に対して推論を実行するには、アカウントを作成し、[モデル]セクションに移動して、選択したYOLO11インスタンスセグメンテーションモデルのバリアントを選択するだけです。画像をアップロードして、以下に示すように、プレビューセクションで予測結果を表示できます。
YOLO11は、信頼性の高いインスタンスセグメンテーション機能を提供し、さまざまな業界で可能性の世界を切り開きます。自律走行車の安全性の向上、石油・ガス部門でのガスフレアリングの監視から、リサイクル施設での廃棄物選別の自動化まで、YOLO11のピクセルレベルの精度は、複雑なセグメンテーションタスクに最適です。
Ultralytics Pythonパッケージによるカスタムトレーニングや、Ultralytics HUBによるノーコード設定のオプションにより、ユーザーはYOLO11をワークフローにシームレスに統合できます。産業用途、ヘルスケア、小売、環境モニタリングなど、YOLO11は多様なセグメンテーションのニーズに対応する柔軟性と精度をもたらします。
詳細については、GitHubリポジトリにアクセスし、コミュニティにご参加ください。当社のソリューションページで、自動運転車や農業におけるAIアプリケーションをご覧ください。🚀