新しいUltralytics YOLO11モデルが、廃棄物管理やフレアモニタリングなどの用途で、より高い精度を達成するためのインスタンスセグメンテーションにどのように使用できるかを理解する。

新しいUltralytics YOLO11モデルが、廃棄物管理やフレアモニタリングなどの用途で、より高い精度を達成するためのインスタンスセグメンテーションにどのように使用できるかを理解する。
人工知能(AI)の一分野であるコンピュータビジョンは、機械が視覚情報を解釈し理解するのを助けるもので、インスタンスセグメンテーションのようなタスクを可能にする。インスタンス・セグメンテーションは 、画像やビデオ・フレームを解析して、同じ種類のオブジェクトが複数存在する場合でも、画像内の各個別のオブジェクトの正確な境界をマークするために使用できる。インスタンス・セグメンテーションは精度が高いため、自動運転車が 道路上の障害物を検出するのに役立ったり、医療用スキャンで 腫瘍を特定したりと、幅広い用途がある。
長年にわたり、インスタンス・セグメンテーションは大きく進化してきた。最近の開発は、Ultralyticsの年次ハイブリッドイベントであるYOLO Vision 2024(YV24)において、Ultralytics YOLO11モデルという形で紹介されました。この新しいモデルは、Ultralytics YOLOv8モデルと同じコンピュータビジョンタスク(インスタンスセグメンテーションを含む)をサポートしているため、以前のバージョンに慣れ親しんだユーザーは、新しいモデルをシームレスに採用することができます。
この記事では、インスタンスセグメンテーションと、セマンティックセグメンテーションのような他のコンピュータビジョンタスクとの違いについて説明し、その応用例についても説明します。また、Ultralytics Pythonパッケージと Ultralytics HUBプラットフォームを使用して、YOLO11インスタンスセグメンテーションモデルを使用する方法についても説明します。それでは始めましょう!
インスタンス・セグメンテーションは、画像内のオブジェクトを識別し、ピクセル・レベルでアウトライン化するために使用できる。このプロセスでは通常、まずオブジェクトを検出し、その周囲にバウンディングボックスを描く。次に、セグメンテーションアルゴリズムがバウンディングボックス内の各ピクセルを分類し、各オブジェクトの正確なマスクを作成する。
インスタンスセグメンテーションは、セマンティックセグメンテーションやパノプティックセグメンテーションのようなタスクとも異なる。セマンティックセグメンテーションは、オブジェクトの一般的なカテゴリに基づいて各ピクセルをラベリングします。一方、パノプティックセグメンテーションは、インスタンスセグメンテーションとセマンティックセグメンテーションの両方を組み合わせ、各ピクセルをクラスとインスタンス ID の両方でラベリングし、各カテゴリー内の個々のオブジェクトを識別します。
インスタンス・セグメンテーションの機能は、さまざまなシナリオに適用することができる。例えば、軽量なモデルはモバイルアプリケーションのリアルタイム処理に最適かもしれないし、より複雑なモデルは製造業の品質管理のような高精度のタスクに使用できるかもしれない。
YOLO11インスタンス・セグメンテーション・モデルにも、これまでのモデルと同様、ニーズに応じていくつかのバリエーションが用意されている。これらのバリエーションには、YOLO11n-seg(Nano)、YOLO11s-seg(Small)、YOLO11m-seg(Medium)、YOLO11l-seg(Large)、YOLO11x-seg(Extra Large)があります。これらのモデルは、そのサイズ、処理速度、精度、必要な計算能力などの点で異なります。お客様の具体的な要件に基づいて、用途に最も適したモデルをお選びいただけます。
YOLO11の高度なインスタンス・セグメンテーション機能は、様々な業界において、様々なアプリケーションを切り開く。これらのアプリケーションのいくつかを詳しく見てみよう。
石油とガスの採掘には、非常に高い圧力の変動を管理する必要がある。ガスフレアのような技術は、石油採掘中に発生する天然ガスを燃やすのに役立つ。これは安全上の理由から必要なことである。例えば、原油の採掘では、突然または大幅な圧力の急上昇が爆発につながる可能性がある。まれなことではあるが、石油・ガス製造部門における産業事故は、封じ込めや制御が困難な激しい火災を引き起こす可能性がある。ガスフレアは、余分なガスを燃焼させることで、設備を安全に減圧し、予測できない大きな圧力変動を管理するのに役立ちます。
AIシステムはこの監視プロセスを改善することができ、インスタンス・セグメンテーション・ベースのフレア監視システムを使用することで、事故のリスクを減らすことができる。フレアリングが多すぎると環境に悪影響を与えるため、ガスフレアの監視は環境上の理由からも重要である。
Ultralytics YOLO11インスタンスセグメンテーションモデルは、フレアリングによる火災や煙の量を監視するために使用できます。検出されセグメント化されたフレアと煙のピクセル面積を計算することができます。この情報を使用することで、オペレーターはフレアリングによって発生したフレアや煙をリアルタイムで把握することができ、事故や環境への悪影響を防ぐことができます。
廃棄物処理施設やリサイクル施設の作業員は、YOLO11のインスタンス・セグメンテーション・ベースのシステムを使って、プラスチック廃棄物を識別することができる。YOLO11は、ロボット選別システムと統合することで、段ボールとプラスチック(別々に処理される)のような異なる廃棄物を正確に識別することができる。世界で発生する70億トンのプラスチック廃棄物のうち、リサイクルされるのはわずか10%程度であることを考えると、これは特に重要なことだ。
プラスチック廃棄物の識別と選別を自動化することで、作業員が手作業で選別していた従来の方法に比べ、所要時間が大幅に短縮される。コンピュータ・ビジョンのモデルは、ラップや袋のような柔らかいプラスチックも選別することができます。YOLO11のモデルは、さまざまな種類のプラスチックをセグメント化するようにカスタム・トレーニングすることもできます。YOLO11モデルをカスタムトレーニングする方法については、次のセクションで詳しく説明します。
インスタンスセグメンテーションのもう1つの興味深い使用例は、自律走行車である。YOLO11は、ピクセルレベルで正確に物体を認識することで、自動運転車の乗客の安全性と道路上の他人の安全性を向上させることができる。車に搭載されたカメラシステムは、周囲の画像をキャプチャし、YOLO11とインスタンス・セグメンテーションを使って解析することができる。画像内の各オブジェクト(歩行者、信号機、他の車両など)がセグメント化され、ラベルが付与される。このような精度の高さにより、自律走行車は周囲のあらゆる物体を識別できるようになる。
さて、インスタンス・セグメンテーションについて検討し、その応用例をいくつか説明したところで、UltralyticsのYOLO11モデルを使って、どのように試すことができるか見てみよう。
これには2つの方法があります:Ultralytics Pythonパッケージを使うか、Ultralytics HUBを使うかです。まずはPythonパッケージから。
推論を実行するには、モデルを使用して、以前に見たことのない新しいデータを分析する必要がある。YOLO11インスタンス・セグメンテーション・モデルをコードで使って推論を実行するには、pip、conda、またはdockerを使ってUltralytics Pythonパッケージをインストールする必要がある。インストール中に何らかの問題に直面した場合は、トラブルシューティングを支援するための「よくある問題ガイド」を参照できる。パッケージがインストールされたら、以下に示すコードを実行して、YOLO11インスタンス・セグメンテーション・モデルをロードし、イメージ上で予測を実行することができます。
同じコード・セットアップで、カスタムYOLO11モデルをトレーニングすることもできます。YOLO11モデルを微調整することで、特定のプロジェクト要件をよりよく満たすモデルのカスタムバージョンを作成することができます。例えば、小売業者はカスタムモデルを使用して、顧客の身体的特徴を正確にセグメント化し、適切にフィットする服を勧めることができます。以下のコード・スニペットは、インスタンス・セグメンテーションのためにYOLO11モデルをロードして学習させる方法を示しています。効果的なセグメンテーションを実現するために、YAML 設定や事前に訓練されたモデルから始めて、重みを転送し、COCO のようなデータセットで訓練することができます。
完了すると、特定のアプリケーションのためにカスタム・モデルを使用して推論を実行することができます。エクスポート・オプションを使えば、カスタム・モデルを別のフォーマットにエクスポートすることもできます。
YOLO11インスタンス・セグメンテーション・モデルのコードによる推論とカスタム・トレーニングの実行について見てきたが、コードなしの代替案を見てみよう:Ultralytics HUBだ。Ultralytics HUBは、YOLO11インスタンス・セグメンテーション・モデルを含むYOLOモデルのトレーニングとデプロイのプロセスを簡素化する、直感的なVision AIプラットフォームである。
画像の推論を実行するには、アカウントを作成し、「モデル」セクションに移動し、YOLO11インスタンス・セグメンテーション・モデルのバリアントを選択するだけです。以下のように、画像をアップロードし、プレビューセクションで予測結果を見ることができます。
YOLO11は、信頼性の高いインスタンス・セグメンテーション機能を提供し、様々な産業における可能性を広げます。自律走行車の安全性向上や、石油・ガスセクターにおけるガスフレアの監視から、リサイクル施設における廃棄物分別の自動化まで、YOLO11のピクセルレベルの精度は、複雑なセグメンテーションタスクに最適です。
Ultralytics Pythonパッケージによるカスタムトレーニングのオプションや、Ultralytics HUBによるコード不要のセットアップにより、ユーザーはYOLO11をワークフローにシームレスに統合することができます。産業用アプリケーション、ヘルスケア、小売、環境モニタリングのいずれにおいても、YOLO11は多様なセグメンテーションのニーズを満たす柔軟性と精度をもたらします。
GitHubリポジトリにアクセスし、私たちのコミュニティに参加してください。自動運転車や 農業におけるAIアプリケーションについては、ソリューションページをご覧ください。🚀