YOLO Vision 2024で発表されたSharkEyeが、Ultralytics YOLOv8 活用し、リアルタイムの物体検知とビーチの安全性をどのように実現しているかを理解しよう。

YOLO Vision 2024で発表されたSharkEyeが、Ultralytics YOLOv8 活用し、リアルタイムの物体検知とビーチの安全性をどのように実現しているかを理解しよう。

自然の生息地にいる動物たち、たとえば農場で草を食む牛や海岸近くを移動するサメなどを観察することは、常に彼らの安全と幸福のために重要なことでした。しかし、手動で観察するのは簡単ではありません。観察者は行動や動きのわずかな変化を注意深く監視する必要があるため、多くの場合、何時間もの忍耐と注意深い集中力が必要です。それでも、微妙でありながら重要な兆候を見逃してしまうことがあります。
人工知能(AI)が参入したおかげで、このプロセスはより速く、より賢く、はるかに効率的になりつつあり、人間の観察者の負担を減らすと同時に精度を向上させている。特にコンピューター・ビジョンは、動物をtrack し、危険を察知し、リアルタイムで判断を下すために使用できる。かつては何時間もかかっていた作業が数分でできるようになり、動物の行動を理解する新たな道が開かれた。
Ultralytics主催の年次ハイブリッド・イベントであるYOLO Vision 2024(YV24)では、専門家やイノベーターが集まり、AIが日常の課題にどのように取り組んでいるかを探った。展示されたトピックの中には、リアルタイムの物体検出や動物モニタリングの進歩が含まれ、AIが様々な分野でいかに安全性と効率性を高めているかを実証した。
イベントのハイライトのひとつは、AIマスター・グループの創設者であるジム・グリフィンによる講演で、彼はビジョンAIがサメが岸に近づきすぎる前に検知することで、ビーチの安全性を高めていることを実演した。彼は Ultralytics YOLOv8最先端のコンピューター・ビジョン・モデルであるUltralytics YOLOv8を使用することで、波の揺れやまぶしさ、水中の障害物などの厳しい条件下でも、リアルタイムでサメを正確に識別する方法を説明した。
この記事では、SharkEyeプロジェクトを詳しく見て、Jim氏の講演からの興味深い洞察を共有します。
ジムはまず、サーファーとサメがしばしば同じ海を共有するカリフォルニアの有名なサーフスポット、パダロ・ビーチを紹介して話を始めた。もちろん、サメに噛まれればdetect のは簡単だ。

SharkEyeは、カリフォルニア大学サンタバーバラ校の支援を受けて、この問題に取り組むために作成されました。Jim氏は、高解像度のAIカメラを搭載したドローンを水面から約200フィート上空に飛行させ、リアルタイムで海をスキャンする方法を説明しました。
サメが検出されると、ライフガード、サーフショップのオーナー、および最新情報にサインアップした人を含む約80人にSMSアラートが送信されます。Jim氏は、これらの即時通知により迅速な対応が可能になり、サメが海岸の近くにいるときに海水浴客の安全を確保できることを指摘しました。
また、Jim氏は、SharkEyeにはサメの検出状況をリアルタイムで確認できるライブダッシュボード機能があると述べました。例えば、過去12週間で、このシステムは2匹の大型のサメと15匹の小型のサメを識別し、1週間あたり平均1匹強のサメを検出しました。
続いて、SharkEyeの開発を主導した科学者、Neil Nathan氏を紹介しました。Nathan氏は、コンピュータサイエンスではなく環境学を専門としていましたが、プロジェクトを見事に成功させました。Jim氏は、SharkEyeで使用されているような最新のAIツールは、専門知識を持たない人でもアクセスしやすいように設計されており、インパクトのあるソリューションを開発できると強調しました。
ジムはさらに詳しく、SharkEyeのボンネットの中身と、サメ検出ソリューションが単純な物体検出タスクだけではなかったことを説明した。サメと間違えやすい海藻の浮遊など、ダイナミックで予測不可能な状況に対処しなければならなかった。静止した物体を見つけるのとは異なり、サメを識別するには精度と適応性が必要であり、YOLOv8 理想的な選択であった。
YOLOv8 もうひとつの利点は、クラウドサーバーに頼ることなくドローンに搭載できることだった。ジムは、このアプローチによって、SharkEyeが即座にアラートを送ることが可能になったことを説明した。
SharkEyeの仕組みと、その背景にある共同作業について説明した後、Jim氏はライブデモを披露しました。
Jim Griffinは、Ultralytics YOLO モデルの"hello world "コード・スニペットという身近な例を通して聴衆を案内し、ライブ・デモを開始した。たった6行のPython コードで、彼は事前に訓練されたUltralytics YOLOv8 モデルが画像内のバスを簡単にdetect できることを示した。

彼のデモでは、ドローンのような低電力デバイス用の軽量版であるYOLOv8 Nanoモデルが使用された。同じモデルがSharkEyeでリアルタイムにサメを検知するために使用された。
さらに背景を説明するために、ジムはデモのモデルが、広く使われているCOCO データセットの小さいサブセットであるCOCO128訓練されていることに言及した。COCO データセットには、80の異なるオブジェクトカテゴリにわたって20,000以上の画像が含まれています。COCO128 迅速なデモには適しているが、SharkEyeにはもっと堅牢なもの、つまり実世界の複雑なシナリオに対応できるアプリケーション固有のサメ検出データセットが必要だと指摘した。
Jim氏によると、SharkEyeプロジェクトで最も困難だったのは、AIモデルのトレーニングではなく、適切なデータを収集することでした。彼は、「このプロジェクトの主な作業はAIではありませんでした。このプロジェクトの主な作業は、5年間ドローンを飛ばし、それらのビデオから画像を選び出し、適切にタグ付けすることでした」とコメントしました。
彼は、チームがパダロビーチで15,000枚の画像を収集した経緯を説明しました。各画像には、サメ、海藻、および水中の他の物体を区別するために、手動でラベルを付ける必要がありました。このプロセスは時間と労力を要しましたが、その後のすべての基礎となりました。

データセットの準備が整うと、Ultralytics YOLOV8 カスタムトレーニングした。ジム氏は、「実際のトレーニングは難しい部分ではなく、T4 GPU(グラフィック・プロセッシング・ユニット)で20時間しかかかりませんでした。また、A100 GPUなど、より強力なハードウェアを使えば、5時間程度に短縮できたかもしれないとも付け加えた。
次に、Jim氏はSharkEyeのパフォーマンスがどのように評価されたかについて説明しました。重要な指標は精度、つまりシステムが実際のサメをどれだけ正確に識別できるかであると説明しました。SharkEyeは92%という驚異的な精度を達成しており、複雑な海洋環境の中でサメを正確に識別する上で非常に効果的であることが証明されました。
精度の重要性についてさらに詳しく説明するために、Jim氏は、この場合、なぜ再現率よりも精度が重要なのかを明確にしました。「ほとんどの場合、人々は再現率に関心を持っています。特に、陽性ケースを見逃すことが重大な結果につながる医療分野ではそうです。しかし、この場合、どれだけのサメがいるのかわからなかったので、私たちが重要視したのは精度でした」と彼は説明しました。SharkEyeは、精度に焦点を当てることで誤報を最小限に抑え、ライフガードやその他の対応者が迅速に行動できるようにしました。

彼は、AIと人間のパフォーマンスを比較し、SharkEyeの92%の精度が人間の専門家の60%の精度をはるかに上回っていると指摘して、講演を締めくくりました。彼はこのギャップを強調し、「それは私たちが人間だからです。あなたや私がどれほど専門家であろうと、一日中スクリーンの前に座ってサメを探さなければならないとしたら、いずれは気が散ってしまうでしょう」と述べました。人間とは異なり、AIモデルは疲れたり、気が散ったりすることがないため、継続的な監視が必要なタスクにとって信頼できるソリューションとなります。
ジム・グリフィンの講演の中にあった「6行のコードが、ある日あなたの命を救うかもしれない」という興味深い言葉は、AIがいかに高度でありながら身近なものになったかを見事に言い表している。Ultralytics YOLO モデルは、このことを念頭に置いて作成されており、最先端のコンピュータビジョン技術をあらゆる規模の開発者や企業に利用しやすくしています。 Ultralytics YOLO11は、より高速な推論と高い精度を実現しています。
YOLO11 特徴を簡単に紹介しよう:
これらの機能により、YOLO11 農場であれ野生であれ、ダイナミックな環境における動物の行動追跡に最適なのだ。
ビジョンAIの進歩は、様々な分野に実用的なツールを提供することで、現実世界の課題への取り組みを容易にしている。例えば、YOLO11 ようなコンピュータ・ビジョン・モデルは、厳しい条件下でも動物のリアルタイム監視や追跡に使用できる。
YV24でのジム・グリフィンの基調講演は、YOLOv8 最小限のコーディングで複雑な問題を解決するためにどのように使用できるかを説明した。ドローンとAIを組み合わせてリアルタイムでサメを探知するSharkEyeプロジェクトは、テクノロジーがビーチの安全性をどのように向上させるかを紹介した。
これは、アクセスしやすいAIが、さまざまなバックグラウンドを持つ人々が効果的なソリューションを作成できるようにする魅力的なケーススタディでした。AIが進化し続けるにつれて、産業を変革し、個人がその可能性を活用して世界をより安全、スマート、効率的な場所にすることが可能になっています。
私たちのコミュニティに参加し、GitHubリポジトリを探求して、AIについてより深く掘り下げてみましょう。農業におけるコンピュータビジョンから自動運転車におけるAIまで、これらのテクノロジーがどのようにイノベーションを推進しているかをご覧ください。当社のライセンスオプションをチェックして、今日からAIプロジェクトを始めましょう!