Yolo 深圳
深セン
今すぐ参加

行動AIはコンピュータビジョンの影響力を高めています

Abirami Vina

4分で読めます

2025年1月6日

デビッド・スコットのYOLO ビジョン2024の基調講演で、AIを活用した行動分析と、畜産などの分野での実際の応用について再考します。

長年にわたり、コンピュータビジョンのイノベーションは、物体検出(画像やビデオ内の犬や車などの物体を識別する)などのタスクに焦点を当ててきました。これらのアプローチにより、自動運転車、製造、ヘルスケアなどの分野での応用が可能になりました。 

しかし、これらのタスクは多くの場合、オブジェクトが何かを識別することにのみ焦点を当てています。もしVision AIシステムがさらに一歩進むことができたらどうでしょうか?例えば、単に犬を検出するだけでなく、犬がボールを追いかけていることや、歩行者が横断しているために車が急ブレーキをかけていることを理解できるとします。この基本的な認識から文脈の理解への移行は、よりスマートで文脈を認識した行動AIへの大きな転換を意味します。

ビジョンAIの進歩を祝うUltralytics年次ハイブリッド・イベント、YOLO ビジョン2024(YV24)では、メインブランチのデイヴィッド・スコットCEOによる興味深い講演の中で、AI主導の行動分析というコンセプトが中心となった。

彼の講演で、Davidは基本的なコンピュータビジョンのタスクから行動追跡への移行を探求しました。最先端の技術アプリケーションの構築における25年以上の経験を持ち、彼はこの飛躍の影響を紹介しました。彼は、パターンと行動を解読することが、農業や動物福祉などの業界をどのように再構築しているかを強調しました。

この記事では、Davidの講演のハイライトを紹介し、行動追跡がAIをより実用的にする方法を探ります。 

AI導入における課題について

David Scott氏は、基調講演を大胆な現実認識から始め、「私の同僚はよく『科学は売れない』と言いますが、私たちは科学が好きなので、多くの人が気を悪くします。AIは本当にクールなのに、なぜ人々はそれを買わないのでしょうか?しかし、現実は、私たちがクールだと思うからといって、人々はそれを買いたいわけではありません。彼らにはそれを買う理由が必要なのです」と述べました。

彼は続けて、彼の会社であるThe Main Branchでは、AIの能力を誇示するだけでなく、AIで実際の問題を解決することに常に焦点を当てていると説明しました。多くのクライアントは、AIをどのように活用できるかについて話したいと思っていますが、彼はそれを逆のアプローチだと考えています。それは、問題のないソリューションを持っているようなものです。代わりに、彼らは特定の課題を持ち込むクライアントと協力して、実際に違いを生むAIソリューションを作成します。

__wf_reserved_inherit
図1. YV24のステージに立つDavid Scott氏。

Davidはまた、彼らの仕事は、シーン内のオブジェクトを認識するだけにとどまらないことが多いと語りました。そこに何があるかを見つけることは、ほんの最初のステップです。真の価値は、その情報をどう活用し、より大きなバリューチェーンの中で役立つものにするかを理解することから生まれます。 

行動追跡技術:実用的なAIへの鍵

AIを真に役立つものにするための重要なステップは、物体検出のような基本的なコンピュータビジョンタスクを超えて、それらの洞察を行動追跡に利用することです。David氏は、行動AIは単に物体を識別するだけでなく、行動とパターンを理解することに焦点を当てていると強調しました。これにより、AIは意味のあるイベントを認識し、実用的な洞察を提供できるようになります。

彼は、動物が床に転がるのは病気を示している可能性があるという例を挙げた。人間は24時間体制で動物を監視することはできないが、行動追跡機能を備えたAI主導の監視システムなら可能だ。このようなソリューションは、対象物を継続的に監視し、特定の行動をdetect し、アラートを送信し、タイムリーな行動を可能にする。これにより、生のデータが実用的で価値のあるものに変わる。

David氏はまた、このアプローチによってAIが単に興味深いだけでなく、真にインパクトのあるものになることを示しました。行動の監視やそれに基づいた行動など、実際の問題に対処することで、行動追跡はさまざまな業界における効果的なAIソリューションの重要な一部となり得ます。

行動AIの実現

デビッド・スコットは、次のように説明した。 Ultralytics YOLOv8は、彼のチームの行動追跡プロジェクトにとって画期的なものだった。YOLOv8は、物体を検出し、分類し、追跡するための強固な基礎を与えてくれた。また、彼のチームはさらに一歩進んで、 YOLOv8時間の経過とともに行動を監視することに重点を置いてカスタムトレーニングし、より実用的で実世界の状況に役立つものにした。

興味深いことに Ultralytics YOLO11のリリースにより、The Main Branchが作成したようなソリューションは、さらに信頼性と精度を高めることができる。この最新モデルは、精度の向上や処理の高速化など、行動をtrack する能力を高める機能を備えている。この点については、行動AIがどのような用途に使用できるかを理解した上で、さらに詳しく説明することにしよう。

次に、Davidが話したソリューションと、行動追跡技術が現実世界のアプリケーションでどのように使用され、日常の課題を解決し、有意義な影響を与えているかを探ります。

AI駆動の行動分析によるHerdSense

まずデビッドは、大規模な肥育場で何千頭もの牛の健康状態をモニタリングするHerdSenseと呼ばれるプロジェクトで取り組んだエキサイティングな挑戦について話した。目標は、個々の牛の行動をtrack し、潜在的な健康問題を特定することだった。これは何万頭もの牛を同時に監視することを意味し、簡単な作業ではなかった。

__wf_reserved_inherit
図2。HerdSenseは、行動AIを使用して牛の監視と識別に焦点を当てました。

個々の牛を識別し、その行動を追跡するという問題を解決するために、Davidのチームは、監視する必要のある考えられるすべての行動を概説するために、2日間のワークショップを実施しました。彼らは合計で200以上の行動を特定しました。

200の行動のすべてが、個々の牛を正確に認識できるかどうかにかかっていました。なぜなら、すべてのデータは特定の動物に関連付けられている必要があったからです。 主な懸念事項の1つは、牛が密集して集まっているときに個々の動物を識別することが困難になるため、牛を追跡することでした。 

David氏のチームは、それぞれの牛が困難な状況でも一貫して識別されるように、コンピュータービジョンシステムを開発しました。彼らは、同じ牛が、たとえ視界から消えたり、他の牛と混ざったり、後で再び現れたりしても、常に同じIDを割り当てられることを確認できました。

コンピュータビジョンを用いた馬の健康状態のモニタリング

さらにデビッドは、同様の行動追跡技術を馬のモニタリングに応用した、もうひとつの魅力的なプロジェクトを紹介した。このプロジェクトでは、デイビッドのチームは馬を追跡する必要がなかった。 track 個々の馬のIDを牛の時ほど詳細に追跡する必要はなかった。その代わりに、特定の行動に焦点を当て、食事のパターンや一般的な活動レベルなどの詳細を追跡し、健康上の問題を早期に発見することにした。行動の小さな変化を特定することで、より良いケアを提供し、問題が深刻化する前に予防するための迅速な介入につながる可能性がある。

__wf_reserved_inherit
図3. 行動AIを活用した馬のモニタリング。

行動AIが、なぜそれほど単純ではないのか

デビッドはまた、興味深い例を通して行動追跡の複雑さについても語った。行動分析を改善する方法を研究していたとき、彼のチームは、誰かがポケットに手を入れているような特定のポーズを分析することで万引きをdetect すると主張する企業に出会った。最初は、これは賢いアイデアに思えた。特定の動作が疑わしい行動を示唆する可能性がある、そうだろう?

__wf_reserved_inherit
Fig 4. 行動追跡技術の課題の理解。

しかし、デイビッドがさらに調査を進めると、この方法の限界に気づきました。ポケットに手を入れているなどの単一のポーズは、必ずしも誰かが万引きをしていることを意味するわけではありません。ただリラックスしていたり、考えていたり、寒かったりするだけかもしれません。孤立したポーズに焦点を当てることの問題点は、より大きなコンテキストを無視していることです。行動は単一の行動ではなく、時間経過に伴う行動のパターンであり、コンテキストと意図によって形作られます。

David氏は、真の行動追跡ははるかに複雑であり、全体的なアプローチが必要であることを強調しました。それは、一連の行動を分析し、それがより広い視野で何を意味するのかを理解することです。AI業界は進歩を遂げていますが、有意義で正確な洞察を提供するために、行動追跡を進化させるにはまだ課題が残っていると指摘しました。

アクションを理解する、よりスマートなVision AIモデルの構築

その後、デビッドは聴衆を舞台裏に案内し、彼のチームがYOLOv8そのポーズ推定能力の助けを借りて、牛の健康をモニターするコンピュータ・ビジョン・ソリューションをどのように構築したかを紹介した。

まず、牛のポーズ推定用のカスタムデータセットを作成し、標準のキーポイント数を17から145に増やして、モデルの動きの分析能力を高めました。次に、200万枚以上の画像と1億1000万件の行動例を含む大規模なデータセットでモデルをトレーニングしました。 

先進的なハードウェア・インフラを使用することで、デイビッドのチームは、従来のハードウェアでは数週間かかっていたモデルの訓練をわずか2日で行うことができた。訓練されたモデルは、複数のビデオフレームを同時に分析し、牛の行動パターンをdetect するカスタムビヘイビアトラッカーと統合された。

その結果、食べる、飲む、横になるなど、8つの異なる牛の行動をdetect ・track し、健康上の懸念を示す可能性のある些細な行動の変化を見つけることができる、ビジョンAI主導のソリューションが誕生した。これにより、酪農家は迅速に行動できるようになり、牛群管理が改善される。

行動AIの今後の展望

David氏は講演の最後に、聴衆に重要な教訓を伝えました。「AIに失敗する余地を与えなければ、最終的には統計的なものなので、失敗する可能性が高まります」。彼は、AIは強力ではあるものの、完璧ではないと指摘しました。AIはパターンから学習するツールであり、常に正しいとは限らない場合があります。それらの間違いを恐れるのではなく、それらを処理し、時間の経過とともに改善し続けることができるシステムを構築することが重要です。

これは、コンピュータ・ビジョン・モデルそのものに関しても言えることだ。例えば、Ultralytics YOLO モデルの最新バージョンであるUltralytics YOLO1111は、YOLOv8比較して次のレベルに進む必要性を念頭に置いて作られています。

 

__wf_reserved_inherit
図5. YOLO11サポートするコンピュータ・ビジョン・タスク。

特に、YOLO11 11は、農業やヘルスケアのような精度が鍵となるリアルタイムアプリケーションに関して、より優れたパフォーマンスを提供します。YOLO11 、その高度な機能により、革新的なリアルタイムの洞察を提供し、より効果的に課題に取り組むことを支援することで、産業界がAIをどのように活用するかを再定義します。

主なポイント

YV24でのDavid氏の基調講演は、AIが単なるクールなイノベーションではなく、実際の問題を解決し、私たちの生活と仕事のやり方を改善するための強力なツールであることを改めて認識させてくれました。行動に焦点を当てることで、AIはすでに動物の健康状態の追跡や、日常の行動における有意義なパターンの認識といった分野で影響を与えています。 

行動AIの可能性は非常に高く、私たちはまだ始まったばかりです。行動AIは、生のデータを実用的な洞察に変換することで、受動的な監視から積極的な問題解決へと移行します。行動AIは、今後さらに発展するにつれて、よりスマートな意思決定を促進し、プロセスを合理化し、私たちの生活に有意義な改善をもたらすでしょう。

AIとその現実世界の応用についてさらに学ぶには、私たちのコミュニティと繋がりましょう。GitHubリポジトリにアクセスして、農業におけるAI製造業におけるコンピュータビジョンなどの分野のイノベーションをご覧ください。

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる