YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024

行動AIはコンピュータビジョンの影響力を高めています

Abirami Vina

4分で読めます

2025年1月6日

デイビッド・スコット氏によるYOLO Vision 2024の基調講演を振り返り、AIを活用した行動分析と、畜産などの分野における現実世界の応用についてご紹介します。

長年にわたり、コンピュータビジョンのイノベーションは、物体検出(画像やビデオ内の犬や車などの物体を識別する)などのタスクに焦点を当ててきました。これらのアプローチにより、自動運転車、製造、ヘルスケアなどの分野での応用が可能になりました。 

しかし、これらのタスクは多くの場合、オブジェクトが何かを識別することにのみ焦点を当てています。もしVision AIシステムがさらに一歩進むことができたらどうでしょうか?例えば、単に犬を検出するだけでなく、犬がボールを追いかけていることや、歩行者が横断しているために車が急ブレーキをかけていることを理解できるとします。この基本的な認識から文脈の理解への移行は、よりスマートで文脈を認識した行動AIへの大きな転換を意味します。

Vision AIの進歩を祝うUltralyticsの年次ハイブリッドイベント、YOLO Vision 2024(YV24)で、The Main BranchのCEOであるDavid Scott氏による興味深い講演の中で、AI駆動の行動分析の概念が中心的なテーマとなりました。

彼の講演で、Davidは基本的なコンピュータビジョンのタスクから行動追跡への移行を探求しました。最先端の技術アプリケーションの構築における25年以上の経験を持ち、彼はこの飛躍の影響を紹介しました。彼は、パターンと行動を解読することが、農業や動物福祉などの業界をどのように再構築しているかを強調しました。

この記事では、Davidの講演のハイライトを紹介し、行動追跡がAIをより実用的にする方法を探ります。 

AI導入における課題について

David Scott氏は、基調講演を大胆な現実認識から始め、「私の同僚はよく『科学は売れない』と言いますが、私たちは科学が好きなので、多くの人が気を悪くします。AIは本当にクールなのに、なぜ人々はそれを買わないのでしょうか?しかし、現実は、私たちがクールだと思うからといって、人々はそれを買いたいわけではありません。彼らにはそれを買う理由が必要なのです」と述べました。

彼は続けて、彼の会社であるThe Main Branchでは、AIの能力を誇示するだけでなく、AIで実際の問題を解決することに常に焦点を当てていると説明しました。多くのクライアントは、AIをどのように活用できるかについて話したいと思っていますが、彼はそれを逆のアプローチだと考えています。それは、問題のないソリューションを持っているようなものです。代わりに、彼らは特定の課題を持ち込むクライアントと協力して、実際に違いを生むAIソリューションを作成します。

__wf_reserved_inherit
図1. YV24のステージに立つDavid Scott氏。

Davidはまた、彼らの仕事は、シーン内のオブジェクトを認識するだけにとどまらないことが多いと語りました。そこに何があるかを見つけることは、ほんの最初のステップです。真の価値は、その情報をどう活用し、より大きなバリューチェーンの中で役立つものにするかを理解することから生まれます。 

行動追跡技術:実用的なAIへの鍵

AIを真に役立つものにするための重要なステップは、物体検出のような基本的なコンピュータビジョンタスクを超えて、それらの洞察を行動追跡に利用することです。David氏は、行動AIは単に物体を識別するだけでなく、行動とパターンを理解することに焦点を当てていると強調しました。これにより、AIは意味のあるイベントを認識し、実用的な洞察を提供できるようになります。

彼は、動物が床を転げ回る例を挙げ、それは病気の兆候である可能性があると述べました。人間は24時間体制で動物を見ていることはできませんが、行動追跡機能を備えたAI駆動の監視システムなら可能です。このようなソリューションは、オブジェクトを継続的に監視し、特定の行動を検出し、アラートを送信し、タイムリーなアクションを可能にします。これにより、生データが実用的で価値のあるものに変わります。

David氏はまた、このアプローチによってAIが単に興味深いだけでなく、真にインパクトのあるものになることを示しました。行動の監視やそれに基づいた行動など、実際の問題に対処することで、行動追跡はさまざまな業界における効果的なAIソリューションの重要な一部となり得ます。

行動AIの実現

David Scott氏は、コンピュータービジョンモデルであるUltralytics YOLOv8が、彼のチームの行動追跡プロジェクトにとって画期的な出来事であったかを説明しました。YOLOv8は、物体の検出、分類、追跡のための強固な基盤を提供しました。彼のチームはさらに一歩進んで、時間の経過に伴う行動の監視に焦点を当てるようにYOLOv8をカスタムトレーニングし、現実世界の状況においてより実用的で役立つものにしました。

興味深いことに、Ultralytics YOLO11のリリースにより、The Main Branchが作成したようなソリューションは、さらに信頼性と精度を高めることができます。この最新モデルは、精度向上や処理速度の向上といった機能を提供し、行動追跡能力を強化します。行動AIがどのような用途に利用できるのかをより深く理解した後、これについてさらに詳しく説明します。

次に、Davidが話したソリューションと、行動追跡技術が現実世界のアプリケーションでどのように使用され、日常の課題を解決し、有意義な影響を与えているかを探ります。

AI駆動の行動分析によるHerdSense

まず、DavidはHerdSenseと呼ばれるプロジェクトで取り組んだエキサイティングな課題を共有しました。これは、大規模な飼育場で数千頭の牛の健康状態を監視するというものでした。目標は、個々の牛の行動を追跡して、潜在的な健康問題を特定することでした。これは、同時に数万頭の動物を監視することを意味し、簡単な作業ではありませんでした。

__wf_reserved_inherit
図2。HerdSenseは、行動AIを使用して牛の監視と識別に焦点を当てました。

個々の牛を識別し、その行動を追跡するという問題を解決するために、Davidのチームは、監視する必要のある考えられるすべての行動を概説するために、2日間のワークショップを実施しました。彼らは合計で200以上の行動を特定しました。

200の行動のすべてが、個々の牛を正確に認識できるかどうかにかかっていました。なぜなら、すべてのデータは特定の動物に関連付けられている必要があったからです。 主な懸念事項の1つは、牛が密集して集まっているときに個々の動物を識別することが困難になるため、牛を追跡することでした。 

David氏のチームは、それぞれの牛が困難な状況でも一貫して識別されるように、コンピュータービジョンシステムを開発しました。彼らは、同じ牛が、たとえ視界から消えたり、他の牛と混ざったり、後で再び現れたりしても、常に同じIDを割り当てられることを確認できました。

コンピュータビジョンを用いた馬の健康状態のモニタリング

次に、デイビッドは、同様の行動追跡技術を応用して馬を監視する別の魅力的なプロジェクトを紹介しました。このプロジェクトでは、デイビッドのチームは、牛の場合ほど個々の馬のIDを厳密に追跡する必要はありませんでした。代わりに、特定の行動に焦点を当て、摂食パターンや一般的な活動レベルなどの詳細を追跡して、健康上の問題を早期に発見しました。行動のわずかな変化を特定することで、より迅速な介入につながり、より良いケアを提供し、問題が深刻になる前に防止できます。

__wf_reserved_inherit
図3. 行動AIを活用した馬のモニタリング。

行動AIが、なぜそれほど単純ではないのか

Davidはまた、興味深い例を通して、行動追跡の複雑さについて議論しました。行動分析を改善する方法を研究している際に、彼のチームは、特定のポーズ(ポケットに手を入れているなど)を分析して万引きを検出すると主張する企業に出会いました。最初は、これは賢いアイデアのように思えました。特定の動きは、疑わしい行動を示唆する可能性があるからです。

__wf_reserved_inherit
Fig 4. 行動追跡技術の課題の理解。

しかし、デイビッドがさらに調査を進めると、この方法の限界に気づきました。ポケットに手を入れているなどの単一のポーズは、必ずしも誰かが万引きをしていることを意味するわけではありません。ただリラックスしていたり、考えていたり、寒かったりするだけかもしれません。孤立したポーズに焦点を当てることの問題点は、より大きなコンテキストを無視していることです。行動は単一の行動ではなく、時間経過に伴う行動のパターンであり、コンテキストと意図によって形作られます。

David氏は、真の行動追跡ははるかに複雑であり、全体的なアプローチが必要であることを強調しました。それは、一連の行動を分析し、それがより広い視野で何を意味するのかを理解することです。AI業界は進歩を遂げていますが、有意義で正確な洞察を提供するために、行動追跡を進化させるにはまだ課題が残っていると指摘しました。

アクションを理解する、よりスマートなVision AIモデルの構築

その後、David は聴衆を舞台裏に案内し、YOLOv8 とその姿勢推定機能を利用して、彼のチームが牛の健康状態を監視するためのコンピュータビジョンソリューションをどのように構築したかを説明しました。

まず、牛のポーズ推定用のカスタムデータセットを作成し、標準のキーポイント数を17から145に増やして、モデルの動きの分析能力を高めました。次に、200万枚以上の画像と1億1000万件の行動例を含む大規模なデータセットでモデルをトレーニングしました。 

Davidのチームは、高度なハードウェアインフラストラクチャを使用して、従来のハードウェアでは数週間かかっていたモデルをわずか2日間でトレーニングすることができました。トレーニングされたモデルは、複数のビデオフレームを同時に分析して牛の行動パターンを検出するカスタム行動トラッカーと統合されました。

その結果、摂食、飲水、横臥など8種類の牛の行動を検出し追跡し、健康上の懸念を示す可能性のあるわずかな行動の変化を特定できる、ビジョンAI主導のソリューションが実現しました。これにより、農家は迅速に対応し、群れの管理を改善できます。

行動AIの今後の展望

David氏は講演の最後に、聴衆に重要な教訓を伝えました。「AIに失敗する余地を与えなければ、最終的には統計的なものなので、失敗する可能性が高まります」。彼は、AIは強力ではあるものの、完璧ではないと指摘しました。AIはパターンから学習するツールであり、常に正しいとは限らない場合があります。それらの間違いを恐れるのではなく、それらを処理し、時間の経過とともに改善し続けることができるシステムを構築することが重要です。

これは、コンピュータビジョンモデル自体に関しても当てはまります。たとえば、Ultralytics YOLOモデルの最新バージョンであるUltralytics YOLO11は、YOLOv8と比較して、物事を次のレベルに引き上げる必要性を念頭に置いて構築されています。

 

__wf_reserved_inherit
図5. YOLO11でサポートされているコンピュータビジョンタスク。

特に、YOLO11は、精度が重要なリアルタイムアプリケーション(農業や医療など)に関して、より優れたパフォーマンスを提供します。YOLO11は、その高度な機能により、革新的なリアルタイムの洞察を提供し、企業がより効果的に課題に取り組むのを支援することで、業界がAIを使用する方法を再定義しています。

主なポイント

YV24でのDavid氏の基調講演は、AIが単なるクールなイノベーションではなく、実際の問題を解決し、私たちの生活と仕事のやり方を改善するための強力なツールであることを改めて認識させてくれました。行動に焦点を当てることで、AIはすでに動物の健康状態の追跡や、日常の行動における有意義なパターンの認識といった分野で影響を与えています。 

行動AIの可能性は非常に高く、私たちはまだ始まったばかりです。行動AIは、生のデータを実用的な洞察に変換することで、受動的な監視から積極的な問題解決へと移行します。行動AIは、今後さらに発展するにつれて、よりスマートな意思決定を促進し、プロセスを合理化し、私たちの生活に有意義な改善をもたらすでしょう。

AIとその現実世界の応用についてさらに学ぶには、私たちのコミュニティと繋がりましょう。GitHubリポジトリにアクセスして、農業におけるAI製造業におけるコンピュータビジョンなどの分野のイノベーションをご覧ください。

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる
クリップボードにコピーしました