行動AIはコンピュータビジョンをよりインパクトのあるものにしています
AI主導の行動分析と、畜産などの分野におけるその実社会での応用に関するDavid ScottのYOLO Vision 2024基調講演を振り返ります。

長年にわたり、コンピュータビジョンの革新は物体検出のようなタスク、つまり画像や動画の中から犬や車といった物体を識別することに焦点を当ててきました。こうしたアプローチは、自動運転、製造、ヘルスケアといった分野でのアプリケーションを可能にしてきました。
しかし、これらのタスクは単に「それが何であるか」を特定することに終始しがちです。もしビジョンAIシステムが一歩先へ進めたらどうなるでしょうか。例えば、単に犬を検出するだけでなく、その犬がボールを追いかけていることや、歩行者が横断しているために車が急ブレーキをかけていることを理解できるとします。単純な認識から文脈の理解へのこのシフトは、よりスマートで文脈を把握できる行動AIへの大きな転換を意味します。
YOLO Vision 2024 (YV24)は、ビジョンAIの進歩を称えるUltralyticsの年次ハイブリッドイベントです。このイベントにおいて、The Main BranchのCEOであるDavid Scott氏による興味深い講演が行われ、AI主導の行動分析という概念が中心的な話題となりました。
講演の中でDavid氏は、基本的なコンピュータビジョンのタスクから行動トラッキングへの移行について探求しました。最先端の技術アプリケーション構築において25年以上の経験を持つ同氏は、この飛躍がもたらす影響を実演しました。同氏は、パターンと行動を解読することが、いかに農業や動物福祉といった業界を再構築しているかを強調しました。
本記事では、David氏の講演のハイライトを振り返り、行動トラッキングがいかにAIをより実用的なものにするかを探ります。
Link to this sectionAI導入の課題を理解する#
David Scott氏は、自身の基調講演を大胆な現実確認から始めました。「私の同僚はよく『科学は売れない』と言いますが、科学を愛する私たちにとっては少しショックな言葉です。AIは非常にクールなのに、なぜ人々はそれを買ってくれないのでしょうか。しかし現実は、人々は私たちがクールだと思うからという理由だけで購入するわけではなく、購入するための理由を必要としているのです」と述べました。
同氏は続けて、自身の会社であるThe Main Branchでは、AIの能力を誇示するのではなく、常にAIで現実の課題を解決することに焦点を当てていると説明しました。多くのクライアントが漠然とAIの活用について相談に訪れますが、同氏はそれを「問題のない解決策」のような逆転したアプローチであると捉えています。代わりに同社は、明確な課題を持つクライアントと連携し、真に変化をもたらすAIソリューションを構築しています。

図1. YV24のステージ上のDavid Scott氏。
David氏はまた、彼らの仕事は単にシーン内の物体を認識することにとどまらないと共有しました。「何があるか」を見つけるのは最初のステップに過ぎません。真の価値は、その情報をどう活用するかを考え出し、より大きなバリューチェーンの中で有用なものにすることから生まれます。
Link to this section行動トラッキング技術:アクションにつながるAIの鍵#
AIを真に有用にするための重要なステップは、物体検出のような基本的なコンピュータビジョンのタスクを超え、その知見を行動トラッキングに活用することです。David氏は、行動AIは単に物体を識別するだけでなく、行動やパターンを理解することに焦点を当てていると強調しました。これにより、AIは意味のあるイベントを認識し、実行可能な知見を提供できるようになります。
同氏は、動物が床で転がるという例を挙げました。これは病気の兆候である可能性があります。人間は四六時中動物を見守ることはできませんが、行動トラッキング機能を備えたAI主導の監視システムであれば可能です。こうしたソリューションは物体を継続的に監視し、特定の行動を検出し、アラートを送信してタイムリーな対応を可能にします。これにより、生のデータが実践的で価値のあるものへと変わります。
David氏はまた、このアプローチがAIを単に興味深いものではなく、真に影響力のあるものにすることも実演しました。行動の監視やそれに基づいた対応など、現実の課題に対処することで、行動トラッキングはさまざまな業界において効果的なAIソリューションの重要な一部となり得ます。
Link to this section行動AIを実現する#
次にDavid Scott氏は、コンピュータビジョンモデルであるUltralytics YOLOv8が、彼のチームの行動トラッキングプロジェクトにとっての突破口であったことを説明しました。これは、物体の検出、分類、トラッキングを行うための強力な基盤となりました。チームはさらに一歩進んでYOLOv8をカスタム学習させ、時間の経過に伴う行動の監視に焦点を当てることで、現実の状況においてより実用的で役立つものにしました。
Ultralytics YOLO11のリリースにより、The Main Branchのようなチームが作成するソリューションは、さらに信頼性と精度が高まる可能性があります。この最新モデルは、精度の向上や処理の高速化といった機能を提供し、行動を追跡する能力を高めます。これについては、行動AIが使用可能なアプリケーションについてより深く理解した後に詳しく説明します。
続いて、David氏が語ったソリューションと、行動トラッキング技術が日常の課題を解決し、有意義な影響を与えるために現実世界のアプリケーションでどのように利用されているかを探ります。
Link to this sectionAI主導の行動分析を活用したHerdSense#
まずDavid氏は、彼らが取り組んだエキサイティングな課題として、大規模な飼育場で数千頭の牛の健康状態を監視する「HerdSense」プロジェクトを共有しました。目的は、個々の牛の行動を追跡し、潜在的な健康問題を特定することでした。これは数万頭の動物を同時に監視することを意味し、決して単純なタスクではありませんでした。

図2. 行動AIを使用して牛を監視および識別するHerdSense。
各牛を識別しその行動を追跡するという問題を解決し始めるため、David氏のチームは2日間のワークショップを実施し、監視する必要があるあらゆる行動を洗い出しました。合計で200以上の行動が特定されました。
200の行動のすべては、個々の牛を正確に認識できるかどうかにかかっていました。すべてのデータは特定の動物と関連付けられる必要があったからです。大きな懸念事項の一つは、牛が集団で密集した際に個々の動物を確認することが困難になる点でした。
David氏のチームは、難しい状況であっても各牛を一貫して識別できるよう、コンピュータビジョンシステムを開発しました。視界から消えたり、他の牛と混ざったり、再び現れたりした場合でも、常に同じ牛に同じIDを割り当てられることを確認できました。
Link to this sectionコンピュータビジョンを使用した馬の健康監視#
次にDavid氏は、馬の監視に同様の行動トラッキング技術を応用した、もう一つの魅力的なプロジェクトを紹介しました。このプロジェクトでは、牛の時ほど個々の馬のIDを詳細に追跡する必要はありませんでした。代わりに、特定の行動に焦点を当て、摂食パターンや全体的な活動レベルなどの詳細を追跡することで、健康上の問題を早期に発見するようにしました。行動のわずかな変化を特定することで、より良いケアを提供し、問題が深刻化する前により迅速な介入が可能になります。

図3. 行動AIの助けを借りた馬の監視。
Link to this sectionなぜ行動AIは見た目ほど単純ではないのか#
David氏は、興味深い例を通して行動トラッキングの複雑さについても議論しました。行動分析を改善する方法を調査中、彼のチームは特定のポーズ、例えばポケットに手を入れているような動きを分析することで万引きを検知できると主張する企業に出会いました。最初はスマートなアイデアのように思えました。特定の動きは疑わしい行動を示唆する可能性があるからです。

図4. 行動トラッキング技術の課題を理解する。
しかし、David氏が深く探求するにつれ、この手法の限界に気づきました。ポケットに手を入れるといった単一のポーズは、必ずしも万引きを意味するわけではありません。単にリラックスしている、考えている、あるいは単に寒いだけかもしれません。孤立したポーズに注目することの問題点は、より大きな文脈を無視していることです。行動とは単なる一つの動作ではなく、文脈や意図によって形作られる時間の経過に伴う動作のパターンなのです。
David氏は、真の行動トラッキングははるかに複雑であり、包括的なアプローチが必要であると強調しました。それは、一連の動作を分析し、全体像の中でそれらが何を意味するかを理解することです。AI業界は進歩していますが、有意義かつ正確な知見を提供するためには、行動トラッキングをさらに発展させる必要があると彼は指摘しました。
Link to this section行動を理解するよりスマートなビジョンAIモデルの構築#
続いてDavid氏は、YOLOv8とその姿勢推定機能を活用して、いかにしてチームが牛の健康を監視するコンピュータビジョンソリューションを構築したかという舞台裏を聴衆に見せました。
彼らはまず、牛の姿勢推定のためのカスタムデータセットを作成し、標準的なキーポイントの数を17から145に増やすことで、動きの分析精度を高めました。次に、モデルを200万枚以上の画像と1億1000万個の行動事例からなる膨大なデータセットで学習させました。
高度なハードウェアインフラストラクチャを使用することで、David氏のチームは従来のハードウェアでは数週間かかるモデル学習をわずか2日で完了させることができました。学習済みのモデルは、複数のビデオフレームを同時に分析して牛の行動パターンを検出するカスタム行動トラッカーと統合されました。
その結果、食べる、飲む、横たわるといった8つの異なる牛の行動を検出・追跡し、健康上の懸念を示す小さな行動の変化を特定できる、ビジョンAI主導のソリューションが完成しました。これにより、酪農家は迅速に行動を起こすことができ、群れの管理が改善されます。
Link to this section行動AIの今後の展望#
David氏は、聴衆への重要な教訓を共有して講演を締めくくりました。「もしAIに失敗する余地を与えないのであれば、それは失敗を招いているのと同じです。なぜなら、結局のところAIは統計的なものだからです」。同氏は、AIはその強みにもかかわらず完璧ではないと指摘しました。それはパターンから学習するツールであり、常に正しく動作しない時があるものです。そうしたミスを恐れるのではなく、それに対処し、時間をかけて改善し続けるシステムを構築することが重要です。
これはコンピュータビジョンモデル自体についても言えることです。例えば、Ultralytics YOLOモデルの最新版であるUltralytics YOLO11は、YOLOv8と比較して次のレベルへ引き上げる必要性を念頭に置いて構築されています。

図5. YOLO11でサポートされるコンピュータビジョンのタスク。
特にYOLO11は、農業やヘルスケアのように精度が不可欠なリアルタイムアプリケーションにおいて、より優れたパフォーマンスを提供します。高度な機能を備えたYOLO11は、革新的なリアルタイムの知見を提供し、より効果的に課題に取り組めるようにすることで、業界によるAIの利用方法を再定義しています。
Link to this section重要なポイント#
YV24でのDavid氏の基調講演は、AIが単なるクールな革新ではなく、現実の課題を解決し、私たちの生活や働き方を改善するための強力なツールであることを再認識させるものでした。行動に焦点を当てることで、AIはすでに動物の健康状態の追跡や、日常的な動作における有意義なパターンの認識といった分野で影響を与えています。
行動AIの可能性は刺激的であり、私たちはまだ始まったばかりです。生のデータを実行可能な知見に変換することで、行動AIは受動的な監視から能動的な問題解決へとシフトします。今後さらに発展していく中で、行動AIはよりスマートな意思決定を促進し、プロセスを効率化し、私たちの生活に有意義な改善をもたらすでしょう。
私たちのコミュニティに参加して、AIとその実世界での応用についてさらに学びましょう。GitHubリポジトリにアクセスして、農業におけるAIや製造におけるコンピュータビジョンといった分野での革新を発見してください。






