YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024

Agentic AIとコンピュータビジョン:自動化の未来

Abirami Vina

4分で読めます

2025年2月12日

エージェントAIシステムが、コンピュータビジョンモデルを使用して、自律的に視覚データを分析し、経験から学習し、変化する条件に適応する仕組みを探求します。

人工知能(AI)とコンピュータビジョンは、機械が世界を見て理解するのを支援します。最近の進歩のおかげで、私たちは今、飛躍的な進歩を目の当たりにしています。それは、視覚データを認識するだけでなく、自ら考え、計画し、行動するAIイノベーションです。以前の記事では、Vision agentがどのように視覚データを処理、分析し、行動できるかについて説明しました。 

今回は、同様の概念である「エージェントAI」について解説します。エージェントAIシステムは、独立して動作するように設計されており、定義された目標を達成するために人間のような推論および問題解決能力を備えています。定義済みの指示で個々のタスクを完了することに焦点を当てた従来のAIシステムとは異なり、エージェントAIは自律的に計画し、行動してタスクを実行できます。これらのエージェントは、以前のインタラクションから学習し、人間の介入なしに意思決定を実行することもできます。 

コンピュータビジョンに関して言えば、エージェントAIシステムは、Ultralytics YOLO11のようなコンピュータビジョンモデルを使用した物体検出などの技術を活用して、視覚データをリアルタイムで分析し、物体を認識し、空間的な関係を理解し、環境に基づいて自律的な意思決定を行うことができます。

Agentic AIとは何ですか?

本質的に、エージェントAIシステムは、自律的で目標指向の思考、適応的な問題解決、および継続的な学習能力を備えて設計されています。AIエージェントを使用して、環境を理解し、意思決定を行い、タスクを実行します。これらのAIエージェントは、コンピュータビジョンモデル、強化学習技術、および大規模言語モデル(LLM)を使用して、複雑なタスクを実行します。これにより、ビジネスワークフローの自動化と意思決定の強化に最適です。

例えば、倉庫では、コンピュータビジョンを搭載したエージェント型AIシステムが、人間の介入なしに荷物を検出し、在庫を追跡し、障害物を回避して移動できます。強化学習を使用することで、渋滞を避ける最適なルートを学習し、時間の経過とともに移動効率を向上させることができます。一方、LLMを活用したチャットボットは、問い合わせに答えたり、業務改善を提案したりすることで作業者を支援し、ワークフロー全体の効率を高めます。

__wf_reserved_inherit
図1. Agentic AIの仕組みの概要。

従来のAIソリューションとエージェント型AIソリューションの主な違いは、エージェント型AIは先を読んで変化する状況に適応できることです。従来のコンピュータビジョンシステムは、物体を認識したり、画像を分類したりするのに優れていますが、動的に動作を調整することはできません。人間が介入してモデルを再トレーニングまたは微調整する必要があります。一方、エージェント型AIは、高度な機械学習技術を使用して、環境と相互作用することで時間の経過とともに改善します。

エージェントAIと他の高度なAIイノベーションの比較

AIは急速に進化しており、生成AI、エージェント自動化、コンピュータビジョンなどの新しい概念がさまざまな業界で急速に採用されています。これらのテクノロジーを比較して、エージェントAIを際立たせているものをより深く理解しましょう。

生成AIとAgentic AIの違い

ChatGPTのようなツールを使用したことがあるなら、生成AIについてはすでによくご存じでしょう。このAIの分野は、ユーザーのプロンプトに基づいて、テキスト、画像、コードなどのコンテンツを作成することに特化しています。生成AIは創造性とアイデアの探求を促進しますが、学習されたパターンに従い、事前に定義された制約内で動作し、自律的な意思決定や独立した目標の追求を行う能力はありません。

対照的に、Agentic AIは積極的に目標を追求します。継続的な人的入力を必要とせずに、環境に動的に適応できます。単にコンテンツを生成するだけでなく、自律的に行動し、問題を解決します。

エージェント型自動化とエージェント型AIは密接に関連しています。

エージェント型自動化とエージェント型AIは密接に関連しており、エージェント型AIは自動化を強化するインテリジェンスを提供します。コンピュータビジョンベースのセキュリティシステムを考えてみてください。 

エージェントAIシステムは、状況を分析し、最適な対応を決定し、自律的に行動します。たとえば、コンピュータビジョンと統合されたAIセキュリティカメラが侵入者を発見した場合、エージェントAIシステムは単にアラートを送信するだけでなく、その人物が従業員であるかどうかを確認し、必要に応じてドアをロックし、その動きを追跡し、監視のためにドローンを送信することさえあります。

エージェント型自動化は、これらすべての動作がスムーズに連携するようにします。セキュリティカメラ、ドアロック、ドローンなどの異なるシステムを接続し、自動的かつ同期して応答できるようにします。エージェント型AIが意思決定を行う一方、エージェント型自動化は、人間の介入を必要とせずに、これらの決定が効率的に実行されるようにします。 

__wf_reserved_inherit
図2. エージェントAIとエージェント自動化の比較。画像:著者。

エージェント型AIの仕組み

エージェントAIとは何かをより深く理解したところで、その仕組みを見ていきましょう。 

Agentic AIシステムは、認識、意思決定、行動、適応の周期的なプロセスを通じて動作し、時間とともに学習および改善するのに役立ちます。この継続的なループにより、これらのシステムは単独で機能し、複雑な目標を達成できます。

継続的なループに含まれるステップの概要を以下に示します。

  • 知覚: エージェントAIシステムは、カメラ、センサー、およびユーザーインタラクションからのデータを収集および分析して、周囲の状況をより良く理解します。
  • 意思決定: システムはさまざまなオプションを評価し、起こりうる結果を予測し、推論とリスク評価に基づいて最適なアクションを選択します。
  • アクション: 意思決定が行われると、システムは物理デバイスを制御したり、他のシステムとやり取りしたり、出力を生成したりしてタスクを実行します。
  • 適応: システムはフィードバックを使用して経験から学習し、機械学習と強化学習を適用して、特に複雑なタスクにおいて時間の経過とともにパフォーマンスを向上させます。
__wf_reserved_inherit
Fig 3. エージェントAIの仕組みの理解。

エージェントAIの現実世界のアプリケーション

次に、エージェントAIの実際の例をいくつか順を追って説明します。これらのシステムはさまざまな業界で使用されており、機械がデータを分析し、独立した意思決定を行って結果を改善するのに役立っています。

創薬におけるAgentic AI

創薬には、疾患に関連する生物学的標的の特定から、潜在的な化合物のスクリーニング、化学構造の最適化、前臨床試験の実施まで、いくつかの重要な段階が含まれます。これは、効果的で安全な治療法を見つけるために、広範なデータ分析と実験を必要とする複雑で時間のかかるプロセスです。

コンピュータビジョンと統合されたAgentic AIは、化学合成などの主要なステップを自動化するのに役立ち、プロセスをより迅速かつ効率的にします。化学合成とは、制御された反応を通じて、医薬品などの新しい物質を作成するために、さまざまな化合物化合物を組み合わせるプロセスです。従来、科学者は、温度、溶媒組成、結晶化タイミングなどの要因を試行錯誤によって手動で調整する必要がありました。

現在、自律型AIシステムは、リアルタイムで反応を監視し、色の変化や結晶形成などの視覚的な変化を分析し、その場で意思決定を行うことができます。例えば、システムが反応が期待どおりに進んでいないことを検出した場合、直ちに温度を調整したり、必要な化学物質を追加してプロセスを最適化したりできます。過去の反応から継続的に学習することで、システムは時間の経過とともに精度を向上させ、手動による介入の必要性を減らし、医薬品開発を加速します。

__wf_reserved_inherit
図4. 自動化された実験室のセットアップ例。

エージェント型AIによるEコマースの再構築

Agentic AIは、オンラインショッピング体験をよりパーソナライズされ、効率的で、自動化されたものにすることで、オンラインショッピングの方法を変えています。Agentic AIは、過去の購入に基づいて製品を推奨するだけでなく、閲覧習慣を分析し、顧客が次に何を望むかを予測し、製品の提案をリアルタイムで調整できます。 

コンピュータビジョンの助けを借りて、エージェントAIは視覚的な検索を分析し、製品画像を認識して、より正確な推奨事項を提供することもできます。たとえば、スニーカーを頻繁に見ている人がいる場合、エージェントAIシステムはトレンドのスタイルを強調表示したり、割引を提供したり、一致するアクセサリーを提案したりできます。また、需要に基づいて価格設定とプロモーションを最適化し、ショッピングをよりダイナミックにすることもできます。

レコメンデーションの枠を超えて、エージェントAIは、在庫管理、補充予測、および注文処理の自動化により、eコマースのロジスティクスを改善しています。コンピュータビジョンにより、エージェントAIシステムは、在庫レベルをリアルタイムで追跡し、置き忘れられた商品を特定し、製品が正しく分類されていることを確認できます。ある商品の売れ行きが急速に伸びている場合、システムは補充をトリガーするか、代替品を提案できます。エージェントAIは、時間とともに学習および適応することにより、顧客と企業の両方にとって、オンラインショッピングをより速く、よりスマートに、そしてよりシームレスにしています。

エージェント型AIシステムの構築方法 

エージェントAIの現実世界の例を見てきましたので、次はエージェントAIの構築方法について説明します。 

コンピュータビジョンベースのアプリケーションを開発している場合、Ultralytics YOLO11のような最新モデルを使用すると、エージェントAIシステムが周囲の状況をより良く理解するのに役立ちます。YOLO11は、さまざまなコンピュータビジョンタスクをサポートしており、エージェントAIシステムが視覚データを正確に分析することを可能にします。

YOLO11を使用して、エージェント型AIシステムを構築する方法をご紹介します。

  • 目的の定義: AIエージェントの目的、目標、および意図された機能を達成するために実行する必要のある特定のタスクを明確に概説します。
  • YOLO11のトレーニング:関連する画像およびビデオデータを収集してラベル付けし、特定のアプリケーションに基づいてYOLO11をカスタムトレーニングします。
  • YOLO11の統合: 検出された視覚データに基づいてリアルタイム分析と意思決定を可能にするAIフレームワークとYOLO11を接続します。
  • 自律的な意思決定を可能にする:アラートのトリガー、設定の調整、ロボットシステムの誘導など、YOLO11の検出に基づいてAIエージェントがアクションを実行できるようにするロジックまたは機械学習モデルを設定します。
  • フィードバックループの組み込み: YOLO11が新しいデータで再トレーニングすることにより精度を向上させ、長期的にモデルのパフォーマンスを改善する自己学習システムを実装します。
__wf_reserved_inherit
図5。YOLO11を使用してエージェント型AIシステムを構築する方法。画像は著者による。

エージェントAIシステムのメリットとデメリット

エージェント型AIシステムがさまざまな産業にもたらす主な利点をいくつかご紹介します。

  • 効率の向上: Agentic AIシステムは、複雑で時間のかかるタスクを自動化し、エラーを減らし、より価値の高い作業のために人間の労働者を解放することができます。
  • 拡張性: これらのシステムは、さまざまな業界に容易に適応でき、必要に応じてより大きなワークロードを処理できるように拡張できます。
  • コスト削減:エージェント型AIは、手作業の必要性を減らし、オペレーションを最適化することで、企業が経費を削減し、リソースをより効果的に活用できるよう支援します。

エージェントAIはさまざまな分野で多くの利点をもたらしますが、それに伴う潜在的な制限事項についても認識しておくことが重要です。注意すべき主な懸念事項を以下に示します。

  • AIにおけるバイアス エージェントAIシステムは、トレーニングデータからバイアスを受け継ぐ可能性があり、特に採用や法執行などの分野で、不公平または不正確な結果につながる可能性があります。
  • 透明性の欠如: 多くのAIモデルは「ブラックボックス」のように機能するため、意思決定の方法を理解することが難しく、医療や金融などの業界では問題になる可能性があります。
  • 規制の課題: Agentic AIの開発は規制よりも速く進んでおり、法的あいまいさと一貫性のないグローバルコンプライアンス基準を生み出しています。

全体として、エージェント型AIシステムには多くの利点がありますが、倫理的な考慮事項、透明性、および適切な規制とのバランスを取り、責任を持って使用されるようにすることが重要です。

主なポイント

YOLO11のようなVision AIモデルと組み合わせることで、エージェントAIシステムは自動化のあり方を変えることができます。自動運転車からオンラインショッピング、ヘルスケアまで、これらのシステムは企業が自律的かつ迅速に業務を行うのに役立ちます。 

しかし、偏見、透明性の欠如、不明確な規制などの課題に対処する必要があります。エージェントAIシステムが改善されるにつれて、イノベーションと責任の適切なバランスを見つけることが、これらのイノベーションを最大限に活用するための鍵となります。

AIについてさらに学ぶには、コミュニティGitHubリポジトリにご参加ください。ソリューションページでは、製造業におけるAIヘルスケアにおけるコンピュータビジョンなど、AIのさまざまな応用例を紹介しています。今すぐコンピュータビジョンを始めるには、Ultralytics YOLOライセンスをご覧ください。

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる
クリップボードにコピーしました