YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
ビジョンAI

コンピュータビジョンは、ビジョンAIエージェントがどのように意思決定を行うかを推進します。

AIエージェントがコンピュータビジョンを使用してどのように業界を再創造しているかを学びます。セキュリティ、自動運転車などの分野における応用を探ります。

ABAbirami Vina
4 min read
ビジョンAIエージェントがコンピュータビジョンを使ってどのように意思決定を行うか

製造業から小売業に至るまで、あらゆる業界が独自のプロセス上の課題に直面しており、これらの問題を解決するための革新的な方法を見つけることが、ビジネスを成功させるための鍵となってきました。近年、AIエージェントは多くの分野で人気の高いソリューションとなっています。これらのシステムは単にデータを分析するだけではありません。自ら行動を起こすことも可能なのです。

例えば、製造業におけるAIエージェントは、リアルタイムで欠陥を検出し、品質管理措置を自動的に開始することで、生産を円滑に維持できます。同様に、物流や小売業においても、スマート監視を使用して複数の拠点を監視し、異常な動きがあれば即座にチームに警告を出すことができます。

この傾向が強まる中、AIエージェントは世界中の産業を積極的に変革しています。世界的なAIエージェント市場は2024年に51億ドルに達し、2030年までには471億ドルに成長すると予測されています。

世界のAIエージェント市場規模の概要

図1。世界的なAIエージェント市場規模の概要。

こうした進歩を後押しする主要な技術の一つがコンピュータビジョンです。機械が視覚データを処理・解釈できるようにすることで、ビジョンAIは、AIエージェントがリアルタイムの物体検出、インスタンスセグメンテーション、物体追跡といったコンピュータビジョンのタスクを驚異的な精度で実行できるようにします。それは、機械が「見る」ことと「どのように意思決定を行うか」の間のギャップを埋めるものであり、多くのAI活用ソリューションにおいて不可欠な構成要素となっています。

本記事では、AIエージェントとそれとコンピュータビジョンとの関係について解説します。また、さまざまなタイプのAIエージェントや、それらがビジョンベースのアプリケーションでどのように使用されているかについても説明します。それでは始めましょう!

Link to this sectionAIエージェントとは何か?#

ビジョンベースのAIエージェントについて掘り下げる前に、まずはAIエージェント全般について理解を深め、これらのシステムがどれほど汎用性が高いかを見ていきましょう。

AIエージェントとは、人間の助けを借りることなく、タスクや質問を理解して対応できるスマートなシステムのことです。多くのAIエージェントは、機械学習や自然言語処理(NLP)を活用して、基本的な質問への回答から複雑なプロセスの管理まで、幅広いタスクをこなします。

従来のAIシステムが更新のたびに人手による入力を必要としていたのに対し、一部のAIエージェントには、時間の経過とともに学習し改善する能力さえ備わっています。そのため、AIエージェントはAIの不可欠な要素として急速に普及しています。それらは絶え間ない監視を必要とせずに、タスクの自動化、意思決定、そして環境との対話が可能です。特に、反復的で時間のかかるタスクの管理において非常に有用です。

例えば、カスタマーサービスやホスピタリティといった分野でAIエージェントを見つけることができます。カスタマーサービスでは、払い戻しの処理やパーソナライズされた製品の提案にAIエージェントが利用されています。一方、ホスピタリティ業界では、ホテルのスタッフがゲストからのリクエストを管理したり、ルームサービスを効率化したり、近隣の観光スポットをゲストに提案したりするのをサポートできます。これらの例は、AIエージェントがいかに日常的なプロセスを迅速かつ効率的にしているかを示しています。

Link to this sectionビジョンAIエージェントの仕組みを理解する#

次に、AIエージェントがどのように機能するのかを簡単に見ていきましょう。AIエージェントはそれぞれ独自の設計がなされ、特定のタスク向けに作られていますが、すべてのエージェントには「知覚」「意思決定」「行動」という共通の主要な3つのステップが存在します。

まず「知覚」のステップで、AIエージェントはさまざまなソースから情報を収集し、何が起きているかを理解します。次に「意思決定」です。収集した情報に基づき、アルゴリズムを使用して状況を分析し、最善の行動方針を決定します。最後に「行動」です。意思決定が完了したら、質問への回答、タスクの完了、あるいは人が対処すべき問題のフラグ立てなど、その決定を実行に移します。

単純に聞こえるかもしれませんが、AIエージェントのタイプによっては、これらのステップを実現するために、舞台裏で多くの処理が行われています。複雑なデータの分析から高度な機械学習モデルの利用まで、各AIエージェントは自身の方法で特定のタスクを処理するように構築されています。

例えば、多くのAIエージェントはNLPによる言語処理に重点を置いていますが、ビジョンAIエージェントと呼ばれるものは、視覚データを処理するためにコンピュータビジョンを統合しています。Ultralytics YOLO11のような高度なコンピュータビジョンモデルを使用することで、ビジョンAIエージェントはより正確な画像解析を実行できます。

YOLO11を使用した画像内のリンゴのカウント

図2。 YOLO11を使用して画像内のリンゴをカウントする例。

Link to this section自動運転車におけるビジョンAIエージェント#

自動運転車を例として、上述の3つの主要なステップを通じてビジョンAIエージェントがどのように機能するかを見てみましょう。

  • 知覚: 自動運転車におけるビジョンAIエージェントは、車両に搭載されたカメラやセンサーから視覚データを収集します。このデータには、他の車両、歩行者、交通信号、道路標識など、周辺環境の画像やビデオが含まれます。
  • 意思決定: AIエージェントはYOLO11のようなモデルを使用して、この視覚データを処理します。車や歩行者などの物体を特定し、障害物や突然の車線変更を検出し、交通の流れや信号の状態といったパターンを認識します。これにより、車は道路状況をリアルタイムで把握することができます。
  • 行動: 分析に基づき、AIエージェントは障害物を避けるための操舵、速度調整、赤信号での停止といった行動をとります。これらの決定は、安全で効率的な運転を確保するために迅速に行われます。

Waymoの自動運転車は、この技術の優れた例です。彼らはビジョンAIエージェントを使用して周囲を理解し、リアルタイムで意思決定を行い、人の介入なしで安全かつ効率的に道路を走行します。

WaymoのAIエージェントベースの自動運転タクシー

図3。 WaymoのAIエージェントベースの自動運転タクシー。

Link to this sectionビジョンAIエージェントの種類#

AIエージェントの仕組みとコンピュータビジョンの活用方法がわかったところで、次はAIエージェントの種類について見ていきましょう。各タイプは、単純な行動から複雑な意思決定や学習に至るまで、特定のタスクに合わせて設計されています。

Link to this section単純反射エージェント#

単純反射エージェントは、最も基本的なタイプのAIエージェントです。履歴や将来の結果を考慮することなく、純粋に現在の状況に基づいて、定義済みの行動で特定の入力に対応します。これらのエージェントは通常、行動を導くために単純な「もし〜ならば(if-then)」ルールを使用します。

画像解析に関して言えば、単純反射エージェントは特定の色の検出(赤など)を行い、即座に行動(赤い物体をハイライト表示またはカウントする)を引き起こすようにプログラムされているかもしれません。これは単純なタスクには機能しますが、エージェントが過去の経験から学習や適応を行わないため、より複雑な環境では不十分となります。

Link to this sectionモデルベース反射エージェント#

モデルベース反射エージェントは、状況をより良く理解するために環境の内部モデルを使用するため、単純反射エージェントよりも高度です。このモデルにより、欠落していたり不完全な情報に対処し、より情報に基づいた決定を下すことができます。

例えば、AIセキュリティカメラシステムを考えてみてください。そこに統合されたビジョンAIエージェントは、コンピュータビジョンを使用してリアルタイムで何が起きているかを分析できます。動きや行動を通常の行動モデルと比較し、万引きのような異常な動きを見つけたり、潜在的なセキュリティ上の脅威をより正確にフラグ立てしたりするのに役立ちます。

コンピュータビジョンを使用した盗難検知

図4。 コンピュータビジョンを使用して盗難を検知する例。

Link to this section効用ベースエージェント#

作物の監視に使用される効用ベースのドローンについて考えてみてください。このドローンは、障害物を回避しながらより広い範囲をカバーするように飛行経路を調整し、作業に最適なルートを選択します。これは、ドローンがどのエリアを優先するか、どのように効率的にナビゲートするかなど、複数の潜在的な行動を評価し、その有効性を最大化するものを選んでいることを意味します。

同様に、効用ベースエージェントは、最大の利益や結果を得るために、複数の選択肢の中から最適な行動を選択するように設計されています。この目的のために設計されたビジョンAIエージェントは、画像やセンサーデータなど、さまざまな視覚入力を処理・分析し、定義された基準に基づいて最も有用な結果を選択できます。

作物監視に使用されるユーティリティベースのドローン

図5。効用ベースのドローンは作物の監視に使用できます。

Link to this section目標ベースエージェント#

目標ベースエージェントは、どちらも特定の目的の達成を目指すという点で効用ベースエージェントと似ています。しかし、目標ベースエージェントは、定義された目標に近づく行動に純粋に焦点を当てます。全体的な価値やトレードオフといった他の要素を考慮することなく、目標達成にどのように役立つかに基づいて各行動を評価します。

例えば、自動運転車は目的地に到達することを目的とする場合、目標ベースエージェントとして動作します。AIカメラやセンサーからのデータを処理して、障害物の回避、交通信号の遵守、正しい方向転換の選択といった意思決定を行い、コースを維持します。これらの意思決定は、安全かつ効率的に目的地に到達するという目標とどれだけ一致しているかによって完全に導かれます。効用ベースエージェントとは異なり、目標ベースエージェントは効率性や最適化のような追加の基準を考慮せず、目標達成のみに焦点を当てます。

コンピュータビジョンを使用して周囲の物体を識別する自動運転車

図6。 周囲の物体を特定するためにコンピュータビジョンを使用している自動運転車。

Link to this section学習エージェント#

コンピュータビジョンに馴染みがある方なら、ファインチューニングについて聞いたことがあるかもしれません。これは新しいデータから学習することでモデルが改善するプロセスです。学習エージェントも同様の方法で機能し、経験を積むにつれて適応・改善していきます。ビジョンベースの品質管理のようなアプリケーションでは、これらのエージェントは検査を行うたびに欠陥の検出精度が高まっていきます。このパフォーマンスを向上させる能力は、安全性と精度が極めて重要となる航空のような分野において特に不可欠です。

Link to this section階層型エージェント#

階層型エージェントは、複雑なタスクをより小さく扱いやすいステップに分割することで単純化します。上位レベルのエージェントが全体のプロセスを監督して戦略的な決定を下し、下位レベルのエージェントが特定のタスクを処理します。複数のステップと詳細な実行を伴うオペレーションにおいて、より効率的になります。

例えば、自動化された倉庫では、上位レベルのロボットが仕分けプロセスを計画し、どのアイテムをどのエリアに送るべきかを決定します。同時に、下位レベルのロボットはコンピュータビジョンを使用してアイテムを特定し、サイズ、形状、ラベルなどの特徴を分析して、正しいビンに整理することに集中します。責任分担を明確にすることで、システムが円滑に稼働します。

荷物を仕分けるロボットAIエージェント

図7。 パッケージを仕分けるロボットAIエージェントの例。

Link to this sectionビジョンAIエージェントの構築を始める方法#

ビジョン機能を持つAIエージェントの核となるのはコンピュータビジョンモデルです。今日利用できる最新かつ最も信頼性の高いコンピュータビジョンモデルの一つがUltralytics YOLO11です。YOLO11はリアルタイムの効率性と精度で知られており、コンピュータビジョンのタスクに最適です。

YOLO11の機能を備えた独自のAIエージェントを構築するプロセスは以下の通りです。

  • データセットの準備: AIエージェントが実行するタスクに関連するラベル付けされた画像を収集し、前処理を行います。

  • モデルのカスタムトレーニング: YOLO11を特定のデータセットでトレーニングし、独自のアプリケーション向けに精度とパフォーマンスを向上させます。

  • 意思決定フレームワークとの統合: トレーニング済みモデルを、AIエージェントが視覚入力に基づいて意思決定を行えるようなシステムに接続します。

  • テストと改善: AIエージェントをデプロイし、パフォーマンスをテストしてフィードバックを収集し、精度と信頼性を高めるためにモデルを調整します。

Link to this section重要なポイント#

コンピュータビジョンと統合されたAIエージェント(ビジョンAIエージェント)は、タスクを自動化し、プロセスを高速化し、意思決定を向上させることで業界を変革しています。交通を制御するスマートシティから顔認証を使用するセキュリティシステムまで、これらのエージェントは一般的な問題に対する新しいソリューションをもたらしています。

また、時間の経過とともに学習と改善を続けることができるため、変化する環境において有用です。YOLO11のようなツールを使用すれば、これらのAIエージェントの作成と利用が容易になり、よりスマートで効率的なソリューションにつながります。

私たちのコミュニティに参加し、GitHubリポジトリをチェックしてAIについて学びましょう。ソリューションページでは、ヘルスケアにおけるコンピュータビジョン農業におけるAIといったさまざまな応用例をご覧ください。利用可能なライセンスオプションを確認して、さっそく始めましょう!

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう