Yolo 深圳
深セン
今すぐ参加
用語集

AIエージェント

AIエージェントとは何か、また、これらの自律システムが最新の自動化をどのように強化しているかを学びましょう。知覚-思考-行動ループと、コンピュータビジョンおよびロボット工学における役割について解説します。

AIエージェントは、環境を認識し、特定の目標を達成する方法を推論し、その目標を達成するための行動をとるように設計された自律システムである。 を推論し、その目標を達成するために行動するように設計された自律システムである。単に入力を処理して出力を生成する静的なAIモデルとは異なり AIエージェントは、継続的なループの中で動作します。 常に人間が介入することなくタスクを実行する。この能力により、エージェントは人工知能の世界の「実行者」となる。 人工知能の世界の「実行者」となり、抽象的なデータ分析と実世界への影響とのギャップを埋める。

知覚-思考-行動のループ

AIエージェントの中核機能は、しばしば「知覚-行動ループ」と呼ばれるオペレーション・サイクルによって定義される。 知覚-行動ループ。この継続的なプロセスにより、エージェントは環境の変化に適応し 時間の経過とともに改善される。

  1. 知覚する(センシング):エージェントは、センサーを使って周囲の情報を収集する。コンピュータビジョン コンピュータビジョン(CV)の文脈では 目 "は、視覚データをキャプチャするカメラやLiDARシステムです。
  2. 考える(処理と意思決定):エージェントは、感覚入力を 「頭脳」-通常は 機械学習(ML)モデルまたは 大規模言語モデル(LLM)。エージェントは 現在の状態を目標に照らして分析し、最適な行動方針を決定する。高度なエージェントは 強化学習を採用することもある。 試行錯誤を通じて最適な戦略を学習する。
  3. Act(実行):エージェントは、アクチュエータを用いて選択された決定を実行する。ロボット工学では、これは機械的なアームを動かすことを含むかもしれない。 ソフトウェアでは、APIリクエストを送信したり、ファイルを書き込んだり、アラートをトリガーしたりします。 アラートを発生させる。

AIエージェントとAIモデルの比較

AIエージェントとAIモデルはしばしば混同されるので、区別することが重要である。

  • AIモデル:数学的エンジン YOLO11のような)パターン認識や予測を行うために訓練された数学的エンジン。 受動的で、入力を待ち、結果を返す。デジタル百科事典や高速度カメラのような、洗練されたツールだと考えてほしい。 百科事典や高速度カメラのような洗練されたツールだと考えてほしい。
  • AIエージェント:目標を達成するためのツールとして1つ以上のモデルを使用する自律システム。 エージェントはワークフローを管理し、過去のインタラクションを記憶し、積極的に世界と関わる。モデルが がエンジンであれば、エージェントはドライバーである。

実際のアプリケーション

AIエージェントは、以前は人間の監視が必要だった複雑なワークフローを自動化することで、業界を変革している。

スマート・マニュファクチャリングとロボティクス

産業環境では、ロボット工学のAIが品質管理を監督するエージェントに力を与えている。 品質管理を監督するエージェントに力を与えている。物体検出モデルを備えた目視検査エージェントは ベルトコンベアを監視することができる。 ベルトを監視することができる。欠陥が検出されると、単にエラーを記録するだけでなく、ロボットアーム(アクチュエーター)を作動させ、欠陥品を即座に除去する。 を起動させる。この自律的なループは効率を高め、無駄を省く。

自動運転車

自動運転車は AIエージェントの最も洗練された例である。自動運転車は、車線標識、交通標識、歩行者を認識するために一連のセンサーを利用する。 歩行者を認識する。搭載されたエージェントは、このデータのストリームをリアルタイムで処理し、生命に関わる重大な決定(ステアリング操作、アクセル操作、ブレーキ操作)を下す、 A地点からB地点まで安全にナビゲートするためだ。 ウェイモのような企業は、このような自律走行車を公道に導入する最前線にいる。 自律走行車を公道に導入する最前線にいる。

シンプルなビジョン・エージェントの構築

開発者は、知覚エンジンとしてYOLO11 ようなモデルを使用して、視覚ベースのエージェントを構築することができる。以下のPython の例では、画像を認識し、権限のない人物がいないかチェックし、シミュレートされた警告を発して行動する、シンプルな "セキュリティ・エージェント "を示している。 シミュレートされたアラートをトリガーすることで動作します。

from ultralytics import YOLO

# Load the YOLO11 model (The Agent's "Brain" for perception)
model = YOLO("yolo11n.pt")

# 1. Perceive: The agent captures/receives visual data
results = model("secure_zone.jpg")

# 2. Think & 3. Act: The agent evaluates the scene and takes action
for result in results:
    # Check if a 'person' (class ID 0) is detected with high confidence
    if 0 in result.boxes.cls and result.boxes.conf.max() > 0.5:
        print("ACTION: Security Alert! Person detected in restricted area.")
    else:
        print("ACTION: Log entry - Area secure.")

関連概念

  • 強化学習A エージェントは報酬やペナルティを受けることで意思決定を行うことを学習する。 エージェントや複雑なロボット工学に不可欠。
  • エッジAIエージェントをクラウドではなく、ローカルデバイス(カメラやドローンなど)に直接展開する。 クラウドではなく、ローカルデバイス(カメラやドローンなど)に直接エージェントを配置することで、より高速なリアルタイム推論を可能にする。 リアルタイムな推論とアクションを可能にする。
  • 人工知能(AGI) エージェントが人間のように様々なタスクを理解し、学習し、知識を適用する能力を持つ理論的な未来の状態。 人間のように多種多様なタスクを理解し、学習し、知識を適用する能力を持つエージェント。

インテリジェント・エージェントのアーキテクチャーについては、以下のリソースを参照されたい。 IBMと スタンフォード大学が提供するリソースは、学術的かつ産業界からの深い視点を提供している。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加