用語集

AIエージェント

AIエージェントとは何か、また、これらの自律システムが最新の自動化をどのように強化しているかを学びましょう。知覚-思考-行動ループと、コンピュータビジョンおよびロボット工学における役割について解説します。

AIエージェントは、環境を認識し、特定の目標を達成する方法を推論し、その目標を達成するための行動をとるように設計された自律システムである。を推論し、その目標を達成するために行動するように設計された自律システムである。単に入力を処理して出力を生成する静的なAIモデルとは異なり AIエージェントは、継続的なループの中で動作します。常に人間が介入することなくタスクを実行する。この能力により、エージェントは人工知能の世界の「実行者」となる。人工知能の世界の「実行者」となり、抽象的なデータ分析と実世界への影響とのギャップを埋める。

知覚-思考-行動のループ

AIエージェントの中核機能は、しばしば「知覚-行動ループ」と呼ばれるオペレーション・サイクルによって定義される。 知覚-行動ループ。この継続的なプロセスにより、エージェントは環境の変化に適応し時間の経過とともに改善される。

知覚する（センシング）：エージェントは、センサーを使って周囲の情報を収集する。コンピュータビジョンコンピュータビジョン（CV）の文脈では目 "は、視覚データをキャプチャするカメラやLiDARシステムです。
考える（処理と意思決定）：エージェントは、感覚入力を「頭脳」-通常は機械学習（ML）モデルまたは大規模言語モデル（LLM）。エージェントは現在の状態を目標に照らして分析し、最適な行動方針を決定する。高度なエージェントは強化学習を採用することもある。試行錯誤を通じて最適な戦略を学習する。
Act（実行）：エージェントは、アクチュエータを用いて選択された決定を実行する。ロボット工学では、これは機械的なアームを動かすことを含むかもしれない。ソフトウェアでは、APIリクエストを送信したり、ファイルを書き込んだり、アラートをトリガーしたりします。アラートを発生させる。

AIエージェントとAIモデルの比較

AIエージェントとAIモデルはしばしば混同されるので、区別することが重要である。

AIモデル：数学的エンジン YOLO11のような）パターン認識や予測を行うために訓練された数学的エンジン。受動的で、入力を待ち、結果を返す。デジタル百科事典や高速度カメラのような、洗練されたツールだと考えてほしい。百科事典や高速度カメラのような洗練されたツールだと考えてほしい。
AIエージェント：目標を達成するためのツールとして1つ以上のモデルを使用する自律システム。エージェントはワークフローを管理し、過去のインタラクションを記憶し、積極的に世界と関わる。モデルががエンジンであれば、エージェントはドライバーである。

実際のアプリケーション

AIエージェントは、以前は人間の監視が必要だった複雑なワークフローを自動化することで、業界を変革している。

スマート・マニュファクチャリングとロボティクス

産業環境では、ロボット工学のAIが品質管理を監督するエージェントに力を与えている。品質管理を監督するエージェントに力を与えている。物体検出モデルを備えた目視検査エージェントはベルトコンベアを監視することができる。ベルトを監視することができる。欠陥が検出されると、単にエラーを記録するだけでなく、ロボットアーム（アクチュエーター）を作動させ、欠陥品を即座に除去する。を起動させる。この自律的なループは効率を高め、無駄を省く。

自動運転車

自動運転車は AIエージェントの最も洗練された例である。自動運転車は、車線標識、交通標識、歩行者を認識するために一連のセンサーを利用する。歩行者を認識する。搭載されたエージェントは、このデータのストリームをリアルタイムで処理し、生命に関わる重大な決定（ステアリング操作、アクセル操作、ブレーキ操作）を下す、 A地点からB地点まで安全にナビゲートするためだ。ウェイモのような企業は、このような自律走行車を公道に導入する最前線にいる。自律走行車を公道に導入する最前線にいる。

シンプルなビジョン・エージェントの構築

開発者は、知覚エンジンとしてYOLO11 ようなモデルを使用して、視覚ベースのエージェントを構築することができる。以下のPython の例では、画像を認識し、権限のない人物がいないかチェックし、シミュレートされた警告を発して行動する、シンプルな "セキュリティ・エージェント "を示している。シミュレートされたアラートをトリガーすることで動作します。

from ultralytics import YOLO

# Load the YOLO11 model (The Agent's "Brain" for perception)
model = YOLO("yolo11n.pt")

# 1. Perceive: The agent captures/receives visual data
results = model("secure_zone.jpg")

# 2. Think & 3. Act: The agent evaluates the scene and takes action
for result in results:
    # Check if a 'person' (class ID 0) is detected with high confidence
    if 0 in result.boxes.cls and result.boxes.conf.max() > 0.5:
        print("ACTION: Security Alert! Person detected in restricted area.")
    else:
        print("ACTION: Log entry - Area secure.")

AIエージェント

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

知覚-思考-行動のループ

AIエージェントとAIモデルの比較

実際のアプリケーション

スマート・マニュファクチャリングとロボティクス

自動運転車

シンプルなビジョン・エージェントの構築

関連概念

このカテゴリの関連記事

人間が関与するループ内アノテーションが重要な理由を理解する

データセット蒸留とは何か？簡単な概要

オークリーメタAIグラスは、ビジョンAIでアイウェアの概念を再定義する

Ultralytics コミュニティに参加する

AIエージェント

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

知覚-思考-行動のループ

AIエージェントとAIモデルの比較

実際のアプリケーション

スマート・マニュファクチャリングとロボティクス

自動運転車

シンプルなビジョン・エージェントの構築

関連概念

このカテゴリの関連記事

人間が関与するループ内アノテーションが重要な理由を理解する

データセット蒸留とは何か？ 簡単な概要

オークリー メタAIグラスは、ビジョンAIでアイウェアの概念を再定義する

Ultralytics コミュニティに参加する

データセット蒸留とは何か？簡単な概要

オークリーメタAIグラスは、ビジョンAIでアイウェアの概念を再定義する