用語集

大型アクションモデル（LAM）

Large Action Models（LAM）について、そしてそれが自律型AIエージェントをどのように駆動するのかを探ります。ビジョンからアクションへのワークフローやタスクの自動化を実現するために、Ultralytics 統合する方法を学びましょう。

大規模アクションモデル（LAM）は、テキスト生成にとどまらず、自律的にタスクを実行し、デジタル環境と相互作用するように設計された、高度な生成型人工知能の一種です。単にテキストを処理・生成する従来のモデルとは異なり、 LAMはAIエージェントの中核となる認知エンジンとして機能し、人間の意図を具体的な多段階の行動へと変換します。自然言語理解と実世界での実行との間のギャップを埋めることで、これらのモデルは汎用人工知能（AGI）および高度に自律的なシステムに向けた大きな飛躍を象徴しています。

大規模アクションモデルの仕組み

LAMは、従来の基盤モデルの基本アーキテクチャを基盤としていますが、ソフトウェア、API、およびWeb環境と連携するように特別に訓練されています。強化学習や関数呼び出しといった技術を活用することで、 LAMは複雑なユーザーのリクエストを論理的なステップに分解し、グラフィカルユーザーインターフェースを操作し、API エンドポイントを実行することができます。例えば、Anthropic Claude 3.5のコンピュータ利用や Salesforce社のxLAMファミリーにおける最近の進展は、これらのシステムが、人間のオペレーターと同様に、自律的にボタンをクリックし、フォームに入力し、ワークフローを管理できることを示しています。

コンピュータビジョンシステムと組み合わせることで、LAMはさらに強力な機能を発揮します。Ultralytics 高効率なモデルによって視覚入力を処理することで、 LAMは周囲の環境を「認識」し、視覚的な文脈を解釈し、検知した内容に基づいて特定のプログラム動作を実行できるようになります。

実際のアプリケーション

LAMは、産業におけるタスクの自動化への取り組み方を変革しており、受動的な支援から能動的な実行へと移行しつつあります。

小売およびカスタマーサポートにおけるAI： LAMは、単に顧客の質問に答えるだけでなく、商品の返品手続きを自律的に処理することができます。ユーザーが注文のキャンセルを依頼した場合、このモデルは人間の介入なしに、企業の請求管理システムを操作し、返品ポリシーを確認し、返金処理を行い、在庫データベースを更新することができます。
医療管理におけるAI： 臨床現場において、LAMは複雑なワークフローを調整します。LAMは患者の要望を抽出し、医師の空き状況を照合し、院内医療システムを通じて電子カルテ（EHR）を自動的に更新し、予約の確定を行います。

コードによるビジョンワークフローの自動化

LAMは、視覚検査を自動化するために、しばしばビジョンモデルと統合されます。以下のPython 、架空のLAMワークフローがどのように活用されるかを示しています ultralytics 画像をスキャンし、それに基づいて自動在庫管理アクションを実行するオブジェクト検出の結果だ。

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for an agentic vision task
model = YOLO("yolo26n.pt")

# The LAM commands the model to scan a warehouse shelf image
results = model.predict("inventory_shelf.jpg")

# The LAM extracts actionable data to autonomously trigger a supply reorder
for result in results:
    detected_items = len(result.boxes)
    if detected_items < 10:
        print(f"Low inventory ({detected_items} items). Action triggered: Reordering supplies via API.")

ユーザーは、最新のAIソリューション向けに堅牢なクラウドインフラストラクチャを提供する Ultralytics を活用することで、こうした統合型ビジュアル・アクション・ワークフローをシームレスに展開・監視できます。

大型アクションモデル（LAM）

17以上の形式にエクスポート。世界43の地域にデプロイ。

H100 GPUでYOLO26を1時間あたり2.39ドルで学習。

ビジョンAIプロジェクトを推進する柔軟なエンタープライズライセンス

次のプロジェクトを推進するために構築されたエンタープライズライセンス

スマートアノテーションで最大10倍高速にラベル付け

アノテーション。トレーニング。デプロイ。 すべて1つのプラットフォームで。

大規模アクションモデルの仕組み

実際のアプリケーション

コードによるビジョンワークフローの自動化

関連概念の区別

このカテゴリの関連記事

Ultralytics を使用したパレットの不適切な積み重ねの検知

Ultralytics を使用したポリゴン注釈ガイド

ドイツで開催されるハノーバー・メッセ2026Ultralytics の主な見どころ

共にAIの未来を築きましょう！

大型アクションモデル（LAM）

17以上の形式にエクスポート。世界43の地域にデプロイ。

H100 GPUでYOLO26を1時間あたり2.39ドルで学習。

ビジョンAIプロジェクトを推進する柔軟なエンタープライズライセンス

次のプロジェクトを推進するために構築されたエンタープライズライセンス

スマートアノテーションで最大10倍高速にラベル付け

アノテーション。トレーニング。デプロイ。 すべて1つのプラットフォームで。

大規模アクションモデルの仕組み

実際のアプリケーション

コードによるビジョンワークフローの自動化

関連概念の区別

このカテゴリの関連記事

Ultralytics を使用したパレットの不適切な積み重ねの検知

Ultralytics を使用したポリゴン注釈ガイド

ドイツで開催されるハノーバー・メッセ2026Ultralytics の主な見どころ

共にAIの未来を築きましょう！

アノテーション。トレーニング。デプロイ。 すべて1つのプラットフォームで。