Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Modelos de Grande Escala (LAM)

Explore os Modelos de Ação em Grande Escala (LAM) e a forma como estes impulsionam os agentes de IA autónomos. Aprenda a integrar Ultralytics em fluxos de trabalho de visão para ação e na automatização de tarefas.

Os Modelos de Ação de Grande Escala (LAM) constituem uma classe avançada de inteligência artificial generativa concebida para ir além da geração de texto, executando tarefas de forma autónoma e interagindo com ambientes digitais. Ao contrário dos modelos tradicionais que processam e produzem texto de forma estrita, os LAMs atuam como o motor cognitivo central para agentes de IA, traduzindo a intenção humana em ações concretas de várias etapas. Ao colmatar a lacuna entre a compreensão da linguagem natural e a execução no mundo real, estes modelos representam um salto significativo em direção à Inteligência Artificial Geral (AGI) e a sistemas altamente autónomos.

Como funcionam os modelos de ação de grande escala

Os LAMs baseiam-se na arquitetura fundamental dos modelos de base tradicionais, mas são especificamente treinados para interagir com software, APIs e ambientes web. Utilizando técnicas como aprendizagem por reforço e chamada de funções, um LAM consegue dividir um pedido complexo do utilizador em passos lógicos, navegar em interfaces gráficas de utilizador e executar pontos de extremidade de API. Por exemplo, desenvolvimentos recentes do uso do computador Claude 3.5Anthropic e da família xLAM da Salesforce demonstram como estes sistemas podem clicar em botões, preencher formulários e gerir fluxos de trabalho de forma autónoma, tal como um operador humano faria.

Quando combinados com sistemas de visão computacional, os LAMs tornam-se ainda mais poderosos. Os dados visuais podem ser processados por modelos altamente eficientes, como Ultralytics , permitindo que o LAM «veja» o seu ambiente, interprete o contexto visual e acione ações programáticas específicas com base no que deteta.

Aplicações no Mundo Real

Os LAM estão a transformar a forma como as indústrias abordam a automatização de tarefas, passando da assistência passiva para a execução ativa.

  • IA no retalho eno apoio ao cliente: Em vez de se limitar a responder às perguntas dos clientes, um LAM pode processar autonomamente a devolução de um produto. Se um utilizador solicitar o cancelamento de uma encomenda, o modelo pode aceder ao software de faturação da empresa, verificar a política, emitir o reembolso e atualizar a base de dados de inventário sem intervenção humana.
  • IA na Administraçãode Cuidados de Saúde: Em contextos clínicos, os LAMs coordenam fluxos de trabalho complexos. Podem extrair os pedidos dos doentes, verificar a disponibilidade dos médicos, atualizar automaticamente os Registos de Saúde Eletrónicos (RSE) através de software médico interno e finalizar o agendamento de consultas.

Automatização de fluxos de trabalho de visão artificial através de código

Os LAMs são frequentemente integrados com modelos de visão para automatizar as inspeções visuais. O Python a seguir demonstra como um fluxo de trabalho hipotético de LAM poderia tirar partido de ultralytics para digitalizar uma imagem e acionar uma ação de inventário automatizada com base no deteção de objectos resultados.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for an agentic vision task
model = YOLO("yolo26n.pt")

# The LAM commands the model to scan a warehouse shelf image
results = model.predict("inventory_shelf.jpg")

# The LAM extracts actionable data to autonomously trigger a supply reorder
for result in results:
    detected_items = len(result.boxes)
    if detected_items < 10:
        print(f"Low inventory ({detected_items} items). Action triggered: Reordering supplies via API.")

Os utilizadores podem implementar e monitorizar estes tipos de fluxos de trabalho integrados de ação visual de forma harmoniosa através da Ultralytics , que oferece uma infraestrutura robusta na nuvem para soluções modernas de IA.

Distinguir conceitos relacionados

Para compreender plenamente o panorama atual da IA, é útil distinguir os LAMs de outros termos estreitamente relacionados:

  • LAM vs. Modelo de Linguagem de Grande Escala (LLM): Um LLM foi concebido exclusivamente para processar, resumir e gerar linguagem, tal como um preditor de texto altamente avançado. Um LAM incorpora essa compreensão da linguagem, mas foi especificamente concebido para interagir com ferramentas externas e realizar ações digitais.
  • LAM vs. IA Agente: «IA Agente» descreve o sistema global ou a entidade de software que opera de forma autónoma. O Large Action Model é a rede neural subjacente — o «cérebro» — que confere ao agente a capacidade de planear e executar essas ações.
  • LAM vs. Agentic RAG: O Agentic RAG centra-se na recuperação e síntese autónomas de informação externa para melhorar a precisão de uma resposta gerada. Um LAM centra-se na manipulação de sistemas e na alteração de estados (como reservar um voo ou mover ficheiros), em vez de se limitar a recuperar dados.

Vamos construir juntos o futuro da IA!

Comece sua jornada com o futuro do aprendizado de máquina