Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Chamada de funções (uso de ferramentas)

Explore como a chamada de funções e o uso de ferramentas capacitam a IA a interagir com APIs e bases de dados. Aprenda a integrar Ultralytics em fluxos de trabalho agenticos hoje mesmo.

A chamada de funções, frequentemente referida como uso de ferramentas, é um paradigma poderoso na inteligência artificial (IA) moderna que permite que os modelos ampliem as suas capacidades para além da geração estática de texto ou imagens. Em vez de apenas responder a um prompt com base em dados de treino internos, o modelo pode produzir comandos estruturados para acionar funções de programação externas, consultar bases de dados ou interagir com APIs REST. Esta abordagem efetivamente dá à IA a capacidade de realizar ações tangíveis em ambientes digitais.

Quando um sistema de IA utiliza chamadas de função, os programadores fornecem ao modelo uma lista de ferramentas disponíveis descritas usando JSON Schema. Se o prompt do utilizador exigir dados em tempo real ou uma ação específica , o modelo pausa o seu processo de geração padrão e gera uma carga útil altamente estruturada no formato JSON, correspondendo aos parâmetros exigidos da ferramenta selecionada. Estruturas como a API de chamada de função da OpenAI e a estrutura de uso de ferramentasAnthropic popularizaram essa técnica, transformando agentes conversacionais em solucionadores de problemas capazes.

Aplicações no Mundo Real

A integração do uso de ferramentas nos fluxos de trabalho transforma a forma como o software opera. Avaliadas por benchmarks como o Berkeley Function Calling Leaderboard, essas capacidades estão a impulsionar uma mudança em direção a sistemas altamente autónomos.

  • Varejo automatizado e atendimento ao cliente: Na IA no varejo, um assistente virtual pode usar a função chamada para consultar o inventário em tempo real. Se um cliente perguntar: "Onde está a minha encomenda?", o modelo gera uma chamada de função para uma API de banco de dados, recupera o status de rastreamento e retorna uma resposta em linguagem natural.
  • Extração de dados assistida por visão: Um modelo de linguagem visual (VLM) pode usar Ultralytics YOLO como ferramentas. Se solicitado a verificar a conformidade de segurança em uma imagem de fábrica, a IA conversacional principal pode chamar um script que executa um modelo Ultralytics para detect , retornando de forma integrada os resultados da detecção de objetos para o diálogo do usuário.

Integrando a visão computacional como ferramenta

É possível expor um modelo de visão computacional como uma ferramenta funcional para um agente de IA abrangente. Nessa arquitetura, define-se um Python que realiza inferência, que um modelo de raciocínio pode acionar quando dados visuais são necessários.

from ultralytics import YOLO


# Define a specific tool function for an AI agent to call
def count_objects_in_scene(image_url: str) -> str:
    # Load the highly efficient YOLO26 model
    model = YOLO("yolo26n.pt")

    # Perform inference to analyze the visual data
    results = model(image_url)
    object_count = len(results[0].boxes)

    # Return structured context back to the calling AI system
    return f"Vision Analysis: Detected {object_count} objects in the scene."


# Simulated function call executed by an AI system
print(count_objects_in_scene("https://ultralytics.com/images/bus.jpg"))

Diferenciação de termos relacionados

Para compreender totalmente as arquiteturas modernas de IA, é útil entender como a chamada de função se relaciona e difere de conceitos semelhantes:

  • Protocolo de Contexto do Modelo (MCP): Enquanto a chamada de função depende de definições específicas da API passadas no prompt do modelo, o MCP é uma arquitetura abrangente e padronizada. O MCP cria um protocolo universal para conectar modelos de IA a fontes de dados, enquanto a chamada de função é o mecanismo localizado que os modelos usam para realmente invocar essas conexões.
  • Geração Aumentada por Recuperação (RAG): A RAG é uma metodologia projetada especificamente para recuperar textos ou documentos relevantes para aumentar o prompt de um LLM. A chamada de função é um mecanismo mais amplo; uma IA pode usar uma ferramenta para executar RAG, mas também pode usar ferramentas para gravar ficheiros no disco ou enviar um e-mail. Você pode encontrar implementações abrangentes de RAG utilizando ferramentas na PyTorch e nos guias multimodaisGoogle .
  • Agente de IA: Um agente de IA é um sistema totalmente autónomo que percebe o seu ambiente e toma medidas para atingir um objetivo. A chamada de funções é a principal habilidade que dá ao agente a capacidade de executar essas ações. Ao implementar sistemas de agentes em grande escala , as equipas costumam usar a Ultralytics para treinar e servir de forma integrada os modelos visuais subjacentes que esses agentes utilizam para ver o mundo. As organizações que estão a fazer a transição de modelos estáticos para fluxos de trabalho de agentes costumam contar com bibliotecas de deep learning, como o TensorFlow para otimizar os pontos finais com os quais essas funções se comunicam.

Energize-se com o Ultralytics YOLO

Obtenha visão de IA avançada para seus projetos. Encontre a licença certa para seus objetivos hoje.

Explore as opções de licenciamento