Function Calling (Tool Use)
Explore como a chamada de funções (function calling) e o uso de ferramentas capacitam a IA a interagir com APIs e bancos de dados. Aprenda a integrar o Ultralytics YOLO26 em fluxos de trabalho agenticos hoje mesmo.
A chamada de função, frequentemente referida como uso de ferramentas, é um paradigma poderoso na inteligência artificial (IA) moderna que permite aos modelos expandirem as suas capacidades para além da geração estática de texto ou imagem. Em vez de apenas responder a um prompt baseado em dados de treino internos, o modelo pode emitir comandos estruturados para ativar funções de programação externas, consultar bases de dados ou interagir com REST APIs. Esta abordagem confere eficazmente à IA a capacidade de tomar ações tangíveis em ambientes digitais.
Quando um sistema de IA utiliza a chamada de função, os programadores fornecem ao modelo uma lista de ferramentas disponíveis descritas utilizando JSON Schema. Se o prompt do utilizador exigir dados em tempo real ou uma ação específica, o modelo pausa o seu processo de geração padrão e emite um payload em JSON format altamente estruturado que corresponde aos parâmetros necessários da ferramenta selecionada. Frameworks como a OpenAI's function calling API e o Anthropic's tool use framework popularizaram esta técnica, transformando agentes de conversação em solucionadores de problemas capazes.
Link to this sectionAplicações no Mundo Real#
Integrar o uso de ferramentas em fluxos de trabalho transforma a forma como o software opera. Avaliadas por benchmarks como o Berkeley Function Calling Leaderboard, estas capacidades estão a impulsionar uma mudança em direção a sistemas altamente autónomos.
- Varejo Automatizado e Atendimento ao Cliente: Em AI in retail, um assistente virtual pode utilizar a chamada de função para consultar o inventário em tempo real. Se um cliente perguntar: "Onde está a minha encomenda?", o modelo gera uma chamada de função para uma API de base de dados, obtém o estado de rastreamento e devolve uma resposta em linguagem natural.
- Extração de Dados Assistida por Visão: Um vision-language model (VLM) pode utilizar detetores de objetos Ultralytics YOLO como ferramentas. Se for pedido para verificar o cumprimento de normas de segurança numa imagem de uma fábrica, a IA de conversação principal pode chamar um script que executa um modelo Ultralytics YOLO26 para detetar capacetes, devolvendo perfeitamente os resultados de object detection ao diálogo do utilizador.
Link to this sectionIntegrar a Visão Computacional como uma Ferramenta#
Podes expor um modelo de visão computacional como uma ferramenta funcional para um AI agent abrangente. Nesta arquitetura, defines um método Python que realiza a inferência, o qual um modelo de raciocínio pode acionar quando dados visuais são necessários.
from ultralytics import YOLO
# Define a specific tool function for an AI agent to call
def count_objects_in_scene(image_url: str) -> str:
# Load the highly efficient YOLO26 model
model = YOLO("yolo26n.pt")
# Perform inference to analyze the visual data
results = model(image_url)
object_count = len(results[0].boxes)
# Return structured context back to the calling AI system
return f"Vision Analysis: Detected {object_count} objects in the scene."
# Simulated function call executed by an AI system
print(count_objects_in_scene("https://ultralytics.com/images/bus.jpg"))Link to this sectionDiferenciando Termos Relacionados#
Para compreenderes totalmente as arquiteturas de IA modernas, é útil entender como a chamada de função se relaciona e difere de conceitos semelhantes:
- Model Context Protocol (MCP): Enquanto a chamada de função depende de definições de API específicas passadas no prompt do modelo, o MCP é uma arquitetura abrangente e normalizada. O MCP cria um protocolo universal para conectar modelos de IA a fontes de dados, enquanto a chamada de função é o mecanismo localizado que os modelos utilizam para efetivamente invocar essas conexões.
- Retrieval Augmented Generation (RAG): RAG é uma metodologia desenhada especificamente para ir buscar texto ou documentos relevantes para aumentar o prompt de um LLM. A chamada de função é um mecanismo mais amplo; uma IA pode utilizar uma ferramenta para realizar RAG, mas também pode utilizar ferramentas para escrever ficheiros no disco ou enviar um e-mail. Podes encontrar implementações abrangentes de RAG que utilizam ferramentas na PyTorch Documentation e nos guias multimodais do Google Gemini multimodal guides.
- AI Agent: Um AI agent é o sistema autónomo completo que perceciona o seu ambiente e toma ações para atingir um objetivo. A chamada de função é a habilidade principal que dá a um agente a capacidade de executar essas ações. Ao implementar sistemas agentivos de grande escala, as equipas utilizam frequentemente a Ultralytics Platform para treinar e servir perfeitamente os modelos visuais subjacentes que estes agentes utilizam para ver o mundo. As organizações que transitam de modelos estáticos para fluxos de trabalho agentivos dependem frequentemente de bibliotecas de aprendizagem profunda como TensorFlow para otimizar os endpoints com os quais estas funções comunicam.






