Descubra cómo las llamadas a funciones y el uso de herramientas permiten a la IA interactuar con API y bases de datos. Aprenda a integrar Ultralytics en flujos de trabajo agenticos hoy mismo.
La llamada a funciones, a menudo denominada «uso de herramientas», es un potente paradigma de la inteligencia artificial moderna (IA) que permite a los modelos ampliar sus capacidades más allá de la generación estática de texto o imágenes. En lugar de limitarse a responder a una solicitud basada en datos de entrenamiento internos, el modelo puede generar comandos estructurados para activar funciones de programación externas, consultar bases de datos o interactuar con API REST. Este enfoque proporciona a la IA la capacidad de realizar acciones tangibles en entornos digitales.
Cuando un sistema de IA utiliza la llamada a funciones, los desarrolladores proporcionan al modelo una lista de herramientas disponibles descritas mediante JSON Schema. Si la solicitud del usuario requiere datos en tiempo real o una acción específica , el modelo pausa su proceso de generación estándar y genera una carga útil en formato JSON altamente estructurada que coincide con los parámetros requeridos de la herramienta seleccionada. Marcos como la API de llamada a funciones de OpenAI y el marco de uso de herramientasAnthropic han popularizado esta técnica, convirtiendo a los agentes conversacionales en capaces solucionadores de problemas.
La integración del uso de herramientas en los flujos de trabajo transforma el funcionamiento del software. Evaluadas por puntos de referencia como el Berkeley Function Calling Leaderboard, estas capacidades están impulsando un cambio hacia sistemas altamente autónomos.
Puede exponer un modelo de visión por ordenador como herramienta funcional para un agente de IA global. En esta arquitectura, se define un Python que realiza la inferencia, que un modelo de razonamiento puede activar cuando se necesitan datos visuales.
from ultralytics import YOLO
# Define a specific tool function for an AI agent to call
def count_objects_in_scene(image_url: str) -> str:
# Load the highly efficient YOLO26 model
model = YOLO("yolo26n.pt")
# Perform inference to analyze the visual data
results = model(image_url)
object_count = len(results[0].boxes)
# Return structured context back to the calling AI system
return f"Vision Analysis: Detected {object_count} objects in the scene."
# Simulated function call executed by an AI system
print(count_objects_in_scene("https://ultralytics.com/images/bus.jpg"))
Para comprender plenamente las arquitecturas modernas de IA, resulta útil entender cómo la llamada a funciones se relaciona y difiere de conceptos similares: