Entdecken Sie, wie Funktionsaufrufe und der Einsatz von Tools KI in die Lage versetzen, mit APIs und Datenbanken zu interagieren. Lernen Sie noch heute, wie Sie Ultralytics in agentenbasierte Workflows integrieren können.
Funktionsaufrufe, häufig auch als Tool-Nutzung bezeichnet, sind ein leistungsstarkes Paradigma in der modernen künstlichen Intelligenz (KI), das es Modellen ermöglicht, ihre Fähigkeiten über die statische Text- oder Bildgenerierung hinaus zu erweitern. Anstatt nur eine Eingabeaufforderung auf der Grundlage interner Trainingsdaten zu beantworten, kann das Modell strukturierte Befehle ausgeben, um externe Programmierfunktionen auszulösen, Datenbanken abzufragen oder mit REST-APIs zu interagieren. Dieser Ansatz gibt der KI effektiv die Fähigkeit, konkrete Aktionen in digitalen Umgebungen durchzuführen.
Wenn ein KI-System Funktionsaufrufe nutzt, stellen Entwickler dem Modell eine Liste der verfügbaren Tools zur Verfügung, die mithilfe von JSON Schema beschrieben werden. Wenn die Eingabeaufforderung des Benutzers Echtzeitdaten oder eine bestimmte Aktion erfordert, unterbricht das Modell seinen Standardgenerierungsprozess und gibt eine hochstrukturierte Nutzlast im JSON-Format aus, die den erforderlichen Parametern des ausgewählten Tools entspricht. Frameworks wie die Funktionsaufruf-API von OpenAI und das Tool-Use-FrameworkAnthropic haben diese Technik populär gemacht und Konversationsagenten zu fähigen Problemlösern gemacht.
Die Integration des Einsatzes von Werkzeugen in Arbeitsabläufe verändert die Funktionsweise von Software. Gemessen an Benchmarks wie dem Berkeley Function Calling Leaderboard treiben diese Fähigkeiten einen Wandel hin zu hochgradig autonomen Systemen voran.
Sie können ein Computer-Vision-Modell als funktionales Werkzeug für einen übergeordneten KI-Agenten bereitstellen. In dieser Architektur definieren Sie eine Python , die eine Inferenz durchführt, die ein Schlussfolgerungsmodell auslösen kann, wenn visuelle Daten benötigt werden.
from ultralytics import YOLO
# Define a specific tool function for an AI agent to call
def count_objects_in_scene(image_url: str) -> str:
# Load the highly efficient YOLO26 model
model = YOLO("yolo26n.pt")
# Perform inference to analyze the visual data
results = model(image_url)
object_count = len(results[0].boxes)
# Return structured context back to the calling AI system
return f"Vision Analysis: Detected {object_count} objects in the scene."
# Simulated function call executed by an AI system
print(count_objects_in_scene("https://ultralytics.com/images/bus.jpg"))
Um moderne KI-Architekturen vollständig zu verstehen, ist es hilfreich zu wissen, wie sich Funktionsaufrufe auf ähnliche Konzepte beziehen und von diesen unterscheiden :