Узнайте, как вызов функций и использование инструментов позволяют ИИ взаимодействовать с API и базами данных. Узнайте, как интегрировать Ultralytics в агентские рабочие процессы уже сегодня.
Вызов функций, часто называемый использованием инструментов, является мощной парадигмой в современном искусственном интеллекте (ИИ), которая позволяет моделям расширять свои возможности за пределы статического генерации текста или изображений. Вместо того, чтобы просто отвечать на запрос на основе внутренних обучающих данных, модель может выводить структурированные команды для запуска внешних программных функций, запроса баз данных или взаимодействия с REST API. Такой подход эффективно даёт ИИ возможность предпринимать конкретные действия в цифровой среде.
Когда система искусственного интеллекта использует вызов функций, разработчики предоставляют модели список доступных инструментов, описанных с помощью JSON Schema. Если запрос пользователя требует данных в реальном времени или конкретного действия, модель приостанавливает свой стандартный процесс генерации и выдает высокоструктурированный пакет данных в формате JSON, соответствующий требуемым параметрам выбранного инструмента. Такие фреймворки, как API вызова функций OpenAI и фреймворк использования инструментовAnthropic, популяризировали эту технику, превратив диалоговых агентов в способных решать проблемы.
Интеграция использования инструментов в рабочие процессы трансформирует способ работы программного обеспечения. По оценкам таких бенчмарков, как Berkeley Function Calling Leaderboard, эти возможности способствуют переходу к высокоавтономным системам.
Модель компьютерного зрения можно представить в качестве функционального инструмента для общего ИИ-агента. В этой архитектуре вы определяете Python , который выполняет вывод, который модель рассуждения может запускать, когда требуются визуальные данные.
from ultralytics import YOLO
# Define a specific tool function for an AI agent to call
def count_objects_in_scene(image_url: str) -> str:
# Load the highly efficient YOLO26 model
model = YOLO("yolo26n.pt")
# Perform inference to analyze the visual data
results = model(image_url)
object_count = len(results[0].boxes)
# Return structured context back to the calling AI system
return f"Vision Analysis: Detected {object_count} objects in the scene."
# Simulated function call executed by an AI system
print(count_objects_in_scene("https://ultralytics.com/images/bus.jpg"))
Чтобы полностью понять современные архитектуры ИИ, полезно понять, как вызов функций соотносится с подобными концепциями и чем отличается от них: