深圳Yolo 视觉
深圳
立即加入
词汇表

工具使用(功能调用)

探索函数调用和工具使用如何赋能人工智能与API及数据库交互。立即学习Ultralytics 集成到智能体工作流中。

函数调用,常被称为工具使用,是现代人工智能(AI)领域中一种强大的范式,它使模型能够突破静态文本或图像生成的局限。模型不再仅基于内部训练数据响应提示,而是能够输出结构化指令来触发外部编程功能、查询数据库或与REST API交互。这种方法有效赋予了AI在数字环境中执行具体操作的能力。

当人工智能系统采用函数调用机制时,开发者会为模型提供一份可用工具清单,这些工具通过JSON Schema进行描述。若用户提示需要实时数据或特定操作,模型将暂停常规生成流程,输出高度结构化的JSON格式有效负载,该负载完全匹配所选工具的必要参数。OpenAI的函数调用API Anthropic工具使用框架等技术框架 已使该技术普及化,将对话式智能体转化为高效的问题解决者。

实际应用

将工具使用整合到工作流程中,彻底改变了软件的运作方式。通过伯克利函数调用排行榜等基准测试评估,这些能力正推动着系统向高度自主化方向转变。

  • 自动化零售与客户服务: 在零售领域的人工智能应用中,虚拟助手可通过函数调用查询实时库存。当顾客询问"我的订单在哪里?"时,模型会生成对数据库API的函数调用,获取物流追踪状态,并返回自然语言响应。
  • 视觉辅助数据提取: 视觉语言模型(VLM)可利用 Ultralytics YOLO 物体检测器作为工具。当需要验证工厂图像中的安全合规性时,主对话式AI可调用Ultralytics 模型的脚本detect ,并将物体检测结果无缝返回至用户对话界面。

将计算机视觉整合为工具

你可以将计算机视觉模型作为功能工具暴露给一个总体的人工智能代理。在此架构中,你定义一个执行推理Python ,当需要视觉数据时,推理模型可以触发该方法。

from ultralytics import YOLO


# Define a specific tool function for an AI agent to call
def count_objects_in_scene(image_url: str) -> str:
    # Load the highly efficient YOLO26 model
    model = YOLO("yolo26n.pt")

    # Perform inference to analyze the visual data
    results = model(image_url)
    object_count = len(results[0].boxes)

    # Return structured context back to the calling AI system
    return f"Vision Analysis: Detected {object_count} objects in the scene."


# Simulated function call executed by an AI system
print(count_objects_in_scene("https://ultralytics.com/images/bus.jpg"))

区分相关术语

要全面理解现代人工智能架构,有必要认识函数调用与相关概念的关联性及差异性:

  • 模型上下文协议(MCP) 函数调用依赖于模型提示中传递的特定API定义,而MCP则是覆盖其上的标准化架构。 MCP为连接AI模型与数据源创建了通用协议, 函数调用则是模型实际调用这些连接时采用的局部化机制。
  • 检索增强生成(RAG) RAG是一种专门设计的方法,用于检索相关文本或文档以增强大型语言模型的提示。 函数调用 是更广泛的机制;AI既可借助工具执行RAG,也可利用工具将文件写入磁盘或发送邮件。 您可在PyTorch Google 多模态指南中找到利用工具实现RAG的完整方案。
  • AI智能体AI智能体是能够感知环境并采取行动以实现目标的完整自主系统。 函数调用是赋予智能体执行这些行动的核心能力。在部署大规模智能体系统时,团队常Ultralytics 无缝训练并服务于这些智能体所调用的底层视觉模型,从而实现对世界的感知。从静态模型向智能体工作流转型的组织,通常依赖于TensorFlow等深度学习库。 TensorFlow 来优化这些函数通信的端点。

使用Ultralytics YOLO增强动力

为您的项目获取高级 AI 视觉。立即找到适合您目标的许可证。

探索许可选项