Structured Outputs

了解结构化输出如何提供机器可读的 AI 数据。在 Ultralytics Platform 上探索使用 Ultralytics YOLO26 进行的模式强制执行和视觉任务。

结构化输出是指人工智能中的一种方法论，它要求模型响应必须严格遵守预定义的格式，通常为 JSON Schema。在传统的大语言模型 (LLMs) 中，文本生成依赖于概率性标记预测，这通常会导致非结构化的自由格式文本。通过利用结构化输出，开发者可以确保 AI 系统返回机器可读、可预测的数据，从而消除了对脆弱的解析脚本和复杂错误处理的需求。

Link to this section了解结构化输出与 JSON 模式#

虽然生成式 AI 的早期迭代提供了基础的“JSON 模式”，但它仅能确保输出为有效的 JSON，而不能保证其包含所请求的特定键或数据类型。结构化输出通过一种称为约束解码的技术解决了这个问题。在生成过程中，推理引擎会在每一步过滤模型的词汇表，屏蔽掉那些会违反开发者所提供模式的标记。这确保了 100% 的模式合规性。

函数调用 (工具使用) 的概念与这种方法论密切相关。虽然函数调用允许模型决定何时执行外部工具，但它完全依赖于结构化输出，以准确地填充工具所需的参数，而不会产生幻觉。

Link to this section行业采用与框架#

在 2024 年至 2025 年间，主要 AI 提供商将结构化输出作为原生功能，以提高企业系统的可靠性。例如，OpenAI Structured Outputs API 允许开发者使用 Python 中的 Pydantic 或 JavaScript 中的 Zod 来定义严格的模式。同样，Anthropic's Claude structured outputs 和 Google Gemini structured output 工具现在也支持针对复杂提示的严格模式强制执行。

Open-source ecosystems also leverage frameworks like vLLM and Outlines to provide constrained decoding methodologies for custom models built with PyTorch.

Link to this section实际应用#

实现结构化输出可以将模棱两可的 AI 响应转换为可操作的预测建模数据。关键用例包括：

数据提取管道：企业利用结构化输出从原始的非结构化文档中提取特定实体（如候选人姓名、发票总额和日期），并直接将其导入 SQL 数据库，而无需手动输入数据。
自主 AI 代理：代理工作流依靠结构化数据来导航复杂的软件。代理可以分析用户查询并输出严格的 JSON 有效负载，从而触发外部 API，并通过 Databricks Model Serving 等系统安全地扩展运营。

Link to this section计算机视觉中的结构化输出#

虽然在自然语言处理中被广泛讨论，但结构化输出是计算机视觉的基础操作原则。视觉模型不会输出自由格式的文本；它们原生生成高度组织的张量，代表坐标、类别和置信度得分。例如，像 Ultralytics YOLO26 这样的尖端模型可以评估图像并返回严格格式化的空间数据，这非常适合在低延迟边缘环境中进行无缝的模型部署。

The following snippet demonstrates how easily you can extract structured object detection results using the ultralytics package:

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Perform inference to generate structured visual data
results = model("image.jpg")

# The model strictly outputs structured bounding box objects
for box in results[0].boxes:
    print(f"Class ID: {box.cls}, Confidence: {box.conf}, Coordinates: {box.xyxy}")

通过弥合概率 AI 逻辑与确定性软件需求之间的鸿沟，结构化输出成为在 Ultralytics Platform 及其他平台上构建可扩展、生产就绪型系统的关键组成部分。