Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Структурированные выводы

Узнайте, как структурированные выводные данные обеспечивают машиночитаемые данные для ИИ. Изучите возможности принудительного соблюдения схем и задачи машинного зрения с помощью Ultralytics на Ultralytics .

Под структурированными выводами понимается методология в области искусственного интеллекта, при которой ответы модели строго приводятся в соответствие с заранее заданным форматом данных, как правило, схемой JSON. В традиционных больших языковых моделях (LLM) генерация текста основана на вероятностном предсказании токенов, что часто приводит к получению неструктурированного текста свободной формы. Используя структурированные выводы, разработчики могут гарантировать, что система ИИ возвращает машиночитаемые, предсказуемые данные, устраняя необходимость в ненадежных скриптах разбора и сложной обработке ошибок.

Различия между структурированными выводами и режимом JSON

Хотя ранние версии генеративного ИИ предлагали базовый «режим JSON», это обеспечивало лишь валидность вывода в формате JSON, не гарантируя при этом наличие в нём конкретных ключей или запрошенных типов данных. Структурированные выводы решают эту проблему с помощью метода, называемого декодированием с ограничениями. Во время генерации механизм инференции фильтрует словарный запас модели на каждом шаге, маскируя токены, которые нарушили бы схему, предоставленную разработчиком. Это обеспечивает 100% соответствие схеме.

Понятие вызова функций (использования инструментов) тесно связано с этой методологией. Хотя вызов функций позволяет моделям определять, когда следует запустить внешний инструмент, он полностью зависит от структурированных выходных данных, необходимых для точного заполнения требуемых параметров инструмента без генерации ложных результатов.

Применение в отрасли и технологические платформы

В период с 2024 по 2025 год крупнейшие поставщики ИИ сделали структурированные выводы встроенной функцией для повышения надежности корпоративных систем. Например, API структурированных выводов OpenAI позволяет разработчикам определять строгие схемы с помощью Pydantic в Python Zod в JavaScript. Аналогичным образом, структурированные выводы ClaudeAnthropic и инструменты структурированных выводовGoogle теперь поддерживают строгое соблюдение схем для сложных запросов.

Экосистемы с открытым исходным кодом также используют такие фреймворки, как vLLM и Outlines, для реализации методологий декодирования с ограничениями для пользовательских моделей, построенных с помощью PyTorch.

Применение в реальном мире

Внедрение структурированных выходных данных позволяет преобразовать неоднозначные ответы ИИ в пригодные для практического применения данные для прогнозного моделирования. К ключевым сценариям использования относятся:

  • Конвейеры извлечения данных: предприятия используют структурированные выходные данные для извлечения конкретных элементов (таких как имена кандидатов, итоговые суммы счетов и даты) из необработанных неструктурированных документов и загрузки их непосредственно в базы данных SQL без ручного ввода данных.
  • Автономные ИИ-агенты: рабочие процессы агентов опираются на структурированные данные для взаимодействия со сложным программным обеспечением. Агент может проанализировать запрос пользователя и сгенерировать строгий JSON-пакет данных, который запускает внешний API, обеспечивая безопасное масштабирование операций с помощью таких систем, как Databricks Model Serving.

Структурированные выходные данные в компьютерном зрении

Несмотря на то что в области обработки естественного языка этот вопрос активно обсуждается, структурированные результаты являются основополагающим принципом работы компьютерного зрения. Модели компьютерного зрения не выдают текст в свободной форме; они изначально генерируют строго организованные тензоры, представляющие координаты, классы и оценки достоверности. Например, передовые модели, такие как Ultralytics , оценивают изображение и возвращают строго отформатированные пространственные данные, что идеально подходит для беспроблемного развертывания моделей в периферийных средах с низкой задержкой.

В приведенном ниже фрагменте кода показано, как легко можно извлечь структурированные обнаружение объектов результаты с использованием ultralytics пакет:

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Perform inference to generate structured visual data
results = model("image.jpg")

# The model strictly outputs structured bounding box objects
for box in results[0].boxes:
    print(f"Class ID: {box.cls}, Confidence: {box.conf}, Coordinates: {box.xyxy}")

Устраняя разрыв между вероятностной логикой ИИ и детерминированными требованиями к программному обеспечению, структурированные результаты выступают в качестве ключевого компонента при создании масштабируемых, готовых к производственному использованию систем на Ultralytics и за ее пределами.

Давайте вместе создадим будущее искусственного интеллекта!

Начните свой путь в будущее машинного обучения