Structured Outputs

Tìm hiểu cách structured outputs cung cấp dữ liệu AI mà máy có thể đọc được. Khám phá việc thực thi schema và các tác vụ thị giác với Ultralytics YOLO26 trên Ultralytics Platform.

Structured outputs đề cập đến một phương pháp trong trí tuệ nhân tạo, nơi các phản hồi của model bị bắt buộc tuân thủ chặt chẽ định dạng dữ liệu được xác định trước, thường là JSON Schema. Trong các Large Language Models (LLMs) truyền thống, việc tạo văn bản dựa trên dự đoán token xác suất, vốn thường dẫn đến văn bản tự do, không có cấu trúc. Bằng cách sử dụng structured outputs, các nhà phát triển có thể đảm bảo rằng hệ thống AI trả về dữ liệu có thể đọc được bằng máy và có thể dự đoán được, loại bỏ nhu cầu về các tập lệnh phân tích cú pháp dễ lỗi và xử lý ngoại lệ phức tạp.

Link to this sectionHiểu về Structured Outputs so với JSON Mode#

Trong khi các phiên bản đầu tiên của generative AI cung cấp "JSON mode" cơ bản, tính năng này chỉ đảm bảo đầu ra là JSON hợp lệ mà không đảm bảo nó chứa các khóa hoặc kiểu dữ liệu cụ thể được yêu cầu. Structured outputs giải quyết vấn đề này thông qua một kỹ thuật gọi là constrained decoding (giải mã có ràng buộc). Trong quá trình tạo, inference engine lọc từ vựng của model tại mỗi bước, che các token có thể vi phạm lược đồ do nhà phát triển cung cấp. Điều này đảm bảo tuân thủ lược đồ 100%.

Khái niệm về Function Calling (Tool Use) có mối liên hệ mật thiết với phương pháp này. Mặc dù function calling cho phép các model xác định thời điểm thực thi một công cụ bên ngoài, nó hoàn toàn dựa vào structured outputs để điền chính xác các tham số bắt buộc của công cụ mà không bị ảo giác.

Link to this sectionSự chấp nhận của ngành và các Framework#

Trong giai đoạn 2024-2025, các nhà cung cấp AI lớn đã biến structured outputs thành một tính năng nguyên bản để cải thiện độ tin cậy của hệ thống doanh nghiệp. Ví dụ, OpenAI Structured Outputs API cho phép các nhà phát triển xác định các lược đồ nghiêm ngặt bằng cách sử dụng Pydantic trong Python hoặc Zod trong JavaScript. Tương tự, các công cụ Anthropic's Claude structured outputs và Google Gemini structured output hiện hỗ trợ thực thi lược đồ nghiêm ngặt cho các prompt phức tạp.

Các hệ sinh thái mã nguồn mở cũng tận dụng các framework như vLLM và Outlines để cung cấp constrained decoding methodologies cho các model tùy chỉnh được xây dựng bằng PyTorch.

Link to this sectionCác ứng dụng trong thực tế#

Việc triển khai structured outputs chuyển đổi các phản hồi AI mơ hồ thành dữ liệu predictive modeling có thể hành động. Các trường hợp sử dụng chính bao gồm:

Data Extraction Pipelines: Các doanh nghiệp sử dụng structured outputs để trích xuất các thực thể cụ thể (như tên ứng viên, tổng hóa đơn và ngày tháng) từ các tài liệu thô, không có cấu trúc và đưa chúng trực tiếp vào cơ sở dữ liệu SQL mà không cần nhập dữ liệu thủ công.
Autonomous AI Agents: Các quy trình làm việc của đại lý dựa vào dữ liệu có cấu trúc để điều hướng phần mềm phức tạp. Một đại lý có thể phân tích truy vấn của người dùng và xuất ra payload JSON nghiêm ngặt để kích hoạt API bên ngoài, mở rộng quy mô hoạt động một cách an toàn thông qua các hệ thống như Databricks Model Serving.

Link to this sectionStructured Outputs trong Computer Vision#

Mặc dù được thảo luận nhiều trong xử lý ngôn ngữ tự nhiên, structured outputs là nguyên lý vận hành nền tảng của Computer Vision. Các model thị giác không xuất ra văn bản tự do; chúng tạo ra các tensor được tổ chức cao đại diện cho tọa độ, lớp và điểm tin cậy một cách nguyên bản. Ví dụ, các model tiên tiến như Ultralytics YOLO26 đánh giá một hình ảnh và trả về dữ liệu không gian được định dạng nghiêm ngặt, rất lý tưởng để model deployment liền mạch trong các môi trường biên có độ trễ thấp.

Đoạn mã sau đây minh họa mức độ dễ dàng mà bạn có thể trích xuất kết quả object detection có cấu trúc bằng cách sử dụng gói ultralytics:

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Perform inference to generate structured visual data
results = model("image.jpg")

# The model strictly outputs structured bounding box objects
for box in results[0].boxes:
    print(f"Class ID: {box.cls}, Confidence: {box.conf}, Coordinates: {box.xyxy}")

Bằng cách thu hẹp khoảng cách giữa logic AI xác suất và các yêu cầu phần mềm tất định, structured outputs đóng vai trò là thành phần quan trọng trong việc xây dựng các hệ thống sẵn sàng sản xuất, có thể mở rộng trên Ultralytics Platform và hơn thế nữa.

Structured Outputs

Link to this sectionHiểu về Structured Outputs so với JSON Mode#

Link to this sectionSự chấp nhận của ngành và các Framework#

Link to this sectionCác ứng dụng trong thực tế#

Link to this sectionStructured Outputs trong Computer Vision#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!