Tìm hiểu cách các kết quả có cấu trúc cung cấp dữ liệu AI có thể đọc được bởi máy. Khám phá việc áp dụng lược đồ và các tác vụ xử lý hình ảnh với Ultralytics trên Ultralytics .
Kết quả có cấu trúc đề cập đến một phương pháp trong trí tuệ nhân tạo, trong đó các phản hồi của mô hình được yêu cầu nghiêm ngặt phải tuân thủ một định dạng dữ liệu được xác định trước, thường là JSON Schema. Trong các Mô hình Ngôn ngữ Lớn (LLMs) truyền thống, việc tạo văn bản dựa trên dự đoán token xác suất, thường dẫn đến văn bản không có cấu trúc và tự do. Bằng cách sử dụng đầu ra có cấu trúc, các nhà phát triển có thể đảm bảo rằng hệ thống AI trả về dữ liệu có thể đọc được bởi máy và dự đoán được, loại bỏ sự cần thiết của các skript phân tích dễ hỏng và xử lý lỗi phức tạp.
Mặc dù các phiên bản đầu tiên của AI tạo sinh cung cấp chế độ "JSON cơ bản", nhưng điều này chỉ đảm bảo đầu ra là JSON hợp lệ mà không đảm bảo nó chứa các khóa cụ thể hoặc các kiểu dữ liệu được yêu cầu. Kết quả có cấu trúc giải quyết vấn đề này thông qua một kỹ thuật gọi là giải mã có điều kiện. Trong quá trình tạo ra, bộ máy suy luận lọc từ vựng của mô hình ở mỗi bước, che đi các token có thể vi phạm lược đồ do nhà phát triển cung cấp. Điều này đảm bảo 100% tuân thủ lược đồ.
Khái niệm Gọi hàm (Sử dụng công cụ) có mối liên hệ chặt chẽ với phương pháp này. Mặc dù việc gọi hàm cho phép các mô hình xác định thời điểm cần thực thi một công cụ bên ngoài, nhưng nó hoàn toàn phụ thuộc vào các đầu ra có cấu trúc để điền chính xác các tham số cần thiết của công cụ mà không gây ra các kết quả sai lệch.
Trong giai đoạn từ năm 2024 đến năm 2025, các nhà cung cấp AI hàng đầu đã tích hợp đầu ra có cấu trúc thành tính năng mặc định nhằm nâng cao độ tin cậy của hệ thống doanh nghiệp. Ví dụ, API Kết quả có cấu trúc của OpenAI cho phép các nhà phát triển định nghĩa các lược đồ nghiêm ngặt bằng Pydantic trong Python Zod trong JavaScript. Tương tự, các công cụ kết quả có cấu trúcAnthropic ClaudeAnthropic và các công cụ kết quả có cấu trúcGoogle hiện hỗ trợ việc áp dụng nghiêm ngặt các lược đồ đối với các lời nhắc phức tạp.
Các hệ sinh thái mã nguồn mở cũng tận dụng các khung công tác như vLLM và Outlines để cung cấp các phương pháp giải mã có điều kiện cho các mô hình tùy chỉnh được xây dựng bằng PyTorch.
Việc triển khai các kết quả có cấu trúc giúp chuyển đổi các phản hồi mơ hồ của AI thành dữ liệu mô hình dự đoán có thể ứng dụng. Các trường hợp sử dụng chính bao gồm:
Mặc dù được đề cập rộng rãi trong lĩnh vực xử lý ngôn ngữ tự nhiên, các kết quả có cấu trúc lại chính là nguyên lý hoạt động nền tảng của Thị giác máy tính. Các mô hình thị giác không tạo ra văn bản tự do; chúng tạo ra các tensor có cấu trúc chặt chẽ đại diện cho tọa độ, lớp và điểm tin cậy theo mặc định. Ví dụ, các mô hình tiên tiến như Ultralytics đánh giá một hình ảnh và trả về dữ liệu không gian được định dạng nghiêm ngặt, điều này lý tưởng cho việc triển khai mô hình mượt mà trong các môi trường biên có độ trễ thấp.
Đoạn mã sau đây minh họa việc trích xuất dữ liệu có cấu trúc dễ dàng như thế nào
phát hiện đối tượng kết quả thu được khi sử dụng
ultralytics bưu kiện:
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Perform inference to generate structured visual data
results = model("image.jpg")
# The model strictly outputs structured bounding box objects
for box in results[0].boxes:
print(f"Class ID: {box.cls}, Confidence: {box.conf}, Coordinates: {box.xyxy}")
Bằng cách thu hẹp khoảng cách giữa logic AI xác suất và các yêu cầu phần mềm xác định, các kết quả có cấu trúc đóng vai trò là thành phần quan trọng trong việc xây dựng các hệ thống có khả năng mở rộng và sẵn sàng đưa vào sản xuất trên Ultralytics cũng như các nền tảng khác.
Bắt đầu hành trình của bạn với tương lai của học máy