Erfahren Sie, wie strukturierte Ausgaben maschinenlesbare KI-Daten liefern. Entdecken Sie die Schema-Durchsetzung und Bildverarbeitungsaufgaben mit Ultralytics auf der Ultralytics .
Unter strukturierten Ausgaben versteht man eine Methode in der künstlichen Intelligenz, bei der die Modellantworten streng an ein vordefiniertes Datenformat gebunden sind, typischerweise ein JSON-Schema. In herkömmlichen großen Sprachmodellen (LLMs) basiert die Textgenerierung auf probabilistischer Token-Vorhersage, was oft zu unstrukturiertem, frei formatiertem Text führt. Durch die Verwendung strukturierter Ausgaben können Entwickler sicherstellen, dass ein KI-System maschinenlesbare, vorhersehbare Daten liefert, wodurch die Notwendigkeit für anfällige Parsing-Skripte und komplexe Fehlerbehandlung entfällt.
Zwar boten frühe Versionen generativer KI einen einfachen „JSON-Modus“ an, doch stellte dieser lediglich sicher, dass die Ausgabe gültiges JSON war, ohne zu garantieren, dass sie die spezifischen Schlüssel oder Datenformate enthielt, die angefordert wurden. Strukturierte Ausgaben lösen dieses Problem durch eine Technik namens „Constrained Decoding“. Während der Generierung filtert die Inferenz-Engine bei jedem Schritt das Vokabular des Modells und maskiert Token, die gegen das vom Entwickler bereitgestellte Schema verstoßen würden. Dies gewährleistet eine 100-prozentige Schema-Konformität.
Das Konzept des Funktionsaufrufs (Tool-Nutzung) ist eng mit dieser Methodik verbunden. Zwar ermöglicht der Funktionsaufruf Modellen, zu bestimmen, wann ein externes Tool ausgeführt werden soll, doch ist er vollständig auf strukturierte Ausgaben angewiesen, um die erforderlichen Parameter des Tools korrekt zu füllen, ohne dass es zu Fehlern kommt.
Zwischen 2024 und 2025 haben große KI-Anbieter strukturierte Ausgaben als integrierte Funktion eingeführt, um die Zuverlässigkeit von Unternehmenssystemen zu verbessern. Beispielsweise ermöglicht die OpenAI Structured Outputs API Entwicklern, strenge Schemata mithilfe von Pydantic in Python Zod in JavaScript zu definieren. Ebenso unterstützen die strukturierten AusgabenAnthropic Claude und die Tools für strukturierte AusgabenGoogle nun die strikte Durchsetzung von Schemata für komplexe Eingabeaufforderungen.
Open-Source-Ökosysteme nutzen zudem Frameworks wie vLLM und Outlines, um Methoden zur eingeschränkten Dekodierung für benutzerdefinierte Modelle bereitzustellen, die mit PyTorch.
Durch die Umsetzung strukturierter Ergebnisse werden mehrdeutige KI-Antworten in verwertbare Daten für Vorhersagemodelle umgewandelt. Zu den wichtigsten Anwendungsfällen gehören:
Obwohl sie in der Verarbeitung natürlicher Sprache viel diskutiert werden, bilden strukturierte Ausgaben das grundlegende Funktionsprinzip der Computer Vision. Vision-Modelle geben keinen freiformatierten Text aus; sie erzeugen von Haus aus hochgradig organisierte Tensoren, die Koordinaten, Klassen und Konfidenzwerte darstellen. Beispielsweise werten modernste Modelle wie Ultralytics ein Bild aus und geben streng formatierte räumliche Daten zurück, was ideal für den nahtlosen Modelleinsatz in Edge-Umgebungen mit geringer Latenz ist.
Der folgende Ausschnitt zeigt, wie einfach Sie strukturierte Daten extrahieren können
Objekterkennung Ergebnisse unter Verwendung der
ultralytics Paket:
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Perform inference to generate structured visual data
results = model("image.jpg")
# The model strictly outputs structured bounding box objects
for box in results[0].boxes:
print(f"Class ID: {box.cls}, Confidence: {box.conf}, Coordinates: {box.xyxy}")
Durch die Überbrückung der Kluft zwischen probabilistischer KI-Logik und deterministischen Softwareanforderungen dienen strukturierte Ausgaben als entscheidende Komponente beim Aufbau skalierbarer, produktionsreifer Systeme auf der Ultralytics und darüber hinaus.
Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens