구조화된 출력이 어떻게 기계가 읽을 수 있는 AI 데이터를 제공하는지 알아보세요. Ultralytics 에서 Ultralytics 활용한 스키마 적용 및 비전 작업을 살펴보세요.
구조화된 출력이란, 모델의 응답이 미리 정의된 데이터 형식(일반적으로 JSON 스키마)을 엄격하게 준수하도록 하는 인공지능 분야의 방법론을 말합니다. 기존의 대규모 언어 모델(LLM)에서는 텍스트 생성이 확률적 토큰 예측에 의존하기 때문에, 종종 구조화되지 않은 자유 형식의 텍스트가 생성됩니다. 구조화된 출력을 활용함으로써 개발자는 AI 시스템이 기계가 읽을 수 있고 예측 가능한 데이터를 반환하도록 보장할 수 있으며, 이로 인해 불안정한 파싱 스크립트와 복잡한 오류 처리의 필요성을 없앨 수 있습니다.
초기 생성형 AI는 기본적인 “JSON 모드”를 제공했지만, 이는 출력이 유효한 JSON 형식임을 보장할 뿐, 요청된 특정 키나 데이터 유형이 포함되어 있다는 보장은 하지 못했습니다. 구조화된 출력은 '제약 조건이 있는 디코딩(constrained decoding)'이라는 기술을 통해 이 문제를 해결합니다. 생성 과정에서 추론 엔진은 매 단계마다 모델의 어휘를 필터링하여, 개발자가 제공한 스키마를 위반할 수 있는 토큰을 가립니다. 이를 통해 100% 스키마 준수를 보장합니다.
‘함수 호출(도구 사용) ’이라는 개념은 이 방법론과 밀접한 관련이 있습니다. 함수 호출을 통해 모델은 외부 도구를 언제 실행할지 결정할 수 있지만, 도구가 요구하는 매개변수를 환각 현상 없이 정확하게 채우려면 전적으로 구조화된 출력에 의존해야 합니다.
2024년부터 2025년 사이, 주요 AI 제공업체들은 기업 시스템의 신뢰성을 높이기 위해 구조화된 출력을 기본 기능으로 도입했습니다. 예를 들어, OpenAI 구조화된 출력 API를 통해 개발자는 Python JavaScript의 Zod를 사용하여 엄격한 스키마를 정의할 수 있습니다. 마찬가지로, Anthropic Claude 구조화된 출력 및 Google 구조화된 출력 도구도 이제 복잡한 프롬프트에 대해 엄격한 스키마 적용을 지원합니다.
오 픈소스 생태계는 또한 vLLM 및 Outlines와 같은 프레임워크를 활용하여 PyTorch로 구축된 맞춤형 모델을 위한 제약 조건이 있는 디코딩 방법론을 제공합니다.
구조화된 출력을 구현하면 모호한 AI 응답을 실행 가능한 예측 모델링 데이터로 전환할 수 있습니다. 주요 활용 사례는 다음과 같습니다:
자연어 처리 분야에서 널리 논의되고 있지만, 구조화된 출력은 컴퓨터 비전의 근본적인 작동 원리입니다. 비전 모델은 자유 형식의 텍스트를 출력하지 않으며, 좌표, 클래스, 신뢰도 점수를 나타내는 고도로 체계화된 텐서를 기본적으로 생성합니다. 예를 들어, Ultralytics 같은 최첨단 모델은 이미지를 평가하여 엄격하게 형식화된 공간 데이터를 반환하며, 이는 저지연 엣지 환경에서 모델을 원활하게 배포하는 데 이상적입니다.
다음 코드 예제는 구조화된 데이터를 얼마나 쉽게 추출할 수 있는지 보여줍니다.
물체 감지 다음 방법을 사용한 결과
ultralytics 패키지입니다:
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Perform inference to generate structured visual data
results = model("image.jpg")
# The model strictly outputs structured bounding box objects
for box in results[0].boxes:
print(f"Class ID: {box.cls}, Confidence: {box.conf}, Coordinates: {box.xyxy}")
확률적 AI 논리와 결정론적 소프트웨어 요구사항 간의 격차를 해소함으로써, 구조화된 출력은 Ultralytics 및 그 외 환경에서 확장 가능하고 즉시 운영 가능한 시스템을 구축하는 데 있어 핵심적인 요소로 작용합니다.

미래의 머신러닝 여정을 시작하세요