YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

XML

XML이 데이터 어노테이션, 구성 및 교환을 통해 AI 및 ML을 어떻게 강화하는지 알아보세요. 구조, 용도 및 실제 적용 사례를 알아보세요!

XML(eXtensible Markup Language)은 사람이 읽을 수 있을 뿐만 아니라 기계가 읽을 수 있는 형식으로 문서를 인코딩하기 위한 다용도 및 널리 사용되는 마크업 언어입니다. World Wide Web Consortium(W3C)에서 개발했으며, 주요 목적은 데이터를 표시하는 것이 아니라 저장하고 전송하는 것입니다. HTML과 같은 다른 마크업 언어와 달리 XML을 사용하면 사용자가 자체 태그를 정의할 수 있으므로 자체 설명 데이터 구조를 만드는 데 매우 유연합니다. 이러한 확장성 덕분에 머신 러닝(ML) 및 기타 데이터 집약적 분야에서 서로 다른 시스템 및 플랫폼 간의 데이터 교환을 위한 기본 기술이 되었습니다.

AI 및 머신 러닝의 XML

인공 지능(AI)컴퓨터 비전(CV) 환경에서 XML은 데이터 표현 및 구성에 중요한 역할을 합니다. 구조화된 계층적 형식은 정교한 모델을 훈련하는 데 필요한 복잡한 어노테이션을 정의하는 데 이상적입니다. 최신 애플리케이션에서는 더 가벼운 형식을 선호하는 경우가 많지만, XML의 견고성과 엄격한 유효성 검사 기능(종종 XML Schema Definition(XSD)와 같은 스키마를 통해 적용됨)은 특정 표준 기반 작업에 필수적입니다. 주요 용도로는 데이터 어노테이션, 모델 구성, 다양한 플랫폼에서 모델 배포를 가능하게 하는 PMML(Predictive Model Markup Language)과 같은 모델 교환 형식이 있습니다.

AI/ML 분야에서 XML의 실제 적용

XML의 구조화된 특성 덕분에 표준화된 데이터 세트 및 메타데이터를 생성하는 데 적합합니다. 다음은 두 가지 주요 예입니다.

  1. PASCAL VOC (Visual Object Classes) 데이터 세트: YOLOv8YOLO11과 같은 모델의 벤치마킹에 널리 사용되는 이 영향력 있는 객체 감지 데이터 세트는 어노테이션에 XML 파일을 사용합니다. 각 XML 파일은 이미지에 해당하며 이미지 소스, 크기 및 각 어노테이션된 객체에 대한 세부 정보(예: '차', '사람') 및 바운딩 박스 좌표를 포함합니다. 공식 PASCAL VOC 웹사이트에서 자세한 내용을 확인하고 VOC 데이터 세트 문서에서 Ultralytics 모델과 함께 사용하는 방법을 배울 수 있습니다. Ultralytics HUB와 같은 플랫폼은 사용자 지정 모델 훈련을 위해 이러한 데이터 세트를 관리하는 데 도움이 될 수 있습니다.
  2. 의료 영상 메타데이터(DICOM): DICOM(Digital Imaging and Communications in Medicine) 표준은 의료 영상을 저장하고 전송하기 위해 헬스케어 분야에서 널리 사용됩니다. DICOM 자체는 이진 형식이지만 XML은 환자 정보, 획득 매개변수 및 진단 결과와 같은 이러한 이미지와 관련된 광범위한 메타데이터를 나타내는 데 일반적으로 사용됩니다. 이 구조화된 메타데이터는 의료 영상 분석 작업에 매우 중요하며, 연구원과 임상의가 데이터 세트를 필터링하고, 진단 AI 모델을 학습하고, AI 헬스케어 애플리케이션에서 추적성을 보장할 수 있도록 합니다.

XML vs. 기타 형식

XML은 강력하지만 다른 데이터 직렬화 형식과 비교하는 방법을 이해하는 것이 중요합니다.

  • JSON(JavaScript Object Notation): JSON은 가벼운 구문과 구문 분석 용이성으로 인해 웹 애플리케이션 및 API에서 XML을 대체했습니다. JSON은 닫는 태그를 사용하지 않기 때문에 XML보다 간결합니다. XML은 구조화된 문서에 적합하지만 JSON은 최신 시스템의 데이터 교환에 선호되는 경우가 많습니다.
  • YAML (YAML Ain't Markup Language): YAML은 사람이 읽을 수 있도록 우선 순위를 지정하고 들여쓰기를 사용하여 데이터 구조를 나타내므로 Ultralytics YOLO 모델 구성을 포함하여 AI/ML 프로젝트의 구성 파일에 널리 사용됩니다. XML은 더 장황하지만 태그 기반 구조는 엄격한 유효성 검사가 필요한 복잡한 중첩 데이터에 더 명시적일 수 있습니다.

요약하자면, 항상 가장 간결한 형식은 아니지만 XML의 구조화된 특성, 확장성 및 강력한 유효성 검사 기능은 특히 데이터 주석, 모델 교환 형식 및 엔터프라이즈 데이터 통합에서 AI 및 ML에서 지속적인 역할을 보장합니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.