Yolo 비전 선전
선전
지금 참여하기
용어집

XML

XML이 데이터 어노테이션, 구성 및 교환을 통해 AI 및 ML을 어떻게 강화하는지 알아보세요. 구조, 용도 및 실제 적용 사례를 알아보세요!

일반적으로 XML로 알려진 확장 가능한 마크업 언어는 다양한 컴퓨팅 시스템에서 데이터를 저장, 구성, 전송하는 데 사용되는 유연한 텍스트 기반 형식입니다. 다양한 컴퓨팅 시스템 간에 데이터를 전송하는 데 사용되는 유연한 텍스트 기반 형식입니다. 데이터가 표시되는 방식에 중점을 두는 HTML과 달리 XML은 데이터가 무엇인지 설명하도록 사용자 정의 태그의 계층적 구조를 활용하여 요소와 속성을 정의함으로써 데이터가 무엇인지 설명합니다. 이 기능 덕분에 데이터 교환 및 구성 관리를 위한 지속적인 표준으로 자리 잡았습니다. 빠르게 진화하고 있는 머신 러닝(ML) 분야에서 XML은 복잡한 데이터를 구조화하기 위한 복잡한 데이터 세트, 특히 상세한 메타데이터와 엄격한 유효성 검사가 필요한 데이터 세트를 구조화하는 데 중요한 형식입니다. 월드와이드웹 컨소시엄(W3C)에서 정의한 표준입니다.

인공 지능에서 XML의 역할

다음 영역 내에서 인공 지능(AI), 구조화된 데이터는 정교한 알고리즘을 구동하는 연료입니다. XML은 데이터 주석을 위한 강력한 프레임워크를 제공합니다. 데이터 주석을 위한 강력한 프레임워크를 제공하여 엔지니어가 이미지, 텍스트 등의 원시 정보를 이미지나 텍스트와 같은 원시 정보를 풍부하고 설명적인 메타데이터로 캡슐화할 수 있습니다. 이러한 구조화된 접근 방식은 다음과 같은 경우에 필수적입니다. 지도 학습, 모델에 패턴 학습을 위해 레이블이 지정된 예제를 필요로 하는 지도 학습에 필수적입니다. 최신 워크플로우에서는 경량 형식을 점점 더 많이 활용하고 있지만, XML의 장황함과 와 엄격한 구문으로 인해 데이터 무결성이 보장되므로 레거시 시스템, 엔터프라이즈 통합 및 특정 컴퓨터 비전 작업에 선호됩니다.

AI 및 머신 러닝의 실제 적용 사례

XML은 특히 데이터 표준화 및 상호 운용성이 가장 중요한 여러 실제 애플리케이션에서 중요한 역할을 합니다. 가장 중요합니다.

  • 객체 감지 데이터 세트(PASCAL VOC): 컴퓨터 비전에서 가장 눈에 띄는 XML 사용 중 하나는 PASCAL 시각적 객체 클래스(VOC) 형식입니다. 이 표준에서는 데이터 세트의 모든 이미지가 주석 세부 정보가 포함된 XML 파일과 쌍을 이룹니다. 이러한 파일은 바운딩 박스 좌표(xmin, ymin, x최대, y최대) 와 각 객체에 대한 클래스 레이블을 정의합니다. 다음과 같은 모델 YOLO11 와 같은 모델은 이러한 어노테이션(종종 텍스트로 변환됨)을 활용하여 객체를 식별하고 위치를 파악하는 방법을 학습할 수 있으며, 이는 객체 감지의 기본 프로세스인 객체 감지의 기본입니다.
  • 의료 영상 및 헬스케어: In 의료 분야에서는 상호 운용성이 매우 중요합니다. 의료 스캔에 보편적으로 사용되는 DICOM(디지털 이미징 및 의료 통신) 표준, 의료 스캔에 보편적으로 사용되는 표준은 복잡한 메타데이터를 처리하기 위해 XML과 자주 인터페이스합니다. XML을 사용하면 환자 데이터, 연구 매개변수, 진단 결과의 구조화된 보고를 가능하게 하여 의료 이미지 분석을 용이하게 하고 이 데이터로 학습된 AI 모델은 다음과 같은 의료 데이터 표준을 엄격하게 준수합니다. HL7.

XML, JSON, YAML 비교하기

최신 AI 스택에서 XML이 어디에 적합한지 이해하려면 XML을 다른 데이터 직렬화 형식과 구별하는 것이 도움이 됩니다. Ultralytics 용어집을 참조하세요:

  • XML 대 JSON(JavaScript 객체 표기법): JSON은 더 가볍고 장황하지 않으며 구문 분석이 빨라 웹 API와 간단한 데이터 전송을 위한 표준으로 사용됩니다. 그러나 XML은 스키마와 네임스페이스를 지원하므로 복잡한 문서 중심 데이터에 대해 더 강력한 유효성 검사를 제공합니다.
  • XML 대 YAML: YAML은 사람의 가독성을 우선시하며 가독성을 우선시하며 모델 구성의 표준입니다. YAML은 들여쓰기에 의존하는 반면, XML은 명시적인 열기 및 닫기 태그를 사용합니다. XML은 다음과 같은 경우에 자주 사용됩니다. 기계 간 유효성 검사가 사람의 편집 가능성보다 더 중요한 경우.

컴퓨터 비전용 XML 구문 분석

레거시 데이터 세트나 특정 훈련 데이터 포맷으로 작업할 때 트레이닝 데이터 형식으로 작업할 때 개발자는 종종 XML을 파싱하여 XML을 파싱하여 레이블과 좌표를 추출해야 하는 경우가 많습니다. 다음 Python 예제는 원시 XML 문자열에서 바운딩 박스 정보를 추출하는 방법을 보여줌으로써 모델을 학습시키기 전에 일반적인 데이터 전처리 단계를 시뮬레이션합니다.

import xml.etree.ElementTree as ET

# Simulating a PASCAL VOC style XML annotation content
voc_xml_data = """
<annotation>
    <object>
        <name>person</name>
        <bndbox>
            <xmin>50</xmin>
            <ymin>30</ymin>
            <xmax>200</xmax>
            <ymax>400</ymax>
        </bndbox>
    </object>
</annotation>
"""

# Parse the XML data
root = ET.fromstring(voc_xml_data)

# Extract label and coordinates for object detection
for obj in root.findall("object"):
    label = obj.find("name").text
    bbox = obj.find("bndbox")
    coords = [int(bbox.find(tag).text) for tag in ["xmin", "ymin", "xmax", "ymax"]]

    print(f"Class: {label}, Box: {coords}")
    # Output: Class: person, Box: [50, 30, 200, 400]

이 구문 분석 로직은 기존 XML 기반 데이터 세트를 현대의 최신 형식으로 변환할 때 기본이 됩니다. 이러한 구조를 이해하면 실무자는 방대한 오픈 소스 데이터 아카이브의 오픈 소스 데이터세트를 효과적으로 활용할 수 있습니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기