Yolo 深圳
深セン
今すぐ参加
用語集

XML

データアノテーション、構成、交換におけるXMLによるAIとMLの強化について解説します。その構造、用途、および実際のアプリケーションについて学びましょう。

一般にXMLとして知られているExtensible Markup Language(拡張可能マークアップ言語)は、多様なコンピューティング・システム間でデータを保存、整理、転送するために使われる、柔軟なテキスト・ベースのフォーマットである。 多様なコンピューティング・システム間でデータを転送するために使用される、柔軟なテキストベースのフォーマットである。データがどのように表示されるかに重点を置くHTMLとは異なり、XMLはデータが何であるかを記述するように設計されている。 は、カスタム・タグの階層構造を利用して要素と属性を定義し、データとは何かを記述するように設計されています。この この機能により、XMLはデータ交換と構成管理のための永続的な標準となっている。急速に進化する 機械学習(ML)の分野では、XMLは複雑なデータセットを構造化するための重要なフォーマットであり続けている。 は、複雑なデータセットを構造化するための重要なフォーマットであり続けている。 W3C(ワールド・ワイド・ウェブ・コンソーシアム)によって定義されています。

人工知能におけるXMLの役割

人工知能(AI)の領域では 人工知能(AI)の領域では データは、洗練されたアルゴリズムに力を与える燃料である。XMLは データ注釈のための堅牢なフレームワークを提供する。 エンジニアは、画像やテキストなどの生の情報を、豊富で説明的なメタデータでカプセル化することができます。この構造化されたアプローチは この構造されたアプローチは、モデルがパターンを学習するために モデルがパターンを学習するためには、ラベル付けされた例が必要です。最近のワークフローでは、軽量なフォーマットを利用することが多くなっているが、XMLの冗長性と厳密な構文がデータ XMLの冗長性と厳密な構文はデータの完全性を保証するため、レガシーシステム、エンタープライズ 統合、および特定の コンピュータビジョンタスクに適しています。

AIと機械学習の実世界での応用

XMLは、特にデータの標準化と相互運用性が最重要視される、いくつかの実用的なアプリケーションで役立っている。 が最も重要である。

  • 物体検出データセット(PASCALVOC):コンピュータビジョンにおけるXMLの最も顕著な用途の1つに、PASCAL Visual Object Classes(VOC)フォーマットがある。 PASCAL Visual Object Classes (VOC)形式である。この この規格では、データセットの各画像は、注釈の詳細を含むXMLファイルと対になっています。これらのファイルは バウンディングボックス座標(xmin, ymin, xmax, ymax) と各オブジェクトのクラスラベルを定義する。モデル YOLO11のようなモデルは YOLO11のようなモデルは、これらの注釈(多くの場合、txtに変換される)を利用して、オブジェクトを識別して位置を特定する方法を学習することができる。 学習することができる。
  • メディカルイメージングとヘルスケア医療 医療におけるAIは相互運用性が重要である。 医療用スキャンに普遍的に使用されているDICOM(Digital Imaging and Communications in Medicine)標準、 は、複雑なメタデータを扱うために、XMLとのインターフェースを頻繁に使用している。XMLは XMLは、患者データ、検査パラメータ、診断結果の構造化された報告を可能にし、医用画像解析を容易にし、以下のことを保証する。 医療画像解析を容易にし このデータでトレーニングされたAIモデルは、HL7などの医療データ標準に厳格に準拠しています。 HL7

XML、JSON、YAMLの比較

現代のAIスタックにおいてXMLがどのような位置づけにあるかを理解するためには、XMLを以下のような他のデータ・シリアライゼーション・フォーマットと区別することが役に立つ。 データシリアライゼーション形式と区別するのに役立つ。 Ultralytics 用語集に記載されています:

  • XMLとJSON(JavaScript Object Notation)の比較: JSONはより軽く、冗長でなく、解析が速いため、ウェブAPIや単純なデータ転送の標準となっている。 しかし、XMLはスキーマと名前空間をサポートしており、複雑なドキュメント中心のデータに対してより強力な検証を提供する。
  • XMLとYAMLの比較:YAMLは人間にとって読みやすく モデル設定の標準です。 Ultralytics モデル構成の標準です。 YAMLがインデントに依存するのに対して、XMLは明示的な開始タグと終了タグに依存します。XMLは XMLは人間の編集可能性よりも機械対機械の検証がより重要な場合によく使われます。

コンピュータ・ビジョンのためのXML解析

レガシーデータセットや特定の 使用する場合、開発者はしばしばXMLを解析してラベルや座標を抽出する必要がある。 XMLを解析してラベルと座標を抽出する必要があります。次のPython サンプルは、XML文字列からバウンディングボックス(bounding box)情報を抽出する方法を示しています。 情報を抽出する方法を示します。モデルをトレーニングする前の典型的なデータ前処理をシミュレートしています。

import xml.etree.ElementTree as ET

# Simulating a PASCAL VOC style XML annotation content
voc_xml_data = """
<annotation>
    <object>
        <name>person</name>
        <bndbox>
            <xmin>50</xmin>
            <ymin>30</ymin>
            <xmax>200</xmax>
            <ymax>400</ymax>
        </bndbox>
    </object>
</annotation>
"""

# Parse the XML data
root = ET.fromstring(voc_xml_data)

# Extract label and coordinates for object detection
for obj in root.findall("object"):
    label = obj.find("name").text
    bbox = obj.find("bndbox")
    coords = [int(bbox.find(tag).text) for tag in ["xmin", "ymin", "xmax", "ymax"]]

    print(f"Class: {label}, Box: {coords}")
    # Output: Class: person, Box: [50, 30, 200, 400]

この構文解析ロジックは、既存のXMLベースのデータセットを最新の YOLO アーキテクチャと互換性のある形式に変換する際の基本である。これらの構造を理解することで 実務者は、膨大なオープンソースデータセットのアーカイブを オープンソースのデータセットを効果的に活用することができる。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加