YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

XML

データアノテーション、構成、交換におけるXMLによるAIとMLの強化について解説します。その構造、用途、および実際のアプリケーションについて学びましょう。

XML(eXtensible Markup Language)は、人間と機械の両方が判読できる形式でドキュメントをエンコードするための、汎用性が高く広く使用されているマークアップ言語です。World Wide Web Consortium(W3C)によって開発され、その主な目的は、データを表示することではなく、保存および転送することです。HTMLのような他のマークアップ言語とは異なり、XMLではユーザーが独自のタグを定義できるため、自己記述的なデータ構造を柔軟に作成できます。この拡張性により、機械学習(ML)やその他のデータ集約型分野におけるさまざまなシステムやプラットフォーム間でのデータ交換の基盤技術となっています。

AIおよび機械学習におけるXML

人工知能(AI)およびコンピュータビジョン(CV)の分野において、XMLはデータ表現と構成において重要な役割を果たします。その構造化された階層形式は、高度なモデルをトレーニングするために必要な複雑なアノテーションを定義するのに理想的です。最新のアプリケーションでは、より軽量な形式が好まれることが多いですが、XMLの堅牢性と厳格な検証機能(多くの場合、XML Schema Definition(XSD)などのスキーマを通じて適用されます)により、特定の標準ベースのタスクには不可欠です。主な用途には、データアノテーション、モデル構成、および異なるプラットフォーム間でのモデルデプロイメントを可能にするPredictive Model Markup Language(PMML)などのモデル交換形式が含まれます。

AI/MLにおけるXMLの実世界での応用

XMLの構造化された性質は、標準化されたデータセットとメタデータを作成するための信頼できる選択肢となります。2つの代表的な例を以下に示します。

  1. PASCAL Visual Object Classes (VOC)データセット: YOLOv8YOLO11などのモデルのベンチマークに広く使用されているこの影響力のある物体検出データセットは、アノテーションにXMLファイルを使用しています。各XMLファイルは画像に対応し、画像のソース、サイズ、およびアノテーションされた各オブジェクトの詳細(クラスラベル(例:「車」、「人」)やバウンディングボックスの座標など)に関する情報が含まれています。公式PASCAL VOCウェブサイトで詳細を確認したり、VOCデータセットのドキュメントでUltralyticsモデルでの使用方法を学ぶことができます。Ultralytics HUBのようなプラットフォームは、カスタムモデルのトレーニングのためにこのようなデータセットを管理するのに役立ちます。
  2. 医用画像メタデータ(DICOM):DICOM(医療用デジタル画像通信)規格は、医療画像の保存と伝送のために医療現場で広く普及しています。DICOM自体はバイナリ形式ですが、XMLは、患者情報、取得パラメータ、診断結果など、これらの画像に関連付けられた広範なメタデータを表現するために一般的に使用されます。この構造化されたメタデータは、医用画像解析のタスクに不可欠であり、研究者や臨床医がデータセットをフィルタリングし、診断AIモデルをトレーニングし、AIヘルスケアアプリケーションにおけるトレーサビリティを確保できるようにします。

XMLと他の形式との比較

XMLは強力ですが、他のデータシリアライゼーション形式との比較を理解することが重要です。

  • JSON(JavaScript Object Notation): JSONは、軽量な構文と解析の容易さにより、WebアプリケーションおよびAPIでXMLに大きく取って代わりました。JSONは、終了タグを使用しないため、XMLよりも冗長ではありません。XMLは構造化されたドキュメントに最適ですが、JSONは最新のシステムでのデータ交換によく使用されます。
  • YAML (YAML Ain't Markup Language): YAMLは、人間の可読性を優先し、インデントを使用してデータ構造を表します。そのため、Ultralytics YOLOモデル構成など、AI/MLプロジェクトの設定ファイルとして広く利用されています。XMLはより冗長ですが、タグベースの構造は、厳密な検証が必要な複雑なネストされたデータに対してより明示的になります。

まとめると、必ずしも最も簡潔な形式ではありませんが、XMLの構造化された性質、拡張性、および堅牢な検証機能により、特にデータアノテーション、モデル交換形式、およびエンタープライズデータ統合において、AIおよびMLの特定の分野での役割が継続されます。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました