Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024
Bảng chú giải thuật ngữ

XML

Khám phá cách XML cung cấp sức mạnh cho AI và ML với chú thích, cấu hình và trao đổi dữ liệu. Tìm hiểu cấu trúc, cách sử dụng và các ứng dụng thực tế của nó!

XML (eXtensible Markup Language) là một ngôn ngữ đánh dấu linh hoạt và được sử dụng rộng rãi để mã hóa tài liệu ở định dạng mà cả con người và máy móc đều có thể đọc được. Được phát triển bởi World Wide Web Consortium (W3C), mục đích chính của nó là lưu trữ và truyền tải dữ liệu, chứ không phải hiển thị dữ liệu. Không giống như các ngôn ngữ đánh dấu khác như HTML, XML cho phép người dùng tự định nghĩa các thẻ, làm cho nó có tính linh hoạt cao trong việc tạo cấu trúc dữ liệu tự mô tả. Tính mở rộng này làm cho nó trở thành một công nghệ nền tảng cho việc trao đổi dữ liệu giữa các hệ thống và nền tảng khác nhau trong Học Máy (ML) và các lĩnh vực thâm dụng dữ liệu khác.

XML trong AI và Học Máy

Trong bối cảnh Trí tuệ nhân tạo (AI)Thị giác máy tính (CV), XML đóng một vai trò quan trọng trong việc biểu diễn và cấu hình dữ liệu. Định dạng phân cấp, có cấu trúc của nó rất lý tưởng để xác định các chú thích phức tạp cần thiết để huấn luyện các mô hình phức tạp. Mặc dù các ứng dụng hiện đại thường ưu tiên các định dạng nhẹ hơn, nhưng tính mạnh mẽ và khả năng validation nghiêm ngặt của XML, thường được thực thi thông qua các lược đồ như Định nghĩa lược đồ XML (XSD), khiến nó trở nên không thể thiếu đối với một số tác vụ dựa trên tiêu chuẩn. Các ứng dụng chính bao gồm chú thích dữ liệu, cấu hình mô hình và các định dạng trao đổi mô hình như Ngôn ngữ đánh dấu mô hình dự đoán (PMML), cho phép triển khai mô hình trên các nền tảng khác nhau.

Ứng dụng thực tế của XML trong AI/ML

Bản chất có cấu trúc của XML làm cho nó trở thành một lựa chọn đáng tin cậy để tạo ra các bộ dữ liệu và siêu dữ liệu tiêu chuẩn. Hai ví dụ nổi bật bao gồm:

  1. Bộ dữ liệu PASCAL Visual Object Classes (VOC): Bộ dữ liệu phát hiện đối tượng có ảnh hưởng này, được sử dụng rộng rãi để đánh giá các mô hình như YOLOv8YOLO11, sử dụng các tệp XML cho chú thích của nó. Mỗi tệp XML tương ứng với một hình ảnh và chứa thông tin về nguồn hình ảnh, kích thước và chi tiết cho từng đối tượng được chú thích, bao gồm nhãn lớp của nó (ví dụ: 'ô tô', 'người') và tọa độ khung giới hạn. Bạn có thể tìm thấy thông tin chi tiết trên trang web PASCAL VOC chính thức và tìm hiểu cách sử dụng nó với các mô hình Ultralytics trong tài liệu về bộ dữ liệu VOC. Các nền tảng như Ultralytics HUB có thể giúp quản lý các bộ dữ liệu như vậy để huấn luyện các mô hình tùy chỉnh.
  2. Siêu dữ liệu hình ảnh y tế (DICOM): Tiêu chuẩn DICOM (Hình ảnh kỹ thuật số và Truyền thông trong Y học) là phổ biến trong chăm sóc sức khỏe để lưu trữ và truyền tải hình ảnh y tế. Mặc dù bản thân DICOM là một định dạng nhị phân, XML thường được sử dụng để biểu diễn siêu dữ liệu mở rộng liên quan đến các hình ảnh này, chẳng hạn như thông tin bệnh nhân, các tham số thu thập và các phát hiện chẩn đoán. Siêu dữ liệu có cấu trúc này rất quan trọng đối với các tác vụ trong phân tích hình ảnh y tế, cho phép các nhà nghiên cứu và bác sĩ lâm sàng lọc các bộ dữ liệu, huấn luyện các mô hình AI chẩn đoán và đảm bảo khả năng truy xuất nguồn gốc trong các ứng dụng AI chăm sóc sức khỏe.

So sánh XML với các định dạng khác

Mặc dù XML rất mạnh mẽ, nhưng điều quan trọng là phải hiểu cách nó so sánh với các định dạng tuần tự hóa (serialization) dữ liệu khác:

  • JSON (JavaScript Object Notation): JSON phần lớn đã thay thế XML trong các ứng dụng web và API do cú pháp nhẹ và dễ phân tích cú pháp. JSON ít dài dòng hơn XML vì nó không sử dụng thẻ đóng. Mặc dù XML rất tuyệt vời cho các tài liệu có cấu trúc, nhưng JSON thường được ưu tiên để trao đổi dữ liệu trong các hệ thống hiện đại.
  • YAML (YAML Ain't Markup Language): YAML ưu tiên khả năng đọc của con người và sử dụng thụt lề để biểu diễn cấu trúc dữ liệu, làm cho nó trở thành một lựa chọn phổ biến cho các tệp cấu hình trong các dự án AI/ML, bao gồm cả cấu hình mô hình Ultralytics YOLO. XML dài dòng hơn nhưng cấu trúc dựa trên thẻ của nó có thể rõ ràng hơn cho dữ liệu lồng nhau, phức tạp, nơi cần xác thực nghiêm ngặt.

Tóm lại, mặc dù không phải lúc nào cũng là định dạng ngắn gọn nhất, nhưng bản chất có cấu trúc, khả năng mở rộng và khả năng validation mạnh mẽ của XML đảm bảo vai trò tiếp tục của nó trong các lĩnh vực cụ thể của AI và ML, đặc biệt là trong chú thích dữ liệu, định dạng trao đổi mô hình và tích hợp dữ liệu doanh nghiệp.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard