مسرد المصطلحات

XML

اكتشف كيف يعمل XML على تشغيل الذكاء الاصطناعي والتعلم الآلي من خلال شرح البيانات وتكوينها وتبادلها. تعرّف على هيكلها واستخداماتها وتطبيقاتها الواقعية!

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

XML، أو لغة الترميز القابلة للتوسيع، هي لغة ترميز متعددة الاستخدامات أنشأها اتحاد شبكة الويب العالمية (W3C ) لترميز المستندات بطريقة يمكن للإنسان قراءتها وقراءتها آليًا. على عكس HTML، الذي يركز على كيفية عرض البيانات، فإن الدور الأساسي لـ XML هو وصف البيانات وتخزينها ونقلها، مع التركيز على ماهية البيانات. إن صيغته المهيكلة ذاتية الوصف تجعله مناسبًا للغاية لتبادل المعلومات بين الأنظمة والتطبيقات المختلفة، بما في ذلك تلك المستخدمة في الذكاء الاصطناعي والتعلم الآلي. يعد فهم XML مفيدًا لأي شخص يعمل مع مجموعات بيانات متنوعة أو يدمج أدوات مختلفة ضمن خط أنابيب التعلم الآلي.

فهم بنية XML

ينظم XML البيانات باستخدام علامات محاطة بأقواس زوايا (< >). تحدد هذه العلامات العناصر، وهي لبنات البناء الأساسية التي تمثل هياكل البيانات. يمكن أن تحتوي العناصر على بيانات نصية أو عناصر أخرى متداخلة أو مزيج من العناصر، مما يشكل بنية هرمية شبيهة بالشجرة. يمكن أن تحتوي العلامات أيضًا على سمات، والتي توفر بيانات وصفية إضافية حول العنصر. على سبيل المثال، قد يبدو ملف XML الذي يصف بيانات الكتاب كما يلي <book category="fiction"><title>Example Novel</title><author>Jane Doe</author></book>. تسمح هذه البنية الصريحة، رغم أنها في بعض الأحيان أكثر إسهابًا من التنسيقات الأخرى، بالتحقق الصارم من صحة المخططات مثل XSD (تعريف مخطط XML)، مما يضمن اتساق البيانات وهو أمر بالغ الأهمية في المعالجة المسبقة للبيانات المراحل.

الملاءمة في الذكاء الاصطناعي والتعلم الآلي

في حين أن التنسيقات الأحدث مثل JSON و YAML تحظى بشعبية متزايدة في بعض المهام نظرًا لإيجازها، إلا أن XML لا تزال ذات صلة في العديد من المجالات الرئيسية للذكاء الاصطناعي والتعلم الآلي:

XML مقابل التنسيقات ذات الصلة

من المفيد التمييز بين XML وتنسيقات تسلسل البيانات الشائعة الأخرى:

  • JSON (تدوين كائنات JavaScript): بالمقارنة مع بناء الجملة المستند إلى علامات XML، يستخدم JSON بنية زوج مفاتيح وقيمة أخف مشتقة من كائنات JavaScript. وهي بشكل عام أقل إسهابًا وغالبًا ما تكون أسهل لتطبيقات الويب وواجهات برمجة التطبيقات. راجع معيار JSON الرسمي للحصول على التفاصيل. بينما يحتوي XML على دعم مدمج لمساحات الأسماء والمخططات، يعتمد JSON عادةً على اصطلاحات خارجية للتحقق من الصحة.
  • YAML (لغة ترميز YAML): تعطي YAML الأولوية لسهولة القراءة البشرية، باستخدام المسافة البادئة للدلالة على البنية بدلاً من العلامات أو الأقواس. تُستخدم بشكل متكرر لملفات التكوين في مشاريع تعلّم الآلة (بما في ذلك Ultralytics YOLO ) وأدوات البنية التحتية كأكواد مثل Kubernetes. استكشف مواصفات YAML لمزيد من المعلومات.

تطبيقات العالم الحقيقي ل XML في الذكاء الاصطناعي/التعلم الآلي

  1. مجموعة بيانات فئات الكائنات المرئية (VOC) PASCAL: مجموعة بيانات الكشف عن الكائنات المؤثرة هذه، التي تُستخدم على نطاق واسع لقياس نماذج مثل YOLOv8 و YOLO11تستخدم ملفات XML لتعليقاتها التوضيحية. يتوافق كل ملف XML مع صورة ويحتوي على معلومات حول مصدر الصورة وحجمها وتفاصيل كل كائن مشروح، بما في ذلك تسمية فئته (على سبيل المثال، "سيارة" و"شخص") وإحداثيات المربع المحيط (xmin، ymin، xmax، ymax). يمكنك العثور على التفاصيل على موقع PASCAL VOC الرسمي على الويب ومعرفة كيفية استخدامه مع نماذج Ultralytics في وثائق مجموعة بيانات VOC. يمكن لمنصات مثل Ultralytics HUB المساعدة في إدارة مجموعات البيانات هذه لتدريب النماذج المخصصة.
  2. البيانات الوصفية للتصوير الطبي (DICOM): إن معيار DICOM (التصوير الرقمي والاتصالات في الطب) منتشر في كل مكان في مجال الرعاية الصحية لتخزين ونقل الصور الطبية. في حين أن DICOM نفسه هو تنسيق ثنائي، إلا أن XML يُستخدم عادةً لتمثيل البيانات الوصفية الشاملة المرتبطة بهذه الصور، مثل معلومات المريض ومعلمات الحصول على الصور ونتائج التشخيص. هذه البيانات الوصفية المنظمة ضرورية للمهام في تحليل الصور الطبية، مما يمكّن الباحثين والأطباء من تصفية مجموعات البيانات، وتدريب نماذج الذكاء الاصطناعي التشخيصية(الذكاء الاصطناعي في الأشعة)، وضمان إمكانية التتبع في تطبيقات الرعاية الصحية القائمة على الذكاء الاصطناعي.

باختصار، على الرغم من أن تنسيق XML ليس دائمًا التنسيق الأكثر إيجازًا، إلا أن طبيعته المنظمة وقابليته للتوسعة وقدرات التحقق القوية تضمن استمرار دوره في مجالات محددة من الذكاء الاصطناعي وتعلم الآلة، خاصة في معايير التعليقات التوضيحية للبيانات، وتنسيقات تبادل النماذج مثل PMML، وتكامل بيانات المؤسسة. إن الإلمام بتنسيق XML له قيمة كبيرة في التنقل بين مصادر البيانات المتنوعة والأدوات في هذا المجال.

قراءة الكل