مسرد المصطلحات

آلة دعم المتجهات الداعمة (SVM)

اكتشف قوة آلات المتجهات الداعمة (SVMs) للتصنيف والانحدار واكتشاف الحالات الشاذة، مع تطبيقات ورؤى من العالم الحقيقي.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

آلة دعم المتجهات الداعمة (SVM) هي خوارزمية شائعة وقوية للتعلم الآلي الخاضع للإشراف (ML) تُستخدم بشكل أساسي في مهام التصنيف، على الرغم من أنها فعالة أيضًا في الانحدار (انحدار متجه الدعم - SVR) واكتشاف الحالات المتطرفة. تعمل SVMs، التي تم تطويرها في تسعينيات القرن العشرين، والتي تم تفصيلها على ويكيبيديا، من خلال إيجاد حد أمثل، يسمى المستوى الفائق، والذي يفصل بشكل أفضل بين نقاط البيانات التي تنتمي إلى فئات مختلفة في فضاء عالي الأبعاد. تكمن الفكرة الرئيسية في تعظيم الهامش - أي المسافة بين المستوى الفائق وأقرب نقاط البيانات (متجهات الدعم) من كل فئة - مما يؤدي غالبًا إلى أداء تعميم جيد على البيانات غير المرئية.

كيف يعمل Svm

يتمثل المبدأ الأساسي للإدارة الصوتية المغناطيسية التفاعلية في إيجاد المستوى الفائق المثالي لتقسيم مجموعة البيانات. بالنسبة للبيانات التي يمكن فصلها بخط مستقيم أو مستوى مستوٍ (البيانات القابلة للفصل الخطي)، تحدد SVM المستوى الفائق الذي يخلق أكبر فجوة ممكنة بين الفئات. تُعرف نقاط البيانات من بيانات التدريب الأقرب إلى هذا المستوى الفائق، والتي تعتبر حاسمة في تحديد موضعه واتجاهه، باسم متجهات الدعم. هذا التركيز على النقاط الأكثر تحديًا بالقرب من الحدود يجعل SVMs فعالة من حيث الذاكرة، حيث إن متجهات الدعم هذه فقط هي المطلوبة لتحديد النموذج بعد التدريب.

بالنسبة لمجموعات البيانات التي لا يمكن فيها الفصل بين الفئات بحدود خطية (بيانات غير قابلة للفصل الخطي)، تستخدم الآلات الجبرية التكرارية الخاصة SVMs تقنية تسمى خدعة النواة. تسمح هذه الطريقة الذكية لآلات SVMs بتعيين البيانات الأصلية في فضاء ذي أبعاد أعلى حيث يمكن الفصل الخطي دون حساب الإحداثيات في هذا الفضاء الجديد بشكل صريح. تتضمن دوال النواة الشائعة ما يلي:

  • خطي: للبيانات القابلة للفصل الخطي.
  • كثيرة الحدود: ينقل البيانات إلى أبعاد أعلى باستخدام دوال كثيرة الحدود.
  • دالة الأساس الشعاعي (RBF): خيار شائع للعلاقات المعقدة وغير الخطية.
  • سيني: تشبه دالة التنشيط المستخدمة في الشبكات العصبية (NN).

يُعد اختيار النواة ومعلماتها أمرًا بالغ الأهمية، وغالبًا ما يتطلب ضبطًا دقيقًا للمعامل الفائق.

الملاءمة والتطبيقات

تظل SVMs ذات أهمية على الرغم من ظهور التعلّم العميق (DL)، لا سيما في السيناريوهات ذات البيانات عالية الأبعاد (العديد من الميزات) ولكن عينات التدريب محدودة. وهي معروفة بضماناتها النظرية وقوتها، خاصةً عند وجود هامش واضح للفصل. من الناحية التاريخية، كانت الآلات الكهروضوئية المغناطيسية SVMs مقترنة بمستخرجات الميزات مثل مخطط التدرجات الموجّهة (HOG) هي الأحدث في مهام مثل اكتشاف الأجسام، كما هو مذكور في تطور اكتشاف الأجسام.

تشمل التطبيقات الشائعة ما يلي:

  • تصنيف الصور: تصنيف الصور بناءً على محتواها (على سبيل المثال، التمييز بين أنواع مختلفة من الزهور أو الحيوانات). يمكن أن تكون SVMs فعالة عند استخدامها مع السمات المصنوعة يدويًا المستخرجة من الصور، خاصةً على مجموعات البيانات ذات الحجم المتوسط.
  • تصنيف النصوص: تصنيف المستندات النصية إلى فئات محددة مسبقًا، مثل الكشف عن البريد الإلكتروني غير المرغوب فيه أو تحليل مشاعر العملاء. تتعامل SVMs مع البيانات النصية عالية الأبعاد (مثل ميزات TF) بشكل جيد.
  • المعلوماتية الحيوية: تُستخدم لمهام مثل تصنيف البروتين أو تشخيص السرطان استنادًا إلى بيانات التعبير الجيني، حيث يمكن أن يكون عدد الميزات كبيرًا جدًا مقارنة بعدد العينات.
  • التعرف على الوجه: التعرف على الأفراد أو التحقق من هويتهم بناءً على ملامح الوجه، وغالباً ما يكون ذلك جزءاً من نظام أكبر.

المزايا والقيود

المزايا:

  • فعال في الأبعاد العالية: يؤدي بشكل جيد حتى عندما يكون عدد الميزات أكبر من عدد العينات.
  • كفاءة الذاكرة: يستخدم فقط مجموعة فرعية من نقاط التدريب (متجهات الدعم) في دالة القرار.
  • متعدد الاستخدامات: يمكن تحديد دوال نواة مختلفة لدالة القرار، مما يتيح المرونة في التعامل مع أنواع البيانات المختلفة.
  • التعميم الجيد: غالبًا ما يؤدي هدف تعظيم الهامش إلى نماذج ذات دقة جيدة على البيانات غير المرئية.

القيود:

  • مكثف حسابيًا: يمكن أن يكون التدريب بطيئًا على مجموعات بيانات كبيرة جدًا.
  • حساسية النواة والمعلمة: يعتمد الأداء بشكل كبير على اختيار النواة ومعلماتها (على سبيل المثال، C، ج، جاما)، مما يتطلب ضبطًا دقيقًا.
  • أداء ضعيف مع الفئات المتداخلة: ليس مثاليًا إذا كانت فئات البيانات متداخلة بشكل كبير.
  • لا توجد تقديرات احتمالية مباشرة: تنتج SVMs القياسية تعيينات للفئات ولكن ليس درجات احتمالية مباشرة. هناك حاجة إلى تقنيات مثل مقياس بلات لمعايرة مخرجات الآلة الجبرية الاجتهادية الخاصة إلى احتمالات.

Svm مقابل الخوارزميات الأخرى

بالمقارنة مع خوارزميات أبسط مثل الانحدار اللوجستي، تهدف SVMs إلى تعظيم الهامش بدلاً من مجرد إيجاد حد فاصل، مما قد يؤدي إلى تعميم أفضل. على عكس الأساليب القائمة على الأشجار مثل أشجار القرار أو الغابات العشوائية، تقوم SVMs ببناء مستوى فائق واحد مثالي (ربما في فضاء عالي الأبعاد). بينما نماذج التعلم العميق الحديثة مثل Ultralytics YOLO تتفوق في الاستخراج التلقائي للميزات من البيانات الأولية (مثل وحدات البكسل في الرؤية الحاسوبية)، فإن الآلات الكهروضوئية المغناطيسية المغناطيسية غالباً ما تتطلب هندسة ميزات دقيقة ولكن يمكنها أن تؤدي بشكل جيد للغاية على مجموعات بيانات أصغر أو أنواع محددة من البيانات المنظمة حيث تكون الميزات محددة بشكل جيد. تشمل التطبيقات الشائعة LibSVM ووحدة SVM في scikit-learn. يمكن تبسيط تدريب وإدارة مثل هذه النماذج، إلى جانب نماذج أخرى مختلفة، باستخدام منصات مثل Ultralytics HUB، التي تبسّط دورة حياة MLOps.

قراءة الكل