آلة المتجهات الداعمة (SVM)
اكتشف قوة آلات المتجهات الداعمة (SVMs) للتصنيف والانحدار واكتشاف القيم المتطرفة، مع تطبيقات ورؤى واقعية.
آلة دعم المتجهات المساندة (SVM) هي خوارزمية قوية ومتعددة الاستخدامات
خوارزمية تعليمية قوية ومتعددة الاستخدامات
لتصنيف الصور ومهام الانحدار.
وخلافاً لبعض الخوارزميات التي تقوم فقط بمطابقة خط مع البيانات، تبحث آلة SVM عن المستوى الفائق الأمثل - أي القرار
الذي يفصل نقاط البيانات بشكل أفضل إلى فئات مختلفة. السمة المميزة لآلة SVM هي تركيزها على
على تعظيم الهامش، وهو المسافة بين حد القرار وأقرب نقاط البيانات من كل فئة.
فئة. من خلال إعطاء الأولوية لهذا الفصل الواسع، يحقق النموذج تعميمًا أفضل على البيانات غير المرئية، مما يقلل بشكل فعال
مما يقلل بشكل فعال من خطر الإفراط في التعميم مقارنةً بالمصنفات
مصنفات خطية أبسط.
الآليات الأساسية لآلية SVM
لفهم كيفية عمل الآلة الكهروضوئية الجبرية التكرارية الخاصة، من المفيد تصوّر نقاط البيانات المرسومة في فضاء متعدد الأبعاد حيث
حيث يمثل كل بُعد سمة أو خاصية معينة.
-
المستوى الأعلى الأمثل: تحدد الخوارزمية مستوى يقسم فضاء متغير المدخلات. في بُعدين
بعدين، يكون هذا خطًا مستقيمًا، وفي ثلاثة أبعاد، مستوى مسطح، وفي الأبعاد الأعلى، مستوى متجاوز. الهدف هو
إيجاد المستوى الفائق المحدد الذي يحافظ على أقصى مسافة من أقرب نقاط البيانات لأي فئة.
-
متجهات الدعم: هذه هي نقاط البيانات المحددة التي تقع الأقرب إلى حدود القرار. وهي
وتسمى "متجهات الدعم" لأنها تدعم أو تحدد بشكل أساسي اتجاه وموقع
المستوى الفائق وموضعه. إذا قمت بإزالة نقاط البيانات الأخرى، تظل الحدود كما هي، ولكن تحريك متجه الدعم يغير
النموذج. بإمكانك قراءة المزيد عن هذه المتجهات في
وثائق Scikit-learn SVM.
-
خدعة النواة: نادرًا ما تكون بيانات العالم الحقيقي قابلة للفصل الخطي. تحل SVMs هذه المشكلة باستخدام تقنية
تسمى خدعة النواة، والتي تُسقط البيانات في فضاءٍ ذي أبعادٍ أعلى حيث يقسم الفاصل الخطي بشكل فعال
يقسم الفصول بشكل فعال. تتضمن النوى الشائعة دالة الأساس الشعاعي (RBF) والنوى متعددة الحدود، مما يسمح للنموذج
النموذج بالتعامل مع العلاقات المعقدة وغير الخطية التي غالبًا ما توجد في
معالجة اللغة الطبيعية (NLP)
المهام.
تطبيقات واقعية
قبل ظهور
الحديثة للتعلم العميق، كانت SVMs هي المعيار الذهبي
المعيار الذهبي للعديد من مشاكل الرؤية الحاسوبية
ومشاكل التعرف على الأنماط.
-
المعلوماتية الحيوية والرعاية الصحية: تلعب الآلات الكهروضوئية الجذعية دورًا حاسمًا في
الذكاء الاصطناعي في الرعاية الصحية، خاصة في
مشاكل التصنيف مثل الكشف عن التماثل البروتيني عن بُعد وتصنيف السرطان بناءً على بيانات
المجهرية. قدرتها على التعامل مع البيانات عالية الأبعاد مع عدد قليل من العينات يجعلها مثالية لتحليل
مجموعات البيانات البيولوجية المعقدة.
-
تصنيف النصوص: في مجال
تحليلات البيانات، تُستخدم الآلات الكهروضوئية الجبرية التكرارية على نطاق واسع لتصنيف النصوص
وتصنيف النصوص والنصوص التشعبية. فهي تقلل بشكل كبير من الحاجة إلى حالات التدريب الموسومة في إعدادات تصنيف النصوص الاستقرائية القياسية
في إعدادات تصنيف النصوص الاستقرائية القياسية، مما يجعلها فعالة في تطبيقات مثل الكشف عن الرسائل غير المرغوب فيها وتحليل المشاعر
وتحليل المشاعر.
-
التعرف على خط اليد: لقد كان أداء الآلات الكهروضوئية الجبرية التحويلية SVMs تاريخيًا جيدًا بشكل استثنائي في
مثل تلك الموجودة في مجموعة بيانات
مجموعة بياناتMNIST . بينما
الشبكات العصبية التلافيفية (CNNs)
إلى حد كبير، تظل SVMs ذات صلة بالقياس المرجعي والحالات ذات
بيانات التدريب.
تنفيذ مصنف SVM
في حين أن المهام الحديثة غالبًا ما تستخدم
Ultralytics YOLO11 نموذج للكشف عن الكائنات من البداية إلى النهاية,
تظل SVMs أداةً قوية للبيانات المهيكلة أو كطبقة تصنيف نهائية فوق الميزات المستخرجة. فيما يلي
مثال موجز باستخدام scikit-learn مكتبة لتدريب مصنف بسيط.
from sklearn import svm
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
# Generate synthetic classification data
X, y = make_classification(n_features=4, random_state=0)
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)
# Initialize and train the Support Vector Classifier
clf = svm.SVC(kernel="linear", C=1.0)
clf.fit(X_train, y_train)
# Display the accuracy on the test set
print(f"Accuracy: {clf.score(X_test, y_test):.2f}")
SVM مقابل الخوارزميات ذات الصلة
يساعد تمييز SVM عن تقنيات التعلّم الآلي الأخرى في اختيار الأداة المناسبة لمشروع النمذجة التنبؤية
مشروع النمذجة التنبؤية.
-
الانحدار اللوجستي: كلاهما مصنفان خطيان، ولكن تختلف أهدافهما التحسينية. فالانحدار اللوجستي يزيد من احتمالية
للبيانات المرصودة (الاحتمالية)، في حين أن SVM يزيد الهامش الهندسي بين الفئات. عادةً ما تكون SVMs أكثر
فعالية عندما تكون الفئات منفصلة بشكل جيد، بينما يوفر الانحدار اللوجستي احتمالات معايرة.
-
K-أقرب الجيران (KNN): KNN هو متعلم غير بارامترى قائم على المثيل يصنف نقطة ما بناءً على فئة الأغلبية من
جيرانها. على النقيض من ذلك، فإن SVM هو نموذج بارامترى يتعلم حدودًا عالمية. تقدم SVMs عمومًا زمنًا أسرع
زمن استنتاج أسرع بمجرد التدريب، حيث أنها لا تحتاج
تحتاج إلى تخزين مجموعة البيانات بأكملها، على عكس KNN.
-
أشجار القرار: تقسم شجرة القرار مساحة البيانات إلى مناطق مستطيلة باستخدام قواعد هرمية. يمكن أن تنشئ SVMs حدود قرار معقدة,
حدود قرار معقدة ومنحنية (عن طريق النواة) قد تكافح أشجار القرار لتقريبها دون أن تصبح عميقة بشكل مفرط
عميقة للغاية وعرضة للإفراط في التركيب.
-
التعلم العميق (على سبيل المثال، YOLO11): تعتمد SVMs بشكل كبير على
هندسة الميزات، حيث يقوم خبراء المجال
باختيار المدخلات ذات الصلة. النماذج الحديثة مثل YOLO11 تتفوق في
الاستخراج التلقائي للميزات مباشرةً من
الخام مباشرة، مما يجعلها متفوقة في المهام المعقدة مثل
اكتشاف الأجسام في الوقت الحقيقي
وتجزئة المثيل.
بالنسبة للمهتمين بالنظرية التأسيسية، فإن الورقة الأصلية التي كتبها
كورتيس وفابنيك (1995) الأساس الرياضي
الرياضية لآلات SVMs ذات الهامش اللين المستخدمة اليوم.