التعلّم الاتحادي
اكتشف التعلُّم المتحد: نهج ذكاء اصطناعي يركز على الخصوصية يتيح التدريب اللامركزي للنماذج عبر الأجهزة دون مشاركة البيانات الأولية.
التعلّم الاتحادي (FL) هو أسلوب للتعلّم الآلي (ML) يتيح تدريب النماذج عبر أجهزة أو خوادم لا مركزية متعددة تحتفظ بعينات بيانات محلية، دون تبادل البيانات نفسها. يعالج هذا النهج المخاوف الهامة المتعلقة بخصوصية البيانات وأمانها من خلال الاحتفاظ بالبيانات الأولية على جهاز المستخدم. فبدلاً من تجميع البيانات في خادم مركزي لتدريب النموذج، يعمل FL عن طريق إرسال نموذج عالمي إلى الأجهزة المحلية. يقوم كل جهاز بتدريب النموذج بالبيانات الخاصة به، ويتم إرسال تحديثات النموذج الناتجة فقط - التحسينات الصغيرة والمركزة - إلى خادم مركزي ليتم تجميعها. تعمل هذه العملية التعاونية على تحسين النموذج العالمي المشترك دون المساس بمعلومات المستخدم.
كيف يعمل التعلُّم الاتحادي
تتضمن عملية التعلم الموحد عادةً دورة متكررة من الخطوات التي ينظمها خادم تنسيق مركزي:
- توزيع النموذج: يقوم الخادم المركزي بتهيئة نموذج ذكاء اصطناعي عالمي، مثل الشبكة العصبية، وتوزيعه على مجموعة مختارة من أجهزة العميل (مثل الهواتف المحمولة أو أجهزة الكمبيوتر في المستشفيات).
- التدريب المحلي: يقوم كل جهاز عميل بتدريب النموذج على مجموعة البيانات المحلية الخاصة به. ونظراً لأن هذه البيانات لا تغادر الجهاز أبداً، فإنها تظل خاصة. هذا التدريب المحلي هو أحد المكونات الرئيسية للذكاء على الجهاز، وغالباً ما يرتبط بالذكاء الاصطناعي المتطور.
- إرسال التحديثات: بعد التدريب لبضع تكرارات، يرسل كل عميل تحديثات النموذج المحسوبة (مثل التدرجات أو أوزان النموذج) إلى الخادم المركزي. هذه حمولة أصغر بكثير وأكثر أمانًا من البيانات الأولية نفسها.
- التجميع الآمن: يقوم الخادم المركزي بتجميع التحديثات من جميع العملاء - على سبيل المثال، عن طريق حساب متوسطها - لتحسين النموذج العام. يمكن استخدام تقنيات مثل الحوسبة الآمنة متعددة الأطراف لضمان عدم قدرة الخادم على عكس التحديثات الفردية.
- تحسين النموذج: ثم يُعاد النموذج العالمي المحسّن إلى العملاء للجولة التالية من التدريب. تستمر هذه العملية التكرارية حتى يصل أداء النموذج إلى المستوى المطلوب من الدقة.
التطبيقات الواقعية
التعلم الموحد ليس مجرد مفهوم نظري؛ فهو يدعم العديد من التطبيقات السائدة ويحدث تحولاً في الصناعات التي تكون فيها حساسية البيانات ذات أهمية قصوى.
- تنبؤات لوحة المفاتيح الذكية: تستخدم شركات مثل Google FL لتحسين النص التنبؤي على لوحات مفاتيح الهاتف المحمول. يتعلم هاتفك من سجل الكتابة الخاص بك لاقتراح الكلمة التالية، وتتم مشاركة هذه المعلومات على شكل تحديثات نموذجية مجهولة الهوية لتحسين المحرك التنبؤي لجميع المستخدمين دون أن تغادر رسائلك الفعلية جهازك.
- الأبحاث الطبية التعاونية: يسمح FL للمستشفيات والمؤسسات البحثية بالتعاون في بناء نماذج تشخيصية قوية لمهام مثل تحليل الصور الطبية للكشف عن الأورام. يمكن لكل مستشفى تدريب نموذج مشترك على بيانات المرضى الخاصة به، والتي تحميها قوانين الخصوصية مثل قانون HIPAA، دون الكشف عن سجلات المرضى الحساسة للمؤسسات الأخرى أو مستودع مركزي. يتيح ذلك إنشاء نماذج أكثر قوة يتم تدريبها على مجموعات بيانات متنوعة.
التعلّم الاتحادي مقابل المفاهيم ذات الصلة
من المهم التمييز بين FL من نماذج التعلم الأخرى:
- التدريب المركزي: النهج التقليدي حيث يتم جمع جميع البيانات في مكان واحد للتدريب. أما FL فهو عكس ذلك تماماً، وهو مصمم خصيصاً لتجنب مركزية البيانات.
- التدريب الموزع: تستخدم هذه التقنية أيضًا آلات متعددة لتسريع التدريب، لكنها تفترض أن بيانات التدريب مخزنة في موقع مركزي ويمكن توزيعها بحرية بين عقد التدريب. على النقيض من ذلك، تعمل تقنية FL مع بيانات لا مركزية بطبيعتها ولا يمكن نقلها.
- التعلّم النشط: تركز هذه الطريقة على اختيار نقاط البيانات الأكثر إفادة بكفاءة ليتم تصنيفها لتقليل تكاليف التعليقات التوضيحية. بينما يتعامل التعلم النشط مع مكان التدريب، يتعامل التعلم النشط مع البيانات المستخدمة. يمكن الجمع بين الاثنين لتعزيز الخصوصية والكفاءة بشكل أكبر، كما هو موضح في هذه المدونة حول التعلم النشط.
التحديات وأطر العمل
على الرغم من مزاياه، يواجه نظام FL تحديات مثل ارتفاع تكاليف الاتصالات، وإدارة الأجهزة ذات القدرة الحاسوبية المتفاوتة(وحدةالمعالجة المركزية/وحدة معالجة الرسومات)، والتعامل مع البيانات غير الموزعة بشكل متماثل ومستقل (غير الموزعة بشكل متماثل ومستقل)، والتي يمكن أن تحرف النموذج. يمكن أن يكون النظام أيضًا عرضة للهجمات العدائية التي تستهدف تحديثات النموذج. ولمعالجة هذه التعقيدات، تم تطوير أطر عمل مثل TensorFlow Federated و PySyft من مؤسسات مثل OpenMined. ومع نضوج التكنولوجيا، تصبح إدارة نشر النموذج بأكمله ودورة حياة المراقبة أمراً بالغ الأهمية، وهي عملية مبسطة من خلال منصات مثل Ultralytics HUB.