مسرد المصطلحات

التعلّم الاتحادي

اكتشف التعلُّم المتحد: نهج ذكاء اصطناعي يركز على الخصوصية يتيح التدريب اللامركزي للنماذج عبر الأجهزة دون مشاركة البيانات الأولية.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

التعلُّم الاتحادي هو أسلوب للتعلُّم الآلي (ML) مصمم لتدريب الخوارزميات عبر أجهزة أو خوادم متعددة لامركزية متطورة تحتفظ بعينات بيانات محلية، دون تبادل البيانات الأولية نفسها. يعالج هذا النهج مباشرةً المخاوف الحرجة المتعلقة بخصوصية البيانات والأمان وحقوق الوصول إلى البيانات، مما يتيح التدريب التعاوني للنموذج باستخدام مجموعات البيانات التي لا يمكن أو لا ينبغي جمعها مركزياً. فبدلاً من جلب البيانات إلى نموذج مركزي، يجلب التعلم الموحد عملية تدريب النموذج إلى موقع البيانات، وغالباً ما تكون موجودة على أجهزة الذكاء الاصطناعي المتطورة مثل الهواتف الذكية أو خوادم المستشفيات. وهو يمثل تحولاً نحو ذكاء اصطناعي أكثر أماناً ووعياً بالخصوصية.

المفاهيم الأساسية للتعلم الاتحادي

يعمل التعلّم الاتحادي من خلال عملية تكرارية يتم تنسيقها عادةً بواسطة خادم مركزي أو منسق:

  1. التهيئة: يبدأ الخادم المركزي بنموذج عام أولي (على سبيل المثال، نموذج عام Ultralytics YOLOلاكتشاف الكائنات).
  2. التوزيع: يتم إرسال هذا النموذج العالمي إلى مجموعة مختارة من أجهزة العميل (مثل الهواتف المحمولة والخوادم المحلية).
  3. التدريب المحلي: يقوم كل جهاز عميل بتدريب النموذج المستلم باستخدام بياناته المحلية الخاصة به. نظرًا لأن هذه البيانات لا تغادر الجهاز أبدًا، يتم الحفاظ على الخصوصية. تستخدم هذه الخطوة الموارد الحاسوبية المحلية.
  4. تحديث الإرسال: بدلاً من إرسال البيانات الأولية، يرسل العملاء فقط معلمات النموذج المحدثةweights and biases) أو التدرجات المحسوبة إلى الخادم المركزي. يمكن تطبيق تقنيات مثل التجميع الآمن والخصوصية التفاضلية هنا لمزيد من الأمان.
  5. التجميع: يقوم الخادم المركزي بتجميع التحديثات الواردة من العملاء المشاركين (على سبيل المثال، عن طريق حساب متوسط الأوزان) لتحسين النموذج العالمي المشترك.
  6. التكرار: يتم تكرار الخطوات من 2 إلى 5 حتى يصل النموذج العالمي إلى مستوى الأداء المطلوب، وغالبًا ما يتم تقييمه باستخدام مقاييس قياسية تمت مناقشتها في أدلة مثل مقاييس أداءYOLO .

تسمح هذه العملية للنموذج العالمي بالتعلم من مجموعة واسعة ومتنوعة من البيانات الموزعة على العديد من المواقع دون المساس بخصوصية المستخدم. يمكنك استكشاف أبحاث وتطبيقات التعلّم الاتحادي لمزيد من المعلومات الأساسية.

التعلم الموحد مقابل التدريب الموزع التدريب الموزع

بينما يتضمن التعلم الموحد التدريب عبر أجهزة متعددة، إلا أنه يختلف بشكل كبير عن التدريب الموزع التقليدي:

  • توزيع البيانات: يفترض التدريب الموزّع عادةً أن البيانات يتم جمعها مركزيًا ثم توزيعها (غالبًا بشكل متماثل ومستقل، أو IID) عبر عقد داخل بيئة خاضعة للرقابة مثل مركز البيانات. يفترض التعلم الاتحادي بطبيعته أن البيانات لا مركزية منذ البداية وغالبًا ما تكون غير IID، مما يعكس اختلافات البيانات في العالم الحقيقي عبر المستخدمين أو المواقع.
  • الخصوصية: الحفاظ على الخصوصية هو هدف أساسي للتعلم الموحد. عادةً ما يكون الهدف الأساسي للتدريب الموزع هو قابلية التوسع والسرعة، مع تركيز أقل على خصوصية البيانات أثناء عملية التدريب نفسها.
  • الشبكة والأجهزة: يجب أن يتعامل التعليم الموحد مع اتصالات الشبكة غير الموثوقة وقدرات الأجهزة غير المتجانسة لأجهزة العميل، في حين أن التدريب الموزع غالباً ما يعمل على شبكات ذات نطاق ترددي عالٍ وأجهزة أكثر اتساقاً.

تطبيقات التعلّم الاتحادي

يعد التعلم الموحد ذا قيمة خاصة في السيناريوهات التي تكون فيها البيانات حساسة أو كبيرة أو موزعة بطبيعتها:

  • الرعاية الصحية: تدريب النماذج التشخيصية لمهام مثل تحليل الصور الطبية عبر مستشفيات متعددة دون مشاركة سجلات المرضى الحساسة. يسمح ذلك بإنشاء نماذج أكثر قوة من خلال الاستفادة من بيانات المرضى المتنوعة مع الالتزام بلوائح الخصوصية الصارمة مثل قانون HIPAA. اطلع على أمثلة في التعلم الموحد لمعلوماتية الرعاية الصحية واستكشف حلول الذكاء الاصطناعي في الرعاية الصحية ذات الصلة.
  • الأجهزة المحمولة: تحسين الميزات الموجودة على الجهاز مثل لوحات المفاتيح النصية التنبؤية (مثل Gboard من Google)، أو التعرف على أوامر المساعد الصوتي، أو التوصيات المخصصة من خلال تدريب النماذج مباشرةً على هواتف المستخدمين دون تحميل البيانات الشخصية أو سجل الاتصالات إلى خوادم مركزية.
  • التمويل: الكشف عن المعاملات الاحتيالية من خلال تدريب النماذج على بيانات المعاملات التي تحتفظ بها البنوك المختلفة دون مطالبة البنوك بمشاركة بيانات العملاء السرية.
  • إنترنت الأشياء الصناعية: تطوير نماذج الصيانة التنبؤية للآلات استناداً إلى بيانات أجهزة الاستشعار من مصانع أو مواقع مختلفة دون مركزية البيانات التشغيلية التي يُحتمل أن تكون مملوكة ملكية خاصة.

فوائد التعلّم الاتحادي

  • خصوصية محسّنة: تظل البيانات الأولية مترجمة على جهاز العميل، مما يقلل بشكل كبير من مخاطر الخصوصية.
  • تقليل عبء الاتصالات: عادةً ما يكون نقل تحديثات النماذج أقل استهلاكًا للنطاق الترددي بكثير من نقل مجموعات بيانات كاملة.
  • التعلم في الوقت الحقيقي: من المحتمل أن يتم تحديث النماذج بشكل متكرر أكثر باستخدام أحدث البيانات المحلية على الأجهزة المتطورة.
  • يستفيد من البيانات المتنوعة: يتيح الوصول إلى مجموعات بيانات أكبر وأكثر تنوعًا لا يمكن أن تكون مركزية لأسباب قانونية أو أخلاقية أو لوجستية، مما يقلل من الإفراط في التجهيز.

تحديات التعلم الموحد

على الرغم من مزاياه، إلا أن التعليم الاتحادي يواجه العديد من العقبات:

  • كفاءة الاتصالات: يمكن أن يكون تنسيق التحديثات وتجميعها من آلاف أو ملايين الأجهزة بطيئاً ومعقداً، خاصةً مع محدودية النطاق الترددي أو الاتصالات غير الموثوقة.
  • عدم تجانس الأنظمة: تختلف أجهزة العميل اختلافًا كبيرًا من حيث قوة المعالجة (CPU/GPU) والذاكرة والاتصال بالشبكة وتوافر الطاقة.
  • عدم التجانس الإحصائي: عادةً ما تكون البيانات عبر الأجهزة غير متجانسة (غير موزعة بشكل متماثل ومستقل)، مما قد يؤدي إلى تحيز النموذج العالمي أو إبطاء التقارب.
  • المخاوف الأمنية: مع تعزيز خصوصية البيانات، يمكن أن يكون النظام نفسه عرضة للهجمات المعادية التي تستهدف تحديثات النماذج أو الاختراقات الأمنية المحتملة في الخادم المركزي. يبقى ضمان أمن البيانات بشكل عام أمراً بالغ الأهمية.
  • إدارة العملاء: يمثل اختيار العملاء المناسبين وإدارة المشاركة والتعامل مع المتسربين تحديات لوجستية.

تهدف أطر العمل مثل TensorFlow Federated والمكتبات من مؤسسات مثل OpenMined إلى معالجة بعض هذه التحديات. وعلى الرغم من تعقيدات التعلم الموحد، إلا أنه اتجاه واعد لبناء أنظمة ذكاء اصطناعي واسعة النطاق مدركة للخصوصية. تعمل منصات مثل Ultralytics HUB على تسهيل دورة حياة نشر النماذج وإدارتها بشكل عام، مما قد يشمل النماذج المطورة باستخدام الأساليب الموحدة. يمكنك استكشاف خيارات نشر النماذج المختلفة داخل نظام Ultralytics البيئي. كما أن الجمع بين FL مع تقنيات أخرى مثل التعلّم النشط هو أيضاً مجال بحث مستمر، كما تمت مناقشته في منشور مدونة التعلّم النشط الذي يسرّع تطوير الرؤية الحاسوبية.

قراءة الكل