اكتشف شبكات الكبسولة (CapsNets): بنية رائدة للشبكات العصبية تتفوق في التسلسلات الهرمية المكانية وعلاقات السمات.
شبكات الكبسولات، والتي غالبًا ما تُعرف اختصارًا باسم CapsNets، هي نوع من بنية الشبكات العصبية (NN) المصممة للتغلب على بعض القيود الرئيسية للشبكات العصبية التلافيفية (CNNs). تهدف شبكات CapsNets، التي قدمها جيفري هينتون وفريقه، إلى التعرف بشكل أفضل على العلاقات الهرمية بين السمات في الصورة. وخلافًا للخلايا العصبية في الشبكات العصبية القياسية التي تُخرج قيمة قياسية واحدة، فإن "الكبسولات" في الشبكات العصبية الكبسولية تُخرج متجهًا، مما يسمح لها بتشفير معلومات أكثر تفصيلاً عن خصائص الجسم، مثل وضعه (الموضع والحجم والاتجاه) والتشوه والملمس. هذه البنية تجعلها بطبيعتها أكثر قوة في مواجهة التغيرات في وجهة النظر والاتجاه.
يتمثل الابتكار الأساسي وراء شبكات CapsNets في قدرتها على الحفاظ على التسلسلات الهرمية المكانية بين الملامح. فبينما قد تتعرف شبكة CNN على مكونات الوجه - مثل الفم والأنف والعينين - إلا أنها لا تفهم بوضوح علاقاتها المكانية. ومع ذلك، تستخدم شبكات CapsNets مجموعات من الخلايا العصبية تسمى كبسولات لتحديد هذه الأجزاء وتوجهاتها النسبية. يتم تحقيق ذلك من خلال عملية تسمى "التوجيه الديناميكي"، حيث ترسل الكبسولات ذات المستوى الأدنى مخرجاتها إلى كبسولات ذات مستوى أعلى يمكنها تفسير نتائجها بشكل أفضل. ويختلف هذا النهج اختلافًا جوهريًا عن طبقات التجميع في شبكات CNN، والتي غالبًا ما تتجاهل المعلومات المكانية المهمة. تم تفصيل المفهوم الأصلي في الورقة البحثية " التوجيه الديناميكي بين الكبسولات".
يكمن الفرق الأساسي بين شبكات CapsNets وشبكات CNN في كيفية تعاملها مع المعلومات المكانية والتجريد.
في حين أن النماذج مثل Ultralytics YOLO مُحسّنة للغاية لتحقيق السرعة والدقة في مهام الرؤية الحاسوبية العملية، فإن CapsNets تمثل فلسفة معمارية بديلة تركز على تحسين الفهم الأساسي للمشاهد المرئية. يمكنك استكشاف المقارنات بين نماذج مختلفة لاكتشاف الكائنات لفهم المشهد الحالي.
على الرغم من أن شبكات CapsNets لا تزال في المقام الأول مجالًا للبحث النشط وأقل شيوعًا من النماذج الراسخة مثل YOLO11، إلا أنها أثبتت أنها واعدة في العديد من المجالات:
وتشمل التطبيقات المحتملة الأخرى تحسين اكتشاف الأجسام، لا سيما في المشاهد المشوشة، وتعزيز فهم المشهد في الروبوتات، والمساهمة في أنظمة إدراك أكثر قوة للمركبات ذاتية القيادة. بينما تظل المتطلبات الحسابية تمثل تحديًا، تهدف الأبحاث الجارية إلى تحسين كفاءة CapsNet لتطبيقات التعلم الآلي الأوسع نطاقًا والتكامل المحتمل في أطر عمل مثل PyTorch أو TensorFlow.