مسرد المصطلحات

الشبكة العصبية التلافيفية (CNN)

اكتشف كيف تُحدِث الشبكات العصبية التلافيفية (CNNs) ثورة في مجال الرؤية الحاسوبية، وتدعم الذكاء الاصطناعي في مجال الرعاية الصحية والسيارات ذاتية القيادة وغيرها.

الشبكة العصبية التلافيفية (CNN) هي نوع متخصص من الشبكات العصبية (NN ) التي تتسم بفعالية عالية في معالجة البيانات ذات الطوبولوجيا الشبيهة بالشبكة، مثل الصور. مستوحاة من القشرة البصرية البشرية، تتعلم الشبكات العصبية التلافيفية تلقائيًا وبشكل تكيّفي التسلسلات الهرمية المكانية للسمات من بيانات الإدخال. وهذا ما يجعلها البنية الأساسية لمعظم مهام الرؤية الحاسوبية الحديثة، حيث حققت أحدث النتائج في كل شيء بدءاً من تصنيف الصور إلى اكتشاف الأجسام.

كيفية عمل Cnn's

على عكس الشبكة العصبية القياسية حيث تكون كل خلية عصبية في طبقة واحدة متصلة بكل خلية عصبية في الطبقة التالية، تستخدم الشبكات العصبية الشبكية الشبكية عملية رياضية خاصة تسمى الالتفاف. وهذا يسمح للشبكة بتعلم الميزات في مجال استقبالي محلي، مع الحفاظ على العلاقات المكانية بين وحدات البكسل.

تتكون بنية CNN النموذجية من عدة طبقات رئيسية:

  1. الطبقة التلافيفية: هذه هي لبنة البناء الأساسية حيث ينزلق مرشح أو نواة على صورة الإدخال لإنتاج خرائط السمات. تبرز هذه الخرائط أنماطًا مثل الحواف والزوايا والأنسجة. يتم تعلم حجم هذه المرشحات والأنماط التي تكتشفها أثناء تدريب النموذج.
  2. طبقة التنشيط: بعد كل عملية التلافيف، يتم تطبيق دالة تنشيط مثل ReLU لإدخال اللاخطية، مما يسمح للنموذج بتعلم أنماط أكثر تعقيدًا.
  3. طبقة التجميع (تصغير العينات): تقلل هذه الطبقة من الأبعاد المكانية (العرض والارتفاع) لخرائط السمات، مما يقلل من العبء الحسابي ويساعد على جعل الميزات المكتشفة أكثر قوة للتغيرات في الموضع والاتجاه. هناك ورقة بحثية كلاسيكية حول هذا الموضوع هي تصنيف ImageNet مع الشبكات العصبية التلافيفية العميقة.
  4. طبقة متصلة بالكامل: بعد عدة طبقات التلافيف والتجميع، يتم تسطيح الميزات عالية المستوى وتمريرها إلى طبقة متصلة بالكامل، والتي تقوم بالتصنيف بناءً على الميزات المكتسبة.

Cnn مقابل البنى الأخرى

على الرغم من أن شبكات CNN هي نوع من نماذج التعلُّم العميق، إلا أنها تختلف بشكل كبير عن البنى الأخرى.

  • الشبكات العصبية (NNs): تتعامل الشبكة العصبية القياسية مع البيانات المدخلة كمتجه مسطح، مما يفقدها جميع المعلومات المكانية. تحافظ الشبكات العصبية الشبكية الشبكية على هذه المعلومات، مما يجعلها مثالية لتحليل الصور.
  • محولات الرؤية (ViTs): على عكس الـ CNNs، التي لديها تحيز استقرائي قوي للمكان المكاني, فيات التعامل مع الصورة على أنها تسلسل من الرقع واستخدام الانتباه الذاتي آلية لتعلم العلاقات العالمية. غالبًا ما تتطلب النماذج الافتراضية الافتراضية مزيدًا من البيانات للتدريب، ولكنها يمكن أن تتفوق في المهام التي يكون فيها السياق بعيد المدى مهمًا. العديد من النماذج الحديثة، مثل RT-DETRاستخدم نهجًا هجينًا يجمع بين CNN backbone مع محول قائم على detection head.

التطبيقات الواقعية

تُعد شبكات CNNs هي القوة الدافعة وراء عدد لا يُحصى من التطبيقات الواقعية:

الأدوات والأطر

يتم دعم تطوير ونشر شبكات CNNs بأدوات وأطر عمل قوية:

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة