استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

الالتفاف

تعرف على كيف يعزز الالتفاف الذكاء الاصطناعي في الرؤية الحاسوبية، مما يتيح مهام مثل الكشف عن العناصر والتعرف على الصور والتصوير الطبي بدقة.

الالتفاف هو عملية أساسية في التعلم العميق (DL)، خاصة في مجال رؤية الكمبيوتر (CV). إنه بمثابة اللبنة الأساسية لـ الشبكات العصبية الالتفافية (CNNs)، مما يمكّن النماذج من تعلم الميزات الهرمية تلقائيًا وبكفاءة من البيانات الشبيهة بالشبكة، مثل الصور. تتضمن العملية تمرير مرشح صغير، يُعرف باسم النواة، فوق صورة إدخال لإنتاج خرائط الميزات التي تسلط الضوء على أنماط معينة مثل الحواف أو الأنسجة أو الأشكال. هذه الطريقة مستوحاة من تنظيم القشرة البصرية للحيوان وهي فعالة للغاية للمهام التي تكون فيها العلاقات المكانية بين نقاط البيانات مهمة.

كيف يعمل الالتفاف

في جوهرها، الالتفاف هو عملية رياضية تدمج مجموعتين من المعلومات. في سياق الشبكة العصبونية الالتفافية (CNN)، فهي تجمع بين بيانات الإدخال (قيم بكسل الصورة) والنواة. النواة عبارة عن مصفوفة صغيرة من الأوزان تعمل ككاشف للميزات. تنزلق هذه النواة عبر ارتفاع وعرض صورة الإدخال، وفي كل موضع، فإنها تجري عملية ضرب عنصرًا بعنصر مع الجزء المتداخل من الصورة. يتم جمع النتائج لإنشاء بكسل واحد في خريطة ميزات الإخراج. تتكرر عملية الانزلاق هذه عبر الصورة بأكملها.

باستخدام نوى مختلفة، يمكن لـ CNN أن تتعلم اكتشاف مجموعة واسعة من الميزات. قد تتعلم الطبقات المبكرة التعرف على الأنماط البسيطة مثل الحواف والألوان، بينما يمكن للطبقات الأعمق أن تجمع بين هذه الميزات الأساسية لتحديد هياكل أكثر تعقيدًا مثل العيون أو العجلات أو النص. هذه القدرة على بناء تسلسل هرمي للميزات المرئية هي ما يمنح CNNs قوتها في مهام الرؤية. تتم العملية بكفاءة حسابية من خلال مبدأين أساسيين:

  • مشاركة المعلمات: يتم استخدام نفس النواة عبر الصورة بأكملها، مما يقلل بشكل كبير من العدد الإجمالي للمعلمات القابلة للتعلم مقارنة بالشبكة المتصلة بالكامل. يساعد مفهوم الاستخدام الفعال للمعلمات هذا أيضًا النموذج على التعميم بشكل أفضل.
  • الموقع المكاني (Spatial Locality): تفترض العملية أن وحدات البكسل القريبة من بعضها البعض مرتبطة بقوة أكبر من تلك البعيدة، وهو تحيز استقرائي قوي وفعال للغاية للصور الطبيعية.

الأهمية في التعلم العميق

الالتفاف هو حجر الزاوية في رؤية الكمبيوتر الحديثة. تستخدم نماذج مثل Ultralytics YOLO طبقات التفافية على نطاق واسع في بنيات العمود الفقري الخاصة بها من أجل استخراج الميزات القوي. يتيح ذلك مجموعة واسعة من التطبيقات، من اكتشاف الكائنات و تقسيم الصور إلى مهام أكثر تعقيدًا. إن كفاءة وفعالية الالتفاف جعلته الطريقة المفضلة لمعالجة الصور والبيانات المكانية الأخرى، مما يشكل الأساس للعديد من البنيات الحديثة المفصلة في موارد مثل تاريخ نماذج الرؤية.

تطبيقات واقعية

  • تحليل الصور الطبية: في الذكاء الاصطناعي للرعاية الصحية، تستخدم الشبكات العصبية التلافيفية (CNNs) الالتواء لتحليل الفحوصات الطبية مثل صور الرنين المغناطيسي أو التصوير المقطعي المحوسب. يمكن تدريب النوى للكشف عن الأنسجة والأشكال المحددة التي تميز الأورام أو التشوهات الأخرى، مما يساعد أخصائيي الأشعة على إجراء تشخيصات أسرع وأكثر دقة. يمكنك قراءة المزيد عن هذه التطورات في مجلات مثل Radiology: Artificial Intelligence.
  • المركبات ذاتية القيادة: تعتمد السيارات ذاتية القيادة على الشبكات العصبية الالتفافية (CNNs) لإدراك محيطها. تعالج الالتواءات المدخلات من الكاميرات في الوقت الفعلي لتحديد المشاة والمركبات الأخرى ومسارات المرور وإشارات الطرق. يتيح ذلك لنظام السيارة بناء فهم شامل لبيئتها والتنقل بأمان، كما هو موضح في التكنولوجيا التي طورتها شركات مثل Waymo.

الالتفاف مقابل المفاهيم ذات الصلة

من المفيد التمييز بين الالتفافية وعمليات الشبكة العصبية الأخرى:

  • طبقات متصلة بالكامل: في الطبقة المتصلة بالكامل، تتصل كل خلية عصبية بكل خلية عصبية في الطبقة السابقة. بالنسبة للصور، هذا غير فعال للغاية لأنه يتجاهل الهيكل المكاني ويؤدي إلى عدد هائل من المعلمات. الالتفاف، مع الاتصال المحلي ومشاركة المعلمات، أكثر قابلية للتطوير وملاءمة لبيانات الصور.
  • محولات الرؤية (ViT): على عكس اكتشاف الميزات المحلية لشبكات CNN، تستخدم محولات الرؤية آلية الانتباه الذاتي لنمذجة العلاقات العالمية بين بقع الصور المختلفة. في حين أن ViT قوية، فإنها تتطلب عادةً مجموعات بيانات أكبر لتعلم هذه العلاقات من البداية، في حين أن التحيز الاستقرائي للالتواءات يجعلها أكثر كفاءة في استخدام البيانات. تهدف النماذج الهجينة، مثل RT-DETR، إلى الجمع بين نقاط قوة كلا النهجين.

الأدوات والتدريب

يتم تسهيل تنفيذ وتدريب النماذج التي تستخدم الالتواء من خلال أطر التعلم العميق المختلفة. توفر مكتبات مثل PyTorch (موقع PyTorch الرسمي) و TensorFlow (موقع TensorFlow الرسمي) أدوات قوية لبناء CNNs. تعمل واجهات برمجة التطبيقات عالية المستوى مثل Keras على تبسيط التطوير بشكل أكبر.

للحصول على تجربة مبسطة، تتيح منصات مثل Ultralytics HUB للمستخدمين إدارة مجموعات البيانات وإجراء تدريب النماذج ونشر نماذج قوية مثل YOLOv8 بسهولة. يعد فهم المفاهيم الأساسية مثل الالتفاف و حجم النواة و الخطوة والحشو و الحقل الاستقبالي الناتج أمرًا بالغ الأهمية لـ تدريب النماذج الفعال وتصميم البنية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة