مسرد المصطلحات

الالتفاف

تعلّم كيف يعمل التلافيف على تشغيل الذكاء الاصطناعي في مجال الرؤية الحاسوبية، مما يتيح مهام مثل اكتشاف الأجسام والتعرف على الصور والتصوير الطبي بدقة.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

يُعد التلافيف عملية رياضية أساسية تُستخدم على نطاق واسع في الذكاء الاصطناعي، خاصةً في مجال الرؤية الحاسوبية. وهي بمثابة لبنة بناء أساسية للشبكات العصبية التلافيفية (CNNs)، مما يمكّن هذه الشبكات من تعلم الأنماط المعقدة والهرمية تلقائيًا مباشرةً من البيانات الشبيهة بالشبكات، مثل الصور أو مقاطع الفيديو. وتتضمن العملية تطبيق مرشح صغير، يُعرف باسم النواة، عبر إشارة أو صورة مُدخَلة. تُنشئ هذه العملية مخرجات تُسمى خريطة الميزات، والتي تبرز أنماطًا محددة (مثل الحواف أو القوام أو الأشكال) التي تم تصميم النواة لاكتشافها.

كيف يعمل الالتفاف

فكر في عملية الالتفاف مثل تحريك عدسة مكبرة صغيرة (النواة أو المرشح) على صورة أكبر (بيانات الإدخال). في كل موضع، تركز النواة على رقعة صغيرة من المدخلات. ثم تحسب عملية الالتفاف مجموعًا مرجحًا لقيم البكسل داخل هذه الرقعة باستخدام الأوزان المحددة داخل النواة. وتصبح هذه القيمة المحسوبة بكسلًا واحدًا في خريطة ميزات الإخراج الناتجة. تتحرك النواة بشكل منهجي عبر صورة الإدخال بأكملها، خطوة بخطوة، مع تحديد حجم الخطوة بواسطة معلمة تسمى"الخطوة". في بعض الأحيان، يتم استخدام"الحشو" (إضافة وحدات بكسل حدية إضافية) حول صورة الإدخال للتحكم في حجم الإخراج. من خلال تطبيق نوى متعددة داخل طبقة تلافيفية واحدة، يمكن لشبكة CNN استخراج مجموعة متنوعة من الميزات من المدخلات في نفس الوقت. يمكن أن توفر التفسيرات المرئية، مثل تلك الموجودة في ملاحظات الدورة التدريبية CS231n في جامعة ستانفورد، مزيدًا من الحدس.

المكونات الرئيسية للتدوير

تحدد عدة معلمات عملية الالتفاف:

  • نواة/مرشح: مصفوفة صغيرة تحتوي على أوزان(أوزان مرشح) تكشف عن ميزات محددة. يحدد حجم النواة المنطقة المحلية التي تتم معالجتها في كل خطوة.
  • الخطوة: عدد البكسلات التي تنقلها النواة على صورة الإدخال في كل خطوة. تؤدي الخطوة الأكبر إلى خريطة ميزات إخراج أصغر.
  • الحشو: إضافة وحدات بكسل (عادةً ما تكون ذات قيمة صفرية) حول حدود صورة الإدخال. يساعد ذلك في التحكم في الأبعاد المكانية للمخرجات ويسمح للنواة بمعالجة بكسلات الحواف بشكل أكثر فعالية.
  • دالة التنشيط: عادةً ما يتم تمرير مخرجات عملية الالتفاف من خلال دالة تنشيط غير خطية، مثل ReLU (الوحدة الخطية المعدلة)، لإدخال اللاخطية في النموذج، مما يتيح له تعلم أنماط أكثر تعقيدًا.

الالتفاف مقابل العمليات ذات الصلة

غالبًا ما يُستخدم الالتفاف جنبًا إلى جنب مع عمليات أخرى داخل شبكات CNN، ولكنه يخدم غرضًا مميزًا:

  • التجميع: يتم استخدام عمليات مثل التجميع الأقصى أو التجميع المتوسط لتقليل الأبعاد المكانية (العرض والارتفاع) لخرائط السمات، مما يجعل النموذج أكثر كفاءة من الناحية الحسابية وأكثر قوة للتغيرات في موقع الميزة. على عكس الالتفاف الذي يستخرج الميزات، يلخص التجميع الميزات داخل منطقة ما. يمكنك العثور على نظرة عامة على طرق التجميع لمزيد من التفاصيل.
  • الطبقات المتصلة بالكامل: بينما تقوم الطبقات التلافيفية بمعالجة المناطق المحلية باستخدام أوزان مشتركة(مشاركة المعلمات) بناءً على المجال الاستقبالي فإن الطبقة المتصلة بالكامل تربط كل خلية عصبية في مدخلاتها بكل خلية عصبية في مخرجاتها. تُستخدم هذه الطبقات عادةً في نهاية شبكة CNN في بنية شبكة عصبية قياسية (NN) للتصنيف النهائي أو مهام الانحدار.

تطبيقات التدوير

لا غنى عن الطبقات التلافيفية في العديد من تطبيقات الذكاء الاصطناعي الحديثة:

1. كشف الكائنات

في الكشف عن الأجسام، تستخدم شبكات CNN طبقات التلافيف لاستخراج الميزات من الصور، مما يمكّنها من تحديد الأجسام وتحديد مواقعها باستخدام المربعات المحدودة. النماذج الحديثة مثل Ultralytics YOLOبما في ذلك إصدارات مثل YOLO11، تعتمد بشكل كبير على عمليات الالتفاف لتحليل الميزات بمقاييس مختلفة للكشف الفعال والدقيق. وهذا أمر حيوي للذكاء الاصطناعي في تطبيقات السيارات، مثل تمكين السيارات ذاتية القيادة(انظر تقنية Waymo) من إدراك المشاة والمركبات وإشارات المرور للملاحة الآمنة، وغالبًا ما يتطلب ذلك الاستدلال في الوقت الحقيقي.

2. تحليل الصور الطبية

يلعب التلافيف دوراً هاماً في تحليل الصور الطبية، حيث يساعد أخصائيي الرعاية الصحية في تفسير الفحوصات مثل الأشعة السينية والأشعة المقطعية والتصوير بالرنين المغناطيسي. يمكن لنماذج الذكاء الاصطناعي التي تم إنشاؤها باستخدام شبكات سي إن إن أن تكشف عن الأنماط الدقيقة التي تشير إلى الأمراض، مثل الأورام أو الكسور، وأحياناً ما تتفوق على سرعة ودقة الإنسان(الأشعة: الذكاء الاصطناعي). على سبيل المثال، يمكن تدريب النماذج على مهام محددة مثل استخدام YOLO11 للكشف عن الأورام. استكشف المزيد عن حلول الذكاء الاصطناعي في مجال الرعاية الصحية.

بالإضافة إلى ذلك، يُعد الالتفاف أساسيًا في مهام الرؤية الأخرى مثل التعرف على الصور وتجزئة الصور.

الأهمية في التعلم العميق

يُعد التلافيف حجر الزاوية في التعلّم العميق الحديث (DL)، خاصةً بالنسبة للمهام التي تتضمن بيانات تشبه الشبكة. إن قدرتها على استغلال الموضع المكاني (بافتراض أن وحدات البكسل القريبة مرتبطة ببعضها البعض) ومشاركة المعلمات عبر مواقع مختلفة تجعل شبكات التعلم العميق ذات كفاءة وفعالية عالية في تعلم التسلسلات الهرمية البصرية مقارنةً بالشبكات التقليدية المتصلة بالكامل.

الأدوات والتدريب

يتم تسهيل تنفيذ وتدريب النماذج التي تستخدم التلافيف من خلال العديد من أطر التعلم العميق. مكتبات مثل PyTorchPyTorch الموقع الرسمي لPyTorch ) و TensorFlowTensorFlow ) أدوات قوية لبناء شبكات CNN. تعمل منصات مثل Ultralytics HUB على تبسيط عملية تدريب الن ماذج، مما يسمح للمستخدمين بالاستفادة من البنى المبنية مسبقًا التي تتضمن التلافيف أو تدريب نماذج مخصصة لتطبيقات محددة. كما تعمل واجهات برمجة التطبيقات عالية المستوى مثل Keras على تبسيط عملية التطوير.

قراءة الكل