تعلّم كيف يعمل التلافيف على تشغيل الذكاء الاصطناعي في مجال الرؤية الحاسوبية، مما يتيح مهام مثل اكتشاف الأجسام والتعرف على الصور والتصوير الطبي بدقة.
يُعد التلافيف عملية رياضية أساسية تُستخدم على نطاق واسع في الذكاء الاصطناعي، خاصةً في مجال الرؤية الحاسوبية. وهي بمثابة لبنة بناء أساسية للشبكات العصبية التلافيفية (CNNs)، مما يمكّن هذه الشبكات من تعلم الأنماط المعقدة والهرمية تلقائيًا مباشرةً من البيانات الشبيهة بالشبكات، مثل الصور أو مقاطع الفيديو. وتتضمن العملية تطبيق مرشح صغير، يُعرف باسم النواة، عبر إشارة أو صورة مُدخَلة. تُنشئ هذه العملية مخرجات تُسمى خريطة الميزات، والتي تبرز أنماطًا محددة (مثل الحواف أو القوام أو الأشكال) التي تم تصميم النواة لاكتشافها.
فكر في عملية الالتفاف مثل تحريك عدسة مكبرة صغيرة (النواة أو المرشح) على صورة أكبر (بيانات الإدخال). في كل موضع، تركز النواة على رقعة صغيرة من المدخلات. ثم تحسب عملية الالتفاف مجموعًا مرجحًا لقيم البكسل داخل هذه الرقعة باستخدام الأوزان المحددة داخل النواة. وتصبح هذه القيمة المحسوبة بكسلًا واحدًا في خريطة ميزات الإخراج الناتجة. تتحرك النواة بشكل منهجي عبر صورة الإدخال بأكملها، خطوة بخطوة، مع تحديد حجم الخطوة بواسطة معلمة تسمى"الخطوة". في بعض الأحيان، يتم استخدام"الحشو" (إضافة وحدات بكسل حدية إضافية) حول صورة الإدخال للتحكم في حجم الإخراج. من خلال تطبيق نوى متعددة داخل طبقة تلافيفية واحدة، يمكن لشبكة CNN استخراج مجموعة متنوعة من الميزات من المدخلات في نفس الوقت. يمكن أن توفر التفسيرات المرئية، مثل تلك الموجودة في ملاحظات الدورة التدريبية CS231n في جامعة ستانفورد، مزيدًا من الحدس.
تحدد عدة معلمات عملية الالتفاف:
غالبًا ما يُستخدم الالتفاف جنبًا إلى جنب مع عمليات أخرى داخل شبكات CNN، ولكنه يخدم غرضًا مميزًا:
لا غنى عن الطبقات التلافيفية في العديد من تطبيقات الذكاء الاصطناعي الحديثة:
في الكشف عن الأجسام، تستخدم شبكات CNN طبقات التلافيف لاستخراج الميزات من الصور، مما يمكّنها من تحديد الأجسام وتحديد مواقعها باستخدام المربعات المحدودة. النماذج الحديثة مثل Ultralytics YOLOبما في ذلك إصدارات مثل YOLO11، تعتمد بشكل كبير على عمليات الالتفاف لتحليل الميزات بمقاييس مختلفة للكشف الفعال والدقيق. وهذا أمر حيوي للذكاء الاصطناعي في تطبيقات السيارات، مثل تمكين السيارات ذاتية القيادة(انظر تقنية Waymo) من إدراك المشاة والمركبات وإشارات المرور للملاحة الآمنة، وغالبًا ما يتطلب ذلك الاستدلال في الوقت الحقيقي.
يلعب التلافيف دوراً هاماً في تحليل الصور الطبية، حيث يساعد أخصائيي الرعاية الصحية في تفسير الفحوصات مثل الأشعة السينية والأشعة المقطعية والتصوير بالرنين المغناطيسي. يمكن لنماذج الذكاء الاصطناعي التي تم إنشاؤها باستخدام شبكات سي إن إن أن تكشف عن الأنماط الدقيقة التي تشير إلى الأمراض، مثل الأورام أو الكسور، وأحياناً ما تتفوق على سرعة ودقة الإنسان(الأشعة: الذكاء الاصطناعي). على سبيل المثال، يمكن تدريب النماذج على مهام محددة مثل استخدام YOLO11 للكشف عن الأورام. استكشف المزيد عن حلول الذكاء الاصطناعي في مجال الرعاية الصحية.
بالإضافة إلى ذلك، يُعد الالتفاف أساسيًا في مهام الرؤية الأخرى مثل التعرف على الصور وتجزئة الصور.
يُعد التلافيف حجر الزاوية في التعلّم العميق الحديث (DL)، خاصةً بالنسبة للمهام التي تتضمن بيانات تشبه الشبكة. إن قدرتها على استغلال الموضع المكاني (بافتراض أن وحدات البكسل القريبة مرتبطة ببعضها البعض) ومشاركة المعلمات عبر مواقع مختلفة تجعل شبكات التعلم العميق ذات كفاءة وفعالية عالية في تعلم التسلسلات الهرمية البصرية مقارنةً بالشبكات التقليدية المتصلة بالكامل.
يتم تسهيل تنفيذ وتدريب النماذج التي تستخدم التلافيف من خلال العديد من أطر التعلم العميق. مكتبات مثل PyTorchPyTorch الموقع الرسمي لPyTorch ) و TensorFlowTensorFlow ) أدوات قوية لبناء شبكات CNN. تعمل منصات مثل Ultralytics HUB على تبسيط عملية تدريب الن ماذج، مما يسمح للمستخدمين بالاستفادة من البنى المبنية مسبقًا التي تتضمن التلافيف أو تدريب نماذج مخصصة لتطبيقات محددة. كما تعمل واجهات برمجة التطبيقات عالية المستوى مثل Keras على تبسيط عملية التطوير.