Yolo فيجن شنتشن
شنتشن
انضم الآن

ما هو مطابقة القوالب؟ دليل سريع

استكشف تقنية معالجة الصور المعروفة باسم مطابقة القوالب، وكيفية عملها، وأهميتها في تاريخ الرؤية الحاسوبية.

غالبًا ما تحتوي الصور على العديد من التفاصيل الدقيقة التي يمكن للبشر اكتشافها بسهولة. ولكن بالنسبة للآلات، هذه المهمة ليست بهذه السهولة. فالآلات ترى الصورة الرقمية على أنها شبكة من قيم البكسل، وحتى التغييرات الطفيفة في الإضاءة أو الزاوية أو الحجم أو الوضوح يمكن أن تسبب لها الارتباك. 

تأتي قدرات تحليل الصور في الآلة عمومًا من مجالين مترابطين في علوم الكمبيوتر: معالجة الصور والرؤية الحاسوبية. ورغم أنهما غالبًا ما يعملان معًا، إلا أن لهما أغراضًا أساسية مختلفة. 

تركز معالجة الصور على الصور كبيانات أولية. يمكنها تحسين الصور، ولكنها لا تحاول فهم محتواها. وهنا تكمن أهمية الرؤية الحاسوبية. الرؤية الحاسوبية هي أحد فروع الذكاء الاصطناعي (AI) التي تسمح للأجهزة بفهم الصور ومقاطع الفيديو. 

توجد معالجة الصور الأساسية منذ سنوات عديدة، ولكن الابتكارات المتطورة في مجال الرؤية الحاسوبية هي أحدث بكثير. ومن الطرق الرائعة لفهم تاريخ هذا المجال أن ننظر إلى الوراء ونرى كيف كنا نحل هذه المشكلات باستخدام طرق قديمة وأكثر تقليدية.

خذ مطابقة الصور على سبيل المثال. إنها مهمة بصرية شائعة حيث يتعين على النظام اكتشاف ما إذا كان هناك كائن أو نمط معين موجود داخل صورة أكبر. 

في الوقت الحاضر، يمكن القيام بذلك بسهولة ودقة باستخدام الذكاء الاصطناعي والتعلم العميق. ومع ذلك، قبل ظهور الشبكات العصبية الحديثة في العقد الأول من القرن الحادي والعشرين، كانت الطريقة المفضلة هي تقنية أبسط بكثير تسمى مطابقة القوالب. 

الشكل 1. مثال على مطابقة القوالب (المصدر)

مطابقة القوالب هي تقنية معالجة الصور حيث يتم تحريك صورة قالب صغيرة عبر صورة أكبر بكسل بكسل. تسمح عملية التحريك الشبيهة بالتلافيف للخوارزمية بالعثور على الموقع الأقرب إلى ذلك النمط المحدد.

في هذه المقالة، سوف نستكشف ما هو مطابقة القوالب وكيف أن التحسينات الحديثة تجعلها أكثر موثوقية في المواقف الواقعية. هيا بنا نبدأ!

ما هو مطابقة القوالب؟

يمكن الإشارة إلى مطابقة القوالب أيضًا على أنها تقنية رؤية حاسوبية كلاسيكية، مما يعني أنها تعمل مباشرة مع بكسلات الصورة (أصغر وحدة في الصورة الرقمية). وهي تُستخدم للعثور على نمط أصغر داخل صورة أكبر. 

يتم تعريف طرق مثل هذه باستخدام الهندسة والبصريات والقواعد الرياضية بدلاً من تدريب نماذج كبيرة على مجموعات بيانات ضخمة. بمعنى آخر، يقارن نظام مطابقة القوالب السطوع واللون ومعلومات البكسل الأخرى بين مدخلين: الصورة المدخلة (الصورة الأكبر) وصورة القالب الأصغر (النمط المطلوب العثور عليه).

الشكل 2. الصورة أ والصورة ب هما مثالان على القوالب. (المصدر)

الهدف الرئيسي لمطابقة القوالب هو تحديد مكان ظهور القالب في المشهد الأكبر وقياس مدى تطابقه مع مناطق مختلفة من الصورة. تقوم خوارزمية مطابقة القوالب بذلك عن طريق تحريك القالب عبر الصورة الأكبر وحساب درجة التشابه في كل موضع.

تعتبر المناطق ذات الدرجات الأعلى هي الأفضل مطابقة، مما يعني أنها تشبه النموذج بشكل كبير. ونظرًا لأن هذه الطريقة تعتمد على المقارنات بين البكسلات، فإنها تعمل بشكل أفضل في البيئات الخاضعة للرقابة، حيث لا يتغير مظهر الكائنات. 

على سبيل المثال، يمكن استخدام مطابقة القوالب في مهام التحقق من الملصقات في مراقبة الجودة. يمكنها بسهولة مطابقة صورة قالب الملصقات مع صور المنتج النهائي للتحقق من وجود الملصقات من عدمه.

كيف تعمل مطابقة القوالب

فيما يلي نظرة عامة خطوة بخطوة على كيفية عمل مطابقة القوالب:

  • الخطوة 1 - إعداد الصور: تبدأ العملية بتحميل الصورة المدخلة وصورة القالب، ثم تحويلهما إلى صورة بتدرج رمادي. نظرًا لأن مطابقة القوالب تعتمد على مقارنة قيم البكسل، فإن إزالة معلومات الألوان يقلل من التشويش ويسرع معالجة الصور. 
  • الخطوة 2 - تحريك القالب عبر الصورة: بعد ذلك، تقوم خوارزمية مطابقة القالب بتحريك القالب عبر الصورة الأكبر حجمًا بمقدار بكسل واحد في كل مرة (بدءًا من الزاوية العلوية اليسرى). كل خطوة في هذه الحركة هي تكرار، حيث تستخرج الخوارزمية جزءًا من الصورة المصدر يطابق حجم القالب.
  • الخطوة 3 - قياس مدى مطابقة الصورة: تتم مقارنة كل رقعة من الصورة مع القالب باستخدام طريقة مطابقة رياضية لتوليد مقياس ترابط أو قيمة ترابط لكل موضع ممكن. تشمل الطرق الشائعة الفروق المربعة (التي تقيس المسافة العددية بين شدة البكسل لحساب إجمالي عدم التطابق)، والترابط المتبادل المعياري (الذي يضرب قيم البكسل لتحديد مدى توافق أنماط الضوء والظلام)، ومعامل الترابط (الذي يطرح متوسط السطوع لضمان بقاء المطابقة دقيقة حتى في حالة تغير الإضاءة قليلاً).
  • الخطوة 4 - تحديد أفضل تطابق: بعد تقييم جميع المواضع، تختار الخوارزمية أفضل تطابق من خلال إيجاد القيمة القصوى أو القيمة الدنيا، اعتمادًا على الطريقة المستخدمة. غالبًا ما يتم تطبيق عتبة على هذه النتائج لضمان قبول التطابقات ذات درجة الثقة العالية فقط، وتصفية الاكتشافات الضعيفة أو غير الصحيحة.
  • الخطوة 5 - إبراز النتيجة: أخيرًا، يتم تعيين الموقع المكتشف مرة أخرى على الصورة الأصلية. عادةً ما يتم رسم مربع حدودي حول المنطقة المطابقة، ليظهر بوضوح مكان ظهور القالب. 

التعرف العملي على مطابقة القوالب

على الرغم من أن مطابقة القوالب القائمة على معالجة الصور لا تستخدم عادةً في تطبيقات حلول الرؤية الحاسوبية الديناميكية في العالم الواقعي بسبب العيوب التي تنطوي عليها، إلا أنك إذا كنت مهتمًا بتجربتها، فإن Python مثل OpenCV تجعل هذه العملية سهلة وتوفر أيضًا دروسًا تعليمية سهلة المتابعة. وهي تتميز بوظيفة matchTemplate مدمجة تتعامل مع المقارنات الرياضية المعقدة. 

كما أنه يدعم وظائف أخرى تساعد في المهام البسيطة مثل تحميل الصور باستخدام وظيفة imread وتحويل الألوان باستخدام وظيفة cvtColor لتحويل الصور إلى تدرج رمادي. يعد تحويل الألوان خطوة مهمة لأن تقليل الصورة إلى قناة كثافة واحدة يجعل المقارنة الرياضية داخل matchTemplate أسرع بكثير وأقل حساسية تجاه ضوضاء الألوان.

بمجرد إنشاء خريطة التشابه، يتضمن OpenCV وظيفة minMaxLoc لإنهاء عملية الكشف. يمكن استخدامها لمسح الخريطة بأكملها لتحديد القيم الدنيا والقصوى العالمية إلى جانب إحداثياتها الدقيقة. اعتمادًا على طريقة المطابقة المستخدمة، تتيح لك minMaxLoc تحديد موقع أفضل مطابقة على الفور من خلال العثور على أعلى قيمة ارتباط أو أقل قيمة خطأ في البيانات.

بالإضافة إلى OpenCV NumPy مكتبات مثل NumPy ضرورية لمعالجة مصفوفات الصور وتطبيق عتبة على النتائج، بينما Matplotlib عادةً لتصور خريطة التشابه والكشف النهائي. توفر هذه الأدوات معًا بيئة كاملة لبناء وتصحيح حل مطابقة القوالب.

تطبيقات واقعية لمطابقة القوالب

الآن بعد أن أصبح لدينا فهم أفضل لكيفية عمل مطابقة القوالب، دعونا نلقي نظرة فاحصة على تطبيقها في سيناريوهات واقعية. 

تحديد الأنماط المعمارية التقليدية

في دراسات التراث الثقافي والعمارة، يتعين على الباحثين تحليل صور المباني التاريخية والمعابد والآثار لفهم كيفية اختلاف أنماط التصميم بين المناطق. قبل انتشار نماذج الرؤية الحاسوبية المتقدمة، كانوا يستخدمون تقنيات مطابقة الصور لدراسة هذه الهياكل.

تتيح مطابقة القوالب للباحثين التركيز على علامات معمارية محددة مثل ملامح الأسقف وترتيب النوافذ أو زخارف الجدران. ومن خلال تحريك القوالب أو الصور المرجعية عبر الصور الأكبر حجماً، يمكنهم تحديد الأشكال المتكررة وتقليل التحليل اليدوي للصور، الذي قد يستغرق ساعات.

هناك مثال مثير للاهتمام مستمد من دراسة تتعلق بالمنازل التقليدية الإندونيسية. فقد أنشأ الباحثون قوالب صغيرة للسمات المميزة وقارنوها بصور فوتوغرافية بالحجم الطبيعي. واستُخدم هذا النهج لتسليط الضوء على مناطق الصورة التي تطابق القالب بشكل وثيق classify الأنماط classify عبر المناطق.

الشكل 3. استخدام مطابقة القوالب classify المنازل classify في إندونيسيا (المصدر)

الكشف عن الأجسام في أنظمة الرؤية الصناعية

يمكن للبيئات الصناعية الاستفادة من أنظمة الرؤية التي يمكنها detect بسرعة أو التحقق من التجميعات أو اكتشاف العيوب. قبل انتشار التعلم العميق في مجال التصنيع، جربت العديد من الفرق طرق مطابقة الصور لأتمتة هذه المهام.

ببساطة، يمكن استخدام قالب مرجعي للمكونات لمسح الصور من خط الإنتاج وتمييز المناطق التي تطابق القالب. يعمل هذا بشكل جيد عندما تظهر الأجزاء في مواضع ثابتة، وتكون الإضاءة مستقرة.

مطابقة القوالب للكشف عن أورام الرئة 

على الرغم من تأثير التكنولوجيا المتطورة في مجال الرعاية الصحية، لا يزال تشخيص المشكلات الصحية من خلال التصوير الطبي مثل الأشعة المقطعية يمثل تحديًا. تقليديًا، كان على أخصائيي الأشعة مراجعة كل شريحة من الأشعة يدويًا، وهي عملية تتطلب دقة فائقة ووقتًا طويلاً. 

قبل تطبيق التعلم العميق في مجال الرعاية الصحية، حاول الباحثون استخدام مطابقة القوالب لتبسيط سير العمل والمساعدة في تحديد الحالات غير الطبيعية. ومن الأمثلة الجيدة على هذه التقنية الكشف عن أورام أو عقيدات الرئة. 

في هذه الطريقة، يقوم الباحثون بإنشاء قوالب مرجعية تمثل الشكل النموذجي للورم وشدته. ثم يقوم النظام بتمرير هذه القوالب عبر صور المرضى، وقياس التشابه في كل نقطة.

الشكل 4. الكشف عن أورام الرئة باستخدام مطابقة القوالب (المصدر)

إيجابيات وسلبيات مطابقة القوالب

فيما يلي بعض المزايا الرئيسية لاستخدام مطابقة القوالب:

  • بديهي ومباشر: مطابقة القوالب سهلة الفهم والتنفيذ، مما يجعلها نقطة انطلاق مثالية للمبتدئين في مجال الذكاء الاصطناعي والرؤية الحاسوبية.
  • موثوق في ظل ظروف خاضعة للرقابة: يعمل بشكل جيد على الصور ذات التدرج الرمادي في ظل إضاءة ثابتة، ويقدم نتائج دقيقة عندما تكون الأنماط والخلفيات مستقرة.
  • سهولة التكامل: باستخدام Python مثل OpenCV يمكن تطبيق مطابقة القوالب بسرعة على المشاريع الحقيقية دون الحاجة إلى إعدادات معقدة أو حسابات معقدة.

على الرغم من أن مطابقة القوالب تقدم العديد من المزايا، إلا أنها تنطوي أيضًا على بعض القيود. فيما يلي بعض التحديات التي يجب أخذها في الاعتبار:

  • حساسية للحجم والتدوير: قد يؤدي التباين في حجم القالب أو اتجاهه إلى تقليل الدقة.
  • الاعتماد على الإضاءة والتباين: قد تؤدي التغييرات في الإضاءة أو التباين بين القالب والصورة إلى حدوث تطابقات غير صحيحة أو تجعل من الصعب detect القالب.
  • قدرة محدودة على التكيف: على عكس الأساليب القائمة على الذكاء الاصطناعي، لا يمكن لمطابقة القوالب التعلم من البيانات أو التحسن بمرور الوقت. وهي تعمل بشكل أفضل في البيئات الخاضعة للرقابة أو المتكررة.

النقاط الرئيسية 

تعد الرؤية الحاسوبية مجالًا واسعًا ويغطي تقنيات متنوعة. يعد التعرف على تقنيات معالجة الصور التقليدية، مثل مطابقة القوالب، نقطة انطلاق رائعة لفهم كيفية عمل تحليل الصور. تعتمد ابتكارات الرؤية الاصطناعية المتطورة على نفس المفاهيم الأساسية وتحل مشكلات مماثلة. 

هل تريد معرفة المزيد عن الذكاء الاصطناعي؟ انضم إلى مجتمعنا وتصفح مستودع GitHub الخاص بنا. تعرف على كيفية قيام الذكاء الاصطناعي في مجال البيع بالتجزئة و Vision AI في مجال التصنيع بدفع عجلة التغيير. اكتشف خيارات الترخيص المتاحة لدينا لبدء العمل مع Vision AI اليوم!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا