التقليم والتكميم في الرؤية الحاسوبية: دليل سريع

أبيرامي فينا

5 دقائق للقراءة

11 يوليو 2025

اكتشف سبب أهمية التقليم والتكميم لتحسين نماذج الرؤية الحاسوبية وتمكين أداء أسرع على الأجهزة المتطورة.

أصبحت الأجهزة المتطورة شائعة بشكل متزايد مع تقدم التكنولوجيا. من الساعات الذكية التي تتعقب معدل ضربات القلب إلى الطائرات بدون طيار التي تراقب الشوارع، يمكن للأنظمة المتطورة معالجة البيانات في الوقت الفعلي محلياً داخل الجهاز نفسه. 

وغالباً ما تكون هذه الطريقة أسرع وأكثر أماناً من إرسال البيانات إلى السحابة، خاصةً بالنسبة للتطبيقات التي تتضمن بيانات شخصية، مثل اكتشاف لوحات السيارات أو تتبع الإيماءات. هذه أمثلة على الرؤية الحاسوبية، وهو فرع من فروع الذكاء الاصطناعي (AI) الذي يُمكِّن الآلات من تفسير المعلومات المرئية وفهمها.

الشكل 1. مثال على اكتشاف لوحة الترخيص.(المصدر)

إلا أن أحد الاعتبارات المهمة هو أن مثل هذه التطبيقات تتطلب نماذج ذكاء اصطناعي للرؤية قادرة على التعامل مع العمليات الحسابية الثقيلة، باستخدام الحد الأدنى من الموارد، والعمل بشكل مستقل. يتم تطوير معظم نماذج الرؤية الحاسوبية للأنظمة عالية الأداء، مما يجعلها أقل ملاءمة للنشر المباشر على الأجهزة المتطورة. 

لسد هذه الفجوة، غالبًا ما يطبق المطورون تحسينات مستهدفة تعمل على تكييف النموذج ليعمل بكفاءة على أجهزة أصغر. هذه التعديلات ضرورية لعمليات النشر على الحافة في العالم الحقيقي، حيث تكون الذاكرة وقوة المعالجة محدودة. 

من المثير للاهتمام أن نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 مصممة بالفعل مع وضع كفاءة الحافة في الاعتبار، مما يجعلها رائعة لمهام الوقت الحقيقي. ومع ذلك، يمكن تحسين أدائها بشكل أكبر باستخدام تقنيات تحسين النموذج مثل التقليم والتكميم الكمي، مما يتيح استنتاجاً أسرع واستخداماً أقل للموارد على الأجهزة المقيدة.

في هذه المقالة، سوف نلقي نظرة فاحصة على ماهية التقليم والتكميم وكيف يعملان وكيف يمكنهما مساعدة نماذج YOLO في عمليات النشر على الحافة في العالم الحقيقي. لنبدأ!

التقليم والتكميم: التقنيات الأساسية في تحسين النموذج

عند إعداد نماذج Vision AI للنشر على الأجهزة المتطورة، يتمثل أحد الأهداف الرئيسية في جعل النموذج خفيف الوزن وموثوقاً دون التضحية بالأداء. وغالباً ما يتضمن ذلك تقليل حجم النموذج ومتطلباته الحسابية حتى يتمكن من العمل بكفاءة على الأجهزة ذات الذاكرة أو الطاقة أو سعة المعالجة المحدودة. هناك طريقتان شائعتان للقيام بذلك هما التقليم والتكميم.

التقليم هو تقنية تحسين نموذج الذكاء الاصطناعي التي تساعد على جعل الشبكات العصبية أصغر حجماً وأكثر كفاءة. في كثير من الحالات، لا تساهم أجزاء من النموذج، مثل بعض الوصلات أو العقد، كثيرًا في تنبؤاته النهائية. يعمل التقليم من خلال تحديد هذه الأجزاء الأقل أهمية وإزالتها، مما يقلل من حجم النموذج ويسرّع من أدائه.

من ناحية أخرى، التكميم هو أسلوب تحسين يقلل من دقة الأرقام التي يستخدمها النموذج. فبدلاً من الاعتماد على الأرقام ذات الفاصلة العائمة عالية الدقة 32 بت، يتحول النموذج إلى تنسيقات أصغر وأكثر كفاءة مثل الأعداد الصحيحة 8 بت. يساعد هذا التغيير على تقليل استخدام الذاكرة وتسريع عملية الاستدلال، وهي العملية التي يقوم فيها النموذج بعمل تنبؤات.

الشكل 2. نظرة على التقليم والتكميم.(المصدر)

كيفية عمل التقليم والتكميم الكمي

والآن بعد أن أصبح لدينا فهم أفضل لماهية التقليم والتكميم الكمي، دعنا نتعرف على كيفية عملهما. 

يتم التقليم باستخدام عملية تعرف باسم تحليل الحساسية. وهي تحدد أي أجزاء من نماذج الشبكة العصبية، مثل بعض الأوزان أو الخلايا العصبية أو القنوات، تساهم بأقل قدر في التنبؤ بالمخرجات النهائية. ويمكن إزالة هذه الأجزاء بأقل تأثير على الدقة. بعد التقليم، عادة ما يتم إعادة تدريب النموذج لضبط أدائه. ويمكن تكرار هذه الدورة لإيجاد التوازن الصحيح بين حجمه ودقته.

بينما يركز التكميم الكمي للن موذج على كيفية تعامل النموذج مع البيانات. يبدأ بالمعايرة، حيث يعمل النموذج على بيانات العينة لمعرفة نطاق القيم التي يحتاج إلى معالجتها. ثم يتم تحويل هذه القيم من النقطة العائمة 32 بت إلى تنسيقات أقل دقة مثل الأعداد الصحيحة 8 بت.

الشكل 3. يساعد التكميم الكمي على تقليل حجم النموذج وتعقيده.(المصدر)

هناك العديد من الأدوات المتاحة التي تجعل من السهل استخدام التقليم والتكميم في مشاريع الذكاء الاصطناعي في العالم الحقيقي. تتضمن معظم أطر عمل الذكاء الاصطناعي، مثل PyTorch و TensorFlow، دعمًا مدمجًا لتقنيات التحسين هذه، مما يسمح للمطورين بدمجها مباشرةً في عملية نشر النموذج. 

وبمجرد تحسين النموذج، يمكن لأدوات مثل ONNX Runtime المساعدة في تشغيله بكفاءة عبر منصات أجهزة مختلفة مثل الخوادم وأجهزة الكمبيوتر المكتبية والأجهزة الطرفية. بالإضافة إلى ذلك، توفر Ultralytics عمليات تكامل تسمح بتصدير نماذج YOLO بتنسيقات مناسبة للتكميم، مما يسهل تقليل حجم النموذج وتعزيز الأداء.

نظرة عامة على تحسين نموذج Ultralytics YOLO نموذج YOLO

تُعرف نماذج Ultralytics YOLO مثل YOLO11 على نطاق واسع بسرعة اكتشافها للأشياء بخطوة واحدة، مما يجعلها مثالية لمهام الذكاء الاصطناعي للرؤية في الوقت الحقيقي. وهي مصممة بالفعل لتكون خفيفة الوزن وفعالة بما يكفي لنشرها على الحافة. ومع ذلك، لا يزال بإمكان الطبقات المسؤولة عن معالجة الميزات المرئية، والتي تسمى الطبقات التلافيفية، أن تتطلب قوة حوسبة كبيرة أثناء الاستدلال.

قد تتساءل: إذا كان YOLO11 مُحسَّنًا بالفعل للاستخدام على الحافة، فلماذا يحتاج إلى مزيد من التحسين؟ ببساطة، ليست كل الأجهزة المتطورة متشابهة. فبعضها يعمل على الحد الأدنى من الأجهزة، مثل المعالجات المدمجة الصغيرة التي تستهلك طاقة أقل من مصباح LED القياسي. 

في هذه الحالات، حتى النموذج المبسّط مثل YOLO11 يحتاج إلى تحسينات إضافية لضمان أداء سلس وموثوق. تساعد تقنيات مثل التقليم والتكميم في تقليل حجم النموذج وتسريع الاستدلال دون التأثير بشكل كبير على الدقة، مما يجعلها مثالية لمثل هذه البيئات المقيدة.

ولتسهيل تطبيق تقنيات التحسين هذه، يدعم Ultralytics العديد من عمليات التكامل التي يمكن استخدامها لتصدير نماذج YOLO إلى تنسيقات متعددة مثل ONNX و TensorRT و OpenVINO و CoreML و PaddlePaddle. تم تصميم كل تنسيق للعمل بشكل جيد مع أنواع محددة من الأجهزة وبيئات النشر. 

على سبيل المثال، غالبًا ما يُستخدم ONNX في مهام سير عمل التكميم نظرًا لتوافقه مع مجموعة كبيرة من الأدوات والمنصات. من ناحية أخرى، تم تحسين TensorRT بشكل كبير لأجهزة NVIDIA ويدعم الاستدلال منخفض الدقة باستخدام INT8، مما يجعله مثاليًا للنشر عالي السرعة على وحدات معالجة الرسومات المتطورة.

حالات الاستخدام المؤثرة لنموذج Ultralytics YOLO الأمثل لنموذج YOLO

مع استمرار توسع الرؤية الحاسوبية في العديد من تطبيقات العالم الحقيقي، تتيح نماذج YOLO المحسّنة إمكانية تشغيل مهام مثل اكتشاف الأجسام وتجزئة المثيل وتتبع الأجسام على أجهزة أصغر وأسرع. بعد ذلك، دعونا نناقش بعض حالات الاستخدام التي يجعل فيها التقليم والتكميم مهام الرؤية الحاسوبية هذه أكثر كفاءة وعملية.

المراقبة الذكية التي يقودها YOLO11

تعتمد العديد من الأماكن الصناعية، وكذلك الأماكن العامة، على المراقبة في الوقت الفعلي للبقاء آمنة ومأمونة. تحتاج أماكن مثل محطات النقل، ومواقع التصنيع، والمرافق الخارجية الكبيرة إلى أنظمة الذكاء الاصطناعي المرئي التي يمكنها اكتشاف الأشخاص أو المركبات بسرعة ودقة. في كثير من الأحيان، تعمل هذه المواقع في ظل محدودية الاتصال وقيود الأجهزة، مما يجعل من الصعب نشر نماذج كبيرة.

في مثل هذه الحالات، يُعد نموذج Vision AI المحسّن مثل YOLO11 حلاً رائعاً. فحجمه الصغير وأداؤه السريع يجعلانه مثاليًا للتشغيل على الأجهزة ذات الطاقة المنخفضة، مثل الكاميرات المدمجة أو أجهزة الاستشعار الذكية. يمكن لهذه النماذج معالجة البيانات المرئية مباشرةً على الجهاز، مما يتيح الكشف في الوقت الفعلي عن انتهاكات السلامة أو الوصول غير المصرح به أو النشاط غير الطبيعي، دون الاعتماد على الوصول المستمر إلى السحابة.

الشكل 4. يمكن استخدام YOLO11 لمراقبة الأماكن العامة مثل محطات المترو.

تعزيز السلامة في مواقع الإنشاءات باستخدام YOLO11

مواقع الإنشاءات هي بيئات سريعة الخطى ولا يمكن التنبؤ بها، فهي مليئة بالآلات الثقيلة والعمال المتحركين والنشاط المستمر. يمكن أن تتغير الظروف بسرعة بسبب تغير الجداول الزمنية أو حركة المعدات أو حتى التغيرات المفاجئة في الطقس. في مثل هذه البيئات الديناميكية، يمكن أن تبدو سلامة العمال تحدياً مستمراً.

تلعب المراقبة في الوقت الحقيقي دوراً حاسماً، ولكن الأنظمة التقليدية غالباً ما تعتمد على الوصول إلى السحابة أو الأجهزة باهظة الثمن التي قد لا تكون عملية في الموقع. هذا هو المكان الذي يمكن أن تكون فيه نماذج مثل YOLO11 مؤثرة. يمكن تحسين YOLO11 لتشغيله على أجهزة صغيرة وفعالة تعمل مباشرةً في الموقع دون الحاجة إلى اتصال بالإنترنت.

على سبيل المثال، ضع في اعتبارك موقع بناء كبير مثل توسعة طريق سريع يمتد على عدة أفدنة. في هذا النوع من الأماكن، يمكن أن يكون تتبع كل مركبة أو قطعة من المعدات يدوياً أمراً صعباً ويستغرق وقتاً طويلاً. يمكن أن تساعد طائرة بدون طيار مزودة بكاميرا ونموذج YOLO11 المحسّن من خلال الكشف عن المركبات وتتبعها تلقائيًا، ومراقبة تدفق حركة المرور، وتحديد مشكلات السلامة مثل الوصول غير المصرح به أو سلوك القيادة غير الآمن.

الشكل 5. تحليل صور طائرة بدون طيار من موقع بناء.(المصدر)

إيجابيات وسلبيات التقليم والتكميم في الرؤية الحاسوبية

فيما يلي بعض المزايا الرئيسية التي توفرها طرق تحسين نموذج الرؤية الحاسوبية مثل التقليم والتكميم:

  • نشر فعال من حيث التكلفة: يمكن أن تقلل النماذج الأصغر حجماً والأكثر كفاءة من الحاجة إلى أجهزة متطورة باهظة الثمن، مما يجعل الذكاء الاصطناعي أكثر سهولة وقابلية للتطوير عبر حالات الاستخدام المختلفة.

  • زمن استجابة أقل: من خلال تبسيط بنية النموذج وتقليل النفقات الحسابية، يمكن أن تساعد هذه التقنيات في تحقيق أوقات استجابة أسرع في تطبيقات الوقت الحقيقي.

  • كفاءة الطاقة: إن تقليل الحمل الحسابي يقلل أيضًا من استهلاك الطاقة، وهو أمر مفيد بشكل خاص للأنظمة التي تعمل بالبطارية أو الأنظمة المحمولة.

في حين أن التقليم والتكميم يوفران العديد من المزايا، إلا أنهما يأتيان أيضًا مع بعض المفاضلات التي يجب على المطورين أخذها في الاعتبار عند تحسين النماذج. فيما يلي بعض القيود التي يجب وضعها في الاعتبار:

  • الدقة المقايضات: إذا كان التقليم شديدًا جدًا أو إذا تم استخدام تكميم منخفض جدًا للبت، يمكن أن تنخفض دقة النموذج، التي تُقاس بمقاييس مثل mAP.

  • قيود الأجهزة: لا تدعم جميع الأجهزة التنسيقات ذات الدقة المنخفضة مثل INT8 بشكل جيد. وهذا يمكن أن يقيد مكان وكيفية نشر نموذج محسّن.

  • تعقيد التنفيذ: غالبًا ما يتطلب تحقيق نتائج جيدة ضبطًا دقيقًا خاصًا بالنموذج. قد يحتاج المطورون إلى إعادة تدريب النموذج وإجراء اختبارات مكثفة للحفاظ على الأداء مع تحسين الكفاءة.

الوجبات الرئيسية

يعد التقليم والتكميم من التقنيات المفيدة التي تساعد نماذج YOLO على أداء أفضل على الأجهزة المتطورة. فهي تقلل من حجم النموذج، وتقلل من احتياجاته الحاسوبية، وتسرع من التنبؤات، كل ذلك دون خسارة ملحوظة في الدقة.

تمنح طرق التحسين هذه المطورين أيضًا المرونة في ضبط النماذج لأنواع مختلفة من الأجهزة دون الحاجة إلى إعادة بنائها بالكامل. مع بعض عمليات الضبط والاختبار، يصبح من الأسهل تطبيق الذكاء الاصطناعي المرئي في مواقف العالم الحقيقي.

انضم إلى مجتمعنا المتنامي! استكشف مستودع GitHub الخاص بنا لمعرفة المزيد عن الذكاء الاصطناعي. هل أنت مستعد لبدء مشاريع الرؤية الحاسوبية الخاصة بك؟ اطلع على خيارات الترخيص لدينا. اكتشف الذكاء الاصطناعي في الزراعة والذكاء الاصطناعي للرؤية في مجال الرعاية الصحية من خلال زيارة صفحات الحلول الخاصة بنا! 

دعونا نبني المستقبل
للذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل التعلم الآلي

ابدأ مجاناً
تم نسخ الرابط إلى الحافظة