التقليم والتكميم في الرؤية الحاسوبية: دليل سريع
اكتشف سبب أهمية التقليم والتكميم لتحسين نماذج الرؤية الحاسوبية وتمكين أداء أسرع على أجهزة الحافة.

تزداد شيوعاً أجهزة الحافة (edge devices) مع تقدم التكنولوجيا. فبدءاً من الساعات الذكية التي تتعقب معدل ضربات قلبك وصولاً إلى الطائرات بدون طيار التي تراقب الشوارع، يمكن لأنظمة الحافة معالجة البيانات في الوقت الفعلي محلياً داخل الجهاز نفسه.
غالباً ما تكون هذه الطريقة أسرع وأكثر أماناً من إرسال البيانات إلى السحابة، خاصة للتطبيقات التي تتضمن بيانات شخصية، مثل اكتشاف لوحات الترخيص أو تعقب الإيماءات. هذه أمثلة على الرؤية الحاسوبية، وهو فرع من الذكاء الاصطناعي (AI) يُمكّن الآلات من تفسير وفهم المعلومات المرئية.

الشكل 1. مثال على اكتشاف لوحة الترخيص. (المصدر)
ومع ذلك، هناك اعتبار مهم وهو أن مثل هذه التطبيقات تتطلب نماذج ذكاء اصطناعي للرؤية قادرة على التعامل مع عمليات حسابية ثقيلة، باستخدام الحد الأدنى من الموارد، والعمل بشكل مستقل. معظم نماذج الرؤية الحاسوبية مطورة لأنظمة عالية الأداء، مما يجعلها أقل ملاءمة للنشر المباشر على أجهزة الحافة.
لسد هذه الفجوة، غالباً ما يطبق المطورون تحسينات مستهدفة تكيّف النموذج ليعمل بكفاءة على أجهزة أصغر. هذه التعديلات ضرورية لعمليات النشر الواقعية على الحافة، حيث تكون الذاكرة وقوة المعالجة محدودة.
من المثير للاهتمام أن نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 مصممة بالفعل مع وضع كفاءة الحافة في الاعتبار، مما يجعلها رائعة للمهام ذات الوقت الفعلي. ومع ذلك، يمكن تعزيز أدائها بشكل أكبر باستخدام تقنيات تحسين النماذج مثل التقليم والتكميم، مما يتيح استنتاجاً أسرع واستخداماً أقل للموارد على الأجهزة المقيدة.
في هذه المقالة، سنلقي نظرة فاحصة على ماهية التقليم والتكميم، وكيفية عملهما، وكيف يمكنهما مساعدة نماذج YOLO في الأداء ضمن عمليات النشر الواقعية على الحافة. لنبدأ!
Link to this sectionالتقليم والتكميم: تقنيات أساسية في تحسين النماذج#
عند إعداد نماذج الذكاء الاصطناعي للرؤية للنشر على أجهزة الحافة، أحد الأهداف الرئيسية هو جعل النموذج خفيف الوزن وموثوقاً دون التضحية بالأداء. يتضمن ذلك غالباً تقليل حجم النموذج والمتطلبات الحسابية ليعمل بكفاءة على الأجهزة ذات الذاكرة أو الطاقة أو سعة المعالجة المحدودة. هناك طريقتان شائعتان للقيام بذلك هما التقليم والتكميم.
التقليم هو تقنية تحسين نموذج ذكاء اصطناعي تساعد في جعل الشبكات العصبية أصغر وأكثر كفاءة. في كثير من الحالات، لا تساهم أجزاء من النموذج، مثل اتصالات أو عقد معينة، كثيراً في تنبؤاته النهائية. يعمل التقليم عن طريق تحديد وإزالة هذه الأجزاء الأقل أهمية، مما يقلل من حجم النموذج ويسرع أداءه.
من ناحية أخرى، التكميم هو تقنية تحسين تقلل من دقة الأرقام التي يستخدمها النموذج. بدلاً من الاعتماد على أرقام الفاصلة العائمة عالية الدقة ذات 32 بت، يتحول النموذج إلى تنسيقات أصغر وأكثر كفاءة مثل الأعداد الصحيحة ذات 8 بت. يساعد هذا التغيير في خفض استخدام الذاكرة وتسريع الاستنتاج، وهي العملية التي يقوم فيها النموذج بإجراء التنبؤات.

الشكل 2. نظرة على التقليم والتكميم. (المصدر)
Link to this sectionكيف يعمل التقليم والتكميم#
الآن بعد أن أصبح لدينا فهم أفضل لماهية التقليم والتكميم، دعنا نمر عبر كيفية عمل كل منهما.
يتم التقليم باستخدام عملية تُعرف بتحليل الحساسية. فهي تحدد أي أجزاء من نماذج الشبكة العصبية، مثل أوزان أو عصبونات أو قنوات معينة، تساهم بأقل قدر في التنبؤ النهائي للمخرجات. يمكن إزالة هذه الأجزاء بأقل تأثير على الدقة. بعد التقليم، عادة ما يتم إعادة تدريب النموذج لضبط أدائه بدقة. يمكن تكرار هذه الدورة للعثور على التوازن الصحيح بين الحجم والدقة.
وفي الوقت نفسه، يركز تكميم النموذج على كيفية معالجة النموذج للبيانات. يبدأ بالمعايرة، حيث يعمل النموذج على بيانات عينة لتعلم نطاق القيم التي يحتاج إلى معالجتها. ثم يتم تحويل تلك القيم من فاصلة عائمة ذات 32 بت إلى تنسيقات منخفضة الدقة مثل الأعداد الصحيحة ذات 8 بت.

الشكل 3. يساعد التكميم في تقليل حجم النموذج وتعقيده. (المصدر)
هناك العديد من الأدوات المتاحة التي تسهل استخدام التقليم والتكميم في مشاريع الذكاء الاصطناعي الواقعية. تتضمن معظم أطر عمل الذكاء الاصطناعي، مثل PyTorch وTensorFlow، دعماً مدمجاً لتقنيات التحسين هذه، مما يسمح للمطورين بدمجها مباشرة في عملية نشر النموذج.
بمجرد تحسين النموذج، يمكن لأدوات مثل ONNX Runtime المساعدة في تشغيله بكفاءة عبر منصات أجهزة متنوعة مثل الخوادم وأجهزة سطح المكتب وأجهزة الحافة. أيضاً، تقدم Ultralytics تكاملات تسمح بتصدير نماذج YOLO بتنسيقات مناسبة للتكميم، مما يسهل تقليل حجم النموذج وتعزيز الأداء.
Link to this sectionنظرة عامة على تحسين نموذج Ultralytics YOLO#
تحظى نماذج Ultralytics YOLO مثل YOLO11 باعتراف واسع النطاق لاكتشافها السريع للأجسام في خطوة واحدة، مما يجعلها مثالية لمهام ذكاء اصطناعي للرؤية في الوقت الفعلي. إنها مصممة بالفعل لتكون خفيفة الوزن وفعالة بما يكفي لنشرها على الحافة. ومع ذلك، لا تزال الطبقات المسؤولة عن معالجة السمات المرئية، والتي تسمى الطبقات التلافيفية، تتطلب قوة حوسبة كبيرة أثناء الاستنتاج.
قد تتساءل: إذا كان YOLO11 محسناً بالفعل لاستخدام الحافة، فلماذا يحتاج إلى مزيد من التحسين؟ ببساطة، ليست كل أجهزة الحافة متطابقة. فبعضها يعمل على أجهزة بسيطة جداً، مثل المعالجات المضمنة الصغيرة التي تستهلك طاقة أقل من مصباح LED قياسي.
في هذه الحالات، حتى نموذج مبسط مثل YOLO11 يحتاج إلى تحسين إضافي لضمان أداء سلس وموثوق. تساعد تقنيات مثل التقليم والتكميم في تقليل حجم النموذج وتسريع الاستنتاج دون التأثير بشكل كبير على الدقة، مما يجعلها مثالية لمثل هذه البيئات المقيدة.
لتسهيل تطبيق تقنيات التحسين هذه، تدعم Ultralytics تكاملات متنوعة يمكن استخدامها لتصدير نماذج YOLO إلى تنسيقات متعددة مثل ONNX وTensorRT وOpenVINO وCoreML وPaddlePaddle. تم تصميم كل تنسيق ليعمل بشكل جيد مع أنواع معينة من الأجهزة وبيئات النشر.
على سبيل المثال، غالباً ما يُستخدم ONNX في سير عمل التكميم نظراً لتوافقه مع مجموعة واسعة من الأدوات والمنصات. من ناحية أخرى، تم تحسين TensorRT بدرجة عالية لأجهزة NVIDIA ويدعم استنتاجاً منخفض الدقة باستخدام INT8، مما يجعله مثالياً للنشر عالي السرعة على وحدات معالجة الرسومات (GPU) على الحافة.
Link to this sectionحالات استخدام مؤثرة لتحسين نموذج Ultralytics YOLO#
مع استمرار توسع الرؤية الحاسوبية في تطبيقات واقعية مختلفة، تجعل نماذج YOLO المحسنة من الممكن تشغيل مهام مثل اكتشاف الأجسام، وتجزئة المثيلات، وتتبع الأجسام على أجهزة أصغر وأسرع. بعد ذلك، دعنا نناقش حالتين من حالات الاستخدام حيث يجعل التقليم والتكميم مهام الرؤية الحاسوبية هذه أكثر كفاءة وعملية.
Link to this sectionالمراقبة الذكية التي يقودها YOLO11#
تعتمد العديد من المساحات الصناعية، وكذلك المناطق العامة، على المراقبة في الوقت الفعلي للبقاء آمنة ومحمية. تحتاج أماكن مثل محطات العبور، ومواقع التصنيع، والمرافق الخارجية الكبيرة إلى أنظمة ذكاء اصطناعي للرؤية يمكنها اكتشاف الأشخاص أو المركبات بسرعة وبدقة. غالباً ما تعمل هذه المواقع مع اتصال محدود وقيود في الأجهزة، مما يجعل من الصعب نشر نماذج كبيرة.
في مثل هذه الحالات، يُعد نموذج الذكاء الاصطناعي للرؤية المحسن مثل YOLO11 حلاً رائعاً. فحجمه المدمج وأداؤه السريع يجعله مثالياً للتشغيل على أجهزة الحافة منخفضة الطاقة، مثل الكاميرات المضمنة أو المستشعرات الذكية. يمكن لهذه النماذج معالجة البيانات المرئية مباشرة على الجهاز، مما يتيح الاكتشاف في الوقت الفعلي لانتهاكات السلامة، أو الوصول غير المصرح به، أو النشاط غير الطبيعي، دون الاعتماد على الوصول المستمر إلى السحابة.

الشكل 4. يمكن استخدام YOLO11 لمراقبة الأماكن العامة مثل محطات المترو.
Link to this sectionتعزيز السلامة في مواقع البناء باستخدام YOLO11#
مواقع البناء هي بيئات سريعة الخطى ولا يمكن التنبؤ بها، مليئة بالآلات الثقيلة، والعمال المتحركين، والنشاط المستمر. يمكن أن تتغير الظروف بسرعة بسبب الجداول الزمنية المتغيرة، أو حركة المعدات، أو حتى التغيرات المفاجئة في الطقس. في مثل هذا الإعداد الديناميكي، يمكن أن تبدو سلامة العمال تحدياً مستمراً.
تلعب المراقبة في الوقت الفعلي دوراً حاسماً، ولكن الأنظمة التقليدية غالباً ما تعتمد على الوصول إلى السحابة أو أجهزة باهظة الثمن قد لا تكون عملية في الموقع. هنا يأتي دور نماذج مثل YOLO11 التي يمكن أن تكون مؤثرة. يمكن تحسين YOLO11 للتشغيل على أجهزة حافة صغيرة وفعالة تعمل مباشرة في الموقع دون الحاجة إلى اتصال بالإنترنت.
على سبيل المثال، ضع في اعتبارك موقع بناء كبيراً مثل توسعة طريق سريع يمتد لعدة أفدنة. في هذا النوع من الإعداد، قد يكون التتبع اليدوي لكل مركبة أو قطعة معدات أمراً صعباً ويستغرق وقتاً طويلاً. يمكن لطائرة بدون طيار مجهزة بكاميرا ونموذج YOLO11 محسن أن تساعد من خلال اكتشاف المركبات وتتبعها تلقائياً، ومراقبة تدفق حركة المرور، وتحديد مشكلات السلامة مثل الوصول غير المصرح به أو سلوك القيادة غير الآمن.

الشكل 5. تحليل صور الطائرات بدون طيار من موقع بناء. (المصدر)
Link to this sectionإيجابيات وسلبيات التقليم والتكميم في الرؤية الحاسوبية#
فيما يلي بعض المزايا الرئيسية التي توفرها طرق تحسين نماذج الرؤية الحاسوبية مثل التقليم والتكميم:
- نشر فعال من حيث التكلفة: يمكن للنماذج الأصغر والأكثر كفاءة أن تقلل الحاجة إلى أجهزة متطورة باهظة الثمن، مما يجعل الذكاء الاصطناعي أكثر سهولة وقابلية للتوسع عبر حالات الاستخدام المختلفة.
- زمن انتقال أقل: من خلال تبسيط بنية النموذج وتقليل النفقات الحسابية، يمكن أن تساعد هذه التقنيات في تحقيق أوقات استجابة أسرع في التطبيقات ذات الوقت الفعلي.
- كفاءة الطاقة: يؤدي تقليل الحمل الحسابي أيضاً إلى خفض استهلاك الطاقة، وهو أمر مفيد بشكل خاص للأنظمة التي تعمل بالبطارية أو الأنظمة المتنقلة.
في حين أن التقليم والتكميم يوفران العديد من المزايا، فإنهما يأتيان أيضاً مع مقايضات معينة يجب على المطورين مراعاتها عند تحسين النماذج. فيما يلي بعض القيود التي يجب وضعها في الاعتبار:
- مقايضات الدقة: إذا كان التقليم عدوانياً جداً أو إذا تم استخدام تكميم منخفض البت جداً، فقد تنخفض دقة النموذج، المقاسة بمقاييس مثل mAP.
- قيود الأجهزة: لا تدعم جميع الأجهزة التنسيقات منخفضة الدقة مثل INT8 بنفس الكفاءة. هذا يمكن أن يقيد مكان وكيفية نشر النموذج المحسن.
- تعقيد التنفيذ: غالباً ما يتطلب تحقيق نتائج جيدة ضبطاً دقيقاً خاصاً بالنموذج. قد يحتاج المطورون إلى إعادة تدريب النموذج وإجراء اختبارات مكثفة للحفاظ على الأداء مع تحسين الكفاءة.
Link to this sectionأبرز النقاط#
التقليم والتكميم تقنيات مفيدة تساعد نماذج YOLO على الأداء بشكل أفضل على أجهزة الحافة. إنها تقلل من حجم النموذج، وتخفض احتياجاته الحسابية، وتسرع التنبؤات، كل ذلك دون خسارة ملحوظة في الدقة.
تمنح طرق التحسين هذه المطورين أيضاً المرونة لتكييف النماذج لأنواع مختلفة من الأجهزة دون الحاجة إلى إعادة بنائها بالكامل. مع بعض الضبط والاختبار، يصبح من الأسهل تطبيق الذكاء الاصطناعي للرؤية في المواقف الواقعية.
انضم إلى مجتمعنا المتنامي! استكشف مستودع GitHub الخاص بنا لمعرفة المزيد عن الذكاء الاصطناعي. هل أنت مستعد لبدء مشاريع الرؤية الحاسوبية الخاصة بك؟ تحقق من خيارات الترخيص لدينا. اكتشف الذكاء الاصطناعي في الزراعة والذكاء الاصطناعي للرؤية في الرعاية الصحية من خلال زيارة صفحات الحلول الخاصة بنا!






