اكتشف سبب أهمية التقليم والتكميم لتحسين نماذج الرؤية الحاسوبية وتمكين أداء أسرع على الأجهزة المتطورة.

اكتشف سبب أهمية التقليم والتكميم لتحسين نماذج الرؤية الحاسوبية وتمكين أداء أسرع على الأجهزة المتطورة.
أصبحت الأجهزة المتطورة شائعة بشكل متزايد مع تقدم التكنولوجيا. من الساعات الذكية التي تتعقب معدل ضربات القلب إلى الطائرات بدون طيار التي تراقب الشوارع، يمكن للأنظمة المتطورة معالجة البيانات في الوقت الفعلي محلياً داخل الجهاز نفسه.
وغالباً ما تكون هذه الطريقة أسرع وأكثر أماناً من إرسال البيانات إلى السحابة، خاصةً بالنسبة للتطبيقات التي تتضمن بيانات شخصية، مثل اكتشاف لوحات السيارات أو تتبع الإيماءات. هذه أمثلة على الرؤية الحاسوبية، وهو فرع من فروع الذكاء الاصطناعي (AI) الذي يُمكِّن الآلات من تفسير المعلومات المرئية وفهمها.
إلا أن أحد الاعتبارات المهمة هو أن مثل هذه التطبيقات تتطلب نماذج ذكاء اصطناعي للرؤية قادرة على التعامل مع العمليات الحسابية الثقيلة، باستخدام الحد الأدنى من الموارد، والعمل بشكل مستقل. يتم تطوير معظم نماذج الرؤية الحاسوبية للأنظمة عالية الأداء، مما يجعلها أقل ملاءمة للنشر المباشر على الأجهزة المتطورة.
لسد هذه الفجوة، غالبًا ما يطبق المطورون تحسينات مستهدفة تعمل على تكييف النموذج ليعمل بكفاءة على أجهزة أصغر. هذه التعديلات ضرورية لعمليات النشر على الحافة في العالم الحقيقي، حيث تكون الذاكرة وقوة المعالجة محدودة.
من المثير للاهتمام أن نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 مصممة بالفعل مع وضع كفاءة الحافة في الاعتبار، مما يجعلها رائعة لمهام الوقت الحقيقي. ومع ذلك، يمكن تحسين أدائها بشكل أكبر باستخدام تقنيات تحسين النموذج مثل التقليم والتكميم الكمي، مما يتيح استنتاجاً أسرع واستخداماً أقل للموارد على الأجهزة المقيدة.
في هذه المقالة، سوف نلقي نظرة فاحصة على ماهية التقليم والتكميم وكيف يعملان وكيف يمكنهما مساعدة نماذج YOLO في عمليات النشر على الحافة في العالم الحقيقي. لنبدأ!
عند إعداد نماذج Vision AI للنشر على الأجهزة المتطورة، يتمثل أحد الأهداف الرئيسية في جعل النموذج خفيف الوزن وموثوقاً دون التضحية بالأداء. وغالباً ما يتضمن ذلك تقليل حجم النموذج ومتطلباته الحسابية حتى يتمكن من العمل بكفاءة على الأجهزة ذات الذاكرة أو الطاقة أو سعة المعالجة المحدودة. هناك طريقتان شائعتان للقيام بذلك هما التقليم والتكميم.
التقليم هو تقنية تحسين نموذج الذكاء الاصطناعي التي تساعد على جعل الشبكات العصبية أصغر حجماً وأكثر كفاءة. في كثير من الحالات، لا تساهم أجزاء من النموذج، مثل بعض الوصلات أو العقد، كثيرًا في تنبؤاته النهائية. يعمل التقليم من خلال تحديد هذه الأجزاء الأقل أهمية وإزالتها، مما يقلل من حجم النموذج ويسرّع من أدائه.
من ناحية أخرى، التكميم هو أسلوب تحسين يقلل من دقة الأرقام التي يستخدمها النموذج. فبدلاً من الاعتماد على الأرقام ذات الفاصلة العائمة عالية الدقة 32 بت، يتحول النموذج إلى تنسيقات أصغر وأكثر كفاءة مثل الأعداد الصحيحة 8 بت. يساعد هذا التغيير على تقليل استخدام الذاكرة وتسريع عملية الاستدلال، وهي العملية التي يقوم فيها النموذج بعمل تنبؤات.
والآن بعد أن أصبح لدينا فهم أفضل لماهية التقليم والتكميم الكمي، دعنا نتعرف على كيفية عملهما.
يتم التقليم باستخدام عملية تعرف باسم تحليل الحساسية. وهي تحدد أي أجزاء من نماذج الشبكة العصبية، مثل بعض الأوزان أو الخلايا العصبية أو القنوات، تساهم بأقل قدر في التنبؤ بالمخرجات النهائية. ويمكن إزالة هذه الأجزاء بأقل تأثير على الدقة. بعد التقليم، عادة ما يتم إعادة تدريب النموذج لضبط أدائه. ويمكن تكرار هذه الدورة لإيجاد التوازن الصحيح بين حجمه ودقته.
بينما يركز التكميم الكمي للن موذج على كيفية تعامل النموذج مع البيانات. يبدأ بالمعايرة، حيث يعمل النموذج على بيانات العينة لمعرفة نطاق القيم التي يحتاج إلى معالجتها. ثم يتم تحويل هذه القيم من النقطة العائمة 32 بت إلى تنسيقات أقل دقة مثل الأعداد الصحيحة 8 بت.
هناك العديد من الأدوات المتاحة التي تجعل من السهل استخدام التقليم والتكميم في مشاريع الذكاء الاصطناعي في العالم الحقيقي. تتضمن معظم أطر عمل الذكاء الاصطناعي، مثل PyTorch و TensorFlow، دعمًا مدمجًا لتقنيات التحسين هذه، مما يسمح للمطورين بدمجها مباشرةً في عملية نشر النموذج.
وبمجرد تحسين النموذج، يمكن لأدوات مثل ONNX Runtime المساعدة في تشغيله بكفاءة عبر منصات أجهزة مختلفة مثل الخوادم وأجهزة الكمبيوتر المكتبية والأجهزة الطرفية. بالإضافة إلى ذلك، توفر Ultralytics عمليات تكامل تسمح بتصدير نماذج YOLO بتنسيقات مناسبة للتكميم، مما يسهل تقليل حجم النموذج وتعزيز الأداء.
تُعرف نماذج Ultralytics YOLO مثل YOLO11 على نطاق واسع بسرعة اكتشافها للأشياء بخطوة واحدة، مما يجعلها مثالية لمهام الذكاء الاصطناعي للرؤية في الوقت الحقيقي. وهي مصممة بالفعل لتكون خفيفة الوزن وفعالة بما يكفي لنشرها على الحافة. ومع ذلك، لا يزال بإمكان الطبقات المسؤولة عن معالجة الميزات المرئية، والتي تسمى الطبقات التلافيفية، أن تتطلب قوة حوسبة كبيرة أثناء الاستدلال.
قد تتساءل: إذا كان YOLO11 مُحسَّنًا بالفعل للاستخدام على الحافة، فلماذا يحتاج إلى مزيد من التحسين؟ ببساطة، ليست كل الأجهزة المتطورة متشابهة. فبعضها يعمل على الحد الأدنى من الأجهزة، مثل المعالجات المدمجة الصغيرة التي تستهلك طاقة أقل من مصباح LED القياسي.
في هذه الحالات، حتى النموذج المبسّط مثل YOLO11 يحتاج إلى تحسينات إضافية لضمان أداء سلس وموثوق. تساعد تقنيات مثل التقليم والتكميم في تقليل حجم النموذج وتسريع الاستدلال دون التأثير بشكل كبير على الدقة، مما يجعلها مثالية لمثل هذه البيئات المقيدة.
ولتسهيل تطبيق تقنيات التحسين هذه، يدعم Ultralytics العديد من عمليات التكامل التي يمكن استخدامها لتصدير نماذج YOLO إلى تنسيقات متعددة مثل ONNX و TensorRT و OpenVINO و CoreML و PaddlePaddle. تم تصميم كل تنسيق للعمل بشكل جيد مع أنواع محددة من الأجهزة وبيئات النشر.
على سبيل المثال، غالبًا ما يُستخدم ONNX في مهام سير عمل التكميم نظرًا لتوافقه مع مجموعة كبيرة من الأدوات والمنصات. من ناحية أخرى، تم تحسين TensorRT بشكل كبير لأجهزة NVIDIA ويدعم الاستدلال منخفض الدقة باستخدام INT8، مما يجعله مثاليًا للنشر عالي السرعة على وحدات معالجة الرسومات المتطورة.
مع استمرار توسع الرؤية الحاسوبية في العديد من تطبيقات العالم الحقيقي، تتيح نماذج YOLO المحسّنة إمكانية تشغيل مهام مثل اكتشاف الأجسام وتجزئة المثيل وتتبع الأجسام على أجهزة أصغر وأسرع. بعد ذلك، دعونا نناقش بعض حالات الاستخدام التي يجعل فيها التقليم والتكميم مهام الرؤية الحاسوبية هذه أكثر كفاءة وعملية.
تعتمد العديد من الأماكن الصناعية، وكذلك الأماكن العامة، على المراقبة في الوقت الفعلي للبقاء آمنة ومأمونة. تحتاج أماكن مثل محطات النقل، ومواقع التصنيع، والمرافق الخارجية الكبيرة إلى أنظمة الذكاء الاصطناعي المرئي التي يمكنها اكتشاف الأشخاص أو المركبات بسرعة ودقة. في كثير من الأحيان، تعمل هذه المواقع في ظل محدودية الاتصال وقيود الأجهزة، مما يجعل من الصعب نشر نماذج كبيرة.
في مثل هذه الحالات، يُعد نموذج Vision AI المحسّن مثل YOLO11 حلاً رائعاً. فحجمه الصغير وأداؤه السريع يجعلانه مثاليًا للتشغيل على الأجهزة ذات الطاقة المنخفضة، مثل الكاميرات المدمجة أو أجهزة الاستشعار الذكية. يمكن لهذه النماذج معالجة البيانات المرئية مباشرةً على الجهاز، مما يتيح الكشف في الوقت الفعلي عن انتهاكات السلامة أو الوصول غير المصرح به أو النشاط غير الطبيعي، دون الاعتماد على الوصول المستمر إلى السحابة.
مواقع الإنشاءات هي بيئات سريعة الخطى ولا يمكن التنبؤ بها، فهي مليئة بالآلات الثقيلة والعمال المتحركين والنشاط المستمر. يمكن أن تتغير الظروف بسرعة بسبب تغير الجداول الزمنية أو حركة المعدات أو حتى التغيرات المفاجئة في الطقس. في مثل هذه البيئات الديناميكية، يمكن أن تبدو سلامة العمال تحدياً مستمراً.
تلعب المراقبة في الوقت الحقيقي دوراً حاسماً، ولكن الأنظمة التقليدية غالباً ما تعتمد على الوصول إلى السحابة أو الأجهزة باهظة الثمن التي قد لا تكون عملية في الموقع. هذا هو المكان الذي يمكن أن تكون فيه نماذج مثل YOLO11 مؤثرة. يمكن تحسين YOLO11 لتشغيله على أجهزة صغيرة وفعالة تعمل مباشرةً في الموقع دون الحاجة إلى اتصال بالإنترنت.
على سبيل المثال، ضع في اعتبارك موقع بناء كبير مثل توسعة طريق سريع يمتد على عدة أفدنة. في هذا النوع من الأماكن، يمكن أن يكون تتبع كل مركبة أو قطعة من المعدات يدوياً أمراً صعباً ويستغرق وقتاً طويلاً. يمكن أن تساعد طائرة بدون طيار مزودة بكاميرا ونموذج YOLO11 المحسّن من خلال الكشف عن المركبات وتتبعها تلقائيًا، ومراقبة تدفق حركة المرور، وتحديد مشكلات السلامة مثل الوصول غير المصرح به أو سلوك القيادة غير الآمن.
فيما يلي بعض المزايا الرئيسية التي توفرها طرق تحسين نموذج الرؤية الحاسوبية مثل التقليم والتكميم:
في حين أن التقليم والتكميم يوفران العديد من المزايا، إلا أنهما يأتيان أيضًا مع بعض المفاضلات التي يجب على المطورين أخذها في الاعتبار عند تحسين النماذج. فيما يلي بعض القيود التي يجب وضعها في الاعتبار:
يعد التقليم والتكميم من التقنيات المفيدة التي تساعد نماذج YOLO على أداء أفضل على الأجهزة المتطورة. فهي تقلل من حجم النموذج، وتقلل من احتياجاته الحاسوبية، وتسرع من التنبؤات، كل ذلك دون خسارة ملحوظة في الدقة.
تمنح طرق التحسين هذه المطورين أيضًا المرونة في ضبط النماذج لأنواع مختلفة من الأجهزة دون الحاجة إلى إعادة بنائها بالكامل. مع بعض عمليات الضبط والاختبار، يصبح من الأسهل تطبيق الذكاء الاصطناعي المرئي في مواقف العالم الحقيقي.
انضم إلى مجتمعنا المتنامي! استكشف مستودع GitHub الخاص بنا لمعرفة المزيد عن الذكاء الاصطناعي. هل أنت مستعد لبدء مشاريع الرؤية الحاسوبية الخاصة بك؟ اطلع على خيارات الترخيص لدينا. اكتشف الذكاء الاصطناعي في الزراعة والذكاء الاصطناعي للرؤية في مجال الرعاية الصحية من خلال زيارة صفحات الحلول الخاصة بنا!