اكتشف لماذا يعتبر التقليم والتكميم ضروريين لتحسين نماذج رؤية الحاسوب وتمكين أداء أسرع على الأجهزة الطرفية.
اكتشف لماذا يعتبر التقليم والتكميم ضروريين لتحسين نماذج رؤية الحاسوب وتمكين أداء أسرع على الأجهزة الطرفية.
أصبحت الأجهزة المتطورة شائعة بشكل متزايد مع تقدم التكنولوجيا. من الساعات الذكية التي track معدل ضربات القلب إلى الطائرات بدون طيار التي تراقب الشوارع، يمكن للأنظمة المتطورة معالجة البيانات في الوقت الفعلي محلياً داخل الجهاز نفسه.
غالبًا ما تكون هذه الطريقة أسرع وأكثر أمانًا من إرسال البيانات إلى السحابة، خاصةً للتطبيقات التي تتضمن بيانات شخصية، مثل اكتشاف لوحات الترخيص أو تتبع الإيماءات. هذه أمثلة على الرؤية الحاسوبية، وهي فرع من فروع الذكاء الاصطناعي (AI) الذي يمكّن الآلات من تفسير المعلومات المرئية وفهمها.

ومع ذلك، فإن الاعتبار المهم هو أن هذه التطبيقات تتطلب نماذج رؤية اصطناعية قادرة على التعامل مع العمليات الحسابية الثقيلة، باستخدام الحد الأدنى من الموارد، والعمل بشكل مستقل. يتم تطوير معظم نماذج رؤية الكمبيوتر للأنظمة عالية الأداء، مما يجعلها أقل ملاءمة للنشر المباشر على الأجهزة الطرفية.
لسد هذه الفجوة، غالبًا ما يطبق المطورون تحسينات مستهدفة تعمل على تكييف النموذج للتشغيل بكفاءة على أجهزة أصغر. هذه التعديلات ضرورية لعمليات النشر الطرفية في العالم الحقيقي، حيث تكون الذاكرة وقوة المعالجة محدودة.
ومن المثير للاهتمام أن نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 مصممة بالفعل مع وضع كفاءة الحافة في الاعتبار، مما يجعلها رائعة لمهام الوقت الحقيقي. ومع ذلك، يمكن تحسين أدائها بشكل أكبر باستخدام تقنيات تحسين النموذج مثل التقليم والتكميم الكمي، مما يتيح استنتاجاً أسرع واستخداماً أقل للموارد على الأجهزة المقيدة.
في هذه المقالة، سوف نلقي نظرة فاحصة على ماهية التقليم والتكميم وكيف يعملان وكيف يمكنهما مساعدة نماذج YOLO في عمليات النشر على الحافة في العالم الحقيقي. لنبدأ!
عند إعداد نماذج رؤية الذكاء الاصطناعي للنشر على الأجهزة الطرفية، فإن أحد الأهداف الرئيسية هو جعل النموذج خفيف الوزن وموثوقًا به دون التضحية بالأداء. غالبًا ما يتضمن ذلك تقليل حجم النموذج ومتطلباته الحسابية حتى يتمكن من العمل بكفاءة على الأجهزة ذات الذاكرة أو الطاقة أو سعة المعالجة المحدودة. هناك طريقتان شائعتان للقيام بذلك وهما التقليم والتكميم.
التقليم هو تقنية لتحسين نموذج الذكاء الاصطناعي تساعد على جعل الشبكات العصبية أصغر حجمًا وأكثر كفاءة. في كثير من الحالات، لا تساهم أجزاء من النموذج، مثل بعض الاتصالات أو العقد، كثيرًا في تنبؤاته النهائية. يعمل التقليم عن طريق تحديد وإزالة هذه الأجزاء الأقل أهمية، مما يقلل من حجم النموذج ويسرع أدائه.
من ناحية أخرى، فإن التكميم هو أسلوب لتحسين الأداء يقلل من دقة الأرقام التي يستخدمها النموذج. بدلاً من الاعتماد على أرقام الفاصلة العائمة ذات 32 بت عالية الدقة، يتحول النموذج إلى تنسيقات أصغر وأكثر كفاءة مثل الأعداد الصحيحة ذات 8 بتات. يساعد هذا التغيير على تقليل استخدام الذاكرة ويسرع الاستدلال، وهي العملية التي يقدم فيها النموذج تنبؤات.

الآن بعد أن أصبح لدينا فهم أفضل لماهية التقليم والقياس الكمي، دعنا نستعرض كيفية عمل كليهما.
يتم التقليم باستخدام عملية تعرف باسم تحليل الحساسية. فهو يحدد أجزاء نماذج الشبكة العصبية، مثل بعض الأوزان أو الخلايا العصبية أو القنوات، التي تساهم بأقل قدر في التنبؤ بالناتج النهائي. يمكن إزالة هذه الأجزاء بأقل تأثير على الدقة. بعد التقليم، عادة ما يتم إعادة تدريب النموذج لضبط أدائه بدقة. يمكن تكرار هذه الدورة للعثور على التوازن الصحيح بين حجمه ودقته.
وفي الوقت نفسه، يركز تكميم النموذج على كيفية تعامل النموذج مع البيانات. يبدأ بالمعايرة، حيث يتم تشغيل النموذج على بيانات نموذجية لتعلم نطاق القيم التي يحتاج إلى معالجتها. ثم يتم تحويل هذه القيم من فاصلة عائمة 32 بت إلى تنسيقات دقة أقل مثل الأعداد الصحيحة 8 بت.

هناك العديد من الأدوات المتاحة التي تجعل من السهل استخدام التقليم والتكميم في مشاريع الذكاء الاصطناعي في العالم الحقيقي. تتضمن معظم أطر عمل الذكاء الاصطناعي، مثل PyTorch و TensorFlow دعمًا مدمجًا لتقنيات التحسين هذه، مما يسمح للمطورين بدمجها مباشرةً في عملية نشر النموذج.
وبمجرد تحسين النموذج، يمكن لأدوات مثل ONNX Runtime المساعدة في تشغيله بكفاءة عبر منصات أجهزة مختلفة مثل الخوادم وأجهزة الكمبيوتر المكتبية والأجهزة الطرفية. بالإضافة إلى ذلك، توفر Ultralytics عمليات تكامل تسمح بتصدير نماذج YOLO بتنسيقات مناسبة للتكميم، مما يسهل تقليل حجم النموذج وتعزيز الأداء.
تُعرف نماذج Ultralytics YOLO مثل YOLO11 على نطاق واسع بسرعة اكتشافها للأشياء بخطوة واحدة، مما يجعلها مثالية لمهام الذكاء الاصطناعي للرؤية في الوقت الحقيقي. وهي مصممة بالفعل لتكون خفيفة الوزن وفعالة بما يكفي لنشرها على الحافة. ومع ذلك، لا يزال بإمكان الطبقات المسؤولة عن معالجة الميزات المرئية، والتي تسمى الطبقات التلافيفية، أن تتطلب قوة حوسبة كبيرة أثناء الاستدلال.
قد تتساءل: إذا كان YOLO11 مُحسَّنًا بالفعل للاستخدام على الحافة، فلماذا يحتاج إلى مزيد من التحسين؟ ببساطة، ليست كل الأجهزة المتطورة متشابهة. فبعضها يعمل على الحد الأدنى من الأجهزة، مثل المعالجات المدمجة الصغيرة التي تستهلك طاقة أقل من مصباح LED القياسي.
في هذه الحالات، حتى النموذج المبسّط مثل YOLO11 يحتاج إلى تحسين إضافي لضمان أداء سلس وموثوق. تساعد تقنيات مثل التقليم والتكميم في تقليل حجم النموذج وتسريع الاستدلال دون التأثير بشكل كبير على الدقة، مما يجعلها مثالية لمثل هذه البيئات المقيدة.
ولتسهيل تطبيق تقنيات التحسين هذه، يدعم Ultralytics العديد من عمليات التكامل التي يمكن استخدامها لتصدير نماذج YOLO إلى تنسيقات متعددة مثل ONNX و TensorRT و OpenVINO و CoreML و PaddlePaddle. تم تصميم كل تنسيق للعمل بشكل جيد مع أنواع محددة من الأجهزة وبيئات النشر.
على سبيل المثال، غالبًا ما يُستخدم ONNX في مهام سير عمل التكميم نظرًا لتوافقه مع مجموعة كبيرة من الأدوات والمنصات. من ناحية أخرى، تم تحسين TensorRT بشكل كبير لأجهزة NVIDIA ويدعم الاستدلال منخفض الدقة باستخدام INT8، مما يجعله مثاليًا للنشر عالي السرعة على وحدات معالجة الرسومات المتطورة.
مع استمرار توسع الرؤية الحاسوبية في العديد من تطبيقات العالم الحقيقي، تتيح نماذج YOLO المحسّنة إمكانية تشغيل مهام مثل اكتشاف الأجسام وتجزئة المثيل وتتبع الأجسام على أجهزة أصغر وأسرع. بعد ذلك، دعونا نناقش بعض حالات الاستخدام التي يجعل فيها التقليم والتكميم مهام الرؤية الحاسوبية هذه أكثر كفاءة وعملية.
تعتمد العديد من الأماكن الصناعية، وكذلك الأماكن العامة، على المراقبة في الوقت الفعلي للحفاظ على سلامتها وأمانها. تحتاج أماكن مثل محطات النقل، ومواقع التصنيع، والمرافق الخارجية الكبيرة إلى أنظمة الذكاء الاصطناعي المرئي التي يمكنها detect الأشخاص أو المركبات بسرعة ودقة. في كثير من الأحيان، تعمل هذه المواقع في ظل محدودية الاتصال وقيود الأجهزة، مما يجعل من الصعب نشر نماذج كبيرة.
في مثل هذه الحالات، يُعد نموذج Vision AI المحسّن مثل YOLO11 حلاً رائعاً. فحجمه الصغير وأداؤه السريع يجعلانه مثاليًا للتشغيل على الأجهزة ذات الطاقة المنخفضة، مثل الكاميرات المدمجة أو أجهزة الاستشعار الذكية. يمكن لهذه النماذج معالجة البيانات المرئية مباشرةً على الجهاز، مما يتيح الكشف في الوقت الفعلي عن انتهاكات السلامة أو الوصول غير المصرح به أو النشاط غير الطبيعي، دون الاعتماد على الوصول المستمر إلى السحابة.

تعتبر مواقع البناء بيئات سريعة الخطى وغير متوقعة، مليئة بالآلات الثقيلة والعمال المتحركين والنشاط المستمر. يمكن أن تتغير الظروف بسرعة بسبب تحول الجداول الزمنية أو حركة المعدات أو حتى التغيرات المفاجئة في الطقس. في مثل هذه البيئة الديناميكية، يمكن أن يبدو أمان العمال تحديًا مستمرًا.
تلعب المراقبة في الوقت الحقيقي دوراً حاسماً، ولكن الأنظمة التقليدية غالباً ما تعتمد على الوصول إلى السحابة أو الأجهزة باهظة الثمن التي قد لا تكون عملية في الموقع. هذا هو المكان الذي يمكن أن تكون فيه نماذج مثل YOLO11 مؤثرة. يمكن تحسين YOLO11 لتشغيله على أجهزة صغيرة وفعالة تعمل مباشرةً في الموقع دون الحاجة إلى اتصال بالإنترنت.
على سبيل المثال، ضع في اعتبارك موقع بناء كبير مثل توسعة طريق سريع يمتد على عدة أفدنة. في هذا النوع من الأماكن، يمكن أن يكون تتبع كل مركبة أو قطعة من المعدات يدوياً أمراً صعباً ويستغرق وقتاً طويلاً. يمكن أن تساعد طائرة بدون طيار مزودة بكاميرا ونموذج YOLO11 المحسّن من خلال الكشف عن المركبات وتتبعها تلقائيًا، ومراقبة تدفق حركة المرور، وتحديد مشكلات السلامة مثل الوصول غير المصرح به أو سلوك القيادة غير الآمن.

فيما يلي بعض المزايا الرئيسية التي توفرها طرق تحسين نموذج رؤية الكمبيوتر مثل التقليم والتكميم:
في حين أن التقليم والتكميم يوفران العديد من المزايا، إلا أنهما يأتيان أيضًا مع بعض المقايضات التي يجب على المطورين أخذها في الاعتبار عند تحسين النماذج. فيما يلي بعض القيود التي يجب وضعها في الاعتبار:
يعد التقليم والتكميم من التقنيات المفيدة التي تساعد نماذج YOLO على أداء أفضل على الأجهزة المتطورة. فهي تقلل من حجم النموذج، وتقلل من احتياجاته الحاسوبية، وتسرع من التنبؤات، كل ذلك دون خسارة ملحوظة في الدقة.
تتيح طرق التحسين هذه للمطورين المرونة اللازمة لضبط النماذج لأنواع مختلفة من الأجهزة دون الحاجة إلى إعادة بنائها بالكامل. مع بعض الضبط والاختبار، يصبح تطبيق رؤية الذكاء الاصطناعي (Vision AI) في مواقف العالم الحقيقي أسهل.
انضم إلى مجتمعنا المتنامي! استكشف مستودع GitHub الخاص بنا لمعرفة المزيد حول الذكاء الاصطناعي. هل أنت مستعد لبدء مشاريع رؤية الحاسوب الخاصة بك؟ تحقق من خيارات الترخيص لدينا. اكتشف الذكاء الاصطناعي في الزراعة والرؤية الاصطناعية في الرعاية الصحية من خلال زيارة صفحات الحلول الخاصة بنا!