اكتشف لماذا يعتبر التقليم والتكميم ضروريين لتحسين نماذج رؤية الحاسوب وتمكين أداء أسرع على الأجهزة الطرفية.

اكتشف لماذا يعتبر التقليم والتكميم ضروريين لتحسين نماذج رؤية الحاسوب وتمكين أداء أسرع على الأجهزة الطرفية.
تزداد الأجهزة الطرفية شيوعًا مع تقدم التكنولوجيا. من الساعات الذكية التي تتبع معدل ضربات قلبك إلى الطائرات بدون طيار التي تراقب الشوارع، يمكن للأنظمة الطرفية معالجة البيانات في الوقت الفعلي محليًا داخل الجهاز نفسه.
غالبًا ما تكون هذه الطريقة أسرع وأكثر أمانًا من إرسال البيانات إلى السحابة، خاصةً للتطبيقات التي تتضمن بيانات شخصية، مثل اكتشاف لوحات الترخيص أو تتبع الإيماءات. هذه أمثلة على الرؤية الحاسوبية، وهي فرع من فروع الذكاء الاصطناعي (AI) الذي يمكّن الآلات من تفسير المعلومات المرئية وفهمها.
ومع ذلك، فإن الاعتبار المهم هو أن هذه التطبيقات تتطلب نماذج رؤية اصطناعية قادرة على التعامل مع العمليات الحسابية الثقيلة، باستخدام الحد الأدنى من الموارد، والعمل بشكل مستقل. يتم تطوير معظم نماذج رؤية الكمبيوتر للأنظمة عالية الأداء، مما يجعلها أقل ملاءمة للنشر المباشر على الأجهزة الطرفية.
لسد هذه الفجوة، غالبًا ما يطبق المطورون تحسينات مستهدفة تعمل على تكييف النموذج للتشغيل بكفاءة على أجهزة أصغر. هذه التعديلات ضرورية لعمليات النشر الطرفية في العالم الحقيقي، حيث تكون الذاكرة وقوة المعالجة محدودة.
ومن المثير للاهتمام، أن نماذج رؤية الكمبيوتر مثل Ultralytics YOLO11 مصممة بالفعل مع وضع كفاءة الحافة في الاعتبار، مما يجعلها رائعة للمهام في الوقت الفعلي. ومع ذلك، يمكن تعزيز أدائها بشكل أكبر باستخدام تقنيات تحسين النموذج مثل التقليم والقياس الكمي، مما يتيح استدلالًا أسرع واستخدامًا أقل للموارد على الأجهزة ذات الموارد المحدودة.
في هذه المقالة، سوف نلقي نظرة فاحصة على ماهية التقليم والتكميم، وكيفية عملهما، وكيف يمكنهما مساعدة نماذج YOLO على الأداء في عمليات النشر المتطورة في العالم الحقيقي. هيا بنا نبدأ!
عند إعداد نماذج رؤية الذكاء الاصطناعي للنشر على الأجهزة الطرفية، فإن أحد الأهداف الرئيسية هو جعل النموذج خفيف الوزن وموثوقًا به دون التضحية بالأداء. غالبًا ما يتضمن ذلك تقليل حجم النموذج ومتطلباته الحسابية حتى يتمكن من العمل بكفاءة على الأجهزة ذات الذاكرة أو الطاقة أو سعة المعالجة المحدودة. هناك طريقتان شائعتان للقيام بذلك وهما التقليم والتكميم.
التقليم هو تقنية لتحسين نموذج الذكاء الاصطناعي تساعد على جعل الشبكات العصبية أصغر حجمًا وأكثر كفاءة. في كثير من الحالات، لا تساهم أجزاء من النموذج، مثل بعض الاتصالات أو العقد، كثيرًا في تنبؤاته النهائية. يعمل التقليم عن طريق تحديد وإزالة هذه الأجزاء الأقل أهمية، مما يقلل من حجم النموذج ويسرع أدائه.
من ناحية أخرى، فإن التكميم هو أسلوب لتحسين الأداء يقلل من دقة الأرقام التي يستخدمها النموذج. بدلاً من الاعتماد على أرقام الفاصلة العائمة ذات 32 بت عالية الدقة، يتحول النموذج إلى تنسيقات أصغر وأكثر كفاءة مثل الأعداد الصحيحة ذات 8 بتات. يساعد هذا التغيير على تقليل استخدام الذاكرة ويسرع الاستدلال، وهي العملية التي يقدم فيها النموذج تنبؤات.
الآن بعد أن أصبح لدينا فهم أفضل لماهية التقليم والقياس الكمي، دعنا نستعرض كيفية عمل كليهما.
يتم التقليم باستخدام عملية تعرف باسم تحليل الحساسية. فهو يحدد أجزاء نماذج الشبكة العصبية، مثل بعض الأوزان أو الخلايا العصبية أو القنوات، التي تساهم بأقل قدر في التنبؤ بالناتج النهائي. يمكن إزالة هذه الأجزاء بأقل تأثير على الدقة. بعد التقليم، عادة ما يتم إعادة تدريب النموذج لضبط أدائه بدقة. يمكن تكرار هذه الدورة للعثور على التوازن الصحيح بين حجمه ودقته.
وفي الوقت نفسه، يركز تكميم النموذج على كيفية تعامل النموذج مع البيانات. يبدأ بالمعايرة، حيث يتم تشغيل النموذج على بيانات نموذجية لتعلم نطاق القيم التي يحتاج إلى معالجتها. ثم يتم تحويل هذه القيم من فاصلة عائمة 32 بت إلى تنسيقات دقة أقل مثل الأعداد الصحيحة 8 بت.
تتوفر العديد من الأدوات التي تسهل استخدام التقليم والتكميم في مشاريع الذكاء الاصطناعي الواقعية. تتضمن معظم أطر عمل الذكاء الاصطناعي، مثل PyTorch و TensorFlow، دعمًا مدمجًا لتقنيات التحسين هذه، مما يسمح للمطورين بدمجها مباشرةً في عملية نشر النموذج.
بمجرد تحسين النموذج، يمكن لأدوات مثل ONNX Runtime المساعدة في تشغيله بكفاءة عبر العديد من منصات الأجهزة مثل الخوادم وأجهزة الكمبيوتر المكتبية والأجهزة الطرفية. أيضًا، تقدم Ultralytics عمليات تكامل تسمح بتصدير نماذج YOLO بتنسيقات مناسبة للتكميم، مما يسهل تقليل حجم النموذج وتعزيز الأداء.
تحظى نماذج Ultralytics YOLO مثل YOLO11 بتقدير واسع النطاق للكشف السريع عن الكائنات بخطوة واحدة، مما يجعلها مثالية لمهام رؤية الذكاء الاصطناعي في الوقت الفعلي. وهي مصممة بالفعل لتكون خفيفة الوزن وفعالة بما يكفي للنشر على الحافة. ومع ذلك، فإن الطبقات المسؤولة عن معالجة الميزات المرئية، والتي تسمى الطبقات التلافيفية، لا تزال تتطلب قدرًا كبيرًا من قوة الحوسبة أثناء الاستدلال.
قد تتساءل: إذا كان YOLO11 مُحسَّنًا بالفعل للاستخدام على الحافة، فلماذا يحتاج إلى مزيد من التحسين؟ ببساطة، ليست كل الأجهزة الطرفية متشابهة. بعضها يعمل على أجهزة قليلة جدًا، مثل معالجات مضمنة صغيرة تستهلك طاقة أقل من لمبة LED القياسية.
في هذه الحالات، حتى النموذج المبسط مثل YOLO11 يحتاج إلى تحسين إضافي لضمان أداء سلس وموثوق. تساعد تقنيات مثل التقليم والتكميم على تقليل حجم النموذج وتسريع الاستدلال دون التأثير بشكل كبير على الدقة، مما يجعلها مثالية لمثل هذه البيئات المقيدة.
لتسهيل تطبيق تقنيات التحسين هذه، تدعم Ultralytics العديد من عمليات التكامل التي يمكن استخدامها لتصدير نماذج YOLO إلى تنسيقات متعددة مثل ONNX و TensorRT و OpenVINO و CoreML و PaddlePaddle. تم تصميم كل تنسيق ليعمل بشكل جيد مع أنواع معينة من الأجهزة وبيئات النشر.
على سبيل المثال، غالبًا ما يستخدم ONNX في مهام سير عمل التكميم نظرًا لتوافقه مع مجموعة واسعة من الأدوات والمنصات. من ناحية أخرى، تم تحسين TensorRT بدرجة كبيرة لأجهزة NVIDIA ويدعم الاستدلال منخفض الدقة باستخدام INT8، مما يجعله مثاليًا للنشر عالي السرعة على وحدات معالجة الرسومات الطرفية.
مع استمرار توسع الرؤية الحاسوبية في تطبيقات العالم الحقيقي المختلفة، فإن نماذج YOLO المحسّنة تجعل من الممكن تشغيل مهام مثل اكتشاف الكائنات وتجزئة المثيلات وتتبع الكائنات على أجهزة أصغر وأسرع. بعد ذلك، دعنا نناقش حالتي استخدام حيث يؤدي التقليم والتكميم إلى جعل مهام الرؤية الحاسوبية هذه أكثر كفاءة وعملية.
تعتمد العديد من المساحات الصناعية، وكذلك المناطق العامة، على المراقبة في الوقت الفعلي للحفاظ على السلامة والأمن. تحتاج أماكن مثل محطات النقل ومواقع التصنيع والمرافق الخارجية الكبيرة إلى أنظمة رؤية حاسوبية يمكنها اكتشاف الأشخاص أو المركبات بسرعة وبدقة. غالبًا ما تعمل هذه المواقع مع اتصال محدود وقيود على الأجهزة، مما يجعل من الصعب نشر نماذج كبيرة.
في مثل هذه الحالات، يعد نموذج رؤية الذكاء الاصطناعي المحسن مثل YOLO11 حلاً رائعًا. حجمه الصغير وأدائه السريع يجعله مثاليًا للتشغيل على الأجهزة الطرفية منخفضة الطاقة، مثل الكاميرات المدمجة أو المستشعرات الذكية. يمكن لهذه النماذج معالجة البيانات المرئية مباشرة على الجهاز، مما يتيح الكشف في الوقت الفعلي عن انتهاكات السلامة أو الوصول غير المصرح به أو النشاط غير الطبيعي، دون الاعتماد على الوصول المستمر إلى السحابة.
تعتبر مواقع البناء بيئات سريعة الخطى وغير متوقعة، مليئة بالآلات الثقيلة والعمال المتحركين والنشاط المستمر. يمكن أن تتغير الظروف بسرعة بسبب تحول الجداول الزمنية أو حركة المعدات أو حتى التغيرات المفاجئة في الطقس. في مثل هذه البيئة الديناميكية، يمكن أن يبدو أمان العمال تحديًا مستمرًا.
تلعب المراقبة في الوقت الفعلي دورًا حاسمًا، ولكن الأنظمة التقليدية غالبًا ما تعتمد على الوصول إلى السحابة أو الأجهزة باهظة الثمن التي قد لا تكون عملية في الموقع. هذا هو المكان الذي يمكن أن يكون فيه لنماذج مثل YOLO11 تأثير. يمكن تحسين YOLO11 للتشغيل على أجهزة طرفية صغيرة وفعالة تعمل مباشرة في الموقع دون الحاجة إلى اتصال بالإنترنت.
على سبيل المثال، ضع في اعتبارك موقع بناء كبير مثل توسعة طريق سريع يمتد لعدة فدادين. في هذا النوع من الإعداد، يمكن أن يكون تتبع كل مركبة أو قطعة من المعدات يدويًا أمرًا صعبًا ويستغرق وقتًا طويلاً. يمكن أن تساعد الطائرة بدون طيار المزودة بكاميرا ونموذج YOLO11 مُحسَّن في ذلك عن طريق الاكتشاف التلقائي للمركبات وتتبعها ومراقبة تدفق حركة المرور وتحديد مشكلات السلامة مثل الوصول غير المصرح به أو سلوك القيادة غير الآمن.
فيما يلي بعض المزايا الرئيسية التي توفرها طرق تحسين نموذج رؤية الكمبيوتر مثل التقليم والتكميم:
في حين أن التقليم والتكميم يوفران العديد من المزايا، إلا أنهما يأتيان أيضًا مع بعض المقايضات التي يجب على المطورين أخذها في الاعتبار عند تحسين النماذج. فيما يلي بعض القيود التي يجب وضعها في الاعتبار:
إن التقليم والقياس الكمي هما تقنيتان مفيدتان تساعدان نماذج YOLO على الأداء بشكل أفضل على الأجهزة الطرفية. فهما يقللان من حجم النموذج، ويخفضان احتياجاته من الحوسبة، ويسرعان التنبؤات، وكل ذلك دون خسارة ملحوظة في الدقة.
تتيح طرق التحسين هذه للمطورين المرونة اللازمة لضبط النماذج لأنواع مختلفة من الأجهزة دون الحاجة إلى إعادة بنائها بالكامل. مع بعض الضبط والاختبار، يصبح تطبيق رؤية الذكاء الاصطناعي (Vision AI) في مواقف العالم الحقيقي أسهل.
انضم إلى مجتمعنا المتنامي! استكشف مستودع GitHub الخاص بنا لمعرفة المزيد حول الذكاء الاصطناعي. هل أنت مستعد لبدء مشاريع رؤية الحاسوب الخاصة بك؟ تحقق من خيارات الترخيص لدينا. اكتشف الذكاء الاصطناعي في الزراعة والرؤية الاصطناعية في الرعاية الصحية من خلال زيارة صفحات الحلول الخاصة بنا!