التقليم والتحديد الكمي في الرؤية الحاسوبية

أصبحت الأجهزة المتطورة شائعة بشكل متزايد مع تقدم التكنولوجيا. من الساعات الذكية التي track معدل ضربات القلب إلى الطائرات بدون طيار التي تراقب الشوارع، يمكن للأنظمة المتطورة معالجة البيانات في الوقت الفعلي محلياً داخل الجهاز نفسه.

غالبًا ما تكون هذه الطريقة أسرع وأكثر أمانًا من إرسال البيانات إلى السحابة، خاصةً للتطبيقات التي تتضمن بيانات شخصية، مثل اكتشاف لوحات الترخيص أو تتبع الإيماءات. هذه أمثلة على الرؤية الحاسوبية، وهي فرع من فروع الذكاء الاصطناعي (AI) الذي يمكّن الآلات من تفسير المعلومات المرئية وفهمها.

الشكل 1. مثال على اكتشاف لوحات ترخيص المركبات. (المصدر)

‍

ومع ذلك، فإن الاعتبار المهم هو أن هذه التطبيقات تتطلب نماذج رؤية اصطناعية قادرة على التعامل مع العمليات الحسابية الثقيلة، باستخدام الحد الأدنى من الموارد، والعمل بشكل مستقل. يتم تطوير معظم نماذج رؤية الكمبيوتر للأنظمة عالية الأداء، مما يجعلها أقل ملاءمة للنشر المباشر على الأجهزة الطرفية.

لسد هذه الفجوة، غالبًا ما يطبق المطورون تحسينات مستهدفة تعمل على تكييف النموذج للتشغيل بكفاءة على أجهزة أصغر. هذه التعديلات ضرورية لعمليات النشر الطرفية في العالم الحقيقي، حيث تكون الذاكرة وقوة المعالجة محدودة.

ومن المثير للاهتمام أن نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 مصممة بالفعل مع وضع كفاءة الحافة في الاعتبار، مما يجعلها رائعة لمهام الوقت الحقيقي. ومع ذلك، يمكن تحسين أدائها بشكل أكبر باستخدام تقنيات تحسين النموذج مثل التقليم والتكميم الكمي، مما يتيح استنتاجاً أسرع واستخداماً أقل للموارد على الأجهزة المقيدة.

في هذه المقالة، سوف نلقي نظرة فاحصة على ماهية التقليم والتكميم وكيف يعملان وكيف يمكنهما مساعدة نماذج YOLO في عمليات النشر على الحافة في العالم الحقيقي. لنبدأ!

التقليم والقياس الكمي: التقنيات الأساسية في تحسين النموذج

عند إعداد نماذج رؤية الذكاء الاصطناعي للنشر على الأجهزة الطرفية، فإن أحد الأهداف الرئيسية هو جعل النموذج خفيف الوزن وموثوقًا به دون التضحية بالأداء. غالبًا ما يتضمن ذلك تقليل حجم النموذج ومتطلباته الحسابية حتى يتمكن من العمل بكفاءة على الأجهزة ذات الذاكرة أو الطاقة أو سعة المعالجة المحدودة. هناك طريقتان شائعتان للقيام بذلك وهما التقليم والتكميم.

التقليم هو تقنية لتحسين نموذج الذكاء الاصطناعي تساعد على جعل الشبكات العصبية أصغر حجمًا وأكثر كفاءة. في كثير من الحالات، لا تساهم أجزاء من النموذج، مثل بعض الاتصالات أو العقد، كثيرًا في تنبؤاته النهائية. يعمل التقليم عن طريق تحديد وإزالة هذه الأجزاء الأقل أهمية، مما يقلل من حجم النموذج ويسرع أدائه.

من ناحية أخرى، فإن التكميم هو أسلوب لتحسين الأداء يقلل من دقة الأرقام التي يستخدمها النموذج. بدلاً من الاعتماد على أرقام الفاصلة العائمة ذات 32 بت عالية الدقة، يتحول النموذج إلى تنسيقات أصغر وأكثر كفاءة مثل الأعداد الصحيحة ذات 8 بتات. يساعد هذا التغيير على تقليل استخدام الذاكرة ويسرع الاستدلال، وهي العملية التي يقدم فيها النموذج تنبؤات.

الشكل 2. نظرة على التقليم والقياس الكمي. (المصدر)

‍

كيف يعمل التقليم والقياس الكمي؟

الآن بعد أن أصبح لدينا فهم أفضل لماهية التقليم والقياس الكمي، دعنا نستعرض كيفية عمل كليهما.

يتم التقليم باستخدام عملية تعرف باسم تحليل الحساسية. فهو يحدد أجزاء نماذج الشبكة العصبية، مثل بعض الأوزان أو الخلايا العصبية أو القنوات، التي تساهم بأقل قدر في التنبؤ بالناتج النهائي. يمكن إزالة هذه الأجزاء بأقل تأثير على الدقة. بعد التقليم، عادة ما يتم إعادة تدريب النموذج لضبط أدائه بدقة. يمكن تكرار هذه الدورة للعثور على التوازن الصحيح بين حجمه ودقته.

وفي الوقت نفسه، يركز تكميم النموذج على كيفية تعامل النموذج مع البيانات. يبدأ بالمعايرة، حيث يتم تشغيل النموذج على بيانات نموذجية لتعلم نطاق القيم التي يحتاج إلى معالجتها. ثم يتم تحويل هذه القيم من فاصلة عائمة 32 بت إلى تنسيقات دقة أقل مثل الأعداد الصحيحة 8 بت.

الشكل 3. يساعد التكميم في تقليل حجم النموذج وتعقيده. (المصدر)

‍

هناك العديد من الأدوات المتاحة التي تجعل من السهل استخدام التقليم والتكميم في مشاريع الذكاء الاصطناعي في العالم الحقيقي. تتضمن معظم أطر عمل الذكاء الاصطناعي، مثل PyTorch و TensorFlow دعمًا مدمجًا لتقنيات التحسين هذه، مما يسمح للمطورين بدمجها مباشرةً في عملية نشر النموذج.

وبمجرد تحسين النموذج، يمكن لأدوات مثل ONNX Runtime المساعدة في تشغيله بكفاءة عبر منصات أجهزة مختلفة مثل الخوادم وأجهزة الكمبيوتر المكتبية والأجهزة الطرفية. بالإضافة إلى ذلك، توفر Ultralytics عمليات تكامل تسمح بتصدير نماذج YOLO بتنسيقات مناسبة للتكميم، مما يسهل تقليل حجم النموذج وتعزيز الأداء.

نظرة عامة على تحسين نموذج Ultralytics YOLO نموذجYOLO

تُعرف نماذج Ultralytics YOLO مثل YOLO11 على نطاق واسع بسرعة اكتشافها للأشياء بخطوة واحدة، مما يجعلها مثالية لمهام الذكاء الاصطناعي للرؤية في الوقت الحقيقي. وهي مصممة بالفعل لتكون خفيفة الوزن وفعالة بما يكفي لنشرها على الحافة. ومع ذلك، لا يزال بإمكان الطبقات المسؤولة عن معالجة الميزات المرئية، والتي تسمى الطبقات التلافيفية، أن تتطلب قوة حوسبة كبيرة أثناء الاستدلال.

قد تتساءل: إذا كان YOLO11 مُحسَّنًا بالفعل للاستخدام على الحافة، فلماذا يحتاج إلى مزيد من التحسين؟ ببساطة، ليست كل الأجهزة المتطورة متشابهة. فبعضها يعمل على الحد الأدنى من الأجهزة، مثل المعالجات المدمجة الصغيرة التي تستهلك طاقة أقل من مصباح LED القياسي.

في هذه الحالات، حتى النموذج المبسّط مثل YOLO11 يحتاج إلى تحسين إضافي لضمان أداء سلس وموثوق. تساعد تقنيات مثل التقليم والتكميم في تقليل حجم النموذج وتسريع الاستدلال دون التأثير بشكل كبير على الدقة، مما يجعلها مثالية لمثل هذه البيئات المقيدة.

ولتسهيل تطبيق تقنيات التحسين هذه، يدعم Ultralytics العديد من عمليات التكامل التي يمكن استخدامها لتصدير نماذج YOLO إلى تنسيقات متعددة مثل ONNX و TensorRT و OpenVINO و CoreML و PaddlePaddle. تم تصميم كل تنسيق للعمل بشكل جيد مع أنواع محددة من الأجهزة وبيئات النشر.

على سبيل المثال، غالبًا ما يُستخدم ONNX في مهام سير عمل التكميم نظرًا لتوافقه مع مجموعة كبيرة من الأدوات والمنصات. من ناحية أخرى، تم تحسين TensorRT بشكل كبير لأجهزة NVIDIA ويدعم الاستدلال منخفض الدقة باستخدام INT8، مما يجعله مثاليًا للنشر عالي السرعة على وحدات معالجة الرسومات المتطورة.

حالات الاستخدام المؤثرة لنموذج Ultralytics YOLO الأمثل لنموذجYOLO

مع استمرار توسع الرؤية الحاسوبية في العديد من تطبيقات العالم الحقيقي، تتيح نماذج YOLO المحسّنة إمكانية تشغيل مهام مثل اكتشاف الأجسام وتجزئة المثيل وتتبع الأجسام على أجهزة أصغر وأسرع. بعد ذلك، دعونا نناقش بعض حالات الاستخدام التي يجعل فيها التقليم والتكميم مهام الرؤية الحاسوبية هذه أكثر كفاءة وعملية.

المراقبة الذكية التي يقودها YOLO11

تعتمد العديد من الأماكن الصناعية، وكذلك الأماكن العامة، على المراقبة في الوقت الفعلي للحفاظ على سلامتها وأمانها. تحتاج أماكن مثل محطات النقل، ومواقع التصنيع، والمرافق الخارجية الكبيرة إلى أنظمة الذكاء الاصطناعي المرئي التي يمكنها detect الأشخاص أو المركبات بسرعة ودقة. في كثير من الأحيان، تعمل هذه المواقع في ظل محدودية الاتصال وقيود الأجهزة، مما يجعل من الصعب نشر نماذج كبيرة.

في مثل هذه الحالات، يُعد نموذج Vision AI المحسّن مثل YOLO11 حلاً رائعاً. فحجمه الصغير وأداؤه السريع يجعلانه مثاليًا للتشغيل على الأجهزة ذات الطاقة المنخفضة، مثل الكاميرات المدمجة أو أجهزة الاستشعار الذكية. يمكن لهذه النماذج معالجة البيانات المرئية مباشرةً على الجهاز، مما يتيح الكشف في الوقت الفعلي عن انتهاكات السلامة أو الوصول غير المصرح به أو النشاط غير الطبيعي، دون الاعتماد على الوصول المستمر إلى السحابة.

الشكل 4. يمكن استخدام YOLO11 لمراقبة الأماكن العامة مثل محطات المترو.

‍

تعزيز السلامة في مواقع الإنشاءات باستخدام YOLO11

تعتبر مواقع البناء بيئات سريعة الخطى وغير متوقعة، مليئة بالآلات الثقيلة والعمال المتحركين والنشاط المستمر. يمكن أن تتغير الظروف بسرعة بسبب تحول الجداول الزمنية أو حركة المعدات أو حتى التغيرات المفاجئة في الطقس. في مثل هذه البيئة الديناميكية، يمكن أن يبدو أمان العمال تحديًا مستمرًا.

تلعب المراقبة في الوقت الحقيقي دوراً حاسماً، ولكن الأنظمة التقليدية غالباً ما تعتمد على الوصول إلى السحابة أو الأجهزة باهظة الثمن التي قد لا تكون عملية في الموقع. هذا هو المكان الذي يمكن أن تكون فيه نماذج مثل YOLO11 مؤثرة. يمكن تحسين YOLO11 لتشغيله على أجهزة صغيرة وفعالة تعمل مباشرةً في الموقع دون الحاجة إلى اتصال بالإنترنت.

على سبيل المثال، ضع في اعتبارك موقع بناء كبير مثل توسعة طريق سريع يمتد على عدة أفدنة. في هذا النوع من الأماكن، يمكن أن يكون تتبع كل مركبة أو قطعة من المعدات يدوياً أمراً صعباً ويستغرق وقتاً طويلاً. يمكن أن تساعد طائرة بدون طيار مزودة بكاميرا ونموذج YOLO11 المحسّن من خلال الكشف عن المركبات وتتبعها تلقائيًا، ومراقبة تدفق حركة المرور، وتحديد مشكلات السلامة مثل الوصول غير المصرح به أو سلوك القيادة غير الآمن.

الشكل 5. تحليل صور الطائرات بدون طيار من موقع بناء.

‍

إيجابيات وسلبيات التقليم والتكميم في رؤية الكمبيوتر

فيما يلي بعض المزايا الرئيسية التي توفرها طرق تحسين نموذج رؤية الكمبيوتر مثل التقليم والتكميم:

نشر فعال من حيث التكلفة: يمكن للنماذج الأصغر حجمًا والأكثر كفاءة أن تقلل الحاجة إلى أجهزة باهظة الثمن وعالية الجودة، مما يجعل الذكاء الاصطناعي أكثر سهولة وقابلية للتطوير عبر حالات استخدام مختلفة.
زمن انتقال أقل: من خلال تبسيط بنية النموذج وتقليل النفقات الحسابية، يمكن أن تساعد هذه التقنيات في تحقيق أوقات استجابة أسرع في التطبيقات في الوقت الفعلي.
كفاءة الطاقة: يؤدي تقليل الحمل الحسابي أيضًا إلى خفض استهلاك الطاقة، وهو أمر مفيد بشكل خاص للأنظمة التي تعمل بالبطاريات أو الأنظمة المتنقلة.

في حين أن التقليم والتكميم يوفران العديد من المزايا، إلا أنهما يأتيان أيضًا مع بعض المقايضات التي يجب على المطورين أخذها في الاعتبار عند تحسين النماذج. فيما يلي بعض القيود التي يجب وضعها في الاعتبار:

الدقة المقايضات: إذا كان التقليم شديدًا جدًا أو إذا تم استخدام تكميم منخفض جدًا للبت، يمكن أن تنخفض دقة النموذج، التي تُقاس بمقاييس مثل mAP.
قيود الأجهزة: لا تدعم جميع الأجهزة تنسيقات الدقة المنخفضة مثل INT8 بالتساوي. هذا يمكن أن يقيد مكان وكيفية نشر نموذج مُحسَّن.
تعقيد التنفيذ: غالبًا ما يتطلب تحقيق نتائج جيدة إجراء تعديلات دقيقة خاصة بالنموذج. قد يحتاج المطورون إلى إعادة تدريب النموذج وإجراء اختبارات مكثفة للحفاظ على الأداء مع تحسين الكفاءة.

النقاط الرئيسية

يعد التقليم والتكميم من التقنيات المفيدة التي تساعد نماذج YOLO على أداء أفضل على الأجهزة المتطورة. فهي تقلل من حجم النموذج، وتقلل من احتياجاته الحاسوبية، وتسرع من التنبؤات، كل ذلك دون خسارة ملحوظة في الدقة.

تتيح طرق التحسين هذه للمطورين المرونة اللازمة لضبط النماذج لأنواع مختلفة من الأجهزة دون الحاجة إلى إعادة بنائها بالكامل. مع بعض الضبط والاختبار، يصبح تطبيق رؤية الذكاء الاصطناعي (Vision AI) في مواقف العالم الحقيقي أسهل.

انضم إلى مجتمعنا المتنامي! استكشف مستودع GitHub الخاص بنا لمعرفة المزيد حول الذكاء الاصطناعي. هل أنت مستعد لبدء مشاريع رؤية الحاسوب الخاصة بك؟ تحقق من خيارات الترخيص لدينا. اكتشف الذكاء الاصطناعي في الزراعة والرؤية الاصطناعية في الرعاية الصحية من خلال زيارة صفحات الحلول الخاصة بنا!

التقليم والقياس الكمي في رؤية الكمبيوتر: دليل سريع

التقليم والقياس الكمي: التقنيات الأساسية في تحسين النموذج

كيف يعمل التقليم والقياس الكمي؟

نظرة عامة على تحسين نموذج Ultralytics YOLO نموذجYOLO

حالات الاستخدام المؤثرة لنموذج Ultralytics YOLO الأمثل لنموذجYOLO

المراقبة الذكية التي يقودها YOLO11

‍

تعزيز السلامة في مواقع الإنشاءات باستخدام YOLO11

إيجابيات وسلبيات التقليم والتكميم في رؤية الكمبيوتر

النقاط الرئيسية

اقرأ المزيد في هذه الفئة

ما هو تقدير العمق الأحادي العين؟ نظرة عامة

ما هو حساب الصور؟ مقدمة سريعة

ما هو مطابقة القوالب؟ دليل سريع

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

التقليم والقياس الكمي في رؤية الكمبيوتر: دليل سريع

التقليم والقياس الكمي: التقنيات الأساسية في تحسين النموذج

كيف يعمل التقليم والقياس الكمي؟

نظرة عامة على تحسين نموذج Ultralytics YOLO نموذجYOLO

حالات الاستخدام المؤثرة لنموذج Ultralytics YOLO الأمثل لنموذجYOLO

المراقبة الذكية التي يقودها YOLO11

‍

تعزيز السلامة في مواقع الإنشاءات باستخدام YOLO11

إيجابيات وسلبيات التقليم والتكميم في رؤية الكمبيوتر

النقاط الرئيسية

اقرأ المزيد في هذه الفئة

ما هو تقدير العمق الأحادي العين؟ نظرة عامة

ما هو حساب الصور؟ مقدمة سريعة

ما هو مطابقة القوالب؟ دليل سريع

لنبنِ مستقبل الذكاء الاصطناعي معًا!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!