دمج نماذج Ultralytics YOLO مع TensorRT

ضع في اعتبارك سيارة ذاتية القيادة تتحرك في شارع مزدحم ولا يتبقى لها سوى أجزاء من الثانية detect أحد المشاة الذي يخرج عن الرصيف. وفي الوقت نفسه، قد تحتاج السيارة إلى التعرّف على إشارة توقف مخفية جزئياً بواسطة شجرة أو الاستجابة بسرعة لسيارة قريبة تنحرف إلى مسارها. في مثل هذه الحالات، تكون السرعة والاستجابات في الوقت الحقيقي أمرًا بالغ الأهمية.

هذا هو المكان الذي يلعب فيه الذكاء الاصطناعي (AI)، وتحديدًا رؤية الكمبيوتر، وهو فرع من فروع الذكاء الاصطناعي يساعد الآلات على تفسير البيانات المرئية، دورًا رئيسيًا. لكي تعمل حلول رؤية الكمبيوتر بشكل موثوق في البيئات الواقعية، غالبًا ما تحتاج إلى معالجة المعلومات بسرعة، والتعامل مع مهام متعددة في وقت واحد، واستخدام الذاكرة بكفاءة.

إحدى طرق تحقيق ذلك هي من خلال تسريع الأجهزة، باستخدام أجهزة متخصصة مثل وحدات معالجة الرسومات (GPU) لتشغيل النماذج بشكل أسرع. وحدات معالجة الرسومات NVIDIA معروفة بشكل خاص لمثل هذه المهام، وذلك بفضل قدرتها على توفير زمن انتقال منخفض وإنتاجية عالية.

ومع ذلك، فإن تشغيل نموذج على GPU كما هو لا يضمن دائمًا الأداء الأمثل. تتطلب نماذج الذكاء الاصطناعي المرئي عادةً تحسينًا للاستفادة الكاملة من قدرات الأجهزة. من أجل تحقيق الأداء الكامل مع أجهزة معينة، نحتاج إلى تجميع النموذج لاستخدام مجموعة محددة من التعليمات الخاصة بالأجهزة.

على سبيل المثال، TensorRT عبارة عن تنسيق تصدير ومكتبة تحسينات طورتها NVIDIA لتحسين الأداء على الأجهزة المتطورة. تستخدم تقنيات متقدمة لتقليل وقت الاستدلال بشكل كبير مع الحفاظ على الدقة.

الشكل 1. يمكّن NVIDIA TensorRT النماذج من العمل على النحو الأمثل على أجهزة NVIDIA المختلفة.

‍

في هذه المقالة، سنستكشف تكاملTensorRT المدعوم من قبل Ultralytics وسنتعرف على كيفية تصدير نموذج YOLO11 الخاص بك لنشر أسرع وأكثر كفاءة على أجهزة NVIDIA . لنبدأ!

نظرة عامة على TensorRT

TensorRT عبارة عن مجموعة أدوات طورتها NVIDIA لمساعدة نماذج الذكاء الاصطناعي على العمل بشكل أسرع وأكثر كفاءة على وحدات معالجة الرسومات NVIDIA . وهي مصممة لتطبيقات العالم الحقيقي حيث تكون السرعة والأداء مهمين حقًا، مثل السيارات ذاتية القيادة ومراقبة الجودة في التصنيع والمستحضرات الصيدلانية.

يتضمن TensorRT أدوات مثل المُجمِّعات ومُحسِّنات النماذج التي يمكنها العمل خلف الكواليس للتأكد من تشغيل نماذجك بزمن انتقال منخفض ويمكنها التعامل مع إنتاجية أعلى.

يعمل تكامل TensorRT المدعوم من قبل Ultralytics من خلال تحسين نموذج YOLO الخاص بك ليعمل بكفاءة أكبر على وحدات معالجة الرسومات باستخدام طرق مثل تقليل الدقة. يشير هذا إلى استخدام تنسيقات ذات بتات أقل، مثل الفاصلة العائمة 16 بت (FP16) أو الأعداد الصحيحة 8 بت (INT8)، لتمثيل بيانات النموذج، مما يقلل من استخدام الذاكرة ويسرّع الحساب بأقل تأثير على الدقة.

أيضًا، يتم دمج طبقات الشبكة العصبية المتوافقة في نماذج TensorRT المحسّنة لتقليل استخدام الذاكرة، مما يؤدي إلى استنتاج أسرع وأكثر كفاءة.

الشكل 2. نظرة على تقنية دمج الطبقات في TensorRT.

‍

الميزات الرئيسية لتنسيق تصدير TensorRT

قبل أن نناقش كيف يمكنك تصدير YOLO11 باستخدام تكامل TensorRT دعنا نلقي نظرة على بعض الميزات الرئيسية لتنسيق نموذج TensorRT :

سهولة تكامل إطار العمل: يدعم TensorRT التكامل المباشر مع أطر عمل الذكاء الاصطناعي الشائعة مثل PyTorch و Hugging Face و ONNX مما يوفر أداءً أسرع بما يصل إلى 6 أضعاف. كما أنه يدعم MATLAB، مما يتيح تطوير محركات ذكاء اصطناعي عالية السرعة على منصات مثل Jetson NVIDIA DRIVE ومراكز البيانات.

النشر القابل للتطوير باستخدام Triton: يمكن نشر النماذج المحسّنة بتنسيق TensorRT على نطاق واسع باستخدام خادمNVIDIA Triton Inference Server، الذي يعزز الكفاءة من خلال ميزات مثل تجميع المدخلات والتنفيذ المتزامن للنموذج ودعم مجموعة النماذج وتدفق الصوت/الفيديو في الوقت الفعلي.

مرن عبر الأجهزة: يعمل TensorRT عبر منظومة NVIDIA بأكملها، بدءاً من الأجهزة الصغيرة المتطورة وحتى الخوادم القوية، حيث يدعم أدوات مثل DeepStream للفيديو، وريفا للذكاء الاصطناعي للكلام، وغيرها من الأدوات الخاصة بالأمن السيبراني والتوصيات وغيرها.

كيف يعمل تكامل TensorRT

من السهل تصدير نماذجUltralytics YOLO مثل Ultralytics YOLO11 إلى تنسيق نموذج TensorRT . لنستعرض الخطوات المتبعة.

للبدء، يمكنك تثبيت حزمةUltralytics Python باستخدام مدير حزم مثل "pip". يمكن القيام بذلك عن طريق تشغيل الأمر "pip install ultralytics" في موجه الأوامر أو في الطرفية.

بعد تثبيت حزمة Ultralytics Python Package بنجاح، يمكنك تدريب النماذج واختبارها وضبطها وتصديرها ونشرها لمختلف مهام الرؤية الحاسوبية، مثل اكتشاف الأجسام وتصنيفها وتجزئة المثيل. أثناء تثبيت الحزمة، إذا واجهتك أي صعوبات، يمكنك الرجوع إلى دليل المشكلات الشائعة للحصول على الحلول والنصائح.

للخطوة التالية، ستحتاج إلى جهاز NVIDIA . استخدم مقتطف الشيفرة أدناه لتحميل وتصدير YOLOv11 إلى تنسيق نموذج TensorRT . يقوم بتحميل متغير نانو مدرب مسبقًا من نموذج YOLO11 (yolo11n.pt) وتصديره كملف محرك TensorRT (yolo11n.engine)، مما يجعله جاهزًا للنشر عبر أجهزة NVIDIA .

from ultralytics import YOLO

model = YOLO("yolo11n.pt")

model.export(format="engine")

بعد تحويل النموذج الخاص بك إلى تنسيق TensorRT يمكنك نشره لتطبيقات مختلفة.

يوضّح المثال أدناه كيفية تحميل نموذج YOLO11 المُصدَّر (yolo11n.engine) وتشغيل الاستدلال باستخدامه. يتضمن الاستدلال استخدام النموذج المدرّب لإجراء تنبؤات على بيانات جديدة. في هذه الحالة، سنستخدم صورة مدخلات لكلب لاختبار النموذج.

tensorrt_model = YOLO("yolo11n.engine")

results = tensorrt_model("https://images.pexels.com/photos/1254140/pexels-photo-1254140.jpeg?auto=compress&cs=tinysrgb&w=1260&h=750&dpr=2.jpg", save=True)

عند تشغيل هذا الرمز، ستُحفظ صورة الإخراج التالية في مجلد detect.

الشكل 3. نتيجة تشغيل الاستدلال باستخدام نموذج YOLO11 المُصدَّر بصيغة TensorRT .

‍

متى يجب الاستفادة من تكامل TensorRT

تدعم حزمة Ultralytics Python العديد من عمليات التكامل التي تسمح بتصدير نماذج YOLO إلى تنسيقات مختلفة مثل TorchScript و CoreML و ONNX و TensorRT. إذن، متى يجب عليك اختيار استخدام تكامل TensorRT

فيما يلي بعض العوامل التي تميز تنسيق نموذج TensorRT عن خيارات تكامل التصدير الأخرى:

حجم نموذج أصغر: يمكن أن يؤدي تصدير نموذج YOLO إلى تنسيق TensorRT بدقة INT8 إلى تقليل حجم النموذج بشكل كبير. يمكن أن يؤدي التحويل الكمي من FP32 إلى INT8 إلى تقليل حجم النموذج بمقدار 4 أضعاف، مما يتيح أوقات تنزيل أسرع، ومتطلبات تخزين أقل، وبصمة ذاكرة أقل أثناء النشر.

استخدام أقل للطاقة: لا يقلل تكميم INT8 من حجم النموذج فحسب، بل يقلل أيضاً من استهلاك الطاقة. يمكن أن تستهلك العمليات ذات الدقة المنخفضة لنماذج YOLO المصدرة INT8 طاقة أقل مقارنةً بنماذج FP32، وهو أمر مفيد بشكل خاص للأجهزة التي تعمل بالبطارية مثل الطائرات بدون طيار أو الهواتف الذكية أو الأجهزة المتطورة.

أداء أسرع: يمكن أن يؤدي الجمع بين بنية YOLO الفعالة مع تحسين TensorRT لـ INT8 إلى تحسين سرعات الاستدلال.

تطبيقات YOLO11 وصيغة نموذج TensorRT

يمكن نشر نماذج Ultralytics YOLO التي تم تصديرها إلى تنسيق TensorRT عبر مجموعة واسعة من سيناريوهات العالم الحقيقي. هذه النماذج المحسّنة مفيدة بشكل خاص عندما يكون الأداء السريع والفعال للذكاء الاصطناعي هو المفتاح. دعنا نستكشف بعض الأمثلة المثيرة للاهتمام حول كيفية استخدامها.

عدادات الخروج الذكية في متاجر البيع بالتجزئة

لا تزال مجموعة واسعة من المهام في متاجر البيع بالتجزئة، مثل مسح الرموز الشريطية أو وزن المنتجات أو تغليف العناصر، تتم يدويًا بواسطة الموظفين. ومع ذلك، فإن الاعتماد فقط على الموظفين يمكن أن يبطئ العمليات ويؤدي إلى إحباط العملاء، خاصة عند الخروج. فالصفوف الطويلة غير مريحة لكل من المتسوقين وأصحاب المتاجر. تعتبر عدادات الدفع الذاتي الذكية حلاً رائعًا لهذه المشكلة.

تستخدم هذه العدادات الرؤية الحاسوبية ووحدات معالجة الرسومات لتسريع العملية، مما يساعد على تقليل أوقات الانتظار. تمكّن الرؤية الحاسوبية هذه الأنظمة من رؤية وفهم بيئتها من خلال مهام مثل اكتشاف الأشياء. يمكن أن تعمل النماذج المتقدمة مثل YOLO11 عند تحسينها باستخدام أدوات مثل TensorRT بشكل أسرع بكثير على أجهزة GPU .

هذه النماذج المصدرة مناسبة تماماً لإعدادات البيع بالتجزئة الذكية التي تستخدم أجهزة مدمجة ولكن قوية مثل NVIDIA Jetson Nano، المصممة خصيصاً لتطبيقات الذكاء الاصطناعي المتطورة.

‍

الكشف الآلي عن العيوب في التصنيع

يمكن تدريب نموذج الرؤية الحاسوبية مثل YOLO11 على نموذج الرؤية الحاسوبية detect المنتجات المعيبة في الصناعة التحويلية. وبمجرد التدريب، يمكن تصدير النموذج إلى تنسيق TensorRT لنشره في المنشآت المجهزة بأنظمة ذكاء اصطناعي عالية الأداء.

بينما تتحرك المنتجات على طول سيور النقل، تلتقط الكاميرات الصور، ويقوم نموذج YOLO11 الذي يعمل بتنسيق TensorRT بتحليلها في الوقت الفعلي لاكتشاف العيوب. يتيح هذا الإعداد للشركات اكتشاف المشكلات بسرعة وبدقة، مما يقلل من الأخطاء ويحسن الكفاءة.

وبالمثل، تستخدم صناعات مثل المستحضرات الصيدلانية هذه الأنواع من الأنظمة لتحديد العيوب في التعبئة الطبية. في الواقع، من المتوقع أن ينمو السوق العالمي لأنظمة الكشف الذكي عن العيوب إلى 5 مليارات دولار بحلول عام 2026.

الشكل 5. استخدام YOLO detect العيوب في صناعة الأدوية.

‍

اعتبارات يجب مراعاتها أثناء استخدام TensorRT

على الرغم من أن تكامل TensorRT يجلب العديد من المزايا، مثل سرعات الاستدلال الأسرع وتقليل زمن الوصول، إلا أن هناك بعض القيود التي يجب وضعها في الاعتبار:

انخفاض طفيف في الدقة: عندما تقوم بتصدير نموذجك بتنسيق TensorRT قد لا يكون النموذج المُصدَّر بنفس دقة النموذج الأصلي. يمكن أن تنخفض مقاييس الأداء مثل الدقة والاستدعاء ومدى دقة النموذج في اكتشاف الكائناتmAP درجاتmAP ) انخفاضًا طفيفًا. يمكن تخفيف ذلك باستخدام مجموعة بيانات تمثيلية أثناء التكميم.

زيادة تعقيد تصحيح الأخطاء: يمكن أن تجعل التحسينات التي يقوم بها TensorRT من الصعب تتبع الأخطاء أو فهم السلوك غير المتوقع، خاصةً عند مقارنة النتائج بالنموذج الأصلي.

حساسية حجم الدفعة: تكون مكاسب أداءTensorRT أكثر وضوحًا مع أحجام الدفعات الأكبر. بالنسبة للتطبيقات التي تعالج صورًا مفردة أو دفعات صغيرة، قد تكون تحسينات الأداء أقل أهمية.

النقاط الرئيسية

إن تصدير نماذج Ultralytics YOLO إلى تنسيق TensorRT يجعلها تعمل بشكل أسرع وأكثر كفاءة، مما يجعلها مثالية للمهام في الوقت الحقيقي مثل اكتشاف العيوب في المصانع، أو تشغيل أنظمة الدفع الذكية، أو مراقبة المناطق الحضرية المزدحمة.

يساعد هذا التحسين على تحسين أداء النماذج على وحدات معالجة الرسومات NVIDIA من خلال تسريع التنبؤات وتقليل استخدام الذاكرة والطاقة. على الرغم من وجود بعض القيود، إلا أن تعزيز الأداء يجعل من تكامل TensorRT خيارًا رائعًا لأي شخص يقوم ببناء أنظمة رؤية حاسوبية عالية السرعة على أجهزة NVIDIA .

هل تريد معرفة المزيد عن الذكاء الاصطناعي؟ استكشف مستودع GitHub الخاص بنا، وتواصل مع مجتمعنا، وتحقق من خيارات الترخيص الخاصة بنا لبدء مشروع الرؤية الحاسوبية الخاص بك. تعرف على المزيد حول الابتكارات مثل الذكاء الاصطناعي في التصنيع و الرؤية الحاسوبية في صناعة الخدمات اللوجستية على صفحات الحلول الخاصة بنا.

تحسين نماذج Ultralytics YOLO باستخدام تكامل TensorRT

نظرة عامة على TensorRT

الميزات الرئيسية لتنسيق تصدير TensorRT

كيف يعمل تكامل TensorRT

متى يجب الاستفادة من تكامل TensorRT

تطبيقات YOLO11 وصيغة نموذج TensorRT

عدادات الخروج الذكية في متاجر البيع بالتجزئة

الكشف الآلي عن العيوب في التصنيع

اعتبارات يجب مراعاتها أثناء استخدام TensorRT

النقاط الرئيسية

اقرأ المزيد في هذه الفئة

نشر نماذج Ultralytics YOLO باستخدام تكامل ExecuTorch

دليل حول بنية U-Net وتطبيقاتها

نماذج OCR مفتوحة المصدر الشائعة وكيفية عملها

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

تحسين نماذج Ultralytics YOLO باستخدام تكامل TensorRT

نظرة عامة على TensorRT

الميزات الرئيسية لتنسيق تصدير TensorRT

كيف يعمل تكامل TensorRT

متى يجب الاستفادة من تكامل TensorRT

تطبيقات YOLO11 وصيغة نموذج TensorRT

عدادات الخروج الذكية في متاجر البيع بالتجزئة

الكشف الآلي عن العيوب في التصنيع

اعتبارات يجب مراعاتها أثناء استخدام TensorRT

النقاط الرئيسية

اقرأ المزيد في هذه الفئة

نشر نماذج Ultralytics YOLO باستخدام تكامل ExecuTorch

دليل حول بنية U-Net وتطبيقاتها

نماذج OCR مفتوحة المصدر الشائعة وكيفية عملها

لنبنِ مستقبل الذكاء الاصطناعي معًا!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!