شيك أخضر
تم نسخ الرابط إلى الحافظة

تحسين نماذج Ultralytics YOLO باستخدام تكامل TensorRT

تعرّف على كيفية تصدير نماذج Ultralytics YOLO باستخدام تكامل TensorRT للحصول على أداء ذكاء اصطناعي أسرع وأكثر كفاءة على وحدات معالجة الرسومات NVIDIA للتطبيقات في الوقت الفعلي.

ضع في اعتبارك سيارة ذاتية القيادة تتحرك في شارع مزدحم ولا يتبقى لها سوى أجزاء من الثانية لاكتشاف أحد المشاة الذي يخرج عن الرصيف. وفي الوقت نفسه، قد تحتاج السيارة إلى التعرّف على إشارة توقف مخفية جزئياً بواسطة شجرة أو الاستجابة بسرعة لسيارة قريبة تنحرف إلى مسارها. في مثل هذه الحالات، تكون السرعة والاستجابات في الوقت الحقيقي أمرًا بالغ الأهمية.

هذا هو المكان الذي يلعب فيه الذكاء الاصطناعي (AI)، وتحديداً الرؤية الحاسوبية، وهو فرع من الذكاء الاصطناعي يساعد الآلات على تفسير البيانات المرئية، دوراً رئيسياً. ولكي تعمل حلول الرؤية الحاسوبية بشكل موثوق في بيئات العالم الحقيقي، فإنها تحتاج في كثير من الأحيان إلى معالجة المعلومات بسرعة، والتعامل مع مهام متعددة في وقت واحد، واستخدام الذاكرة بكفاءة.

إحدى طرق تحقيق ذلك هي من خلال تسريع الأجهزة، باستخدام أجهزة متخصصة مثل وحدات معالجة الرسومات (GPU) لتشغيل النماذج بشكل أسرع. وحدات معالجة الرسومات NVIDIA معروفة بشكل خاص لمثل هذه المهام، وذلك بفضل قدرتها على توفير زمن انتقال منخفض وإنتاجية عالية.

ومع ذلك، فإن تشغيل نموذج على GPU كما هو لا يضمن دائمًا الأداء الأمثل. تتطلب نماذج الذكاء الاصطناعي المرئي عادةً تحسينًا للاستفادة الكاملة من قدرات الأجهزة. من أجل تحقيق الأداء الكامل مع أجهزة معينة، نحتاج إلى تجميع النموذج لاستخدام مجموعة محددة من التعليمات الخاصة بالأجهزة.

على سبيل المثال، TensorRT عبارة عن تنسيق تصدير ومكتبة تحسين طوّرتها NVIDIA لتحسين الأداء على الأجهزة المتطورة. تستخدم تقنيات متقدمة لتقليل وقت الاستدلال بشكل كبير مع الحفاظ على الدقة.

الشكل 1. يمكّن NVIDIA TensorRT النماذج من العمل على النحو الأمثل على أجهزة NVIDIA المختلفة.

في هذه المقالة، سنستكشف تكاملTensorRT المدعوم من قبل Ultralytics وسنتعرف على كيفية تصدير نموذج YOLO11 الخاص بك لنشر أسرع وأكثر كفاءة على أجهزة NVIDIA . لنبدأ!

نظرة عامة على TensorRT

TensorRT عبارة عن مجموعة أدوات طورتها NVIDIA لمساعدة نماذج الذكاء الاصطناعي على العمل بشكل أسرع وأكثر كفاءة على وحدات معالجة الرسومات NVIDIA . وهي مصممة لتطبيقات العالم الحقيقي حيث تكون السرعة والأداء مهمين حقًا، مثل السيارات ذاتية القيادة ومراقبة الجودة في التصنيع والمستحضرات الصيدلانية. 

يتضمن TensorRT أدوات مثل المُجمِّعات ومُحسِّنات النماذج التي يمكنها العمل خلف الكواليس للتأكد من تشغيل نماذجك بزمن انتقال منخفض ويمكنها التعامل مع إنتاجية أعلى.

يعمل تكامل TensorRT المدعوم من قبل Ultralytics من خلال تحسين نموذج YOLO الخاص بك ليعمل بكفاءة أكبر على وحدات معالجة الرسومات باستخدام طرق مثل تقليل الدقة. يشير هذا إلى استخدام تنسيقات ذات بتات أقل، مثل الفاصلة العائمة 16 بت (FP16) أو الأعداد الصحيحة 8 بت (INT8)، لتمثيل بيانات النموذج، مما يقلل من استخدام الذاكرة ويسرّع الحساب بأقل تأثير على الدقة. 

أيضًا، يتم دمج طبقات الشبكة العصبية المتوافقة في نماذج TensorRT المحسّنة لتقليل استخدام الذاكرة، مما يؤدي إلى استنتاج أسرع وأكثر كفاءة.

الشكل 2. نظرة على تقنية دمج الطبقات في TensorRT.

الميزات الرئيسية لتنسيق تصدير TensorRT

قبل أن نناقش كيف يمكنك تصدير YOLO11 باستخدام تكامل TensorRT دعنا نلقي نظرة على بعض الميزات الرئيسية لتنسيق نموذج TensorRT :

  • سهولة تكامل إطار العمل: يدعم TensorRT التكامل المباشر مع أطر عمل الذكاء الاصطناعي الشائعة مثل PyTorch و Hugging Face و ONNX مما يوفر أداءً أسرع بما يصل إلى 6 أضعاف. كما أنه يدعم MATLAB، مما يتيح تطوير محركات ذكاء اصطناعي عالية السرعة على منصات مثل Jetson NVIDIA DRIVE ومراكز البيانات.
  • نشر قابل للتطوير باستخدام Triton: يمكن نشر النماذج المحسّنة بتنسيق TensorRT على نطاق واسع باستخدام خادمNVIDIA Triton Inference Server، الذي يعزز الكفاءة من خلال ميزات مثل تجميع المدخلات والتنفيذ المتزامن للنموذج ودعم مجموعة النماذج وتدفق الصوت/الفيديو في الوقت الفعلي.
  • مرن عبر الأجهزة: يعمل TensorRT عبر منظومة NVIDIA بأكملها، بدءاً من الأجهزة الصغيرة المتطورة وحتى الخوادم القوية، حيث يدعم أدوات مثل DeepStream للفيديو، وريفا للذكاء الاصطناعي للكلام، وغيرها من الأدوات الخاصة بالأمن السيبراني والتوصيات وغيرها.

كيف يعمل تكامل TensorRT

من السهل تصدير نماذجUltralytics YOLO مثل Ultralytics YOLO11 إلى تنسيق نموذج TensorRT . لنستعرض الخطوات المتبعة.

للبدء، يمكنك تثبيت حزمةUltralytics Python باستخدام مدير حزم مثل "pip". يمكن القيام بذلك عن طريق تشغيل الأمر "pip install ultralytics" في موجه الأوامر أو في الطرفية.

بعد تثبيت حزمة Ultralytics Python Package بنجاح، يمكنك تدريب النماذج واختبارها وضبطها وتصديرها ونشرها لمختلف مهام الرؤية الحاسوبية، مثل اكتشاف الأجسام وتصنيفها وتجزئة المثيل. أثناء تثبيت الحزمة، إذا واجهتك أي صعوبات، يمكنك الرجوع إلى دليل المشكلات الشائعة للحصول على الحلول والنصائح.

للخطوة التالية، ستحتاج إلى جهاز NVIDIA . استخدم مقتطف الشيفرة أدناه لتحميل وتصدير YOLOv11 إلى تنسيق نموذج TensorRT . حيث يقوم بتحميل متغير نانو مدرب مسبقًا من نموذج YOLO11 (yolo11n.pt) وتصديره كملف محرك TensorRT (yolo11n.engine)، مما يجعله جاهزًا للنشر عبر أجهزة NVIDIA .

from ultralytics import YOLO

model = YOLO("yolo11n.pt")

model.export(format="engine")

بعد تحويل النموذج الخاص بك إلى تنسيق TensorRT يمكنك نشره لتطبيقات مختلفة. 

يوضّح المثال أدناه كيفية تحميل نموذج YOLO11 المُصدَّر (yolo11n.engine) وتشغيل الاستدلال باستخدامه. يتضمن الاستدلال استخدام النموذج المدرّب لإجراء تنبؤات على بيانات جديدة. في هذه الحالة، سنستخدم صورة مدخلات لكلب لاختبار النموذج. 

tensorrt_model = YOLO("yolo11n.engine")

results = tensorrt_model("https://images.pexels.com/photos/1254140/pexels-photo-1254140.jpeg?auto=compress&cs=tinysrgb&w=1260&h=750&dpr=2.jpg", save=True)

عند تشغيل هذا الرمز، ستُحفظ صورة الإخراج التالية في مجلد التشغيل/الكشف/التنبؤ.

الشكل 3. نتيجة تشغيل الاستدلال باستخدام نموذج YOLO11 المُصدَّر بصيغة TensorRT .

متى يجب الاستفادة من تكامل TensorRT

تدعم حزمة Ultralytics Python العديد من عمليات التكامل التي تسمح بتصدير نماذج YOLO إلى تنسيقات مختلفة مثل TorchScript و CoreML و ONNX و TensorRT. إذن، متى يجب عليك اختيار استخدام تكامل TensorRT

فيما يلي بعض العوامل التي تميز تنسيق نموذج TensorRT عن خيارات تكامل التصدير الأخرى:

  • حجم نموذج أصغر: يمكن أن يؤدي تصدير نموذج YOLO إلى تنسيق TensorRT بدقة INT8 إلى تقليل حجم النموذج بشكل كبير. يمكن أن يؤدي التحويل الكمي من FP32 إلى INT8 إلى تقليل حجم النموذج بمقدار 4 أضعاف، مما يتيح أوقات تنزيل أسرع، ومتطلبات تخزين أقل، وبصمة ذاكرة أقل أثناء النشر.
  • استخدام أقل للطاقة: لا يقلل تكميم INT8 من حجم النموذج فحسب، بل يقلل أيضاً من استهلاك الطاقة. يمكن أن تستهلك العمليات ذات الدقة المنخفضة لنماذج YOLO المصدرة INT8 طاقة أقل مقارنةً بنماذج FP32، وهو أمر مفيد بشكل خاص للأجهزة التي تعمل بالبطارية مثل الطائرات بدون طيار أو الهواتف الذكية أو الأجهزة المتطورة.
  • أداء أسرع: يمكن أن يؤدي الجمع بين بنية YOLO الفعالة مع تحسين TensorRT لـ INT8 إلى تحسين سرعات الاستدلال.

تطبيقات YOLO11 وصيغة نموذج TensorRT

يمكن نشر نماذج Ultralytics YOLO التي تم تصديرها إلى تنسيق TensorRT عبر مجموعة واسعة من سيناريوهات العالم الحقيقي. هذه النماذج المحسّنة مفيدة بشكل خاص عندما يكون الأداء السريع والفعال للذكاء الاصطناعي هو المفتاح. دعنا نستكشف بعض الأمثلة المثيرة للاهتمام حول كيفية استخدامها.

عدادات الدفع الذكية في متاجر البيع بالتجزئة

لا تزال مجموعة كبيرة من المهام في متاجر البيع بالتجزئة، مثل مسح الرموز الشريطية أو وزن المنتجات أو تغليف المنتجات، يتم التعامل معها يدويًا بواسطة الموظفين. ومع ذلك، فإن الاعتماد على الموظفين فقط يمكن أن يؤدي إلى إبطاء العمليات ويؤدي إلى إحباط العملاء، خاصة عند الخروج. الطوابير الطويلة غير مريحة لكل من المتسوقين وأصحاب المتاجر. تُعد عدادات الدفع الذاتي الذكية حلاً رائعاً لهذه المشكلة.

تستخدم هذه العدادات الرؤية الحاسوبية ووحدات معالجة الرسومات لتسريع العملية، مما يساعد على تقليل أوقات الانتظار. تمكّن الرؤية الحاسوبية هذه الأنظمة من رؤية وفهم بيئتها من خلال مهام مثل اكتشاف الأشياء. يمكن أن تعمل النماذج المتقدمة مثل YOLO11 عند تحسينها باستخدام أدوات مثل TensorRT بشكل أسرع بكثير على أجهزة GPU .

هذه النماذج المصدرة مناسبة تمامًا لإعدادات البيع بالتجزئة الذكية باستخدام أجهزة مدمجة ولكن قوية مثل NVIDIA Jetson Nano، المصممة خصيصًا لتطبيقات الذكاء الاصطناعي المتطورة.

الشكل 4. مثال على عداد الدفع الذكي.

الكشف الآلي عن العيوب في التصنيع

يمكن تدريب نموذج الرؤية الحاسوبية مثل YOLO11 على نموذج الرؤية الحاسوبية للكشف عن المنتجات المعيبة في الصناعة التحويلية. وبمجرد التدريب، يمكن تصدير النموذج إلى تنسيق TensorRT لنشره في المنشآت المجهزة بأنظمة ذكاء اصطناعي عالية الأداء. 

بينما تتحرك المنتجات على طول سيور النقل، تلتقط الكاميرات الصور، ويقوم نموذج YOLO11 الذي يعمل بتنسيق TensorRT بتحليلها في الوقت الفعلي لاكتشاف العيوب. يتيح هذا الإعداد للشركات اكتشاف المشكلات بسرعة وبدقة، مما يقلل من الأخطاء ويحسن الكفاءة.

وبالمثل، تستخدم صناعات مثل المستحضرات الصيدلانية هذه الأنواع من الأنظمة لتحديد العيوب في العبوات الطبية. في الواقع، من المتوقع أن ينمو السوق العالمي لأنظمة الكشف عن العيوب الذكية إلى 5 مليارات دولار بحلول عام 2026.

الشكل 5. استخدام YOLO للكشف عن العيوب في صناعة الأدوية.

اعتبارات يجب مراعاتها أثناء استخدام TensorRT

على الرغم من أن تكامل TensorRT يجلب العديد من المزايا، مثل سرعات الاستدلال الأسرع وتقليل زمن الوصول، إلا أن هناك بعض القيود التي يجب وضعها في الاعتبار:

  • انخفاض طفيف في الدقة: عندما تقوم بتصدير نموذجك بتنسيق TensorRT قد لا يكون النموذج المُصدَّر بنفس دقة النموذج الأصلي. يمكن أن تنخفض مقاييس الأداء مثل الدقة والاستدعاء ومدى دقة النموذج في اكتشاف الكائنات (درجات mAP) انخفاضًا طفيفًا. يمكن التخفيف من ذلك باستخدام مجموعة بيانات تمثيلية أثناء التكميم. 
  • زيادة تعقيد تصحيح الأخطاء: يمكن للتحسينات التي يقوم بها TensorRT أن تجعل من الصعب تتبع الأخطاء أو فهم السلوك غير المتوقع، خاصةً عند مقارنة النتائج بالنموذج الأصلي.
  • حساسية حجم الدفعة: تكون مكاسب أداءTensorRT أكثر وضوحًا مع أحجام الدفعات الأكبر. بالنسبة للتطبيقات التي تعالج صورًا مفردة أو دفعات صغيرة، قد تكون تحسينات الأداء أقل أهمية.

الوجبات الرئيسية

إن تصدير نماذج Ultralytics YOLO إلى تنسيق TensorRT يجعلها تعمل بشكل أسرع وأكثر كفاءة، مما يجعلها مثالية للمهام في الوقت الحقيقي مثل اكتشاف العيوب في المصانع، أو تشغيل أنظمة الدفع الذكية، أو مراقبة المناطق الحضرية المزدحمة. 

يساعد هذا التحسين على تحسين أداء النماذج على وحدات معالجة الرسومات NVIDIA من خلال تسريع التنبؤات وتقليل استخدام الذاكرة والطاقة. على الرغم من وجود بعض القيود، إلا أن تعزيز الأداء يجعل من تكامل TensorRT خيارًا رائعًا لأي شخص يقوم ببناء أنظمة رؤية حاسوبية عالية السرعة على أجهزة NVIDIA .

هل تريد معرفة المزيد عن الذكاء الاصطناعي؟ استكشف مستودع GitHub الخاص بنا، وتواصل مع مجتمعنا، وتحقق من خيارات الترخيص لدينا لبدء مشروع الرؤية الحاسوبية الخاص بك. تعرّف على المزيد حول الابتكارات مثل الذكاء الاصطناعي في التصنيع والرؤية الحاسوبية في مجال الخدمات اللوجستية على صفحات الحلول الخاصة بنا.

شعار LinkedInشعار تويترشعار الفيسبوكرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي