تعرّف على كيفية تصدير نماذج Ultralytics YOLO باستخدام تكامل TensorRT للحصول على أداء ذكاء اصطناعي أسرع وأكثر كفاءة على وحدات معالجة الرسومات NVIDIA للتطبيقات في الوقت الفعلي.
ضع في اعتبارك سيارة ذاتية القيادة تتحرك في شارع مزدحم ولا يتبقى لها سوى أجزاء من الثانية لاكتشاف أحد المشاة الذي يخرج عن الرصيف. وفي الوقت نفسه، قد تحتاج السيارة إلى التعرّف على إشارة توقف مخفية جزئياً بواسطة شجرة أو الاستجابة بسرعة لسيارة قريبة تنحرف إلى مسارها. في مثل هذه الحالات، تكون السرعة والاستجابات في الوقت الحقيقي أمرًا بالغ الأهمية.
هذا هو المكان الذي يلعب فيه الذكاء الاصطناعي (AI)، وتحديداً الرؤية الحاسوبية، وهو فرع من الذكاء الاصطناعي يساعد الآلات على تفسير البيانات المرئية، دوراً رئيسياً. ولكي تعمل حلول الرؤية الحاسوبية بشكل موثوق في بيئات العالم الحقيقي، فإنها تحتاج في كثير من الأحيان إلى معالجة المعلومات بسرعة، والتعامل مع مهام متعددة في وقت واحد، واستخدام الذاكرة بكفاءة.
إحدى طرق تحقيق ذلك هي من خلال تسريع الأجهزة، باستخدام أجهزة متخصصة مثل وحدات معالجة الرسومات (GPU) لتشغيل النماذج بشكل أسرع. وحدات معالجة الرسومات NVIDIA معروفة بشكل خاص لمثل هذه المهام، وذلك بفضل قدرتها على توفير زمن انتقال منخفض وإنتاجية عالية.
ومع ذلك، فإن تشغيل نموذج على GPU كما هو لا يضمن دائمًا الأداء الأمثل. تتطلب نماذج الذكاء الاصطناعي المرئي عادةً تحسينًا للاستفادة الكاملة من قدرات الأجهزة. من أجل تحقيق الأداء الكامل مع أجهزة معينة، نحتاج إلى تجميع النموذج لاستخدام مجموعة محددة من التعليمات الخاصة بالأجهزة.
على سبيل المثال، TensorRT عبارة عن تنسيق تصدير ومكتبة تحسين طوّرتها NVIDIA لتحسين الأداء على الأجهزة المتطورة. تستخدم تقنيات متقدمة لتقليل وقت الاستدلال بشكل كبير مع الحفاظ على الدقة.
في هذه المقالة، سنستكشف تكاملTensorRT المدعوم من قبل Ultralytics وسنتعرف على كيفية تصدير نموذج YOLO11 الخاص بك لنشر أسرع وأكثر كفاءة على أجهزة NVIDIA . لنبدأ!
TensorRT عبارة عن مجموعة أدوات طورتها NVIDIA لمساعدة نماذج الذكاء الاصطناعي على العمل بشكل أسرع وأكثر كفاءة على وحدات معالجة الرسومات NVIDIA . وهي مصممة لتطبيقات العالم الحقيقي حيث تكون السرعة والأداء مهمين حقًا، مثل السيارات ذاتية القيادة ومراقبة الجودة في التصنيع والمستحضرات الصيدلانية.
يتضمن TensorRT أدوات مثل المُجمِّعات ومُحسِّنات النماذج التي يمكنها العمل خلف الكواليس للتأكد من تشغيل نماذجك بزمن انتقال منخفض ويمكنها التعامل مع إنتاجية أعلى.
يعمل تكامل TensorRT المدعوم من قبل Ultralytics من خلال تحسين نموذج YOLO الخاص بك ليعمل بكفاءة أكبر على وحدات معالجة الرسومات باستخدام طرق مثل تقليل الدقة. يشير هذا إلى استخدام تنسيقات ذات بتات أقل، مثل الفاصلة العائمة 16 بت (FP16) أو الأعداد الصحيحة 8 بت (INT8)، لتمثيل بيانات النموذج، مما يقلل من استخدام الذاكرة ويسرّع الحساب بأقل تأثير على الدقة.
أيضًا، يتم دمج طبقات الشبكة العصبية المتوافقة في نماذج TensorRT المحسّنة لتقليل استخدام الذاكرة، مما يؤدي إلى استنتاج أسرع وأكثر كفاءة.
قبل أن نناقش كيف يمكنك تصدير YOLO11 باستخدام تكامل TensorRT دعنا نلقي نظرة على بعض الميزات الرئيسية لتنسيق نموذج TensorRT :
من السهل تصدير نماذجUltralytics YOLO مثل Ultralytics YOLO11 إلى تنسيق نموذج TensorRT . لنستعرض الخطوات المتبعة.
للبدء، يمكنك تثبيت حزمةUltralytics Python باستخدام مدير حزم مثل "pip". يمكن القيام بذلك عن طريق تشغيل الأمر "pip install ultralytics" في موجه الأوامر أو في الطرفية.
بعد تثبيت حزمة Ultralytics Python Package بنجاح، يمكنك تدريب النماذج واختبارها وضبطها وتصديرها ونشرها لمختلف مهام الرؤية الحاسوبية، مثل اكتشاف الأجسام وتصنيفها وتجزئة المثيل. أثناء تثبيت الحزمة، إذا واجهتك أي صعوبات، يمكنك الرجوع إلى دليل المشكلات الشائعة للحصول على الحلول والنصائح.
للخطوة التالية، ستحتاج إلى جهاز NVIDIA . استخدم مقتطف الشيفرة أدناه لتحميل وتصدير YOLOv11 إلى تنسيق نموذج TensorRT . حيث يقوم بتحميل متغير نانو مدرب مسبقًا من نموذج YOLO11 (yolo11n.pt) وتصديره كملف محرك TensorRT (yolo11n.engine)، مما يجعله جاهزًا للنشر عبر أجهزة NVIDIA .
from ultralytics import YOLO
model = YOLO("yolo11n.pt")
model.export(format="engine")
بعد تحويل النموذج الخاص بك إلى تنسيق TensorRT يمكنك نشره لتطبيقات مختلفة.
يوضّح المثال أدناه كيفية تحميل نموذج YOLO11 المُصدَّر (yolo11n.engine) وتشغيل الاستدلال باستخدامه. يتضمن الاستدلال استخدام النموذج المدرّب لإجراء تنبؤات على بيانات جديدة. في هذه الحالة، سنستخدم صورة مدخلات لكلب لاختبار النموذج.
tensorrt_model = YOLO("yolo11n.engine")
results = tensorrt_model("https://images.pexels.com/photos/1254140/pexels-photo-1254140.jpeg?auto=compress&cs=tinysrgb&w=1260&h=750&dpr=2.jpg", save=True)
عند تشغيل هذا الرمز، ستُحفظ صورة الإخراج التالية في مجلد التشغيل/الكشف/التنبؤ.
تدعم حزمة Ultralytics Python العديد من عمليات التكامل التي تسمح بتصدير نماذج YOLO إلى تنسيقات مختلفة مثل TorchScript و CoreML و ONNX و TensorRT. إذن، متى يجب عليك اختيار استخدام تكامل TensorRT
فيما يلي بعض العوامل التي تميز تنسيق نموذج TensorRT عن خيارات تكامل التصدير الأخرى:
يمكن نشر نماذج Ultralytics YOLO التي تم تصديرها إلى تنسيق TensorRT عبر مجموعة واسعة من سيناريوهات العالم الحقيقي. هذه النماذج المحسّنة مفيدة بشكل خاص عندما يكون الأداء السريع والفعال للذكاء الاصطناعي هو المفتاح. دعنا نستكشف بعض الأمثلة المثيرة للاهتمام حول كيفية استخدامها.
لا تزال مجموعة كبيرة من المهام في متاجر البيع بالتجزئة، مثل مسح الرموز الشريطية أو وزن المنتجات أو تغليف المنتجات، يتم التعامل معها يدويًا بواسطة الموظفين. ومع ذلك، فإن الاعتماد على الموظفين فقط يمكن أن يؤدي إلى إبطاء العمليات ويؤدي إلى إحباط العملاء، خاصة عند الخروج. الطوابير الطويلة غير مريحة لكل من المتسوقين وأصحاب المتاجر. تُعد عدادات الدفع الذاتي الذكية حلاً رائعاً لهذه المشكلة.
تستخدم هذه العدادات الرؤية الحاسوبية ووحدات معالجة الرسومات لتسريع العملية، مما يساعد على تقليل أوقات الانتظار. تمكّن الرؤية الحاسوبية هذه الأنظمة من رؤية وفهم بيئتها من خلال مهام مثل اكتشاف الأشياء. يمكن أن تعمل النماذج المتقدمة مثل YOLO11 عند تحسينها باستخدام أدوات مثل TensorRT بشكل أسرع بكثير على أجهزة GPU .
هذه النماذج المصدرة مناسبة تمامًا لإعدادات البيع بالتجزئة الذكية باستخدام أجهزة مدمجة ولكن قوية مثل NVIDIA Jetson Nano، المصممة خصيصًا لتطبيقات الذكاء الاصطناعي المتطورة.
يمكن تدريب نموذج الرؤية الحاسوبية مثل YOLO11 على نموذج الرؤية الحاسوبية للكشف عن المنتجات المعيبة في الصناعة التحويلية. وبمجرد التدريب، يمكن تصدير النموذج إلى تنسيق TensorRT لنشره في المنشآت المجهزة بأنظمة ذكاء اصطناعي عالية الأداء.
بينما تتحرك المنتجات على طول سيور النقل، تلتقط الكاميرات الصور، ويقوم نموذج YOLO11 الذي يعمل بتنسيق TensorRT بتحليلها في الوقت الفعلي لاكتشاف العيوب. يتيح هذا الإعداد للشركات اكتشاف المشكلات بسرعة وبدقة، مما يقلل من الأخطاء ويحسن الكفاءة.
وبالمثل، تستخدم صناعات مثل المستحضرات الصيدلانية هذه الأنواع من الأنظمة لتحديد العيوب في العبوات الطبية. في الواقع، من المتوقع أن ينمو السوق العالمي لأنظمة الكشف عن العيوب الذكية إلى 5 مليارات دولار بحلول عام 2026.
على الرغم من أن تكامل TensorRT يجلب العديد من المزايا، مثل سرعات الاستدلال الأسرع وتقليل زمن الوصول، إلا أن هناك بعض القيود التي يجب وضعها في الاعتبار:
إن تصدير نماذج Ultralytics YOLO إلى تنسيق TensorRT يجعلها تعمل بشكل أسرع وأكثر كفاءة، مما يجعلها مثالية للمهام في الوقت الحقيقي مثل اكتشاف العيوب في المصانع، أو تشغيل أنظمة الدفع الذكية، أو مراقبة المناطق الحضرية المزدحمة.
يساعد هذا التحسين على تحسين أداء النماذج على وحدات معالجة الرسومات NVIDIA من خلال تسريع التنبؤات وتقليل استخدام الذاكرة والطاقة. على الرغم من وجود بعض القيود، إلا أن تعزيز الأداء يجعل من تكامل TensorRT خيارًا رائعًا لأي شخص يقوم ببناء أنظمة رؤية حاسوبية عالية السرعة على أجهزة NVIDIA .
هل تريد معرفة المزيد عن الذكاء الاصطناعي؟ استكشف مستودع GitHub الخاص بنا، وتواصل مع مجتمعنا، وتحقق من خيارات الترخيص لدينا لبدء مشروع الرؤية الحاسوبية الخاص بك. تعرّف على المزيد حول الابتكارات مثل الذكاء الاصطناعي في التصنيع والرؤية الحاسوبية في مجال الخدمات اللوجستية على صفحات الحلول الخاصة بنا.