نشر تطبيقات الرؤية الحاسوبية على أجهزة ذكاء الحافة
استكشف كيف تعمل ذكاء الحافة وابتكارات NVIDIA، مثل Jetson وTriton وTensorRT، على تبسيط نشر تطبيقات الرؤية الحاسوبية.

بفضل التطورات الأخيرة في الرؤية الحاسوبية والذكاء الاصطناعي (AI)، أصبح ما كان يوماً مجرد مجال بحثي يدفع الآن تطبيقات ذات تأثير في مجموعة متنوعة من الصناعات. فمن السيارات ذاتية القيادة إلى التصوير الطبي والأمن، تعمل أنظمة الرؤية الحاسوبية على حل مشكلات حقيقية على نطاق واسع.
تتضمن العديد من هذه التطبيقات تحليل الصور والفيديوهات في الوقت الفعلي، والاعتماد على الحوسبة السحابية ليس دائماً عملياً بسبب زمن الوصول والتكاليف ومخاوف الخصوصية. يُعد الذكاء الاصطناعي الطرفي (Edge AI) حلاً رائعاً في هذه المواقف. من خلال تشغيل نماذج الرؤية بالذكاء الاصطناعي مباشرة على الأجهزة الطرفية، يمكن للشركات معالجة البيانات بشكل أسرع وأكثر فعالية من حيث التكلفة وبأمان أكبر، مما يجعل الذكاء الاصطناعي في الوقت الفعلي أكثر سهولة في الوصول.
خلال YOLO Vision 2024 (YV24)، وهو الحدث الهجين السنوي الذي تستضيفه Ultralytics، كان أحد الموضوعات المركزية هو إضفاء الطابع الديمقراطي على الرؤية بالذكاء الاصطناعي من خلال جعل النشر أكثر سهولة وكفاءة للمستخدم. ناقش Guy Dahan، مهندس الحلول الأول في NVIDIA، كيف تساعد حلول الأجهزة والبرامج الخاصة بـ NVIDIA، بما في ذلك أجهزة الحوسبة الطرفية، وخوادم الاستدلال، وأطر العمل التحسينية، ومجموعات أدوات تطوير البرمجيات (SDKs) لنشر الذكاء الاصطناعي، المطورين على تحسين الذكاء الاصطناعي عند الطرف.
في هذه المقالة، سنستكشف النقاط الرئيسية من الكلمة الرئيسية لـ Guy Dahan في YV24 وكيف تجعل ابتكارات NVIDIA الأخيرة نشر الرؤية بالذكاء الاصطناعي أسرع وأكثر قابلية للتوسع.
Link to this sectionما هو الذكاء الاصطناعي الطرفي (Edge AI)؟#
بدأ Guy Dahan حديثه بالتعبير عن حماسه للانضمام إلى YV24 افتراضياً وعن اهتمامه بحزمة Ultralytics Python ونماذج YOLO الخاصة بـ Ultralytics، قائلاً: "لقد كنت أستخدم Ultralytics منذ اليوم الذي ظهرت فيه. أنا معجب حقاً بـ Ultralytics - لقد كنت أستخدم YOLOv5 حتى قبل ذلك، وأنا متحمس جداً لهذه الحزمة."
ثم قدم مفهوم الذكاء الاصطناعي الطرفي، موضحاً أنه يتضمن إجراء عمليات حساب الذكاء الاصطناعي مباشرة على أجهزة مثل الكاميرات أو الطائرات بدون طيار أو الآلات الصناعية، بدلاً من إرسال البيانات إلى خوادم سحابية بعيدة للمعالجة.
بدلاً من انتظار رفع الصور أو الفيديوهات، وتحليلها، ثم إعادتها مع النتائج، يجعل الذكاء الاصطناعي الطرفي من الممكن تحليل البيانات فوراً على الجهاز نفسه. وهذا يجعل أنظمة الرؤية بالذكاء الاصطناعي أسرع وأكثر كفاءة وأقل اعتماداً على الاتصال بالإنترنت. الذكاء الاصطناعي الطرفي مفيد بشكل خاص لتطبيقات اتخاذ القرار في الوقت الفعلي، مثل السيارات ذاتية القيادة، وكاميرات المراقبة، والمصانع الذكية.
Link to this sectionالفوائد الرئيسية للذكاء الاصطناعي الطرفي#
بعد تقديم الذكاء الاصطناعي الطرفي، سلط Guy Dahan الضوء على مزاياه الرئيسية، مع التركيز على الكفاءة، وتوفير التكاليف، وأمن البيانات. وأوضح أن إحدى أكبر المزايا هي زمن الوصول المنخفض - نظراً لأن نماذج الذكاء الاصطناعي تعالج البيانات مباشرة على الجهاز، فلا داعي لإرسال المعلومات إلى السحابة وانتظار الاستجابة.
يساعد الذكاء الاصطناعي الطرفي أيضاً في تقليل التكاليف وحماية البيانات الحساسة. إرسال كميات كبيرة من البيانات إلى السحابة، خاصة تدفقات الفيديو، يمكن أن يكون مكلفاً. ومع ذلك، فإن معالجتها محلياً يقلل من تكاليف النطاق الترددي والتخزين.
ميزة رئيسية أخرى هي خصوصية البيانات لأن المعلومات تبقى على الجهاز بدلاً من نقلها إلى خادم خارجي. وهذا مهم بشكل خاص لتطبيقات الرعاية الصحية، والتمويل، والأمن، حيث يعد الحفاظ على أمن البيانات محلياً أولوية قصوى.

الشكل 1. Guy Dahan يقدم عرضاً عن بُعد في YV24 حول فوائد الذكاء الاصطناعي الطرفي.
بناءً على هذه الفوائد، علق Guy Dahan على التبني المتزايد للذكاء الاصطناعي الطرفي. وأشار إلى أنه منذ قدمت NVIDIA جهاز Jetson في عام 2014، زاد الاستخدام عشرة أضعاف. اليوم، يعمل أكثر من 1.2 مليون مطور باستخدام أجهزة Jetson.
Link to this sectionنظرة عامة على NVIDIA Jetson: جهاز للذكاء الاصطناعي الطرفي#
ركز Guy Dahan بعد ذلك على أجهزة NVIDIA Jetson، وهي عائلة من أجهزة الحوسبة الطرفية المخصصة للذكاء الاصطناعي والمصممة لتقديم أداء عالٍ باستهلاك منخفض للطاقة. تُعد أجهزة Jetson مثالية لتطبيقات الرؤية الحاسوبية في قطاعات مثل الروبوتات، والزراعة، والرعاية الصحية، والأتمتة الصناعية. وأضاف Guy Dahan: "أجهزة Jetson هي أجهزة ذكاء اصطناعي طرفية مصممة خصيصاً للذكاء الاصطناعي. قد أضيف حتى أنها صُممت في الأصل في الغالب للرؤية الحاسوبية."
تأتي أجهزة Jetson في ثلاث فئات، كل منها مناسب لاحتياجات مختلفة:
- مستوى الدخول: توفر هذه الأجهزة من 20 إلى 40 تريليون عملية في الثانية (TOPS) من أداء الذكاء الاصطناعي باستهلاك طاقة من 10 إلى 15 وات، مما يجعلها خياراً ميسور التكلفة للتطبيقات الطرفية.
- المستوى السائد (Mainstream): توازن بين الأداء والكفاءة، وتوفر من 70 إلى 200 TOPS باستهلاك طاقة من 20 إلى 40 وات، وهي مناسبة لأحمال عمل الذكاء الاصطناعي المتوسطة.
- الأداء العالي: توفر ما يصل إلى 275 TOPS باستهلاك طاقة من 60 إلى 75 وات، وهي مصممة لتطبيقات الذكاء الاصطناعي الصعبة مثل الروبوتات والأتمتة.
أيضاً، تحدث Guy Dahan عن جهاز Jetson AGX Thor القادم، والذي سيتم إطلاقه هذا العام، وقال إنه سيوفر ثمانية أضعاف أداء وحدة معالجة الرسومات (GPU)، وضعف سعة الذاكرة، وأداء محسناً لوحدة المعالجة المركزية (CPU). إنه مصمم خصيصاً للروبوتات الشبيهة بالبشر وتطبيقات الذكاء الاصطناعي الطرفي المتقدمة.
Link to this sectionالتحديات المتعلقة بنشر نماذج الرؤية الحاسوبية#
انتقل Guy Dahan بعد ذلك لمناقشة الجانب البرمجي للذكاء الاصطناعي الطرفي وأوضح أنه حتى مع وجود أجهزة قوية، يمكن أن يكون نشر النماذج بكفاءة أمراً صعباً.
أحد أكبر العقبات هو التوافق، حيث غالباً ما يعمل مطورو الذكاء الاصطناعي مع أطر عمل مختلفة للذكاء الاصطناعي مثل PyTorch وTensorFlow. قد يكون التنقل بين أطر العمل هذه أمراً صعباً، ويتطلب من المطورين إعادة إنشاء البيئات لضمان عمل كل شيء بشكل صحيح.
قابلية التوسع هي تحدٍ رئيسي آخر. تتطلب نماذج الذكاء الاصطناعي قوة حوسبة كبيرة، وكما قال Dahan: "لم تكن هناك أبداً شركة ذكاء اصطناعي تريد طاقة حوسبة أقل". يمكن أن يصبح توسيع تطبيقات الذكاء الاصطناعي عبر أجهزة متعددة مكلفاً بسرعة، مما يجعل التحسين أمراً ضرورياً.
أيضاً، خطوط أنابيب (pipelines) الذكاء الاصطناعي معقدة، وغالباً ما تتضمن أنواعاً مختلفة من البيانات، والمعالجة في الوقت الفعلي، وتكامل الأنظمة. يبذل المطورون الكثير من الجهد للتأكد من أن نماذجهم تتفاعل بسلاسة مع الأنظمة البيئية البرمجية الحالية. يعد التغلب على هذه التحديات جزءاً حاسماً لجعل نشر الذكاء الاصطناعي أكثر كفاءة وقابلية للتوسع.

الشكل 2. التحديات في نشر النماذج.
Link to this sectionتبسيط النشر باستخدام خادم Triton Inference Server من NVIDIA#
بعد ذلك، وجه Guy Dahan انتباهه إلى Triton Inference Server من NVIDIA. وأشار إلى أن العديد من الشركات والشركات الناشئة تبدأ في تطوير الذكاء الاصطناعي دون تحسين نماذجها بالكامل. يمكن أن تكون إعادة تصميم نظام الذكاء الاصطناعي بالكامل من الصفر مزعجة وتستغرق وقتاً طويلاً، مما يجعل التوسع بكفاءة أمراً صعباً.
بدلاً من الحاجة إلى إصلاح شامل للنظام، يتيح Triton للمطورين تحسين مسارات عمل الذكاء الاصطناعي الخاصة بهم تدريجياً، ودمج مكونات أكثر كفاءة دون كسر إعداداتهم الحالية. مع دعم أطر عمل متعددة للذكاء الاصطناعي، بما في ذلك TensorFlow وPyTorch وONNX وTensorRT، يتيح Triton النشر السلس عبر بيئات السحابة، ومراكز البيانات، والأجهزة الطرفية بأقل قدر من التعديلات.

الشكل 3. نظرة عامة على خادم NVIDIA Triton Inference Server.
فيما يلي بعض المزايا الرئيسية لخادم Triton Inference Server من NVIDIA:
- التجميع التلقائي (Automatic batching): يقوم Triton بتجميع طلبات الذكاء الاصطناعي المتعددة معاً قبل معالجتها، مما يقلل من التأخير (زمن الوصول) ويحسن سرعة الاستدلال (الوقت الذي يستغرقه نموذج الذكاء الاصطناعي لإنتاج النتائج).
- تكامل Kubernetes: خادم Triton أصلي في السحابة، مما يعني أنه يعمل بسلاسة مع Kubernetes (نظام يساعد في إدارة وتوسيع تطبيقات الذكاء الاصطناعي عبر أجهزة كمبيوتر أو خوادم سحابية متعددة).
- مفتوح المصدر وقابل للتخصيص: يمكن للمطورين تعديل Triton ليتناسب مع احتياجاتهم الخاصة، مما يضمن المرونة لمجموعة واسعة من تطبيقات الذكاء الاصطناعي.
Link to this sectionتعظيم أداء الذكاء الاصطناعي باستخدام NVIDIA TensorRT#
لنفترض أنك تبحث عن المزيد من التسريع؛ يُعد NVIDIA TensorRT خياراً مثيراً للاهتمام لتحسين نماذج الذكاء الاصطناعي الخاصة بك. أوضح Guy Dahan أن TensorRT هو أداة تحسين للتعلم العميق عالية الأداء مصممة لوحدات معالجة الرسومات من NVIDIA. يمكن تحويل النماذج من TensorFlow وPyTorch وONNX وMXNet إلى ملفات عالية الكفاءة قابلة للتنفيذ على وحدة معالجة الرسومات باستخدام TensorRT.
ما يجعل TensorRT موثوقاً للغاية هو تحسيناته الخاصة بالأجهزة. لن يعمل النموذج الذي تم تحسينه لأجهزة Jetson بنفس الكفاءة على وحدات معالجة الرسومات الأخرى لأن TensorRT يضبط الأداء بدقة بناءً على الجهاز المستهدف. يمكن أن يؤدي نموذج الرؤية الحاسوبية المضبوط بدقة إلى زيادة في سرعة الاستدلال تصل إلى 36 ضعفاً مقارنة بالنماذج غير المحسنة.
سلط Guy Dahan الضوء أيضاً على دعم Ultralytics لـ TensorRT، متحدثاً عن كيفية جعله نشر نماذج الذكاء الاصطناعي أسرع وأكثر كفاءة. يمكن تصدير نماذج Ultralytics YOLO مباشرة إلى تنسيق TensorRT، مما يسمح للمطورين بتحسينها لوحدات معالجة الرسومات من NVIDIA دون الحاجة إلى إجراء أي تغييرات.
Link to this sectionDeepStream 7.0: مجموعة أدوات لتحليلات البث#
في ختام الحديث بنبرة إيجابية، عرض Guy Dahan أداة DeepStream 7.0 - وهي إطار عمل للذكاء الاصطناعي مصمم للمعالجة في الوقت الفعلي للفيديو والصوت وبيانات المستشعرات باستخدام وحدات معالجة الرسومات من NVIDIA. صُممت لدعم تطبيقات الرؤية الحاسوبية عالية السرعة، وهي تتيح اكتشاف الكائنات، وتتبعها، وتحليلاتها عبر الأنظمة المستقلة، والأمن، والأتمتة الصناعية، والمدن الذكية. من خلال تشغيل الذكاء الاصطناعي مباشرة على الأجهزة الطرفية، يلغي DeepStream الاعتماد على السحابة، مما يقلل من زمن الوصول ويحسن الكفاءة.

الشكل 4. استكشاف DeepStream 7.0 في YV24 مع Guy Dahan.
على وجه التحديد، يمكن لـ DeepStream التعامل مع معالجة الفيديو المدعومة بالذكاء الاصطناعي من البداية إلى النهاية. وهي تدعم مسارات العمل الشاملة، بدءاً من فك تشفير الفيديو والمعالجة المسبقة وصولاً إلى استدلال الذكاء الاصطناعي والمعالجة اللاحقة.
مؤخراً، قدم DeepStream العديد من التحديثات لتعزيز نشر الذكاء الاصطناعي، مما جعله أكثر سهولة وقابلية للتوسع. تعمل الأدوات الجديدة على تبسيط التطوير، وتحسين تتبع الكاميرات المتعددة، وتحسين خطوط أنابيب الذكاء الاصطناعي لأداء أفضل.
يتمتع المطورون الآن بدعم موسع لبيئات Windows، وقدرات محسنة لدمج المستشعرات لدمج البيانات من مصادر متعددة، وإمكانية الوصول إلى تطبيقات مرجعية مبنية مسبقاً لتسريع النشر. تجعل هذه التحسينات من DeepStream حلاً أكثر مرونة وكفاءة لتطبيقات الذكاء الاصطناعي في الوقت الفعلي، مما يساعد المطورين على توسيع نطاق تحليلات الفيديو الذكية بسهولة.
Link to this sectionأبرز النقاط#
كما هو موضح في الكلمة الرئيسية لـ Guy Dahan في YV24، فإن الذكاء الاصطناعي الطرفي يعيد تعريف تطبيقات الرؤية الحاسوبية. ومع التطورات في الأجهزة والبرامج، أصبحت المعالجة في الوقت الفعلي أسرع وأكثر كفاءة وفعالية من حيث التكلفة.
مع تبني المزيد من الصناعات للذكاء الاصطناعي الطرفي، سيكون معالجة التحديات مثل التجزئة وتعقيد النشر مفتاحاً لإطلاق إمكاناته الكاملة. إن تبني هذه الابتكارات سيدفع نحو تطبيقات ذكاء اصطناعي أكثر ذكاءً واستجابة، مما يشكل مستقبل الرؤية الحاسوبية.
كن جزءاً من مجتمعنا المتنامي! استكشف مستودعنا على GitHub لمعرفة المزيد عن الذكاء الاصطناعي، وتحقق من خيارات الترخيص الخاصة بنا لبدء مشاريع الرؤية بالذكاء الاصطناعي الخاصة بك. هل تشعر بالفضول بشأن ابتكارات مثل الذكاء الاصطناعي في الرعاية الصحية والرؤية الحاسوبية في التصنيع؟ قم بزيارة صفحات الحلول الخاصة بنا لمعرفة المزيد!






