اكتشف كيف تعمل Edge AI وابتكارات NVIDIA، مثل Jetson و Triton و TensorRT، على تبسيط نشر تطبيقات رؤية الكمبيوتر.
اكتشف كيف تعمل Edge AI وابتكارات NVIDIA، مثل Jetson و Triton و TensorRT، على تبسيط نشر تطبيقات رؤية الكمبيوتر.
بفضل التطورات الأخيرة في الرؤية الحاسوبية والذكاء الاصطناعي (AI)، فإن ما كان مجرد مجال بحثي يقود الآن تطبيقات مؤثرة في مجموعة واسعة من الصناعات. من السيارات ذاتية القيادة إلى التصوير الطبي والأمن، تحل أنظمة الرؤية الحاسوبية مشاكل حقيقية على نطاق واسع.
تتضمن العديد من هذه التطبيقات تحليل الصور والفيديو في الوقت الفعلي، والاعتماد على الحوسبة السحابية ليس عمليًا دائمًا بسبب زمن الوصول والتكاليف ومخاوف الخصوصية. الذكاء الاصطناعي الطرفي (Edge AI) هو حل رائع في هذه الحالات. من خلال تشغيل نماذج Vision AI مباشرةً على الأجهزة الطرفية، يمكن للشركات معالجة البيانات بشكل أسرع وبتكلفة معقولة وأمان أكبر، مما يجعل الذكاء الاصطناعي في الوقت الفعلي أكثر سهولة.
خلال YOLO Vision 2024 (YV24)، وهو الحدث الهجين السنوي الذي تستضيفه Ultralytics، كان أحد الموضوعات المركزية هو إضفاء الطابع الديمقراطي على الرؤية بالذكاء الاصطناعي من خلال جعل النشر أكثر سهولة في الاستخدام وكفاءة. ناقش Guy Dahan، كبير مهندسي الحلول في NVIDIA، كيف تساعد حلول الأجهزة والبرامج من NVIDIA، بما في ذلك أجهزة الحوسبة الطرفية وخوادم الاستدلال وأطر التحسين وحزم SDK لنشر الذكاء الاصطناعي، المطورين على تحسين الذكاء الاصطناعي على الحافة.
في هذه المقالة، سنستكشف النقاط الرئيسية من كلمة Guy Dahan الرئيسية في YV24 وكيف أن أحدث ابتكارات NVIDIA تجعل نشر Vision AI أسرع وأكثر قابلية للتطوير.
بدأ جاي داهان حديثه بالإعراب عن حماسه للانضمام إلى YV24 افتراضيًا واهتمامه بحزمة Ultralytics Python ونماذج Ultralytics YOLO، قائلاً: "أنا أستخدم Ultralytics منذ اليوم الذي ظهرت فيه. أنا حقًا أحب Ultralytics - لقد كنت أستخدم YOLOv5 حتى قبل ذلك، وأنا متحمس حقيقي لهذه الحزمة."
ثم، قدم مفهوم الذكاء الاصطناعي الطرفي (Edge AI)، موضحًا أنه ينطوي على تشغيل حسابات الذكاء الاصطناعي مباشرة على الأجهزة مثل الكاميرات أو الطائرات بدون طيار أو الآلات الصناعية، بدلاً من إرسال البيانات إلى خوادم سحابية بعيدة للمعالجة.
بدلًا من انتظار تحميل الصور أو مقاطع الفيديو، وتحليلها، ثم إرسالها مرة أخرى مع النتائج، يتيح الذكاء الاصطناعي الطرفي (Edge AI) تحليل البيانات على الفور على الجهاز نفسه. وهذا يجعل أنظمة الرؤية الاصطناعية (Vision AI) أسرع وأكثر كفاءة وأقل اعتمادًا على الاتصال بالإنترنت. يعتبر الذكاء الاصطناعي الطرفي مفيدًا بشكل خاص لتطبيقات اتخاذ القرارات في الوقت الفعلي، مثل السيارات ذاتية القيادة وكاميرات المراقبة والمصانع الذكية.
بعد تقديم Edge AI، سلط غي دهان الضوء على مزاياه الرئيسية، مع التركيز على الكفاءة وتوفير التكاليف وأمن البيانات. وأوضح أن إحدى أكبر الفوائد هي زمن الوصول المنخفض - نظرًا لأن نماذج الذكاء الاصطناعي تعالج البيانات مباشرة على الجهاز، فليست هناك حاجة لإرسال المعلومات إلى السحابة والانتظار للحصول على استجابة.
يساعد الذكاء الاصطناعي المتطور أيضًا على تقليل التكاليف وحماية البيانات الحساسة. يمكن أن يكون إرسال كميات كبيرة من البيانات إلى السحابة، وخاصة تدفقات الفيديو، مكلفًا. ومع ذلك، فإن معالجتها محليًا تقلل من تكاليف النطاق الترددي والتخزين.
ميزة رئيسية أخرى هي خصوصية البيانات لأن المعلومات تبقى على الجهاز بدلاً من نقلها إلى خادم خارجي. وهذا مهم بشكل خاص لتطبيقات الرعاية الصحية والمالية والأمن، حيث يعد الحفاظ على البيانات المحلية والآمنة أولوية قصوى.

بالاعتماد على هذه الفوائد، علق غي دهان على التبني المتزايد للذكاء الاصطناعي المتطرف (Edge AI). وأشار إلى أنه منذ أن قدمت NVIDIA Jetson في عام 2014، زاد الاستخدام عشرة أضعاف. واليوم، يعمل أكثر من 1.2 مليون مطور مع أجهزة Jetson.
ثم ركز غي داهان على أجهزة NVIDIA Jetson، وهي عائلة من أجهزة الحوسبة الطرفية للذكاء الاصطناعي المصممة لتقديم أداء عالٍ مع استهلاك منخفض للطاقة. تُعد أجهزة Jetson مثالية لتطبيقات الرؤية الحاسوبية في قطاعات مثل الروبوتات والزراعة والرعاية الصحية والأتمتة الصناعية. وأضاف غي داهان: "أجهزة Jetson هي أجهزة Edge AI مصممة خصيصًا للذكاء الاصطناعي. قد أضيف أيضًا أنها صُممت في الأصل في الغالب للرؤية الحاسوبية."
تأتي أجهزة Jetson في ثلاثة مستويات، كل منها مناسب لاحتياجات مختلفة:
أيضًا، شارك جاي داهان معلومات حول Jetson AGX Thor القادم، والذي سيتم إطلاقه هذا العام، وقال إنه سيوفر ثمانية أضعاف أداء وحدة معالجة الرسومات (GPU)، وضعف سعة الذاكرة، وتحسين أداء وحدة المعالجة المركزية (CPU). إنه مصمم خصيصًا للإنسان الآلي وتطبيقات Edge AI المتقدمة.
ثم انتقل غي داهان لمناقشة الجانب البرمجي من Edge AI وأوضح أنه حتى مع وجود أجهزة قوية، يمكن أن يكون نشر النماذج بكفاءة أمرًا صعبًا.
تتمثل إحدى أكبر العقبات في التوافق، حيث غالبًا ما يعمل مطورو الذكاء الاصطناعي مع أطر عمل للذكاء الاصطناعي مختلفة مثل PyTorch و TensorFlow. قد يكون الانتقال بين أطر العمل هذه أمرًا صعبًا، مما يتطلب من المطورين إعادة إنشاء بيئات لضمان تشغيل كل شيء بشكل صحيح.
تعد قابلية التوسع تحديًا رئيسيًا آخر. تتطلب نماذج الذكاء الاصطناعي قوة حوسبة كبيرة، وكما قال داهان، "لم تكن هناك شركة ذكاء اصطناعي تريد قوة حوسبة أقل." يمكن أن يصبح توسيع تطبيقات الذكاء الاصطناعي عبر أجهزة متعددة مكلفًا بسرعة، مما يجعل التحسين ضروريًا.
أيضًا، تعد خطوط أنابيب الذكاء الاصطناعي معقدة، وغالبًا ما تتضمن أنواعًا مختلفة من البيانات، والمعالجة في الوقت الفعلي، وتكامل الأنظمة. يبذل المطورون الكثير من الجهد للتأكد من أن نماذجهم تتفاعل بسلاسة مع النظم البيئية للبرامج الحالية. يعد التغلب على هذه التحديات جزءًا حاسمًا من جعل عمليات نشر الذكاء الاصطناعي أكثر كفاءة وقابلية للتطوير.

بعد ذلك، حول جاي دهان انتباهه إلى خادم استدلال ترايتون الخاص بـ NVIDIA. وأشار إلى أن العديد من الشركات والشركات الناشئة تبدأ تطوير الذكاء الاصطناعي دون تحسين نماذجها بشكل كامل. يمكن أن تكون إعادة تصميم خط أنابيب الذكاء الاصطناعي بأكمله من البداية أمرًا معطلاً ويستغرق وقتًا طويلاً، مما يجعل من الصعب التوسع بكفاءة.
بدلاً من الحاجة إلى إصلاح شامل للنظام، يسمح Triton للمطورين بتحسين سير عمل الذكاء الاصطناعي تدريجيًا وتحسينه، ودمج مكونات أكثر كفاءة دون تعطيل الإعداد الحالي. مع دعم أطر عمل الذكاء الاصطناعي المتعددة، بما في ذلك TensorFlow و PyTorch و ONNX و TensorRT، يتيح Triton نشرًا سلسًا عبر البيئات السحابية ومراكز البيانات والأجهزة الطرفية بأقل قدر من التعديلات.

فيما يلي بعض المزايا الرئيسية لخادم استنتاج ترايتون من NVIDIA:
لنفترض أنك تبحث عن المزيد من التسريع؛ NVIDIA TensorRT هو خيار مثير للاهتمام لتحسين نماذج الذكاء الاصطناعي الخاصة بك. أوضح جاي داهان أن TensorRT هو مُحسِّن للتعلم العميق عالي الأداء مصمم لوحدات معالجة الرسومات NVIDIA. يمكن تحويل النماذج من TensorFlow و PyTorch و ONNX و MXNet إلى ملفات قابلة للتنفيذ على وحدة معالجة الرسومات بكفاءة عالية باستخدام TensorRT.
ما يجعل TensorRT موثوقًا للغاية هو التحسينات الخاصة بالأجهزة. النموذج المُحسَّن لأجهزة Jetson لن يعمل بكفاءة على وحدات معالجة الرسومات الأخرى لأن TensorRT يضبط الأداء استنادًا إلى الأجهزة المستهدفة. يمكن أن تؤدي نماذج رؤية الحاسوب المضبوطة بدقة إلى زيادة في سرعة الاستدلال تصل إلى 36 مرة مقارنة بالنماذج غير المحسنة.
كما لفت غي داهان الانتباه إلى دعم Ultralytics لـ TensorRT، متحدثًا عن كيف يجعل نشر نماذج الذكاء الاصطناعي أسرع وأكثر كفاءة. يمكن تصدير نماذج Ultralytics YOLO مباشرةً إلى تنسيق TensorRT، مما يتيح للمطورين تحسينها لوحدات معالجة الرسوميات NVIDIA دون الحاجة إلى إجراء أي تغييرات.
في ختام الحديث بنبرة عالية، عرض جاي داهان DeepStream 7.0 - وهو إطار عمل للذكاء الاصطناعي مصمم للمعالجة في الوقت الفعلي للبيانات المرئية والصوتية وبيانات الاستشعار باستخدام وحدات معالجة الرسومات NVIDIA. تم تصميمه لدعم تطبيقات الرؤية الحاسوبية عالية السرعة، فهو يتيح الكشف عن الأجسام وتتبعها وتحليلها عبر الأنظمة المستقلة والأمن والأتمتة الصناعية والمدن الذكية. من خلال تشغيل الذكاء الاصطناعي مباشرةً على الأجهزة الطرفية، يزيل DeepStream الاعتماد على السحابة، مما يقلل من زمن الوصول ويحسن الكفاءة.

على وجه التحديد، يمكن لـ DeepStream التعامل مع معالجة الفيديو المدعومة بالذكاء الاصطناعي من البداية إلى النهاية. وهو يدعم سير العمل الشامل، بدءًا من فك ترميز الفيديو والمعالجة المسبقة وحتى الاستدلال بالذكاء الاصطناعي والمعالجة اللاحقة.
في الآونة الأخيرة، قدمت DeepStream العديد من التحديثات لتحسين نشر الذكاء الاصطناعي، مما يجعلها أكثر سهولة وقابلية للتطوير. تعمل الأدوات الجديدة على تبسيط التطوير وتحسين تتبع الكاميرات المتعددة وتحسين خطوط أنابيب الذكاء الاصطناعي لتحسين الأداء.
يتمتع المطورون الآن بدعم موسع لبيئات Windows، وقدرات محسنة لدمج أجهزة الاستشعار لدمج البيانات من مصادر متعددة، والوصول إلى تطبيقات مرجعية مُنشأة مسبقًا لتسريع النشر. هذه التحسينات تجعل DeepStream حلاً أكثر مرونة وكفاءة لتطبيقات الذكاء الاصطناعي في الوقت الفعلي، مما يساعد المطورين على توسيع نطاق تحليلات الفيديو الذكية بسهولة.
كما هو موضح في الكلمة الرئيسية التي ألقاها Guy Dahan في YV24، فإن الذكاء الاصطناعي المتطرف يعيد تعريف تطبيقات الرؤية الحاسوبية. مع التقدم في الأجهزة والبرامج، أصبحت المعالجة في الوقت الفعلي أسرع وأكثر كفاءة وفعالية من حيث التكلفة.
مع تبني المزيد من الصناعات للذكاء الاصطناعي الطرفي (Edge AI)، سيكون التصدي للتحديات مثل التجزئة وتعقيد النشر أمرًا أساسيًا لإطلاق إمكاناته الكاملة. إن تبني هذه الابتكارات سيؤدي إلى تطبيقات ذكاء اصطناعي أكثر ذكاءً واستجابة، مما يشكل مستقبل رؤية الكمبيوتر.
كن جزءًا من مجتمعنا المتنامي! استكشف مستودع GitHub الخاص بنا لمعرفة المزيد حول الذكاء الاصطناعي، وتحقق من خيارات الترخيص الخاصة بنا لبدء مشاريع Vision AI الخاصة بك. هل أنت مهتم بالابتكارات مثل الذكاء الاصطناعي في الرعاية الصحية و رؤية الكمبيوتر في التصنيع؟ قم بزيارة صفحات الحلول الخاصة بنا لمعرفة المزيد!