Yolo فيجن شنتشن
شنتشن
انضم الآن

تمكين الذكاء الاصطناعي المتطور باستخدام Sony IMX500 و AITRIOS

انضم إلينا ونحن نلخص الإنجازات التي حققتها سوني في معالجة الذكاء الاصطناعي المتطورة مع مستشعر IMX500 ومنصة AITRIOS، للمساعدة في تحسين نماذج Ultralytics YOLO .

تتيح Edge AI تشغيل نماذج الذكاء الاصطناعي (AI) مباشرة على الأجهزة مثل الهواتف الذكية و الكاميرات و الطائرات بدون طيار. ميزتها الرئيسية هي أنها تدعم اتخاذ قرارات أسرع وفي الوقت الفعلي دون الاعتماد على السحابة. في الواقع، تظهر الدراسات أن استخدام الذكاء الاصطناعي على منصات الحافة يمكن أن يزيد الكفاءة التشغيلية بنسبة تصل إلى 40٪. 

جعلت التطورات الأخيرة في مجال الذكاء الاصطناعي المتطور، لا سيما في مجال الرؤية الحاسوبية، موضوعاً محورياً في YOLO Vision 2024 (YV24)، وهو الحدث السنوي الهجين الذي تنظمه Ultralytics والذي يجمع بين عشاق الذكاء الاصطناعي والخبراء لاستكشاف أحدث ما توصل إليه الذكاء الاصطناعي البصري. كان العرض التقديمي الرئيسي لشركة سوني أحد أبرز الأحداث في هذا الحدث، حيث عرضت الشركة حلولها الجديدة المتطورة في مجال الذكاء الاصطناعي من أجهزة وبرامج الذكاء الاصطناعي. كما تم عرض مستشعر IMX500 ومنصة AITRIOS، وعرضت سوني كيف تجعل هذه الابتكارات نشر نماذجUltralytics YOLO أسهل وأكثر كفاءة مثل Ultralytics YOLO11 و Ultralytics YOLOv8 على الحافة

قاد الجلسة Wei Tang، مدير تطوير الأعمال الذي يركز على حلول التصوير من Sony، و Amir Servi، مدير منتجات Edge Deep Learning ذو الخبرة في نشر نماذج التعلم العميق على أجهزة الحافة

في هذا المقال، سنعيد النظر في حديث سوني في YV24 ونستكشف كيف يعمل مستشعر IMX500 ومنصة AITRIOS على تحسين استخدام نماذج YOLO لمعالجة الذكاء الاصطناعي في الوقت الحقيقي بشكل أسرع. لنبدأ!

رؤية سوني: إضفاء الطابع الديمقراطي على الذكاء الاصطناعي على الأجهزة الطرفية

افتتحت وي تانغ الجلسة بالحديث عن هدف سوني المتمثل في جعل الذكاء الاصطناعي الطرفي متاحًا كما فعلوا مع التصوير الفوتوغرافي منذ سنوات. وأكدت على أن سوني تركز الآن على جلب الرؤية المتقدمة للذكاء الاصطناعي إلى المزيد من الأشخاص من خلال الحوسبة الطرفية. أحد العوامل الدافعة وراء ذلك هو التأثير الإيجابي الذي يمكن أن تحدثه الحوسبة الطرفية على البيئة. من خلال معالجة البيانات مباشرة على الأجهزة بدلاً من الاعتماد على مراكز بيانات ضخمة، تساعد الحوسبة الطرفية في خفض استهلاك الطاقة وتقليل انبعاثات الكربون. إنه نهج أكثر ذكاءً وخضرة يتناسب تمامًا مع التزام سوني ببناء تكنولوجيا لا تعمل بشكل أفضل فحسب، بل تساعد أيضًا في خلق مستقبل أكثر استدامة.

وتابعت وي لتشرح كيف تقوم شركة Sony Semiconductor Solutions، وهي قسم من شركة Sony متخصص في تقنيات التصوير والاستشعار، بإنشاء مستشعرات صور متقدمة. تُستخدم هذه المستشعرات في مجموعة متنوعة من الأجهزة، حيث تحول الضوء إلى إشارات إلكترونية لالتقاط الصور. مع شحن أكثر من 1.2 مليار مستشعر سنويًا، توجد في ما يقرب من نصف الهواتف المحمولة في العالم، مما يجعل سوني لاعبًا رئيسيًا في صناعة التصوير

__wf_reserved_inherit
الشكل 1. أمثلة على مستشعرات الصور من سوني.

بالاعتماد على هذه الخبرة، تتخذ Sony الآن خطوات إضافية من خلال تحويل هذه المستشعرات من أجهزة التقاط الصور إلى أدوات ذكية يمكنها معالجة البيانات في الوقت الفعلي، مما يتيح رؤى مدعومة بالذكاء الاصطناعي مباشرة على الأجهزة. قبل أن نناقش حلول الأجهزة والبرامج التي تستخدمها Sony لدعم هذا التحول، دعنا نفهم تحديات الذكاء الاصطناعي الطرفية التي تهدف هذه الابتكارات إلى حلها.

تحديات متعلقة بمعالجة صور الذكاء الاصطناعي على الأجهزة الطرفية

يأتي تطوير حلول الذكاء الاصطناعي الطرفية مع بعض التحديات الرئيسية، خاصة عند العمل مع أجهزة مثل الكاميرات وأجهزة الاستشعار. العديد من هذه الأجهزة لديها طاقة وقدرة معالجة محدودة، مما يجعل من الصعب تشغيل نماذج الذكاء الاصطناعي المتقدمة بكفاءة.

فيما يلي بعض القيود الرئيسية الأخرى:

  • تعقيد البرامج: قد يكون تكييف نماذج الذكاء الاصطناعي للعمل عبر الأجهزة الطرفية المختلفة ذات التكوينات المختلفة للأجهزة أمرًا معقدًا ويتطلب تعديلات و تحسينات.
  • اختناقات ما بعد المعالجة (Post-processing bottlenecks): غالبًا ما يكون هناك تأخير عند نقل كميات كبيرة من البيانات من الجهاز إلى المضيف للمعالجة اللاحقة. غالبًا ما يستهلك وقتًا أطول من الاستدلال (inference) لنموذج الذكاء الاصطناعي الفعلي.
  • انفجار البيانات: مع وجود العديد من أجهزة إنترنت الأشياء التي تولد البيانات باستمرار، يمكن أن يكون حجم البيانات التي يجب معالجتها محليًا هائلاً، مما يزيد من الضغط على الأجهزة الطرفية.

التعرف على مستشعر الرؤية الذكي Sony IMX500

يُعد مستشعر الرؤية الذكي Sony IMX500 قطعة أجهزة تغير قواعد اللعبة في معالجة الذكاء الاصطناعي المتطورة. إنه أول مستشعر رؤية ذكي في العالم يتمتع بقدرات الذكاء الاصطناعي على الرقاقة. يساعد هذا المستشعر في التغلب على العديد من التحديات في الذكاء الاصطناعي المتطور، بما في ذلك اختناقات معالجة البيانات و مخاوف الخصوصية وقيود الأداء.

في حين أن المستشعرات الأخرى تمرر الصور والإطارات فقط، فإن IMX500 يروي قصة كاملة. يقوم بمعالجة البيانات مباشرة على المستشعر، مما يسمح للأجهزة بإنشاء رؤى في الوقت الفعلي. خلال الجلسة، قال Wei Tang: "من خلال الاستفادة من تقنية مستشعر الصور المتقدمة لدينا، نهدف إلى تمكين جيل جديد من التطبيقات التي يمكن أن تعزز الحياة اليومية." تم تصميم IMX500 لتحقيق هذا الهدف، وتحويل طريقة تعامل الأجهزة مع البيانات مباشرة على المستشعر، دون الحاجة إلى إرسالها إلى السحابة للمعالجة.

فيما يلي بعض ميزاته الرئيسية:

  • إخراج البيانات الوصفية: بدلاً من إرسال صور كاملة، فإنه يخرج بيانات وصفية، مما يقلل بشكل كبير من حجم البيانات، مما يقلل من استخدام النطاق الترددي والتكاليف.
  • تحسين الخصوصية: من خلال معالجة البيانات على الجهاز، يحسن IMX500 الخصوصية، خاصة في الحالات التي تتضمن معلومات حساسة، مثل مهام الرؤية الحاسوبية المتعلقة بالإنسان مثل عد الأشخاص.
  • المعالجة في الوقت الفعلي: تعني قدرة المستشعر على التعامل مع البيانات بسرعة أنه يدعم اتخاذ القرارات بسرعة وفي الوقت الفعلي مما يتيح تطبيقات الذكاء الاصطناعي المتطورة مثل الأنظمة المستقلة.

إن IMX500 ليس مجرد مستشعر كاميرا، بل هو أداة استشعار قوية تعمل على تحويل كيفية إدراك الأجهزة للعالم من حولها وتفاعلها معه. من خلال تضمين الذكاء الاصطناعي مباشرةً في المستشعر، تجعل سوني الذكاء الاصطناعي المتطور أكثر سهولة في صناعات مثل السيارات والرعاية الصحية والمدن الذكية. في الأقسام اللاحقة، سنتعمق أكثر في كيفية عمل IMX500 مع نماذج Ultralytics YOLO لتحسين اكتشاف الأجسام ومعالجة البيانات على الأجهزة المتطورة.

__wf_reserved_inherit
الشكل 2. وي تانغ على خشبة المسرح في معرض YOLO VIiion 2024 لتقديم مستشعر الرؤية الذكي IMX500 من سوني.

منصة AITRIOS من سوني: تبسيط الذكاء الاصطناعي المتطور

بعد تقديم مستشعر IMX500، أعرب Wei Tang عن أنه في حين أن الأجهزة ضرورية، إلا أنها ليست كافية بمفردها لمعالجة النطاق الكامل للتحديات التي تنطوي عليها عملية نشر الذكاء الاصطناعي على الحافة. تحدثت عن كيف أن دمج الذكاء الاصطناعي على الأجهزة مثل الكاميرات وأجهزة الاستشعار يتطلب أكثر من مجرد أجهزة متطورة - بل يحتاج إلى برامج ذكية لإدارتها. هذا هو المكان الذي تأتي فيه منصة AITRIOS من Sony، حيث تقدم حلاً برمجيًا موثوقًا مصممًا لجعل نشر الذكاء الاصطناعي على الأجهزة الطرفية أبسط وأكثر كفاءة.

يعمل AITRIOS كجسر بين نماذج الذكاء الاصطناعي المعقدة وقيود الأجهزة الطرفية. إنه يوفر للمطورين مجموعة من الأدوات لنشر نماذج الذكاء الاصطناعي المدربة مسبقًا بسرعة. ولكن الأهم من ذلك، أنه يدعم إعادة التدريب المستمر حتى تتمكن نماذج الذكاء الاصطناعي من التكيف باستمرار مع التغيرات في العالم الحقيقي. 

سلطت وي أيضًا الضوء على كيف أن AITRIOS يبسط العملية لأولئك الذين ليس لديهم خبرة عميقة في الذكاء الاصطناعي، مما يوفر المرونة لتخصيص نماذج الذكاء الاصطناعي لحالات استخدام الذكاء الاصطناعي الطرفية المحددة. كما أنه يعالج التحديات الشائعة مثل قيود الذاكرة وانخفاض الأداء، مما يسهل دمج الذكاء الاصطناعي في الأجهزة الأصغر حجمًا دون التضحية بالدقة أو السرعة. 

__wf_reserved_inherit
الشكل 3. أمثلة على حالات استخدام الذكاء الاصطناعي المتطورة (Edge AI). مصدر الصورة: SONY Semicon | AITRIOS.

تحسين طرازات YOLO على IMX500

في الجزء الثاني من المحاضرة، تم تمرير الميكروفون إلى أمير، الذي تطرق إلى الجانب التقني لكيفية تحسين سوني لنماذجYOLO على مستشعر IMX500. 

بدأ أمير حديثه قائلاً: "إن نماذجYOLO هي نماذج متميزة وسهلة التحسين إلى حد ما، وذلك بفضل جلين والفريق. سأقنعك بذلك، لا تقلق." ثم أوضح أمير أنه بينما ينصب الكثير من التركيز عادةً على تحسين نموذج الذكاء الاصطناعي نفسه، فإن هذا النهج غالباً ما يتجاهل مصدر قلق بالغ الأهمية: اختناقات ما بعد المعالجة.

أشار أمير إلى أنه في كثير من الحالات، بمجرد أن يكمل نموذج الذكاء الاصطناعي مهمته، يمكن أن تتسبب عملية نقل البيانات والتعامل مع المعالجة اللاحقة على جهاز مضيف في تأخيرات كبيرة. يؤدي نقل البيانات ذهابًا وإيابًا بين الجهاز والمضيف إلى حدوث زمن انتقال، والذي يمكن أن يكون عقبة رئيسية أمام تحقيق أفضل أداء.

__wf_reserved_inherit
الشكل 4. أمير سرفي على خشبة المسرح في مؤتمر YOLO Vision 2024 يشرح عن اختناقات ما بعد المعالجة.

ولمعالجة هذه المشكلة، أكد أمير على أهمية النظر إلى النظام بأكمله من البداية إلى النهاية، بدلاً من التركيز فقط على نموذج الذكاء الاصطناعي. فمع مستشعر IMX500، اكتشفوا أن المعالجة اللاحقة كانت عنق الزجاجة الرئيسي الذي يبطئ كل شيء. وأشار إلى أن الإنجاز الحقيقي كان فتح القفل غير الأقصى على الرقاقة (NMS)

وسمح ذلك بإجراء المعالجة اللاحقة مباشرة على المستشعر، مما يلغي الحاجة إلى نقل كميات كبيرة من البيانات إلى جهاز مضيف. من خلال تشغيل NMS مباشرةً على IMX500، اخترقت سوني ما أطلق عليه أمير "السقف الزجاجي لما بعد المعالجة"، وحققت أداءً أفضل بكثير وتقليل زمن الوصول.

__wf_reserved_inherit
الشكل 6. التغلب على عنق الزجاجة في مرحلة ما بعد المعالجة. مصدر الصورة: SONY Semicon | AITRIOS

بعد ذلك، سنلقي نظرة على كيفية مساعدة هذا الابتكار لنماذج YOLO وخاصةً YOLOv8 Nano، في العمل بكفاءة أكبر على الأجهزة المتطورة، مما يخلق فرصًا جديدة لمعالجة الذكاء الاصطناعي في الوقت الفعلي على أجهزة أصغر حجماً ومحدودة الموارد.

تحقق طرز YOLOv8 زيادة في السرعة بمعدل 4 أضعاف مع IMX500 من سوني

وفي ختام المحاضرة، أوضح أمير كيف تمكنوا من مضاعفة أداء نموذج YOLOv8 Nano أربعة أضعاف من خلال تشغيل NMS على الحافة. وعرض ذلك على جهاز Raspberry Pi 5، الذي تم دمجه مع مستشعر IMX500 AI. قارن أمير الأداء عندما تمت معالجة ما بعد المعالجة على جهاز مضيف مقابل شريحة IMX500. 

أظهرت النتائج بوضوح تحسنًا كبيرًا في الإطارات في الثانية (FPS) والكفاءة الإجمالية عند إجراء المعالجة على الشريحة. أدى التحسين إلى جعل اكتشاف الكائنات أسرع وأكثر سلاسة وأظهر أيضًا التطبيق العملي لمعالجة الذكاء الاصطناعي في الوقت الفعلي على الأجهزة الأصغر ذات الموارد المحدودة مثل Raspberry Pi.

النقاط الرئيسية

يعمل مستشعر IMX500 من سوني ومنصة AITRIOS ونماذج Ultralytics YOLO على إعادة تشكيل تطوير الذكاء الاصطناعي المتطور. تقلل معالجة الذكاء الاصطناعي على الرقاقة من نقل البيانات وزمن الاستجابة مع تعزيز الخصوصية والأمان والكفاءة. من خلال التركيز على النظام بأكمله، وليس فقط على نموذج الذكاء الاصطناعي، تجعل هذه الابتكارات الذكاء الاصطناعي المتطور في متناول المطورين ومن لا يمتلكون خبرة عميقة في الذكاء الاصطناعي. مع استمرار تقدم تقنية الذكاء الاصطناعي المتطور، من المرجح أن تتيح أجهزة أكثر ذكاءً وسرعة في اتخاذ القرارات وحماية أقوى للخصوصية عبر مجموعة واسعة من الصناعات والتطبيقات.

ابق على اتصال بـ مجتمعنا لمواصلة التعلم عن الذكاء الاصطناعي! تحقق من مستودع GitHub الخاص بنا لاكتشاف كيف يمكننا استخدام الذكاء الاصطناعي لإنشاء حلول مبتكرة في مختلف الصناعات مثل الزراعة و التصنيع. 🚀

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا