يولو فيجن شنتشن
شنتشن
انضم الآن

تمكين الذكاء الاصطناعي المتطور باستخدام Sony IMX500 و AITRIOS

أبيرامي فينا

4 دقائق قراءة

25 أكتوبر 2024

انضم إلينا بينما نلخص إنجازات Sony في معالجة الذكاء الاصطناعي على الحافة باستخدام مستشعر IMX500 ومنصة AITRIOS، للمساعدة في تحسين نماذج Ultralytics YOLO.

تتيح Edge AI تشغيل نماذج الذكاء الاصطناعي (AI) مباشرة على الأجهزة مثل الهواتف الذكية و الكاميرات و الطائرات بدون طيار. ميزتها الرئيسية هي أنها تدعم اتخاذ قرارات أسرع وفي الوقت الفعلي دون الاعتماد على السحابة. في الواقع، تظهر الدراسات أن استخدام الذكاء الاصطناعي على منصات الحافة يمكن أن يزيد الكفاءة التشغيلية بنسبة تصل إلى 40٪. 

التحسينات الأخيرة في الذكاء الاصطناعي الطرفي (Edge AI)، وخاصة في الرؤية الحاسوبية، جعلت منه موضوعًا رئيسيًا في YOLO Vision 2024 (YV24)، وهو الحدث الهجين السنوي لـ Ultralytics الذي يجمع عشاق وخبراء الذكاء الاصطناعي لاستكشاف أحدث التطورات في Vision AI. كان من أبرز فعاليات الحدث عرض سوني التقديمي الرئيسي، حيث عرضوا حلول الأجهزة والبرامج الجديدة المتطورة للذكاء الاصطناعي. تم عرض مستشعر IMX500 ومنصة AITRIOS، وأوضحت سوني كيف تسهل هذه الابتكارات نشر نماذج Ultralytics YOLO مثل Ultralytics YOLO11 و Ultralytics YOLOv8 على الحافة بكفاءة أكبر.

قاد الجلسة Wei Tang، مدير تطوير الأعمال الذي يركز على حلول التصوير من Sony، و Amir Servi، مدير منتجات Edge Deep Learning ذو الخبرة في نشر نماذج التعلم العميق على أجهزة الحافة

في هذه المقالة، سنعيد النظر في حديث سوني في YV24 ونستكشف كيف تعمل منصة IMX500 ومستشعر AITRIOS على تحسين استخدام نماذج YOLO لمعالجة الذكاء الاصطناعي بشكل أسرع وفي الوقت الفعلي على الحافة. هيا بنا نبدأ!

رؤية سوني: إضفاء الطابع الديمقراطي على الذكاء الاصطناعي على الأجهزة الطرفية

افتتحت وي تانغ الجلسة بالحديث عن هدف سوني المتمثل في جعل الذكاء الاصطناعي الطرفي متاحًا كما فعلوا مع التصوير الفوتوغرافي منذ سنوات. وأكدت على أن سوني تركز الآن على جلب الرؤية المتقدمة للذكاء الاصطناعي إلى المزيد من الأشخاص من خلال الحوسبة الطرفية. أحد العوامل الدافعة وراء ذلك هو التأثير الإيجابي الذي يمكن أن تحدثه الحوسبة الطرفية على البيئة. من خلال معالجة البيانات مباشرة على الأجهزة بدلاً من الاعتماد على مراكز بيانات ضخمة، تساعد الحوسبة الطرفية في خفض استهلاك الطاقة وتقليل انبعاثات الكربون. إنه نهج أكثر ذكاءً وخضرة يتناسب تمامًا مع التزام سوني ببناء تكنولوجيا لا تعمل بشكل أفضل فحسب، بل تساعد أيضًا في خلق مستقبل أكثر استدامة.

وتابعت وي لتشرح كيف تقوم شركة Sony Semiconductor Solutions، وهي قسم من شركة Sony متخصص في تقنيات التصوير والاستشعار، بإنشاء مستشعرات صور متقدمة. تُستخدم هذه المستشعرات في مجموعة متنوعة من الأجهزة، حيث تحول الضوء إلى إشارات إلكترونية لالتقاط الصور. مع شحن أكثر من 1.2 مليار مستشعر سنويًا، توجد في ما يقرب من نصف الهواتف المحمولة في العالم، مما يجعل سوني لاعبًا رئيسيًا في صناعة التصوير

__wf_reserved_inherit
الشكل 1. أمثلة على مستشعرات الصور من سوني.

بالاعتماد على هذه الخبرة، تتخذ Sony الآن خطوات إضافية من خلال تحويل هذه المستشعرات من أجهزة التقاط الصور إلى أدوات ذكية يمكنها معالجة البيانات في الوقت الفعلي، مما يتيح رؤى مدعومة بالذكاء الاصطناعي مباشرة على الأجهزة. قبل أن نناقش حلول الأجهزة والبرامج التي تستخدمها Sony لدعم هذا التحول، دعنا نفهم تحديات الذكاء الاصطناعي الطرفية التي تهدف هذه الابتكارات إلى حلها.

تحديات متعلقة بمعالجة صور الذكاء الاصطناعي على الأجهزة الطرفية

يأتي تطوير حلول الذكاء الاصطناعي الطرفية مع بعض التحديات الرئيسية، خاصة عند العمل مع أجهزة مثل الكاميرات وأجهزة الاستشعار. العديد من هذه الأجهزة لديها طاقة وقدرة معالجة محدودة، مما يجعل من الصعب تشغيل نماذج الذكاء الاصطناعي المتقدمة بكفاءة.

فيما يلي بعض القيود الرئيسية الأخرى:

  • تعقيد البرامج: قد يكون تكييف نماذج الذكاء الاصطناعي للعمل عبر الأجهزة الطرفية المختلفة ذات التكوينات المختلفة للأجهزة أمرًا معقدًا ويتطلب تعديلات و تحسينات.
  • اختناقات ما بعد المعالجة (Post-processing bottlenecks): غالبًا ما يكون هناك تأخير عند نقل كميات كبيرة من البيانات من الجهاز إلى المضيف للمعالجة اللاحقة. غالبًا ما يستهلك وقتًا أطول من الاستدلال (inference) لنموذج الذكاء الاصطناعي الفعلي.
  • انفجار البيانات: مع وجود العديد من أجهزة إنترنت الأشياء التي تولد البيانات باستمرار، يمكن أن يكون حجم البيانات التي يجب معالجتها محليًا هائلاً، مما يزيد من الضغط على الأجهزة الطرفية.

التعرف على مستشعر الرؤية الذكي Sony IMX500

يُعد مستشعر الرؤية الذكي Sony IMX500 قطعة أجهزة تغير قواعد اللعبة في معالجة الذكاء الاصطناعي المتطورة. إنه أول مستشعر رؤية ذكي في العالم يتمتع بقدرات الذكاء الاصطناعي على الرقاقة. يساعد هذا المستشعر في التغلب على العديد من التحديات في الذكاء الاصطناعي المتطور، بما في ذلك اختناقات معالجة البيانات و مخاوف الخصوصية وقيود الأداء.

في حين أن المستشعرات الأخرى تمرر الصور والإطارات فقط، فإن IMX500 يروي قصة كاملة. يقوم بمعالجة البيانات مباشرة على المستشعر، مما يسمح للأجهزة بإنشاء رؤى في الوقت الفعلي. خلال الجلسة، قال Wei Tang: "من خلال الاستفادة من تقنية مستشعر الصور المتقدمة لدينا، نهدف إلى تمكين جيل جديد من التطبيقات التي يمكن أن تعزز الحياة اليومية." تم تصميم IMX500 لتحقيق هذا الهدف، وتحويل طريقة تعامل الأجهزة مع البيانات مباشرة على المستشعر، دون الحاجة إلى إرسالها إلى السحابة للمعالجة.

فيما يلي بعض ميزاته الرئيسية:

  • إخراج البيانات الوصفية: بدلاً من إرسال صور كاملة، فإنه يخرج بيانات وصفية، مما يقلل بشكل كبير من حجم البيانات، مما يقلل من استخدام النطاق الترددي والتكاليف.
  • تحسين الخصوصية: من خلال معالجة البيانات على الجهاز، يحسن IMX500 الخصوصية، خاصة في الحالات التي تتضمن معلومات حساسة، مثل مهام الرؤية الحاسوبية المتعلقة بالإنسان مثل عد الأشخاص.
  • المعالجة في الوقت الفعلي: تعني قدرة المستشعر على التعامل مع البيانات بسرعة أنه يدعم اتخاذ القرارات بسرعة وفي الوقت الفعلي مما يتيح تطبيقات الذكاء الاصطناعي المتطورة مثل الأنظمة المستقلة.

إن IMX500 ليس مجرد مستشعر كاميرا - بل هو أداة استشعار قوية تحول الطريقة التي تدرك بها الأجهزة العالم من حولها وتتفاعل معه. من خلال تضمين الذكاء الاصطناعي مباشرة في المستشعر، تجعل Sony الذكاء الاصطناعي الطرفي أكثر سهولة للصناعات مثل السيارات و الرعاية الصحية و المدن الذكية. في الأقسام اللاحقة، سنتعمق أكثر في كيفية عمل IMX500 مع نماذج Ultralytics YOLO لتحسين اكتشاف الأجسام و معالجة البيانات على الأجهزة الطرفية.

__wf_reserved_inherit
الشكل 2. وي تانغ على خشبة المسرح في YOLO VIiion 2024 يقدم مستشعر الرؤية الذكي Sony IMX500.

منصة AITRIOS من سوني: تبسيط الذكاء الاصطناعي المتطور

بعد تقديم مستشعر IMX500، أعرب Wei Tang عن أنه في حين أن الأجهزة ضرورية، إلا أنها ليست كافية بمفردها لمعالجة النطاق الكامل للتحديات التي تنطوي عليها عملية نشر الذكاء الاصطناعي على الحافة. تحدثت عن كيف أن دمج الذكاء الاصطناعي على الأجهزة مثل الكاميرات وأجهزة الاستشعار يتطلب أكثر من مجرد أجهزة متطورة - بل يحتاج إلى برامج ذكية لإدارتها. هذا هو المكان الذي تأتي فيه منصة AITRIOS من Sony، حيث تقدم حلاً برمجيًا موثوقًا مصممًا لجعل نشر الذكاء الاصطناعي على الأجهزة الطرفية أبسط وأكثر كفاءة.

يعمل AITRIOS كجسر بين نماذج الذكاء الاصطناعي المعقدة وقيود الأجهزة الطرفية. إنه يوفر للمطورين مجموعة من الأدوات لنشر نماذج الذكاء الاصطناعي المدربة مسبقًا بسرعة. ولكن الأهم من ذلك، أنه يدعم إعادة التدريب المستمر حتى تتمكن نماذج الذكاء الاصطناعي من التكيف باستمرار مع التغيرات في العالم الحقيقي. 

سلطت وي أيضًا الضوء على كيف أن AITRIOS يبسط العملية لأولئك الذين ليس لديهم خبرة عميقة في الذكاء الاصطناعي، مما يوفر المرونة لتخصيص نماذج الذكاء الاصطناعي لحالات استخدام الذكاء الاصطناعي الطرفية المحددة. كما أنه يعالج التحديات الشائعة مثل قيود الذاكرة وانخفاض الأداء، مما يسهل دمج الذكاء الاصطناعي في الأجهزة الأصغر حجمًا دون التضحية بالدقة أو السرعة. 

__wf_reserved_inherit
الشكل 3. أمثلة على حالات استخدام الذكاء الاصطناعي المتطورة (Edge AI). مصدر الصورة: SONY Semicon | AITRIOS.

تحسين نماذج YOLO على IMX500

في الجزء الثاني من الحديث، تم تمرير الميكروفون إلى أمير، الذي تعمق في الجانب التقني لكيفية قيام Sony بتحسين نماذج YOLO على مستشعر IMX500. 

بدأ أمير حديثه بالقول: "نماذج YOLO تمكّن الحوسبة الطرفية (edge-enabling) ويسهل تحسينها إلى حد ما، وذلك بفضل غلين والفريق. سأقنعكم بذلك، لا تقلقوا." ثم أوضح أمير أنه في حين ينصب الكثير من التركيز عادةً على تحسين نموذج الذكاء الاصطناعي نفسه، فإن هذا النهج غالبًا ما يتجاهل مصدر قلق بالغ الأهمية: الاختناقات في مرحلة ما بعد المعالجة.

أشار أمير إلى أنه في كثير من الحالات، بمجرد أن يكمل نموذج الذكاء الاصطناعي مهمته، يمكن أن تتسبب عملية نقل البيانات والتعامل مع المعالجة اللاحقة على جهاز مضيف في تأخيرات كبيرة. يؤدي نقل البيانات ذهابًا وإيابًا بين الجهاز والمضيف إلى حدوث زمن انتقال، والذي يمكن أن يكون عقبة رئيسية أمام تحقيق أفضل أداء.

__wf_reserved_inherit
الشكل 4. أمير سيرفي على خشبة المسرح في YOLO Vision 2024 يشرح عن الاختناقات في مرحلة ما بعد المعالجة.

لمعالجة ذلك، أكد أمير على أهمية النظر إلى النظام الكامل من البداية إلى النهاية، بدلاً من مجرد التركيز على نموذج الذكاء الاصطناعي. باستخدام مستشعر IMX500، اكتشفوا أن المعالجة اللاحقة كانت العائق الرئيسي الذي يبطئ كل شيء. وشارك أن الاختراق الحقيقي كان إطلاق منع غير الأقصى (NMS) على الشريحة. 

سمح بإجراء المعالجة اللاحقة مباشرة على المستشعر، مما يلغي الحاجة إلى نقل كميات كبيرة من البيانات إلى جهاز مضيف. من خلال تشغيل NMS مباشرة على IMX500، اخترقت Sony ما أسماه أمير "السقف الزجاجي للمعالجة اللاحقة"، وحققت أداءً أفضل بكثير وتقليلًا في زمن الوصول.

__wf_reserved_inherit
الشكل 6. التغلب على عنق الزجاجة في مرحلة ما بعد المعالجة. مصدر الصورة: SONY Semicon | AITRIOS

بعد ذلك، سنلقي نظرة على كيف ساعد هذا الابتكار نماذج YOLO، وخاصة YOLOv8 Nano، على العمل بكفاءة أكبر على الأجهزة الطرفية، مما أوجد فرصًا جديدة لمعالجة الذكاء الاصطناعي في الوقت الفعلي على أجهزة أصغر ذات موارد محدودة.

نماذج YOLOv8 تحقق زيادة في السرعة بمقدار 4x مع IMX500 من Sony

في ختام الحديث بنبرة عالية، أوضح أمير كيف تمكنوا من مضاعفة أداء نموذج YOLOv8 Nano أربع مرات عن طريق تشغيل NMS على الحافة. عرض هذا على Raspberry Pi 5، والذي تم دمجه مع مستشعر IMX500 AI. قارن أمير الأداء عندما تمت معالجة ما بعد المعالجة على جهاز مضيف مقابل شريحة IMX500. 

أظهرت النتائج بوضوح تحسنًا كبيرًا في الإطارات في الثانية (FPS) والكفاءة الإجمالية عند إجراء المعالجة على الشريحة. أدى التحسين إلى جعل اكتشاف الكائنات أسرع وأكثر سلاسة وأظهر أيضًا التطبيق العملي لمعالجة الذكاء الاصطناعي في الوقت الفعلي على الأجهزة الأصغر ذات الموارد المحدودة مثل Raspberry Pi.

النقاط الرئيسية

يعمل مستشعر IMX500 من سوني ومنصة AITRIOS ونماذج Ultralytics YOLO على إعادة تشكيل تطوير الذكاء الاصطناعي المتطور. تقلل معالجة الذكاء الاصطناعي على الرقاقة من نقل البيانات ووقت الاستجابة مع تعزيز الخصوصية والأمان والكفاءة. من خلال التركيز على النظام بأكمله، وليس فقط نموذج الذكاء الاصطناعي، تجعل هذه الابتكارات الذكاء الاصطناعي المتطور أكثر سهولة للمطورين وأولئك الذين ليس لديهم خبرة عميقة في الذكاء الاصطناعي. مع استمرار تقدم تكنولوجيا الذكاء الاصطناعي المتطورة، فمن المحتمل أن تتيح أجهزة أكثر ذكاءً واتخاذ قرارات أسرع وحماية أقوى للخصوصية عبر مجموعة واسعة من الصناعات والتطبيقات.

ابق على اتصال بـ مجتمعنا لمواصلة التعلم عن الذكاء الاصطناعي! تحقق من مستودع GitHub الخاص بنا لاكتشاف كيف يمكننا استخدام الذكاء الاصطناعي لإنشاء حلول مبتكرة في مختلف الصناعات مثل الزراعة و التصنيع. 🚀

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا