انضم إلينا ونحن نلخص الإنجازات التي حققتها سوني في معالجة الذكاء الاصطناعي المتطورة مع مستشعر IMX500 ومنصة AITRIOS، للمساعدة في تحسين نماذج Ultralytics YOLO .
انضم إلينا ونحن نلخص الإنجازات التي حققتها سوني في معالجة الذكاء الاصطناعي المتطورة مع مستشعر IMX500 ومنصة AITRIOS، للمساعدة في تحسين نماذج Ultralytics YOLO .
تتيح Edge AI تشغيل نماذج الذكاء الاصطناعي (AI) مباشرة على الأجهزة مثل الهواتف الذكية و الكاميرات و الطائرات بدون طيار. ميزتها الرئيسية هي أنها تدعم اتخاذ قرارات أسرع وفي الوقت الفعلي دون الاعتماد على السحابة. في الواقع، تظهر الدراسات أن استخدام الذكاء الاصطناعي على منصات الحافة يمكن أن يزيد الكفاءة التشغيلية بنسبة تصل إلى 40٪.
جعلت التطورات الأخيرة في مجال الذكاء الاصطناعي المتطور، لا سيما في مجال الرؤية الحاسوبية، موضوعاً محورياً في YOLO Vision 2024 (YV24)، وهو الحدث السنوي الهجين الذي تنظمه Ultralytics والذي يجمع بين عشاق الذكاء الاصطناعي والخبراء لاستكشاف أحدث ما توصل إليه الذكاء الاصطناعي البصري. كان العرض التقديمي الرئيسي لشركة سوني أحد أبرز الأحداث في هذا الحدث، حيث عرضت الشركة حلولها الجديدة المتطورة في مجال الذكاء الاصطناعي من أجهزة وبرامج الذكاء الاصطناعي. كما تم عرض مستشعر IMX500 ومنصة AITRIOS، وعرضت سوني كيف تجعل هذه الابتكارات نشر نماذجUltralytics YOLO أسهل وأكثر كفاءة مثل Ultralytics YOLO11 و Ultralytics YOLOv8 على الحافة
قاد الجلسة Wei Tang، مدير تطوير الأعمال الذي يركز على حلول التصوير من Sony، و Amir Servi، مدير منتجات Edge Deep Learning ذو الخبرة في نشر نماذج التعلم العميق على أجهزة الحافة.
في هذا المقال، سنعيد النظر في حديث سوني في YV24 ونستكشف كيف يعمل مستشعر IMX500 ومنصة AITRIOS على تحسين استخدام نماذج YOLO لمعالجة الذكاء الاصطناعي في الوقت الحقيقي بشكل أسرع. لنبدأ!
افتتحت وي تانغ الجلسة بالحديث عن هدف سوني المتمثل في جعل الذكاء الاصطناعي الطرفي متاحًا كما فعلوا مع التصوير الفوتوغرافي منذ سنوات. وأكدت على أن سوني تركز الآن على جلب الرؤية المتقدمة للذكاء الاصطناعي إلى المزيد من الأشخاص من خلال الحوسبة الطرفية. أحد العوامل الدافعة وراء ذلك هو التأثير الإيجابي الذي يمكن أن تحدثه الحوسبة الطرفية على البيئة. من خلال معالجة البيانات مباشرة على الأجهزة بدلاً من الاعتماد على مراكز بيانات ضخمة، تساعد الحوسبة الطرفية في خفض استهلاك الطاقة وتقليل انبعاثات الكربون. إنه نهج أكثر ذكاءً وخضرة يتناسب تمامًا مع التزام سوني ببناء تكنولوجيا لا تعمل بشكل أفضل فحسب، بل تساعد أيضًا في خلق مستقبل أكثر استدامة.
وتابعت وي لتشرح كيف تقوم شركة Sony Semiconductor Solutions، وهي قسم من شركة Sony متخصص في تقنيات التصوير والاستشعار، بإنشاء مستشعرات صور متقدمة. تُستخدم هذه المستشعرات في مجموعة متنوعة من الأجهزة، حيث تحول الضوء إلى إشارات إلكترونية لالتقاط الصور. مع شحن أكثر من 1.2 مليار مستشعر سنويًا، توجد في ما يقرب من نصف الهواتف المحمولة في العالم، مما يجعل سوني لاعبًا رئيسيًا في صناعة التصوير.

بالاعتماد على هذه الخبرة، تتخذ Sony الآن خطوات إضافية من خلال تحويل هذه المستشعرات من أجهزة التقاط الصور إلى أدوات ذكية يمكنها معالجة البيانات في الوقت الفعلي، مما يتيح رؤى مدعومة بالذكاء الاصطناعي مباشرة على الأجهزة. قبل أن نناقش حلول الأجهزة والبرامج التي تستخدمها Sony لدعم هذا التحول، دعنا نفهم تحديات الذكاء الاصطناعي الطرفية التي تهدف هذه الابتكارات إلى حلها.
يأتي تطوير حلول الذكاء الاصطناعي الطرفية مع بعض التحديات الرئيسية، خاصة عند العمل مع أجهزة مثل الكاميرات وأجهزة الاستشعار. العديد من هذه الأجهزة لديها طاقة وقدرة معالجة محدودة، مما يجعل من الصعب تشغيل نماذج الذكاء الاصطناعي المتقدمة بكفاءة.
فيما يلي بعض القيود الرئيسية الأخرى:
يُعد مستشعر الرؤية الذكي Sony IMX500 قطعة أجهزة تغير قواعد اللعبة في معالجة الذكاء الاصطناعي المتطورة. إنه أول مستشعر رؤية ذكي في العالم يتمتع بقدرات الذكاء الاصطناعي على الرقاقة. يساعد هذا المستشعر في التغلب على العديد من التحديات في الذكاء الاصطناعي المتطور، بما في ذلك اختناقات معالجة البيانات و مخاوف الخصوصية وقيود الأداء.
في حين أن المستشعرات الأخرى تمرر الصور والإطارات فقط، فإن IMX500 يروي قصة كاملة. يقوم بمعالجة البيانات مباشرة على المستشعر، مما يسمح للأجهزة بإنشاء رؤى في الوقت الفعلي. خلال الجلسة، قال Wei Tang: "من خلال الاستفادة من تقنية مستشعر الصور المتقدمة لدينا، نهدف إلى تمكين جيل جديد من التطبيقات التي يمكن أن تعزز الحياة اليومية." تم تصميم IMX500 لتحقيق هذا الهدف، وتحويل طريقة تعامل الأجهزة مع البيانات مباشرة على المستشعر، دون الحاجة إلى إرسالها إلى السحابة للمعالجة.
فيما يلي بعض ميزاته الرئيسية:
إن IMX500 ليس مجرد مستشعر كاميرا، بل هو أداة استشعار قوية تعمل على تحويل كيفية إدراك الأجهزة للعالم من حولها وتفاعلها معه. من خلال تضمين الذكاء الاصطناعي مباشرةً في المستشعر، تجعل سوني الذكاء الاصطناعي المتطور أكثر سهولة في صناعات مثل السيارات والرعاية الصحية والمدن الذكية. في الأقسام اللاحقة، سنتعمق أكثر في كيفية عمل IMX500 مع نماذج Ultralytics YOLO لتحسين اكتشاف الأجسام ومعالجة البيانات على الأجهزة المتطورة.

بعد تقديم مستشعر IMX500، أعرب Wei Tang عن أنه في حين أن الأجهزة ضرورية، إلا أنها ليست كافية بمفردها لمعالجة النطاق الكامل للتحديات التي تنطوي عليها عملية نشر الذكاء الاصطناعي على الحافة. تحدثت عن كيف أن دمج الذكاء الاصطناعي على الأجهزة مثل الكاميرات وأجهزة الاستشعار يتطلب أكثر من مجرد أجهزة متطورة - بل يحتاج إلى برامج ذكية لإدارتها. هذا هو المكان الذي تأتي فيه منصة AITRIOS من Sony، حيث تقدم حلاً برمجيًا موثوقًا مصممًا لجعل نشر الذكاء الاصطناعي على الأجهزة الطرفية أبسط وأكثر كفاءة.
يعمل AITRIOS كجسر بين نماذج الذكاء الاصطناعي المعقدة وقيود الأجهزة الطرفية. إنه يوفر للمطورين مجموعة من الأدوات لنشر نماذج الذكاء الاصطناعي المدربة مسبقًا بسرعة. ولكن الأهم من ذلك، أنه يدعم إعادة التدريب المستمر حتى تتمكن نماذج الذكاء الاصطناعي من التكيف باستمرار مع التغيرات في العالم الحقيقي.
سلطت وي أيضًا الضوء على كيف أن AITRIOS يبسط العملية لأولئك الذين ليس لديهم خبرة عميقة في الذكاء الاصطناعي، مما يوفر المرونة لتخصيص نماذج الذكاء الاصطناعي لحالات استخدام الذكاء الاصطناعي الطرفية المحددة. كما أنه يعالج التحديات الشائعة مثل قيود الذاكرة وانخفاض الأداء، مما يسهل دمج الذكاء الاصطناعي في الأجهزة الأصغر حجمًا دون التضحية بالدقة أو السرعة.

في الجزء الثاني من المحاضرة، تم تمرير الميكروفون إلى أمير، الذي تطرق إلى الجانب التقني لكيفية تحسين سوني لنماذجYOLO على مستشعر IMX500.
بدأ أمير حديثه قائلاً: "إن نماذجYOLO هي نماذج متميزة وسهلة التحسين إلى حد ما، وذلك بفضل جلين والفريق. سأقنعك بذلك، لا تقلق." ثم أوضح أمير أنه بينما ينصب الكثير من التركيز عادةً على تحسين نموذج الذكاء الاصطناعي نفسه، فإن هذا النهج غالباً ما يتجاهل مصدر قلق بالغ الأهمية: اختناقات ما بعد المعالجة.
أشار أمير إلى أنه في كثير من الحالات، بمجرد أن يكمل نموذج الذكاء الاصطناعي مهمته، يمكن أن تتسبب عملية نقل البيانات والتعامل مع المعالجة اللاحقة على جهاز مضيف في تأخيرات كبيرة. يؤدي نقل البيانات ذهابًا وإيابًا بين الجهاز والمضيف إلى حدوث زمن انتقال، والذي يمكن أن يكون عقبة رئيسية أمام تحقيق أفضل أداء.

ولمعالجة هذه المشكلة، أكد أمير على أهمية النظر إلى النظام بأكمله من البداية إلى النهاية، بدلاً من التركيز فقط على نموذج الذكاء الاصطناعي. فمع مستشعر IMX500، اكتشفوا أن المعالجة اللاحقة كانت عنق الزجاجة الرئيسي الذي يبطئ كل شيء. وأشار إلى أن الإنجاز الحقيقي كان فتح القفل غير الأقصى على الرقاقة (NMS).
وسمح ذلك بإجراء المعالجة اللاحقة مباشرة على المستشعر، مما يلغي الحاجة إلى نقل كميات كبيرة من البيانات إلى جهاز مضيف. من خلال تشغيل NMS مباشرةً على IMX500، اخترقت سوني ما أطلق عليه أمير "السقف الزجاجي لما بعد المعالجة"، وحققت أداءً أفضل بكثير وتقليل زمن الوصول.

بعد ذلك، سنلقي نظرة على كيفية مساعدة هذا الابتكار لنماذج YOLO وخاصةً YOLOv8 Nano، في العمل بكفاءة أكبر على الأجهزة المتطورة، مما يخلق فرصًا جديدة لمعالجة الذكاء الاصطناعي في الوقت الفعلي على أجهزة أصغر حجماً ومحدودة الموارد.
وفي ختام المحاضرة، أوضح أمير كيف تمكنوا من مضاعفة أداء نموذج YOLOv8 Nano أربعة أضعاف من خلال تشغيل NMS على الحافة. وعرض ذلك على جهاز Raspberry Pi 5، الذي تم دمجه مع مستشعر IMX500 AI. قارن أمير الأداء عندما تمت معالجة ما بعد المعالجة على جهاز مضيف مقابل شريحة IMX500.
أظهرت النتائج بوضوح تحسنًا كبيرًا في الإطارات في الثانية (FPS) والكفاءة الإجمالية عند إجراء المعالجة على الشريحة. أدى التحسين إلى جعل اكتشاف الكائنات أسرع وأكثر سلاسة وأظهر أيضًا التطبيق العملي لمعالجة الذكاء الاصطناعي في الوقت الفعلي على الأجهزة الأصغر ذات الموارد المحدودة مثل Raspberry Pi.
يعمل مستشعر IMX500 من سوني ومنصة AITRIOS ونماذج Ultralytics YOLO على إعادة تشكيل تطوير الذكاء الاصطناعي المتطور. تقلل معالجة الذكاء الاصطناعي على الرقاقة من نقل البيانات وزمن الاستجابة مع تعزيز الخصوصية والأمان والكفاءة. من خلال التركيز على النظام بأكمله، وليس فقط على نموذج الذكاء الاصطناعي، تجعل هذه الابتكارات الذكاء الاصطناعي المتطور في متناول المطورين ومن لا يمتلكون خبرة عميقة في الذكاء الاصطناعي. مع استمرار تقدم تقنية الذكاء الاصطناعي المتطور، من المرجح أن تتيح أجهزة أكثر ذكاءً وسرعة في اتخاذ القرارات وحماية أقوى للخصوصية عبر مجموعة واسعة من الصناعات والتطبيقات.
ابق على اتصال بـ مجتمعنا لمواصلة التعلم عن الذكاء الاصطناعي! تحقق من مستودع GitHub الخاص بنا لاكتشاف كيف يمكننا استخدام الذكاء الاصطناعي لإنشاء حلول مبتكرة في مختلف الصناعات مثل الزراعة و التصنيع. 🚀