Yolo فيجن شنتشن
شنتشن
انضم الآن

تأثير تصميم Ultralytics الأسرع والأكثر تطوراً

اكتشف كيف أن Ultralytics أسرع في الحافة ولماذا هذا مهم لتطبيقات الرؤية الحاسوبية من الجيل التالي التي تتطلب زمن انتقال منخفض وكفاءة عالية.

في وقت سابق من هذا الأسبوع، أطلقت Ultralytics Ultralytics وهو YOLO أسرع وأخف وزنًا وأصغر حجمًا يهدف إلى إعادة تعريف أداء أنظمة الرؤية الحاسوبية في الحافة. يدعم YOLO26 نفس مهام الرؤية الأساسية التي تدعمها YOLO السابقة، بما في ذلك اكتشاف الكائنات وتجزئة المثيلات.

الشكل 1. مثال على استخدام YOLO26 segment .

الفرق الجوهري بين YOLO26 والنماذج السابقة هو البيئة التي صُمم للعمل فيها. فبدلاً من التركيز على تحسين أداء وحدات معالجة الرسومات السحابية (GPUs) أو الأداء القائم على المعايير المرجعية، صُمم YOLO26 من الألف إلى الياء ليتم نشره في العالم الواقعي على الأجهزة الطرفية والأجهزة المدمجة.

مع انتقال الرؤية الحاسوبية من مرحلة البحث إلى مرحلة الإنتاج، أصبحت قيود الأداء أكثر وضوحًا. تتشكل بيئات الحافة من خلال ميزانيات زمن انتقال ضيقة، وذاكرة محدودة، وقيود الطاقة والحرارة، والحاجة إلى سلوك يمكن التنبؤ به عبر منصات متنوعة.

في هذه الإعدادات، لا يعتمد الأداء العام للنظام على سرعة الاستدلال الأولية فحسب، بل يعتمد أيضًا على مدى كفاءة تشغيل خط الأنابيب بأكمله. غالبًا ما تشكل أعباء المعالجة اللاحقة وضغط الذاكرة ومسارات التنفيذ الخاصة بالمنصة عقبات.

يعالج YOLO26 هذه التحديات من خلال اتباع نهج أسرع يركز على الحافة أولاً وينظر إلى مسار الاستدلال بأكمله بدلاً من مقاييس النموذج الفردية. من خلال التركيز على تحسين الحافة وتبسيط مسار الاستدلال وإزالة خطوات المعالجة اللاحقة غير الضرورية، يوفر YOLO26 تحسينات في السرعة تؤدي إلى انخفاض زمن الاستجابة وسلوك أكثر موثوقية في الإنتاج.

في هذه المقالة، سوف نستكشف كيف تترجم الخيارات المعمارية لـ YOLO26 إلى تحسينات في الأداء في العالم الواقعي، ولماذا يؤدي السرعة في الحافة إلى تغيير جذري في إمكانيات تطبيقات الرؤية الحاسوبية من الجيل التالي. 

واقع نشر الحافة

يختلف تشغيل نماذج الرؤية الحاسوبية على الحافة اختلافًا كبيرًا عن تشغيلها في السحابة. في بيئات السحابة، عادةً ما تتمتع الأنظمة بإمكانية الوصول إلى وحدات معالجة رسومات قوية وذاكرة كبيرة وأجهزة مستقرة. على الحافة، لا تنطبق نفس الافتراضات. 

تعمل معظم عمليات النشر الطرفية على بنى أجهزة متنوعة، وليس على وحدات معالجة الرسومات (GPU). عادةً ما تستخدم الأجهزة معالجات متخصصة متعددة لمهام مختلفة، وهي مُحسّنة من أجل الكفاءة واستهلاك الطاقة المنخفض بدلاً من السعة الحاسوبية الخام لوحدات معالجة الرسومات (GPU) السحابية.

يعد زمن الاستجابة أحد العوائق الرئيسية الأخرى. غالبًا ما تعمل أنظمة الحافة في ظل قيود صارمة في الوقت الفعلي، حيث يمكن أن تؤثر حتى التأخيرات الصغيرة على الاستجابة أو السلامة. في هذه الحالات، يكون زمن الاستجابة من طرف إلى طرف أكثر أهمية من سرعة الاستدلال الأولية. قد يكون النموذج سريعًا على الورق، ولكنه لا يزال قاصرًا عند إضافة المعالجة اللاحقة ونقل البيانات.

تلعب الذاكرة أيضًا دورًا كبيرًا. تتمتع العديد من الأجهزة الطرفية بذاكرة محدودة وذاكرة تخزين مؤقتة مشتركة. يمكن أن تؤدي الموترات الوسيطة الكبيرة والاستخدام غير الفعال للذاكرة إلى إبطاء الأنظمة، حتى عندما يكون النموذج نفسه فعالًا.

تضيف حدود الطاقة والحرارة مزيدًا من القيود. غالبًا ما تعمل الأجهزة الطرفية بدون تبريد نشط وضمن ميزانيات طاقة ثابتة. يجب أن يكون الأداء فعالًا ومستدامًا، وليس سريعًا لفترات قصيرة فقط.

علاوة على كل ذلك، تتطلب عمليات النشر الطرفية الاتساق. يجب أن تعمل النماذج بنفس الطريقة عبر الأجهزة وبيئات التشغيل. قد يؤدي استخدام أكواد خاصة بالمنصة أو خطوات معالجة لاحقة معقدة إلى ظهور اختلافات طفيفة تجعل من الصعب نشر الأنظمة وصيانتها.

الشكل 2. نظرة على قيود نشر الحافة. الصورة من إعداد المؤلف.

تحدد هذه القيود المعنى الحقيقي للأداء في الحافة. بمعنى آخر، يتم تحديد الأداء من خلال خط الأنابيب بأكمله، وليس من خلال مقياس واحد.

لماذا تتطلب الرؤية الحافة نموذج أداء مختلفًا

إذن، كيف ترتبط قيود نشر الحافة بمتطلبات نموذج الرؤية الحاسوبية المصمم للحافة؟ يصبح هذا الارتباط واضحًا بمجرد انتقال النماذج من بيئات البحث إلى الأنظمة الواقعية.

في بيئات السحابة، غالبًا ما يتم قياس الأداء باستخدام معايير مثل سرعة الاستدلال ودقته. في الحافة، لا تعطي هذه المقاييس سوى جزء من الصورة الكاملة. عادةً ما تعمل أنظمة الرؤية عبر أجهزة غير متجانسة، حيث يتم تفريغ استدلال الشبكة العصبية إلى مسرعات متخصصة بينما تعمل أجزاء أخرى من خط الأنابيب على معالجات للأغراض العامة.

في هذا السياق، لا تكفي سرعة النموذج. فالأمر الأساسي هو أداء النظام بأكمله بعد نشر النموذج. قد يبدو النموذج سريعًا في حد ذاته، ولكنه يظل قاصرًا إذا أضافت المعالجة اللاحقة أو نقل البيانات أو الخطوات الخاصة بالمنصة أعباء إضافية.

لهذا السبب تتطلب الرؤية المتطورة نموذج أداء يركز على كفاءة النظام بدلاً من المعايير المنفصلة. يعكس YOLO26 هذا التحول من خلال التركيز على التحسين المتطور، والاستدلال المبسط، والتنفيذ الشامل المصمم للتطبيق في العالم الواقعي.

أساس السرعة: تصميم يركز على الحافة أولاً

في الحافة، يتم تحديد الأداء من خلال مدى ملاءمة النموذج لهيكل الأجهزة الفعلي للجهاز. يضمن التصميم المخصص للحافة أولاً تشغيل أنظمة الرؤية بشكل موثوق عبر منصات العالم الحقيقي، بغض النظر عن المزيج المحدد لوحدات المعالجة المتاحة.

يعطي نهج "الحافة أولاً" الأولوية للتنفيذ المتوقع والفعال عبر الأجهزة غير المتجانسة، بدلاً من تكييف النماذج التي تم تحسينها لـ GPU السحابية بعد وقوع الحدث. ببساطة، هذا يعني تفضيل العمليات التي تترجم جيدًا إلى مسرعات الشبكات العصبية، وتقليل الأعمال غير العصبية خارج النموذج، وتقليل التعقيد غير الضروري الذي يمكن أن يبطئ التنفيذ من البداية إلى النهاية.

تم تصميم YOLO26 مع مراعاة هذه القيود. تركز بنيته على الأداء المتسق بدلاً من الإنتاجية القصوى في الظروف المثالية. من خلال تبسيط مسارات التنفيذ والقضاء على الحسابات غير الضرورية، يقلل YOLO26 من الأعباء الإضافية عبر خط أنابيب الاستدلال ويستفيد بشكل أفضل من التسريع المتاح للجهاز وتسلسل الذاكرة.

هذا النهج يحسن أيضًا الموثوقية. يؤدي التحسين الذي يركز على الحافة إلى توقيت أكثر قابلية للتنبؤ وتقلبات أقل في الأداء، وهو أمر بالغ الأهمية للأنظمة التي تعمل في الوقت الفعلي. بدلاً من الاعتماد على أجهزة متخصصة أو معالجة لاحقة مكثفة لتحقيق السرعة، يركز YOLO26 على الكفاءة في جميع مراحل عملية الاستدلال.

الاستدلال الشامل وتكلفة المعالجة اللاحقة

قد تتساءل عن معنى القضاء على خطوات المعالجة اللاحقة غير الضرورية. لفهم ذلك، دعنا نرجع خطوة إلى الوراء ونلقي نظرة على كيفية عمل أنظمة الكشف عن الأجسام التقليدية.

في العديد من خطوط إنتاج الكشف عن الكائنات، لا ينتهي الاستدلال عندما ينتج النموذج تنبؤاته. بدلاً من ذلك، ينتج النموذج عددًا كبيرًا من المربعات المحددة المتداخلة، والتي تحتاج بعد ذلك إلى التصفية والتحسين قبل أن يمكن استخدامها. تتم عملية التنظيف هذه من خلال خطوات المعالجة اللاحقة التي يتم تنفيذها خارج النموذج نفسه.

إحدى خطوات المعالجة اللاحقة الأكثر شيوعًا هي القمع غير الأقصى( NMS). NMS المربعات المحددة المتداخلة ويحتفظ فقط بالكشف الأكثر دقة، ويزيل التكرارات التي تشير إلى نفس الكائن. على الرغم من فعالية هذه الطريقة، إلا أنها تتطلب حسابات إضافية بعد اكتمال الاستدلال.

الشكل 3. فهم NMS. الصورة من إعداد المؤلف.

في النهاية، هذا العمل الإضافي له ثمنه. خطوات المعالجة اللاحقة مثل NMS مناسبة تمامًا للمسرعات المتخصصة المستخدمة في استنتاج الشبكات العصبية، والتي تم تحسينها للحساب العصبي الكثيف بدلاً من العمليات التي تتطلب تحكمًا مكثفًا أو ذاكرة مكثفة. 

ونتيجة لذلك، NMS زمن انتقال إضافي وعبء إضافي على الذاكرة، وتزداد تكلفته مع زيادة عدد عمليات الكشف. حتى عندما يكون النموذج نفسه سريعًا، NMS جزءًا كبيرًا من إجمالي وقت التشغيل.

تزيد المعالجة اللاحقة أيضًا من تعقيد النظام. نظرًا لأنها تعمل خارج النموذج، يجب تنفيذها بشكل منفصل لمختلف أوقات التشغيل والأجهزة المستهدفة. وغالبًا ما يؤدي ذلك إلى مسارات رموز خاصة بالمنصة، وسلوك غير متسق عبر الأجهزة، وخطوط أنابيب نشر أكثر هشاشة.

والأهم من ذلك، أن المعالجة اللاحقة تكسر فكرة الأداء الحقيقي من البداية إلى النهاية. قياس سرعة استدلال النموذج لا يعكس كيفية عمل النظام في الإنتاج. ما يهم في النهاية هو الوقت الإجمالي من المدخلات إلى المخرجات النهائية، بما في ذلك كل خطوة في خط الأنابيب.

في هذه الحالات، تصبح المعالجة اللاحقة عقبة خفية على الحافة. فهي تضيف زمن انتقال، وتستهلك CPU ، وتعقد عملية النشر، كل ذلك بينما تظل خارج النموذج نفسه.

كيف يزيل YOLO26 NMS ماذا يجعله ذلك أسرع

يزيل YOLO26 NMS من خلال معالجة السبب الجذري للكشف عن التكرارات بدلاً من تنظيفها بعد الاستدلال. بدلاً من إنتاج العديد من التنبؤات المتداخلة التي تحتاج إلى تصفية، يتم تدريب النموذج على إنشاء مجموعة أصغر من عمليات الكشف النهائية الموثوقة مباشرةً.

وقد أصبح ذلك ممكناً من خلال تغيير طريقة تعلم عمليات الكشف أثناء التدريب. يشجع YOLO26 على إقامة علاقة أكثر وضوحاً بين الكائنات والتنبؤات، مما يقلل من التكرار في مصدره. ونتيجة لذلك، يتم حل عمليات الكشف المكررة داخل الشبكة نفسها بدلاً من المعالجة اللاحقة الخارجية.

إزالة NMS تأثير فوري على أداء الحافة. نظرًا لأن NMS تتوافق جيدًا مع مسرعات الشبكات العصبية، فإن إزالتها تقلل من حركة الذاكرة وتتجنب خطوات المعالجة غير العصبية المكلفة. هذا يقلل من زمن الوصول من طرف إلى طرف ويجعل الأداء أكثر قابلية للتنبؤ، خاصة على الأجهزة الطرفية حيث يمكن أن تستهلك المعالجة اللاحقة جزءًا ملحوظًا من إجمالي وقت التشغيل.

كما أنه يبسط مسار الاستدلال. مع وجود عدد أقل من الخطوات خارج النموذج، يكون هناك حركة أقل للبيانات وتسليم أقل بين المكونات. ناتج النموذج هو بالفعل النتيجة النهائية، مما يجعل التنفيذ أكثر قابلية للتنبؤ.

إزالة DFL لتمكين الأداء الحقيقي من البداية إلى النهاية

ومن الابتكارات الأخرى في YOLO26 إزالة Distribution Focal Loss، أو DFL، التي كانت تستخدم في YOLO السابقة لانحدار المربع المحيط. وبدلاً من توقع إحداثيات واحدة مباشرة، تعلمت النماذج التي تستخدم DFL توزيع القيم المحتملة ثم استنتجت المربع المحيط النهائي من هذا التوزيع. وساعد هذا النهج في تحسين دقة تحديد الموقع وكان خطوة مهمة إلى الأمام في الأجيال السابقة.

ومع ذلك، مع مرور الوقت، أدخلت DFL أيضًا بعض التنازلات. يؤدي التنبؤ بالتوزيعات إلى زيادة الحسابات وإضافة تعقيد إلى بنية النموذج، مما قد يبطئ الاستدلال على وحدات المعالجة المركزية ويجعل النماذج أكثر صعوبة في التصدير عبر تنسيقات النشر. كما فرضت DFL نطاقات انحدار ثابتة، مما قد يحد من المرونة عند اكتشاف كائنات كبيرة جدًا.

يزيل YOLO26 DFL كجزء من تحوله نحو تصميم أبسط وشامل. تم إعادة تصميم انحدار الصندوق المحيط ليكون أكثر مباشرة، مما يقلل من الحسابات غير الضرورية مع الحفاظ على الدقة. يتوافق هذا التغيير مع نهج YOLO26 NMS.

من أين تأتي سرعة CPU التي تزيد بنسبة 43٪ CPU

في المعايير CPU، يُظهر YOLO26 تحسناً واضحاً في الأداء مقارنةً YOLO السابقة. مقارنةً بـ Ultralytics YOLO11، يوفر نموذج YOLO26 nano CPU أسرع بنسبة تصل إلى 43٪ CPU ، وهو فرق له تأثير ملموس في عمليات النشر الفعلية.

الشكل 4. قياس أداء CPU YOLO26.

يأتي هذا المكسب من تبسيط خط أنابيب الاستدلال الكامل بدلاً من تحسين مكون واحد. يؤدي التنفيذ من البداية إلى النهاية إلى إزالة عبء المعالجة اللاحقة، وتقلل طريقة انحدار الصندوق المحيط الأكثر مباشرة من الحساب، وتحسن خيارات التصميم CPU كفاءة التنفيذ على المعالجات العامة الغرض.

تؤدي هذه التغييرات مجتمعة إلى تقليل زمن الاستجابة وتقليل CPU ، مما يؤدي إلى أداء أسرع وأكثر اتساقًا على الأجهزة الطرفية في العالم الواقعي.

تأثير YOLO26 على النشر على الحافة والصادرات

تتجاوز مزايا أداء YOLO26 مجرد الاستدلال الأسرع. فمن خلال تبسيط النموذج وتقليل الحمل الزائد على الذاكرة، يصبح من السهل نشره وتشغيله بشكل أكثر موثوقية عبر بيئات الحافة.

كما أن تصميم YOLO26 الشامل يبسط عملية التصدير. مع عدد أقل من المكونات الإضافية وبدون خطوات معالجة لاحقة خارجية، تكون النماذج المصدرة مستقلة تمامًا. وهذا يقلل من التبعيات الخاصة بالمنصة ويساعد على ضمان سلوك متسق عبر أوقات التشغيل والأجهزة المستهدفة.

في الواقع، هذا يعني أنه يمكن نشر YOLO26 بسهولة أكبر على الأجهزة الطرفية مثل الكاميرات والروبوتات والأنظمة المدمجة، باستخدام تنسيقات تصدير متنوعة. ما تقوم بتصديره هو ما تقوم بتشغيله، مع خطوات تكامل أقل ومخاطر أقل لانحراف النشر.

يتيح الاستدلال الأسرع على الحافة استخدام الروبوتات والرؤية الصناعية بالذكاء الاصطناعي

حتى الآن، نظرنا في كيفية تحسين تصميم YOLO26 الذي يركز على الحافة الأداء على مستوى النظام. لكن التأثير الحقيقي يكمن في كيفية تسهيل دمج الذكاء الاصطناعي البصري في التطبيقات الواقعية.

على سبيل المثال، في مجال الروبوتات والبيئات الصناعية، غالبًا ما تعمل أنظمة الرؤية في ظل قيود صارمة في الوقت الفعلي. يجب اتخاذ القرارات بسرعة واتساق، باستخدام حوسبة محدودة ودون الاعتماد على اتصال السحابة. مع Ultralytics يصبح تلبية هذه المتطلبات أمرًا عمليًا.

تستفيد تطبيقات مثل الملاحة الروبوتية ومعالجة الأشياء من زمن انتقال أقل واستدلال أكثر قابلية للتنبؤ، مما يسمح للروبوتات بالاستجابة بسلاسة للتغيرات في بيئتها. وبالمثل، في البيئات الصناعية، يمكن تشغيل نماذج الرؤية مباشرة على خطوط الإنتاج detect track ومراقبة العمليات دون إحداث تأخير أو تعقيد إضافي.

من خلال تمكين الاستدلال السريع والموثوق على الأجهزة المتطورة، يساعد YOLO26 في جعل الذكاء الاصطناعي البصري جزءًا طبيعيًا من الروبوتات والأنظمة الصناعية، بدلاً من أن يكون تحديًا في النشر والصيانة.

النقاط الرئيسية

تم تصميم YOLO26 من أجل الحافة، حيث تحدد القيود الواقعية مثل زمن الاستجابة والذاكرة والموثوقية ما هو ممكن. من خلال تصميم النموذج حول التنفيذ CPU والاستدلال الشامل، والنشر الأبسط، يجعل YOLO26 من الممكن دمج الذكاء الاصطناعي البصري في الأنظمة الحقيقية. يتيح هذا النهج الذي يعتمد على الحافة أولاً مجموعة واسعة من التطبيقات، من الروبوتات والرؤية الصناعية إلى الذكاء الاصطناعي المدمج والموجود على الأجهزة، حيث يكون الأداء والقدرة على التنبؤ أمرين في غاية الأهمية.

انضم إلى مجتمعنا المتنامي واستكشف مستودع GitHub للحصول على موارد الذكاء الاصطناعي العملية. للبناء باستخدام Vision AI اليوم، استكشف خيارات الترخيص لدينا. تعرّف على كيفية قيام الذكاء الاصطناعي في الزراعة بتحويل الزراعة وكيف يقوم الذكاء الاصطناعي في Vision AI في مجال الرعاية الصحية بتشكيل المستقبل من خلال زيارة صفحات الحلول الخاصة بنا.

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا