Yolo فيجن شنتشن
شنتشن
انضم الآن

تعرّف على Ultralytics YOLO26: طراز YOLO الأفضل والأسرع والأصغر حجماً

استكشف أحدث طرازات Ultralytics YOLO وهو Ultralytics YOLO26، وميزاته المتطورة التي تدعم التوازن الأمثل بين السرعة والدقة وقابلية النشر.

في 25 سبتمبر، في حدثنا الهجين السنوي، YOLO Vision 2025 (YV25) في لندن، أعلن جلين جوشر، مؤسسنا ومديرنا التنفيذي، رسميًا عن أحدث إنجاز في سلسلة نماذج Ultralytics YOLO وهو Ultralytics YOLO26! يمكن لنموذج الرؤية الحاسوبية الجديد لدينا، YOLO26، تحليل الصور والفيديو وتفسيرها من خلال بنية مبسطة توازن بين السرعة والدقة وسهولة النشر. 

بينما يعمل Ultralytics YOLO26 على تبسيط جوانب تصميم النموذج وإضافة تحسينات جديدة، فإنه يستمر أيضًا في تقديم الميزات المألوفة التي يتوقعها المستخدمون من نماذج Ultralytics YOLO . على سبيل المثال، يعد Ultralytics YOLO26 سهل الاستخدام، ويدعم مجموعة من مهام الرؤية الحاسوبية، ويوفر خيارات تكامل ونشر مرنة. 

وغني عن القول أن هذا يجعل التحول إلى استخدام Ultralytics YOLO26 خاليًا من المتاعب، ولا يسعنا الانتظار حتى نرى المستخدمين يختبرونه بأنفسهم عندما يصبح متاحًا للجمهور في نهاية أكتوبر. 

الشكل 1. مثال على استخدام YOLO26 detect الأجسام في الصورة.

ببساطة، فإن Ultralytics YOLO26 هو نموذج ذكاء اصطناعي فيجن أفضل وأسرع وأصغر حجماً. في هذه المقالة، سنستكشف الميزات الرئيسية لـ Ultralytics YOLO26 وما يقدمه إلى الطاولة. لنبدأ! 

دفع حدود الذكاء الاصطناعي للرؤية مع Ultralytics YOLO26

قبل أن نغوص في الميزات الرئيسية لـ Ultralytics YOLO26 والتطبيقات التي يتيحها، دعنا نأخذ خطوة إلى الوراء ونناقش الإلهام والدافع الذي دفع إلى تطوير هذا النموذج.

لطالما آمنا في Ultralytics بقوة الابتكار. ومنذ البداية، كانت مهمتنا ذات شقين. فمن ناحية، نريد أن نجعل الذكاء الاصطناعي فيجن متاحاً للجميع حتى يتمكن أي شخص من استخدامه دون عوائق. ومن ناحية أخرى، نحن ملتزمون بالقدر نفسه بإبقائه في الطليعة، ودفع حدود ما يمكن أن تحققه نماذج الرؤية الحاسوبية.

أحد العوامل الرئيسية وراء هذه المهمة هو أن مجال الذكاء الاصطناعي يتطور دائمًا. على سبيل المثال، يتم اعتماد الذكاء الاصطناعي الطرفي، الذي يتضمن تشغيل نماذج الذكاء الاصطناعي مباشرة على الأجهزة بدلاً من الاعتماد على السحابة، بسرعة عبر الصناعات.

من الكاميرات الذكية إلى الأنظمة المستقلة، يُتوقع الآن من الأجهزة الطرفية معالجة المعلومات في الوقت الفعلي. يتطلب هذا التحول نماذج أخف وأسرع، مع الاستمرار في تقديم نفس المستوى العالي من الدقة.

لهذا السبب هناك حاجة مستمرة لمواصلة تحسين نماذج Ultralytics YOLO . وكما يقول جلين يوتشر، "كان أحد أكبر التحديات هو التأكد من أن المستخدمين يمكنهم تحقيق أقصى استفادة من YOLO26 مع الاستمرار في تقديم أفضل أداء."

نظرة عامة على Ultralytics YOLO26

يتوفر YOLO26 خارج الصندوق في خمسة نماذج مختلفة، مما يمنحك المرونة للاستفادة من قدراته في التطبيقات من أي نطاق.
تدعم جميع هذه النماذج المختلفة مهام الرؤية الحاسوبية المتعددة، تمامًا مثل نماذج Ultralytics YOLO السابقة. يعني هذا أنه بغض النظر عن الحجم الذي تختاره، يمكنك الاعتماد على YOLO26 لتقديم مجموعة واسعة من القدرات، مثل Ultralytics YOLO11.

إليك نظرة عامة على مهام رؤية الكمبيوتر التي يدعمها YOLO26:

  • اكتشاف الأجسام: يمكن ل YOLO26 تحديد كائنات متعددة داخل صورة أو إطار فيديو وتحديد موقعها.
  • ‍تقسيم الكائنات: للذهاب إلى ما هو أبعد من الاكتشاف، يمكن ل YOLO26 إنشاء حدود مثالية بالبكسل حول كل كائن يحدده. 
  • ‍تصنيف الصور: يمكن للنموذج تحليل صورة كاملة وتعيينها إلى فئة أو تسمية محددة.‍
  • تقدير الوضعية: يستطيع YOLO26 detect النقاط الرئيسية وتقدير الوضعيات للبشر وكذلك الأجسام الأخرى.‍
  • المربعات المحدودة الموجهة (OBB): يمكن للنموذج detect الأجسام في أي زاوية، وهو أمر مفيد بشكل خاص للصور الجوية وصور الطائرات بدون طيار وصور الأقمار الصناعية، حيث قد لا تكون عناصر مثل المباني أو المركبات أو المحاصيل بمحاذاة إطار الصورة.‍
  • تتبع الأجسام: يمكن استخدام YOLO26 track الكائنات عبر إطارات الفيديو أو التدفقات في الوقت الفعلي.
الشكل 2. الكشف عن الكائنات في صورة باستخدام YOLO26.

نظرة على بنية YOLO26

الآن بعد أن أصبح لدينا فهم أفضل لما يمكن أن يفعله YOLOv5، دعنا نستعرض بعض الابتكارات في بنيته.

تم تبسيط تصميم النموذج عن طريق إزالة وحدة توزيع الفقد البؤري (DFL)، التي كانت تبطئ الاستدلال وتقيد انحدار المربع المحيط. 

كما تم تبسيط عملية التنبؤ أيضًا من خلال خيار الاستدلال من طرف إلى طرف (E2E)، والذي يتيح للنموذج تخطي خطوة الكبح غير الأقصى التقليديةNMS. يقلل هذا التحسين من التعقيد ويتيح للنموذج تقديم النتائج بسرعة أكبر، مما يجعل النشر أسهل في التطبيقات الواقعية.

تحسينات أخرى تجعل النموذج أكثر ذكاءً وموثوقية. يساعد موازنة الخسارة التدريجية (ProgLoss) على استقرار التدريب وتحسين الدقة، بينما يضمن تعيين التسمية المدرك للأهداف الصغيرة (STAL) أن يكتشف النموذج الكائنات الصغيرة بشكل أكثر فعالية. علاوة على ذلك، يعمل مُحسِّن MuSGD الجديد على تحسين تقارب التدريب وتعزيز الأداء العام.

في الواقع، يعمل أصغر إصدار من YOLO26، وهو نموذج النانو، الآن بسرعة تصل إلى 43% على وحدات المعالجة المركزية القياسية، مما يجعله مناسبًا بشكل خاص لتطبيقات الهاتف المحمول والكاميرات الذكية والأجهزة الطرفية الأخرى حيث السرعة والكفاءة أمران بالغان الأهمية.

إليك ملخص سريع لميزات YOLO26 وما يمكن للمستخدمين التطلع إليه:

  • إزالة DFL: أزلنا وحدة الخسارة البؤرية للتوزيع من بنية النموذج. بغض النظر عن أحجام الكائنات في الصورة، يمكن لـ YOLO26 وضع مربعات محصورة مصممة خصيصًا أثناء التشغيل بكفاءة أكبر.
  • الاستدلال NMS من البداية إلى النهاية: يُضيف YOLO26 وضعًا اختياريًا لا يحتاج إلى كبت غير نهائي (NMS)، وهي خطوة تُستخدم عادةً لإزالة التنبؤات المكررة، مما يجعل النشر أبسط وأسرع للاستخدام في الوقت الفعلي.
  • ProgLoss و STAL: تجعل هذه التحسينات التدريب أكثر استقرارًا وتعزز الدقة بشكل كبير، خاصةً في اكتشاف الأجسام الصغيرة في المشاهد المعقدة.
  • مُحسِّن MuSGD: يستخدم YOLO26 مُحسِّنًا جديدًا يجمع بين نقاط قوة مُحسِّنَي التدريب (Muon SGD)، مما يساعد النموذج على التعلم بشكل أسرع والوصول إلى دقة أعلى.
الشكل 3. قياس أداء YOLO26.

تبسيط عملية النشر باستخدام Ultralytics YOLO26 

سواء كنت تعمل على تطبيقات الأجهزة المحمولة أو الكاميرات الذكية أو أنظمة المؤسسات، فإن نشر YOLO26 بسيط ومرن. تدعم حزمةUltralytics Python عددًا متزايدًا باستمرار من تنسيقات التصدير، مما يجعل من السهل دمج YOLO26 في مهام سير العمل الحالية ويجعله متوافقًا مع أي منصة تقريبًا. 

تتضمن بعض خيارات التصدير TensorRT لتحقيق أقصى قدر من التسريع GPU ONNX للتوافق الواسع، CoreML لتطبيقات iOS الأصلية، TFLite لأجهزة Android والأجهزة المتطورة، OpenVINO للأداء المحسّن على أجهزة Intel . هذه المرونة تجعل من السهل نقل YOLO26 من مرحلة التطوير إلى مرحلة الإنتاج دون عقبات إضافية.

جزء آخر مهم من النشر هو التأكد من أن النماذج تعمل بكفاءة على الأجهزة ذات الموارد المحدودة. هذا هو المكان الذي يأتي فيه التكميم. بفضل بنيته المبسطة، يتعامل YOLO26 مع هذا بشكل جيد للغاية. وهو يدعم نشر INT8 (باستخدام ضغط 8 بت لتقليل الحجم وتحسين السرعة مع الحد الأدنى من فقدان الدقة) بالإضافة إلى نصف الدقة (FP16) للاستدلال بشكل أسرع على الأجهزة المدعومة. 

الأهم من ذلك، يقدم YOLO26 أداءً ثابتًا عبر مستويات التكميم هذه، لذلك يمكنك الاعتماد عليه سواء كان يعمل على خادم قوي أو جهاز طرفي صغير.

من الروبوتات إلى التصنيع: حالات استخدام YOLOv8 

يمكن استخدام YOLO26 في مجموعة واسعة من تطبيقات رؤية الكمبيوتر عبر العديد من الصناعات وحالات الاستخدام المختلفة. من الروبوتات إلى التصنيع، يمكن أن يحدث تأثيرًا كبيرًا من خلال تحسين سير العمل وتمكين اتخاذ قرارات أسرع وأكثر دقة.

على سبيل المثال، مثال جيد على ذلك هو في الروبوتات، حيث يمكن أن يساعد YOLO26 الروبوتات على تفسير محيطها في الوقت الفعلي. وهذا يجعل التنقل أكثر سلاسة والتعامل مع الأجسام أكثر دقة. كما أنه يتيح تعاونًا أكثر أمانًا مع الأشخاص.

مثال آخر هو التصنيع، حيث يمكن استخدام النموذج للكشف عن العيوب. يمكنه تحديد العيوب تلقائيًا على خطوط الإنتاج بسرعة ودقة أكبر من الفحص اليدوي.

الشكل 4. اكتشاف الزجاجات في مصنع باستخدام YOLO26.

بشكل عام، نظرًا لأن YOLO26 أفضل وأسرع وأخف وزنًا، فإنه يتكيف بسهولة مع مجموعة واسعة من البيئات، من الأجهزة الطرفية خفيفة الوزن إلى أنظمة المؤسسات الكبيرة. هذا يجعله خيارًا عمليًا للصناعات التي تتطلع إلى تحسين الكفاءة والدقة والموثوقية.

النقاط الرئيسية 

إن Ultralytics YOLO26 هو نموذج للرؤية الحاسوبية أفضل وأسرع وأخف وزناً، مع الحفاظ على سهولة استخدامه واستمراره في تقديم أداء قوي. يعمل عبر مجموعة واسعة من المهام والمنصات وسيكون متاحًا للجميع بحلول نهاية أكتوبر. نحن متشوقون لرؤية كيف يستخدمه المجتمع لابتكار حلول جديدة وتخطي حدود الرؤية الحاسوبية.

انضم إلى مجتمعنا المتنامي! استكشف مستودع GitHub الخاص بنا لمعرفة المزيد حول الذكاء الاصطناعي. اكتشف ابتكارات مثل رؤية الحاسوب في مجال البيع بالتجزئة والذكاء الاصطناعي في صناعة السيارات من خلال زيارة صفحات الحلول الخاصة بنا. لتبدأ البناء باستخدام رؤية الحاسوب اليوم، تحقق من خيارات الترخيص لدينا.

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا