Yolo فيجن شنتشن
شنتشن
انضم الآن

Ultralytics : المعيار الجديد للذكاء الاصطناعي البصري الذي يركز على الحافة

تعرف على كيفية قيام Ultralytics بوضع معيار جديد لذكاء الاصطناعي البصري الذي يركز على الحافة من خلال الاستدلال الشامل NMS CPU أسرع ونشر إنتاج مبسط.

اليوم، تطلق Ultralytics YOLO26، وهو YOLO الأكثر تقدمًا وقابلية للتطبيق حتى الآن. تم الإعلان عن YOLO26 لأول مرة في YOLO 2025 (YV25)، وهو يمثل تحولًا جذريًا في كيفية تدريب نماذج الرؤية الحاسوبية ونشرها وتوسيع نطاقها في الأنظمة الواقعية. 

تتجه تقنية الرؤية الاصطناعية بسرعة نحو الحافة. ففيما يزداد استخدام الصور والفيديو بشكل مباشر على الأجهزة والكاميرات والروبوتات والأنظمة المدمجة، حيث يكون زمن الاستجابة والموثوقية والتكلفة أكثر أهمية من الحوسبة السحابية الأولية. تم تصميم YOLO26 لتتناسب مع هذا الواقع، حيث توفر أداءً رائدًا على مستوى العالم مع تشغيلها بكفاءة على وحدات المعالجة المركزية ومسرعات الحافة والأجهزة منخفضة الطاقة.

على الرغم من أن YOLO26 يمثل قفزة كبيرة إلى الأمام، إلا أنه لا يزال يحافظ على المظهر المألوف والمبسط Ultralytics YOLO التي يعتمد عليها المطورون. يتناسب هذا البرنامج بسلاسة مع سير العمل الحالي، ويدعم مجموعة واسعة من مهام الرؤية، ويظل سهل الاستخدام، مما يجعل اعتماده أمرًا سهلاً لكل من فرق البحث والإنتاج.

Ultralytics لاكتشاف الأجسام
الشكل 1. مثال على استخدام Ultralytics لاكتشاف الكائنات

في هذه المقالة، سنشرح كل ما تحتاج لمعرفته عن Ultralytics وما يعنيه YOLO الأخف وزناً والأصغر حجماً والأسرع بالنسبة لمستقبل الذكاء الاصطناعي في مجال الرؤية. هيا بنا نبدأ!

Ultralytics تضع معيارًا جديدًا للذكاء الاصطناعي في مجال الرؤية

تم تصميم Ultralytics بناءً على فكرة أن قدرات الذكاء الاصطناعي ذات التأثير الكبير يجب أن تكون سهلة الوصول للجميع. نحن نؤمن بأن أدوات الرؤية الحاسوبية القوية لا يجب أن تكون محصورة أو مقتصرة على مجموعة صغيرة من المؤسسات.

في YV25 في لندن، شارك مؤسسنا ومديرنا التنفيذي جلين جوشر أفكاره حول هذه الرؤية، قائلاً: "أكثر تقنيات الذكاء الاصطناعي إثارة للإعجاب هي تلك التي تقع خلف الأبواب المغلقة. فهي ليست متاحة للجميع. تسيطر الشركات الكبرى على التطورات الجديدة، ويجب على الجميع الانتظار في طابور للحصول عليها. لدينا رؤية مختلفة في Ultralytics. نريد أن يكون الذكاء الاصطناعي في متناول الجميع."

وأوضح أيضًا أن هذا يعني إخراج الذكاء الاصطناعي من السحابة إلى بيئات العالم الحقيقي، مضيفًا: "نريد أن لا تظل هذه التكنولوجيا محصورة في السحابة، بل أن يتم نقلها إلى الأجهزة الطرفية، إلى هواتفكم ومركباتكم وأنظمة الطاقة المنخفضة. ونريد أن يتمكن هؤلاء الأشخاص الرائعون الذين يبتكرون الحلول من الوصول إلى ذلك".

يعكس YOLO26 هذه الرؤية في الممارسة العملية: نموذج مصمم للعمل في الأماكن التي يتم فيها بالفعل استخدام الذكاء الاصطناعي للرؤية، وليس في الأماكن التي يسهل فيها إنشاء النماذج الأولية.

تحليل Ultralytics : نموذج رؤية متطور

مثلYOLO Ultralytics YOLO السابقة، يدعم YOLO26 مهام رؤية حاسوبية متعددة ضمن عائلة نماذج واحدة موحدة. وهو متوفر بخمسة أحجام، Nano (n) و Small (s) و Medium (m) و Large (l) و Extra Large (x)، مما يتيح للفرق تحقيق التوازن بين السرعة والدقة وحجم النموذج وفقًا لقيود النشر.

بالإضافة إلى المرونة، يرفع YOLO26 مستوى الأداء. مقارنةً بـ YOLO11 يوفر نموذج YOLO26 nano CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله أحد أسرع نماذج الكشف عن الأجسام عالية الدقة المتاحة للنشر على الحافة وعلى CPU.

Ultralytics YOLO26
الشكل 2. Ultralytics هو نموذج رؤية متطور.

فيما يلي نظرة فاحصة على مهام الرؤية الحاسوبية التي يدعمها YOLO26:

  • تصنيف الصور: يمكن لـ YOLO26 تحليل صورة كاملة وتصنيفها في فئة معينة، مما يساعد الأنظمة على فهم السياق العام للمشهد.
  • اكتشاف الكائنات: يمكن للنموذج العثور على كائنات متعددة في الصور أو مقاطع الفيديو وتحديد مواقعها.
  • تقسيم المثيلات: يمكن لـ YOLO26 تحديد الكائنات الفردية بتفاصيل على مستوى البكسل.
  • تقدير الوضع: يمكن استخدامه لتحديد النقاط الرئيسية وتقدير أوضاع الأشخاص والأشياء الأخرى.
  • الكشف عن الصندوق المحيط الموجه (OBB): يمكن لـ YOLO26 detect من زوايا مختلفة، وهو أمر مفيد بشكل خاص للصور الجوية والأقمار الصناعية.
  • تتبع الكائنات: بالاقتران مع Python يمكن استخدام YOLO26 لتتبع الكائنات عبر إطارات الفيديو والبث المباشر.

تدعم جميع المهام التدريب والتحقق والاستدلال والتصدير ضمن إطار عمل متسق.

الابتكارات الرئيسية وراء Ultralytics

يقدم Ultralytics العديد من الابتكارات الأساسية التي تعمل على تحسين سرعة الاستدلال واستقرار التدريب وبساطة النشر. فيما يلي نظرة عامة على هذه الابتكارات:

  • إزالة فقدان بؤرة التوزيع (DFL): تمت إزالة وحدة DFL لتبسيط توقع مربع الحدود، وتحسين توافق الأجهزة، وتسهيل تصدير النماذج وتشغيلها على الأجهزة المتطورة والأجهزة منخفضة الطاقة.
  • استدلال شامل NMS: تم تصميم YOLO26 كنموذج شامل أصلي يقدم تنبؤات نهائية مباشرة، مما يلغي الحاجة إلى Non-Maximum Suppression ويقلل من زمن الاستدلال وتعقيد النشر.
  • موازنة الخسارة التدريجية + STAL: تعمل استراتيجيات الخسارة المحسّنة هذه على استقرار التدريب وتحسين دقة الكشف، خاصة بالنسبةdetect الصغيرةdetect .
  • مُحسّن MuSGD: يستخدم YOLO26 مُحسّنًا هجينًا جديدًا يمزج SGD وتقنيات التحسين المستوحاة من Muon من أجل تدريب أكثر استقرارًا.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : تم تحسين YOLO26 خصيصًا للحوسبة الطرفية، ويوفر CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يتيح الأداء في الوقت الفعلي على الأجهزة الطرفية.

بعد ذلك، دعونا نستعرض بالتفصيل ميزات الجيل التالي التي تجعل YOLO26 أسرع وأكثر كفاءة وأسهل في النشر.

تبسيط التنبؤ من خلال إزالة الخسارة البؤرية للتوزيع

استخدمت YOLO السابقة خسارة التركيز التوزيعي (DFL) أثناء التدريب لتحسين دقة مربع الحدود. على الرغم من فعالية DFL، إلا أنها أدت إلى زيادة التعقيد وفرضت قيودًا ثابتة على الانحدار، مما جعل التصدير والنشر أكثر صعوبة، لا سيما على الأجهزة المتطورة والأجهزة منخفضة الطاقة.

يزيل YOLO26 DFL بالكامل. يؤدي إزالة DFL إلى التخلص من حدود الانحدار الثابتة لمربع الحدود الموجودة في النماذج السابقة، مما يحسن الموثوقية والدقة عند اكتشاف الأجسام الكبيرة جدًا.

من خلال تبسيط عملية توقع مربع الحدود، أصبح YOLO26 أسهل في التصدير ويعمل بشكل أكثر موثوقية عبر مجموعة واسعة من الأجهزة المتطورة ومنخفضة الطاقة.

استدلال شامل NMS باستخدام Ultralytics

تعتمد خطوط أنابيب الكشف عن الكائنات التقليدية على تقنية Non-Maximum Suppression (NMS) كخطوة ما بعد المعالجة لتصفية التنبؤات المتداخلة. على الرغم من فعالية NMS إلا NMS زمن انتقال وتعقيد وهشاشة، خاصة عند نشر النماذج عبر أوقات تشغيل متعددة وأهداف أجهزة متعددة.

يقدم YOLO26 وضع استدلال أصلي شامل، حيث يقوم النموذج بإخراج التنبؤات النهائية مباشرةً دون الحاجة NMS معالجة لاحقة منفصلة. يتم التعامل مع التنبؤات المكررة داخل الشبكة نفسها.

NMS التخلص NMS زمن الاستجابة وتبسيط خطوط النشر وتقليل مخاطر أخطاء التكامل، مما يجعل YOLO26 مناسبًا بشكل خاص للنشر في الوقت الفعلي وعلى الحافة.

تعزيز التعرف باستخدام تقنية Progressive Loss Balancing + STAL

من الميزات المهمة المتعلقة بالتدريب إدخال توازن الخسارة التدريجي (ProgLoss) وتعيين التسميات المراعية للأهداف الصغيرة (STAL). تساعد وظائف الخسارة المحسنة هذه على استقرار التدريب وتحسين دقة الكشف.

يساعد ProgLoss النموذج على التعلم بشكل أكثر اتساقًا أثناء التدريب، مما يقلل من عدم الاستقرار ويسمح له بالتقارب بشكل أكثر سلاسة. وفي الوقت نفسه، يركز STAL على تحسين طريقة تعلم النموذج من الأجسام الصغيرة، التي غالبًا ما يكون من الصعب detect محدودية التفاصيل البصرية.

يعمل كل من ProgLoss و STAL معًا على تحسين موثوقية عمليات الكشف، مع تحسينات ملحوظة في التعرف على الأجسام الصغيرة. وهذا مهم بشكل خاص للتطبيقات المتطورة مثل إنترنت الأشياء (IoT) والروبوتات والصور الجوية، حيث تكون الأجسام غالبًا صغيرة أو بعيدة أو مرئية جزئيًا.

تدريب أكثر استقرارًا مع مُحسِّن MuSGD 

مع YOLO26، اعتمدنا مُحسّنًا جديدًا يُدعى MuSGD، مصممًا لجعل التدريب أكثر استقرارًا وكفاءة. MuSGD هو نهج هجين يجمع بين نقاط القوة في المنحدر العشوائي التقليدي (SGD) والتقنيات المستوحاة من Muon، وهو مُحسّن يُستخدم في تدريب نماذج اللغة الكبيرة (LLM).

لطالما SGD خيارًا موثوقًا SGD في مجال الرؤية الحاسوبية، وذلك بفضل بساطته وتعميمه القوي. وفي الوقت نفسه، أظهرت التطورات الحديثة في تدريب LLM أن طرق التحسين الأحدث يمكن أن تحسن الاستقرار والسرعة عند تطبيقها بعناية. يجلب MuSGD بعضًا من هذه الأفكار إلى مجال الرؤية الحاسوبية.

مستوحاة من Kimi K2 من Moonshot AI، تدمج MuSGD استراتيجيات تحسين تساعد النموذج على التكامل بشكل أكثر سلاسة أثناء التدريب. وهذا يجعل من الممكن لـ YOLO26 الوصول إلى أداء قوي بشكل أسرع مع تقليل عدم استقرار التدريب، خاصة في إعدادات التدريب الأكبر حجماً أو الأكثر تعقيداً.

يساعد MuSGD YOLO26 على التدريب بشكل أكثر قابلية للتنبؤ عبر أحجام النماذج، مما يساهم في تحسين الأداء واستقرار التدريب.

يوفر Ultralytics CPU أسرع بنسبة تصل إلى 43٪ CPU

مع استمرار تقنية الرؤية الاصطناعية في الاقتراب من مكان إنتاج البيانات، أصبح الأداء القوي للحافة أكثر أهمية. تم تحسين YOLO26 خصيصًا للحوسبة الحافة، ويوفر CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يضمن الأداء في الوقت الفعلي على الأجهزة التي لا تحتوي على وحدات معالجة رسومات. يتيح هذا التحسين تشغيل أنظمة الرؤية سريعة الاستجابة والموثوقة مباشرة على الكاميرات والروبوتات والأجهزة المدمجة، حيث تحدد قيود الكمون والكفاءة والتكلفة ما هو ممكن.

مهام رؤية حاسوبية محسّنة مدعومة بواسطة Ultralytics

بالإضافة إلى التحسينات المعمارية التي تجعل اكتشاف الأجسام أكثر دقة، يتضمن YOLO26 أيضًا تحسينات خاصة بالمهام مصممة لتحسين الأداء عبر مهام الرؤية الحاسوبية. على سبيل المثال، يعزز تقسيم الحالات وتقدير الوضع واكتشاف المربعات المحددة الموجهة من خلال تحديثات مستهدفة تعمل على تحسين الدقة والموثوقية.

فيما يلي نظرة عامة على هذه التحسينات:

  • تجزئة الحالات: يستخدم YOLO26 خسارة التجزئة الدلالية لتحسين طريقة تعلم النموذج أثناء التدريب، مما يؤدي إلى أقنعة حالات أكثر دقة واتساقًا. كما تتيح الوحدة النمطية proto المطورة استخدام المعلومات من مستويات متعددة، بحيث يتعامل النموذج مع كائنات ذات أحجام مختلفة بشكل أكثر فعالية، حتى في المشاهد المعقدة.
  • تقدير الوضع: من خلال دمج تقدير الاحتمالية اللوغاريتمية المتبقية (RLE)، وهي تقنية تنمذج عدم اليقين في تنبؤات النقاط الرئيسية، وتحسين عملية فك التشفير، يوفر YOLO26 نقاطًا رئيسية أكثر دقة مع أداء أفضل في الوقت الفعلي.
  • الكشف عن المربع المحيط الموجه: يقدم YOLO26 خسارة زاوية متخصصة تساعد النموذج على تعلم دوران الكائنات بشكل أكثر دقة، خاصة بالنسبة للكائنات المربعة الشكل حيث يمكن أن يكون الاتجاه غامضًا. كما أن فك التشفير OBB المحسّن يقلل من القفزات المفاجئة في توقعات الزاوية بالقرب من حدود الدوران، مما يؤدي إلى تقديرات اتجاه أكثر استقرارًا واتساقًا.
استخدام Ultralytics لتقسيم الأمثلة.
الشكل 3. استخدام Ultralytics لتقسيم الأمثلة.

Ultralytics : تقسيم المفردات المفتوحة المبني على YOLO26

Ultralytics أيضًا YOLOE-26، وهي عائلة جديدة من نماذج التجزئة ذات المفردات المفتوحة المبنية على بنية YOLO26 وابتكارات التدريب.

YOLOE-26 ليست مهمة أو ميزة جديدة، بل هي عائلة نماذج متخصصة تعيد استخدام مهمة التجزئة الحالية مع تمكين المطالبات النصية والمطالبات المرئية والاستدلال بدون مطالبات. تتوفر YOLOE-26 بجميع YOLO القياسية، وتوفر دقة أقوى وأداءً أكثر موثوقية في العالم الواقعي مقارنة بنماذج التجزئة ذات المفردات المفتوحة السابقة.

تم تصميم Ultralytics خصيصًا للأماكن التي تعمل فيها تقنية Vision AI بالفعل.

من الكاميرات التي تعمل بالرؤية إلى الروبوتات التي تعمل بالرؤية الحاسوبية وشرائح المعالجة الصغيرة في الحافة، يتم نشر الرؤية الحاسوبية والذكاء الاصطناعي مباشرة على الجهاز للاستدلال في الوقت الفعلي. تم تصميم Ultralytics خصيصًا لهذه البيئات، حيث يعد انخفاض زمن الاستجابة والكفاءة والأداء الموثوق أمرًا حيويًا.

في الواقع، هذا يعني أنه يمكن نشر YOLO26 بسهولة عبر مجموعة واسعة من الأجهزة. على وجه التحديد، من خلالPython Ultralytics Python ومجموعة واسعة من عمليات التكامل، يمكن تصدير النماذج إلى تنسيقات محسّنة لمختلف المنصات ومسرعات الأجهزة.

على سبيل المثال، TensorRT التصدير إلى TensorRT استنتاجًا عالي الأداء على NVIDIA بينما CoreML النشر الأصلي على أجهزة Apple، OpenVINO الأداء على Intel . يمكن أيضًا تصدير YOLO26 لتشغيله على عدة مسرعات حافة مخصصة، مما يتيح استنتاجًا عالي الإنتاجية وموفرًا للطاقة على أجهزة Edge AI المتخصصة. 

هذه مجرد أمثلة قليلة، حيث يتم دعم العديد من عمليات الدمج الأخرى عبر بيئات الحافة والإنتاج. تتيح هذه المرونة تشغيل نموذج YOLO26 واحد عبر أهداف نشر متنوعة. كما أنها تبسط سير عمل الإنتاج وتقرب Vision AI من الحافة.

إعادة تعريف حالات استخدام الرؤية الحاسوبية عبر مختلف القطاعات

صُمم YOLO26 للاستخدام في العالم الواقعي، ويمكن استخدامه في مجموعة واسعة من حالات استخدام الرؤية الحاسوبية في مختلف الصناعات. فيما يلي بعض الأمثلة على مجالات تطبيقه:

  • الروبوتات: يمكن استخدام YOLO26 في مهام مثل الملاحة واكتشاف العوائق والتفاعل مع الأشياء. تدعم هذه القدرات العمليات الروبوتية الآمنة والفعالة في البيئات الديناميكية.
  • التصنيع: على خطوط الإنتاج، يمكن لـ YOLO26 تحليل الصور ومقاطع الفيديو لتحديد العيوب أو المكونات المفقودة أو مشكلات المعالجة. تعمل معالجة البيانات على الجهاز على الحفاظ على سرعة الكشف وتقليل الاعتماد على أنظمة السحابة.
  • التطبيقات الجوية والطائرات بدون طيار: عند استخدامه على الطائرات بدون طيار، يمكن لـ YOLO26 معالجة الصور الجوية أثناء الطيران لأغراض الفحص ورسم الخرائط والمسح. وهذا يجعل من الممكن تحليل المشاهد في الوقت الفعلي، حتى في المواقع البعيدة.
  • الأنظمة المدمجة وأنظمة إنترنت الأشياء: بفضل تصميمه الخفيف الوزن، يمكن تشغيل YOLO26 على أجهزة مدمجة منخفضة الطاقة لمعالجة البيانات المرئية محليًا. تشمل حالات الاستخدام الشائعة الكاميرات الذكية وأجهزة الاستشعار المتصلة وأجهزة المراقبة الآلية.

المدن الذكية: في جميع البيئات الحضرية، يمكن لـ YOLO26 تحليل تدفقات الفيديو من كاميرات المرور والأماكن العامة. وهذا يتيح تطبيقات مثل مراقبة حركة المرور والسلامة العامة وإدارة البنية التحتية على الحافة.

يمكن استخدام YOLO26 في العديد من تطبيقات الرؤية الحاسوبية.
الشكل 4. يمكن استخدام YOLO26 في العديد من تطبيقات الرؤية الحاسوبية.

البدء في استخدام Ultralytics

يمكن استخدام Ultralytics من خلال سير عملين متكاملين، اعتمادًا على كيفية إنشاء ونشر الذكاء الاصطناعي للرؤية.

الخيار 1: استخدام Ultralytics من خلال Ultralytics (موصى به)

توفر Ultralytics طريقة مركزية لتدريب ونشر ومراقبة نماذج YOLO26 في الإنتاج. فهي تجمع مجموعات البيانات والتجارب وعمليات النشر في مكان واحد، مما يسهل إدارة سير عمل الذكاء الاصطناعي البصري على نطاق واسع، خاصة بالنسبة للفرق التي تنشر في بيئات الحافة والإنتاج.

من خلال المنصة، يمكن للمستخدمين:

  • الوصول إلى نماذج YOLO26
  • تدريب وضبط البيانات المخصصة
  • نماذج التصدير لنشر الحافة والإنتاج
  • مراقبة التجارب والنماذج المستخدمة في سير عمل واحد

👉 استكشف YOLO26 على Ultralytics : platform.ultralytics.ultralytics

الخيار 2: استخدام Ultralytics عبر سير عمل مفتوح المصدر

يظل YOLO26 متاحًا بالكامل من خلال النظام البيئي مفتوح المصدر Ultralyticsويمكن استخدامه مع سير العمل الحالي Python للتدريب والاستدلال والتصدير.

يمكن للمطورين تثبيت Ultralytics وتحميل نماذج YOLO26 المدربة مسبقًا ونشرها باستخدام أدوات وتنسيقات مألوفة مثل ONNX أو TensorRT أو CoreML أو OpenVINO.

pip install ultralytics
from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

بالنسبة للمستخدمين الذين يفضلون التحكم اليدوي أو خطوط الأنابيب المخصصة، تتوفر وثائق وأدلة كاملة في Ultralytics .

Ultralytics : مصمم لمواكبة المستقبل في مجال الرؤية الحاسوبية

تم تصميم Ultralytics لتلبية احتياجات حلول الذكاء الاصطناعي للرؤية في المستقبل، حيث يجب أن تكون النماذج سريعة وفعالة وسهلة النشر على الأجهزة الحقيقية. من خلال تحسين الأداء وتبسيط النشر وتوسيع نطاق ما يمكن أن يفعله النموذج، يتناسب YOLO26 بشكل طبيعي مع مجموعة واسعة من التطبيقات في العالم الحقيقي. يضع YOLO26 أساسًا جديدًا لكيفية بناء الذكاء الاصطناعي للرؤية ونشره وتوسيع نطاقه. نحن متحمسون لرؤية كيفية استخدام المجتمع له لتقديم أنظمة رؤية حاسوبية في العالم الحقيقي.

انضم إلى مجتمعنا المتنامي واستكشف مستودع GitHub الخاص بنا للحصول على موارد الذكاء الاصطناعي العملية. للبناء باستخدام Vision AI اليوم، استكشف خيارات الترخيص لدينا. تعرّف على كيفية قيام الذكاء الاصطناعي في الزراعة بتحويل الزراعة وكيف يقوم الذكاء الاصطناعي في Vision AI في مجال الروبوتات بتشكيل المستقبل من خلال زيارة صفحات الحلول الخاصة بنا.

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا