Yolo فيجن شنتشن
شنتشن
انضم الآن

تعرّف على YOLO وهو نموذج مبتكر للكشف عن الكائنات يمكنه تحديد الكائنات من خلال المطالبات النصية. استكشف كيفية عمل YOLO وتطبيقاته، واحصل على تدريب عملي من خلال مثال برمجي سريع.

غالباً ما تنطوي مشاريع الرؤية الحاسوبية على قضاء الكثير من الوقت في التعليق على البيانات وتدريب نماذج اكتشاف الأجسام. ولكن، قد يصبح ذلك شيئاً من الماضي قريباً. فقد أصدر مختبر الذكاء الاصطناعي في تينسنت نموذج YOLO وهو نموذج لاكتشاف الأجسام في الوقت الحقيقي، وهو نموذج مفتوح المفردات في الوقت الحقيقي، في 31 يناير 2024. YOLO هو نموذج بدون لقطات، مما يعني أنه يمكنك تشغيل استنتاجات اكتشاف الأجسام على الصور دون الحاجة إلى تدريبه.

نماذج اللقطة الصفرية لديها القدرة على تغيير الطريقة التي نتعامل بها مع تطبيقات الرؤية الحاسوبية. في هذه المدونة، سنستكشف في هذه المدونة كيفية عمل YOLO واستخداماته المحتملة وسنشارك مثالاً عمليًا على كود عملي لتبدأ به.

نظرة خاطفة على YOLO

يمكنك تمرير صورة ونص موجه يصف الأشياء التي تبحث عنها من خلال نموذج YOLO. على سبيل المثال، إذا كنت مهتمًا بالعثور على "شخص يرتدي قميصًا أحمر" داخل صورة، يأخذ YOLO هذه المدخلات ويبدأ العمل.

يجمع التصميم المعماري الفريد للنموذج بين ثلاثة عناصر رئيسية:

  • كاشف يعتمد على Ultralytics YOLOv8 نموذج اكتشاف الأجسام، لتحليل المحتوى المرئي للصورة.
  • مشفر نصوص تم تدريبه مسبقًا بواسطة CLIP الخاص بـ OpenAI، وهو مصمم خصيصًا لفهم مطالبتك النصية.
  • شبكة، وهي شبكة تجميع مسار الرؤية واللغة (RepVL-PAN)، تدمج بيانات الصور المعالجة مع البيانات النصية.

يقوم كاشف YOLO بمسح صورة الإدخال الخاصة بك لتحديد الكائنات المحتملة. يقوم مشفر النص بتحويل وصفك إلى تنسيق يمكن للنموذج فهمه. ثم يتم بعد ذلك دمج هذين التدفقين من المعلومات من خلال RepVL-PAN باستخدام دمج متعدد المستويات عبر الوسائط. يتيح لـ YOLO detect وتحديد موقع الكائنات الموصوفة في مطالبتك بدقة داخل الصورة.

مثال على النتائج من YOLO.

فوائد اختيار YOLO

تتمثل إحدى أكبر مزايا استخدام YOLO في أنك لست مضطرًا لتدريب النموذج على فئة معينة. فقد تعلم بالفعل من أزواج من الصور والنصوص، لذا فهو يعرف كيفية العثور على الأشياء بناءً على الأوصاف. يمكنك تجنب ساعات من جمع البيانات، والتعليق على البيانات، والتدريب على وحدات معالجة الرسومات باهظة الثمن، وما إلى ذلك.

إليك بعض الفوائد الأخرى لاستخدام YOLO:

  • الأداء في الوقت الحقيقي - يدعم YOLO الأداء في الوقت الحقيقي تمامًا مثل بنية YOLO الأصلية. وهو مثالي للتطبيقات التي تتطلب الكشف الفوري عن الأجسام مثل المركبات ذاتية القيادة وأنظمة المراقبة.
  • تجزئة المثيل - يمكن لـ YOLO تحديد وفصل الأجسام في الصور بدقة، حتى لو لم يتم تدريس تلك الأجسام على وجه التحديد أثناء التدريب.
  • الكفاءة - يجمع YOLO بين الدقة العالية والكفاءة الحسابية، مما يجعله عمليًا للتطبيقات الواقعية. تتيح بنيته الانسيابية إمكانية الكشف السريع عن الأجسام دون الحاجة إلى متطلبات مفرطة على طاقة المعالجة.

تطبيقات YOLO

يمكن استخدام نماذج YOLO في مجموعة متنوعة من التطبيقات. دعونا نستكشف بعضاً منها.

مراقبة الجودة في التصنيع

يتم فحص المنتجات المصنعة على خط التجميع بصريًا بحثًا عن العيوب قبل تعبئتها. غالبًا ما يتم فحص العيوب يدويًا، مما يستغرق وقتًا طويلاً ويمكن أن يؤدي إلى أخطاء. يمكن أن تسبب هذه الأخطاء مشاكل مثل التكاليف المرتفعة والحاجة إلى الإصلاحات أو عمليات الاسترجاع. للمساعدة في ذلك، تم إنشاء كاميرات رؤية آلية وأنظمة ذكاء اصطناعي خاصة لإجراء هذه الفحوصات. 

تعتبر نماذج YOLO تقدماً كبيراً في هذا المجال. حيث يمكنها العثور على العيوب في المنتجات حتى عندما لا تكون قد دُرّبت على تلك المشكلة المحددة باستخدام قدراتها في اللقطة الصفرية. على سبيل المثال، يمكن لمصنع يقوم بتصنيع زجاجات المياه أن يميز بسهولة بين زجاجة محكمة الغلق بغطاء الزجاجة مقابل زجاجة لم يتم غلق الغطاء فيها أو بها عيب باستخدام YOLO.

مثال على فحص أغطية الزجاجات.

الروبوتات

تسمح نماذج YOLO للروبوتات بالتفاعل مع البيئات غير المألوفة. دون أن يتم تدريبها على أجسام محددة قد تكون موجودة في الغرفة، لا يزال بإمكانها تحديد الأجسام الموجودة. لذا، لنفترض أن الروبوت يدخل غرفة لم يدخلها من قبل. باستخدام نموذج YOLO لا يزال بإمكانه التعرف على الأشياء مثل الكراسي أو الطاولات أو المصابيح وتحديدها، على الرغم من أنه لم يتم تدريبه على تلك العناصر على وجه التحديد.

وبالإضافة إلى اكتشاف الأجسام، يمكن لـ YOLO أيضاً تحديد ظروف تلك الأجسام، وذلك بفضل ميزة "المطالبة detect الاكتشاف". على سبيل المثال، في مجال الروبوتات الزراعية، يمكن استخدامه لتحديد الثمار الناضجة مقابل الثمار غير الناضجة من خلال برمجة الروبوت detect عنها.

الذكاء الاصطناعي في صناعة السيارات

تنطوي صناعة السيارات على العديد من الأجزاء المتحركة، ويمكن استخدام YOLO في تطبيقات السيارات المختلفة. على سبيل المثال، عندما يتعلق الأمر بصيانة السيارات، فإن قدرة YOLO على التعرف على مجموعة واسعة من الأشياء دون الحاجة إلى وضع علامات يدوية أو تدريب مسبق مكثف مفيد للغاية. يمكن استخدام YOLO لتحديد أجزاء السيارة التي يجب استبدالها. ويمكنه أيضاً أتمتة مهام مثل فحص الجودة واكتشاف العيوب أو القطع المفقودة في السيارات الجديدة.

تطبيق آخر هو الكشف عن الأجسام بدون لقطة في السيارات ذاتية القيادة. يمكن لإمكانيات الكشف عن اللقطة الصفرية في YOLO تحسين قدرة السيارة ذاتية القيادة على detect الأجسام الموجودة على الطريق classify مثل المشاة وإشارات المرور والمركبات الأخرى في الوقت الفعلي. وبذلك، يمكنها المساعدة في detect العوائق ومنع الحوادث من أجل رحلة أكثر أماناً. 

مثال على اكتشاف الأجسام على طريق.

إدارة المخزون لمتاجر البيع بالتجزئة

يُعد التعرف على الأشياء الموجودة على الرفوف في متاجر البيع بالتجزئة جزءًا مهمًا من تتبع المخزون والحفاظ على المخزون وأتمتة العمليات. تُعد قدرة برنامج Ultralytics YOLO على التعرف على مجموعة واسعة من الأشياء دون وضع علامات يدوية أو تدريب مسبق مكثف مفيد للغاية لإدارة المخزون. 

على سبيل المثال، في مجال إدارة المخزون، يمكن لـ YOLO تحديد العناصر الموجودة على الرف وتصنيفها بسرعة، مثل العلامات التجارية المختلفة لمشروبات الطاقة. يمكن لمتاجر البيع بالتجزئة الاحتفاظ بمخزون دقيق، وإدارة مستويات المخزون بكفاءة، وتسهيل عمليات سلسلة التوريد. 

جميع التطبيقات فريدة من نوعها وتوضح مدى إمكانية استخدام YOLO على نطاق واسع. بعد ذلك، دعنا نبدأ بالتدريب العملي على YOLO ونلقي نظرة على مثال ترميز.

شرح تفصيلي للتعليمات البرمجية

كما ذكرنا من قبل، يمكن استخدام YOLO detect الأجزاء المختلفة للسيارة من أجل صيانتها. سيتضمن تطبيق الرؤية الحاسوبية الذي يكتشف أي إصلاحات مطلوبة التقاط صورة للسيارة، وتحديد أجزاء السيارة، وفحص كل جزء من أجزاء السيارة بحثاً عن أي تلف، والتوصية بالإصلاحات. سيستخدم كل جزء من هذا النظام تقنيات وأساليب ذكاء اصطناعي مختلفة. لغرض هذه الشرح التفصيلي للشفرة البرمجية، دعنا نركز على الجزء الذي يتم فيه اكتشاف أجزاء السيارة.

باستخدام YOLO يمكنك تحديد أجزاء السيارة المختلفة في صورة في أقل من 5 دقائق. يمكنك توسيع هذا الرمز لتجربة تطبيقات مختلفة باستخدام YOLO أيضًا! للبدء، سنحتاج إلى تثبيت حزمةUltralytics كما هو موضح أدناه.

لمزيد من الإرشادات وأفضل الممارسات المتعلقة بعملية التثبيت، راجع دليل تثبيتUltralytics الخاص بنا. أثناء تثبيت الحزم المطلوبة لـ YOLOv8 إذا واجهت أي صعوبات، ألقِ نظرة على دليل المشكلات الشائعة للحصول على الحلول والنصائح.

بمجرد تثبيت الحزمة المطلوبة، يمكننا تنزيل صورة من الإنترنت لتشغيل الاستدلالات عليها. سنستخدم الصورة أدناه.

صورة الإدخال الخاصة بنا.

ثم، سنقوم باستيراد الحزمة المطلوبة، وتهيئة النموذج الخاص بنا، وتعيين الفئات التي نبحث عنها في صورة الإدخال الخاصة بنا. هنا، نحن مهتمون بالفئات التالية: سيارة، عجلة، باب سيارة، مرآة سيارة، ولوحة ترخيص.

سنستخدم بعد ذلك طريقة التنبؤ، مع توفير مسار الصورة مع معلمات الحد الأقصى لعدد الاكتشافات وعتبات التقاطع على الاتحادIoU) والثقة (conf) لتشغيل الاستدلال على الصورة. أخيرًا، يتم حفظ الكائنات المكتشفة في ملف باسم "result.jpg".

سيتم حفظ صورة الإخراج التالية في ملفاتك.

صورة الإخراج الخاصة بنا.

إذا كنت تفضل رؤية ما يمكن لـ YOLO القيام به دون ترميز، يمكنك الانتقال إلى صفحة YOLO التجريبية وتحميل صورة إدخال وإدخال الفئات المخصصة. 

اقرأ صفحة المستندات الخاصة بنا على YOLO لمعرفة كيفية حفظ النموذج بالفئات المخصصة بحيث يمكن استخدامه مباشرةً لاحقًا دون إدخال فئات مخصصة بشكل متكرر.

هل لاحظت عدم اكتشاف أبواب السيارة؟

إذا ألقيت نظرة على صورة الإخراج مرة أخرى، ستلاحظ أن الفئة المخصصة "باب السيارة" لم يتم اكتشافها. على الرغم من إنجازاته العظيمة، فإن YOLO لديه بعض القيود. للتغلب على هذه القيود واستخدام نموذج YOLO بفعالية، من المهم استخدام الأنواع الصحيحة من المطالبات النصية. 

إليك بعض الأفكار حول ذلك:

  • قد لا تحتاج YOLO إلى مستويات ثقة عالية للحصول على تنبؤات دقيقة، لذا فإن تقليل عتبات الثقة يمكن أن يحسن معدلات الاكتشاف.
  • أضف الفئات التي لست مهتمًا بها. سيساعد ذلك في تحسين اكتشاف الكائنات الأساسي عن طريق تقليل النتائج الإيجابية الخاطئة للكائنات الثانوية.
  • يمكن أن يؤدي الكشف عن الكائنات الأكبر أولاً قبل التركيز على التفاصيل الأصغر إلى تحسين دقة الكشف.
  • اذكر الألوان في صفوفك detect الأجسام بناءً على إشارات لونية.
  • يمكن أن يساعد وصف أحجام الكائنات في المطالبات أيضًا YOLO على تحديد كائنات معينة بدقة أكبر.
  • يمكن لطرق المعالجة اللاحقة، مثل تصفية التنبؤات حسب الحجم أو تعديل مستويات الثقة لكل فئة، أن تزيد من تحسين نتائج اكتشاف الكائنات.

الحدود لا حصر لها

بشكل عام، يمكن تحويل نماذج YOLO إلى أداة قوية بفضل قدراتها المتقدمة في اكتشاف الأجسام، فهي توفر كفاءة ودقة كبيرة وتساعد على أتمتة المهام المختلفة في مختلف التطبيقات، مثل مثال تحديد أجزاء السيارة الذي ناقشناه عملياً.

لا تتردد في استكشاف مستودع GitHub الخاص بنا لمعرفة المزيد عن مساهماتنا في مجال الرؤية الحاسوبية والذكاء الاصطناعي. إذا كان لديك فضول حول كيفية إعادة تشكيل الذكاء الاصطناعي لقطاعات مثل تكنولوجيا الرعاية الصحية، اطلع على صفحات الحلول الخاصة بنا. يبدو أن الاحتمالات مع ابتكارات مثل YOLO لا حصر لها!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا