تعرّف على YOLO وهو نموذج مبتكر للكشف عن الكائنات يمكنه تحديد الكائنات من خلال المطالبات النصية. استكشف كيفية عمل YOLO وتطبيقاته، واحصل على تدريب عملي من خلال مثال برمجي سريع.

تعرّف على YOLO وهو نموذج مبتكر للكشف عن الكائنات يمكنه تحديد الكائنات من خلال المطالبات النصية. استكشف كيفية عمل YOLO وتطبيقاته، واحصل على تدريب عملي من خلال مثال برمجي سريع.

غالباً ما تنطوي مشاريع الرؤية الحاسوبية على قضاء الكثير من الوقت في التعليق على البيانات وتدريب نماذج اكتشاف الأجسام. ولكن، قد يصبح ذلك شيئاً من الماضي قريباً. فقد أصدر مختبر الذكاء الاصطناعي في تينسنت نموذج YOLO وهو نموذج لاكتشاف الأجسام في الوقت الحقيقي، وهو نموذج مفتوح المفردات في الوقت الحقيقي، في 31 يناير 2024. YOLO هو نموذج بدون لقطات، مما يعني أنه يمكنك تشغيل استنتاجات اكتشاف الأجسام على الصور دون الحاجة إلى تدريبه.
نماذج اللقطة الصفرية لديها القدرة على تغيير الطريقة التي نتعامل بها مع تطبيقات الرؤية الحاسوبية. في هذه المدونة، سنستكشف في هذه المدونة كيفية عمل YOLO واستخداماته المحتملة وسنشارك مثالاً عمليًا على كود عملي لتبدأ به.
يمكنك تمرير صورة ونص موجه يصف الأشياء التي تبحث عنها من خلال نموذج YOLO. على سبيل المثال، إذا كنت مهتمًا بالعثور على "شخص يرتدي قميصًا أحمر" داخل صورة، يأخذ YOLO هذه المدخلات ويبدأ العمل.
يجمع التصميم المعماري الفريد للنموذج بين ثلاثة عناصر رئيسية:
يقوم كاشف YOLO بمسح صورة الإدخال الخاصة بك لتحديد الكائنات المحتملة. يقوم مشفر النص بتحويل وصفك إلى تنسيق يمكن للنموذج فهمه. ثم يتم بعد ذلك دمج هذين التدفقين من المعلومات من خلال RepVL-PAN باستخدام دمج متعدد المستويات عبر الوسائط. يتيح لـ YOLO detect وتحديد موقع الكائنات الموصوفة في مطالبتك بدقة داخل الصورة.

تتمثل إحدى أكبر مزايا استخدام YOLO في أنك لست مضطرًا لتدريب النموذج على فئة معينة. فقد تعلم بالفعل من أزواج من الصور والنصوص، لذا فهو يعرف كيفية العثور على الأشياء بناءً على الأوصاف. يمكنك تجنب ساعات من جمع البيانات، والتعليق على البيانات، والتدريب على وحدات معالجة الرسومات باهظة الثمن، وما إلى ذلك.
إليك بعض الفوائد الأخرى لاستخدام YOLO:
يمكن استخدام نماذج YOLO في مجموعة متنوعة من التطبيقات. دعونا نستكشف بعضاً منها.
يتم فحص المنتجات المصنعة على خط التجميع بصريًا بحثًا عن العيوب قبل تعبئتها. غالبًا ما يتم فحص العيوب يدويًا، مما يستغرق وقتًا طويلاً ويمكن أن يؤدي إلى أخطاء. يمكن أن تسبب هذه الأخطاء مشاكل مثل التكاليف المرتفعة والحاجة إلى الإصلاحات أو عمليات الاسترجاع. للمساعدة في ذلك، تم إنشاء كاميرات رؤية آلية وأنظمة ذكاء اصطناعي خاصة لإجراء هذه الفحوصات.
تعتبر نماذج YOLO تقدماً كبيراً في هذا المجال. حيث يمكنها العثور على العيوب في المنتجات حتى عندما لا تكون قد دُرّبت على تلك المشكلة المحددة باستخدام قدراتها في اللقطة الصفرية. على سبيل المثال، يمكن لمصنع يقوم بتصنيع زجاجات المياه أن يميز بسهولة بين زجاجة محكمة الغلق بغطاء الزجاجة مقابل زجاجة لم يتم غلق الغطاء فيها أو بها عيب باستخدام YOLO.

تسمح نماذج YOLO للروبوتات بالتفاعل مع البيئات غير المألوفة. دون أن يتم تدريبها على أجسام محددة قد تكون موجودة في الغرفة، لا يزال بإمكانها تحديد الأجسام الموجودة. لذا، لنفترض أن الروبوت يدخل غرفة لم يدخلها من قبل. باستخدام نموذج YOLO لا يزال بإمكانه التعرف على الأشياء مثل الكراسي أو الطاولات أو المصابيح وتحديدها، على الرغم من أنه لم يتم تدريبه على تلك العناصر على وجه التحديد.
وبالإضافة إلى اكتشاف الأجسام، يمكن لـ YOLO أيضاً تحديد ظروف تلك الأجسام، وذلك بفضل ميزة "المطالبة detect الاكتشاف". على سبيل المثال، في مجال الروبوتات الزراعية، يمكن استخدامه لتحديد الثمار الناضجة مقابل الثمار غير الناضجة من خلال برمجة الروبوت detect عنها.
تنطوي صناعة السيارات على العديد من الأجزاء المتحركة، ويمكن استخدام YOLO في تطبيقات السيارات المختلفة. على سبيل المثال، عندما يتعلق الأمر بصيانة السيارات، فإن قدرة YOLO على التعرف على مجموعة واسعة من الأشياء دون الحاجة إلى وضع علامات يدوية أو تدريب مسبق مكثف مفيد للغاية. يمكن استخدام YOLO لتحديد أجزاء السيارة التي يجب استبدالها. ويمكنه أيضاً أتمتة مهام مثل فحص الجودة واكتشاف العيوب أو القطع المفقودة في السيارات الجديدة.
تطبيق آخر هو الكشف عن الأجسام بدون لقطة في السيارات ذاتية القيادة. يمكن لإمكانيات الكشف عن اللقطة الصفرية في YOLO تحسين قدرة السيارة ذاتية القيادة على detect الأجسام الموجودة على الطريق classify مثل المشاة وإشارات المرور والمركبات الأخرى في الوقت الفعلي. وبذلك، يمكنها المساعدة في detect العوائق ومنع الحوادث من أجل رحلة أكثر أماناً.

يُعد التعرف على الأشياء الموجودة على الرفوف في متاجر البيع بالتجزئة جزءًا مهمًا من تتبع المخزون والحفاظ على المخزون وأتمتة العمليات. تُعد قدرة برنامج Ultralytics YOLO على التعرف على مجموعة واسعة من الأشياء دون وضع علامات يدوية أو تدريب مسبق مكثف مفيد للغاية لإدارة المخزون.
على سبيل المثال، في مجال إدارة المخزون، يمكن لـ YOLO تحديد العناصر الموجودة على الرف وتصنيفها بسرعة، مثل العلامات التجارية المختلفة لمشروبات الطاقة. يمكن لمتاجر البيع بالتجزئة الاحتفاظ بمخزون دقيق، وإدارة مستويات المخزون بكفاءة، وتسهيل عمليات سلسلة التوريد.
جميع التطبيقات فريدة من نوعها وتوضح مدى إمكانية استخدام YOLO على نطاق واسع. بعد ذلك، دعنا نبدأ بالتدريب العملي على YOLO ونلقي نظرة على مثال ترميز.
كما ذكرنا من قبل، يمكن استخدام YOLO detect الأجزاء المختلفة للسيارة من أجل صيانتها. سيتضمن تطبيق الرؤية الحاسوبية الذي يكتشف أي إصلاحات مطلوبة التقاط صورة للسيارة، وتحديد أجزاء السيارة، وفحص كل جزء من أجزاء السيارة بحثاً عن أي تلف، والتوصية بالإصلاحات. سيستخدم كل جزء من هذا النظام تقنيات وأساليب ذكاء اصطناعي مختلفة. لغرض هذه الشرح التفصيلي للشفرة البرمجية، دعنا نركز على الجزء الذي يتم فيه اكتشاف أجزاء السيارة.
باستخدام YOLO يمكنك تحديد أجزاء السيارة المختلفة في صورة في أقل من 5 دقائق. يمكنك توسيع هذا الرمز لتجربة تطبيقات مختلفة باستخدام YOLO أيضًا! للبدء، سنحتاج إلى تثبيت حزمةUltralytics كما هو موضح أدناه.
لمزيد من الإرشادات وأفضل الممارسات المتعلقة بعملية التثبيت، راجع دليل تثبيتUltralytics الخاص بنا. أثناء تثبيت الحزم المطلوبة لـ YOLOv8 إذا واجهت أي صعوبات، ألقِ نظرة على دليل المشكلات الشائعة للحصول على الحلول والنصائح.
بمجرد تثبيت الحزمة المطلوبة، يمكننا تنزيل صورة من الإنترنت لتشغيل الاستدلالات عليها. سنستخدم الصورة أدناه.

ثم، سنقوم باستيراد الحزمة المطلوبة، وتهيئة النموذج الخاص بنا، وتعيين الفئات التي نبحث عنها في صورة الإدخال الخاصة بنا. هنا، نحن مهتمون بالفئات التالية: سيارة، عجلة، باب سيارة، مرآة سيارة، ولوحة ترخيص.
سنستخدم بعد ذلك طريقة التنبؤ، مع توفير مسار الصورة مع معلمات الحد الأقصى لعدد الاكتشافات وعتبات التقاطع على الاتحادIoU) والثقة (conf) لتشغيل الاستدلال على الصورة. أخيرًا، يتم حفظ الكائنات المكتشفة في ملف باسم "result.jpg".
سيتم حفظ صورة الإخراج التالية في ملفاتك.

إذا كنت تفضل رؤية ما يمكن لـ YOLO القيام به دون ترميز، يمكنك الانتقال إلى صفحة YOLO التجريبية وتحميل صورة إدخال وإدخال الفئات المخصصة.
اقرأ صفحة المستندات الخاصة بنا على YOLO لمعرفة كيفية حفظ النموذج بالفئات المخصصة بحيث يمكن استخدامه مباشرةً لاحقًا دون إدخال فئات مخصصة بشكل متكرر.
إذا ألقيت نظرة على صورة الإخراج مرة أخرى، ستلاحظ أن الفئة المخصصة "باب السيارة" لم يتم اكتشافها. على الرغم من إنجازاته العظيمة، فإن YOLO لديه بعض القيود. للتغلب على هذه القيود واستخدام نموذج YOLO بفعالية، من المهم استخدام الأنواع الصحيحة من المطالبات النصية.
إليك بعض الأفكار حول ذلك:
بشكل عام، يمكن تحويل نماذج YOLO إلى أداة قوية بفضل قدراتها المتقدمة في اكتشاف الأجسام، فهي توفر كفاءة ودقة كبيرة وتساعد على أتمتة المهام المختلفة في مختلف التطبيقات، مثل مثال تحديد أجزاء السيارة الذي ناقشناه عملياً.
لا تتردد في استكشاف مستودع GitHub الخاص بنا لمعرفة المزيد عن مساهماتنا في مجال الرؤية الحاسوبية والذكاء الاصطناعي. إذا كان لديك فضول حول كيفية إعادة تشكيل الذكاء الاصطناعي لقطاعات مثل تكنولوجيا الرعاية الصحية، اطلع على صفحات الحلول الخاصة بنا. يبدو أن الاحتمالات مع ابتكارات مثل YOLO لا حصر لها!