تعزيز الرؤية الحاسوبية مفتوحة المصدر مع محولات (Transformers) من Hugging Face
تعمق في الرؤية الحاسوبية مفتوحة المصدر مع Hugging Face! تعلم حول التعلم بنقل المعرفة، والمحولات (Transformers)، واستكشف أكثر من 8000 نموذج. انضم إلى Merve Noyan للحصول على رؤى وعروض توضيحية عملية، لتمكين المطورين من الابتكار في استكشاف الذكاء الاصطناعي.

بينما نواصل استكشاف أبرز مقتطفات فعالية YOLO VISION 2023 (YV23)، دعونا نتعرف على Merve Noyan، مهندسة مناصرة المطورين في Hugging Face، وهي منصة NLP الرائدة التي توفر نماذج مدربة مسبقاً للتطوير الفعال لتطبيقات اللغة. في كلمتها، شاركت Merve بعض الرؤى المذهلة حول عالم الرؤية الحاسوبية مفتوحة المصدر.
انضم إلينا بينما نأخذك في رحلة عبر عالم مثير من التعلم بنقل المعرفة (transfer learning)، ونماذج Transformer، ونظام الرؤية الحاسوبية مفتوح المصدر.
Link to this sectionكشف النقاب عن التعلم بنقل المعرفة: ملخص سريع#
بدأت Merve حديثها بمدخل سريع حول التعلم بنقل المعرفة، ذلك العصا السحرية التي تسمح لنا بنقل المعرفة من شبكة عصبية إلى أخرى. تخيل تدريب نموذج على السمات العامة في الطبقات الأولى، مثل الحواف والزوايا، ثم ضبطه بدقة لمهام محددة. هذا هو جوهر التعلم بنقل المعرفة، فهو يقلل من الاعتماد على البيانات ويعزز الدقة.
سلطت Merve الضوء على الهياكل التلافيفية التقليدية مثل ResNet وInception، مما مهد الطريق للرحلة التحويلية القادمة.
Link to this sectionدخول نماذج Transformer: لغز تم كشفه#
ما الذي يجعل نماذج Transformer مميزة؟ شبهت Merve الأمر بلغز، موضحة كيف تختلف عن النماذج التقليدية القائمة على الالتفاف (convolution). تكمن الوصفة السرية في قدرتها على إجراء التعلم بالإشراف الذاتي، مما يسمح بالتقاط السمات دون الحاجة إلى بيانات مصنفة. كانت Vision Transformer وData Efficient Transformer وCLIP وSwin Transformer من بين مجموعة النماذج القائمة على Transformer التي قدمتها.
وضع بعض القواسم المشتركة مع Ultralytics التي توفر دعماً لـ نموذج transformer مصمم للكشف عن الأشياء. يتميز هذا النموذج بمشفر هجين فعال، واختيار استعلام واعي بـ IoU، وسرعة استنتاج قابلة للتعديل. والجدير بالذكر أنه يتبع النمط المألوف لنماذج Ultralytics YOLOv8 الأخرى، حيث يقدم خيارات للتنبؤ والتدريب والتحقق والتصدير.
Link to this sectionوجهتك الشاملة#
ثم تعمقت Merve في كنز عروض Hugging Face، مع أكثر من 8,000 نموذج لمهام الرؤية الحاسوبية التقليدية و10,000 نموذج للتطبيقات متعددة الوسائط. يضم Hugging Face Hub أكثر من 3,000 مجموعة بيانات، مما يجعله ساحة لعب للمطورين والمتحمسين على حد سواء. أكدت Merve على التجربة السلسة بفضل API المتسق الخاص بـ Hugging Face، والذي يوفر نماذج جاهزة للاستخدام لمختلف حالات الاستخدام.
Link to this sectionسحر عملي مع Hugging Face#
انتقلت المحادثة إلى عروض عملية، تعرض مدى سهولة العمل مع النماذج. من إنشاء النماذج والمعالجات إلى الضبط الدقيق باستخدام Trainer API، أوضحت Merve أن مكتبة Hugging Face Transformers هي أفضل صديق للمطور. حتى أنها قدمت Pipeline API، وهو المفضل لديها شخصياً، مما يبسط سير العمل للمستخدمين.

الشكل 1. Merve Noyan تقدم عرضاً في YV23 في حرم Google for Startups في مدريد.
Link to this sectionلمحة عن التطبيقات#
اختتمت Merve المحادثة بلمحة عن بعض التطبيقات الرائعة، بما في ذلك نموذج Plot للإجابة على الأسئلة المرئية، وBlip لوصف الصور، ونموذج Segment Anything القوي لتقسيم الصور. سلطت الأضواء على Pipeline API في نظام Hugging Face البيئي، مما جعل استخدام النماذج أمراً سهلاً دون الغوص في التعقيدات التقنية.
كانت الكرزة على الكعكة هي عرض Merve لإنشاء خداع بصري باستخدام Elysian Diffusion، وهي تجربة آسرة تضيف لمسة ممتعة إلى عالم الذكاء الاصطناعي.
Link to this sectionباختصار!#
في الختام، تركتنا محادثة Merve ملهمين ومتحمسين لاستكشاف الإمكانيات اللانهائية للرؤية الحاسوبية مفتوحة المصدر. لقد جعلت Hugging Face الذكاء الاصطناعي في متناول الجميع وممتعاً ومثيراً، مما مكن المطورين من إطلاق العنان لإبداعهم. تحية لمستقبل مجتمع المصادر المفتوحة والابتكارات المذهلة التي يحملها!






