انغمس في الرؤية الحاسوبية مفتوحة المصدر مع HuggingFace! تعرف على التعلم بالنقل، والمحولات، واستكشف أكثر من 8000 نموذج. انضم إلى Merve Noyan للحصول على رؤى وعروض توضيحية عملية، وتمكين المطورين من الابتكار في استكشاف الذكاء الاصطناعي.

انغمس في الرؤية الحاسوبية مفتوحة المصدر مع HuggingFace! تعرف على التعلم بالنقل، والمحولات، واستكشف أكثر من 8000 نموذج. انضم إلى Merve Noyan للحصول على رؤى وعروض توضيحية عملية، وتمكين المطورين من الابتكار في استكشاف الذكاء الاصطناعي.
بينما نواصل استكشاف أبرز الأحداث من فعالية YOLO VISION 2023 (YV23)، دعونا نلتقي بـ Merve Noyan، مهندسة الدعوة للمطورين في HuggingFace، وهي منصة NLP الرائدة مع نماذج مدربة مسبقًا لتطوير تطبيقات اللغة بكفاءة. في حديثها، شاركت Merve بعض الأفكار الرائعة حول عالم الرؤية الحاسوبية مفتوحة المصدر.
انضموا إلينا في رحلة عبر عالم التعلم بالنقل الرائع، والمحولات، والنظام البيئي مفتوح المصدر لرؤية الحاسوب.
بدأت ميرفي الأمور بتمهيد سريع حول التعلّم بالنقل (transfer learning)، العصا السحرية التي تسمح لنا بنقل المعرفة من شبكة عصبونية إلى أخرى. تخيل تدريب نموذج على الميزات الشاملة في الطبقات المبكرة، مثل الحواف والزوايا، ثم ضبطه بدقة لمهام محددة. هذا هو جوهر التعلّم بالنقل، مما يقلل من الاعتماد على البيانات ويعزز الدقة.
سلّطت ميرفي الضوء على الهياكل الأساسية الالتفافية الكلاسيكية مثل ResNet وInception، ممهدة الطريق للرحلة التحويلية المقبلة.
ما الذي يجعل Transformers مميزة؟ شبهتها ميرفي باللغز، موضحة كيف تختلف عن النماذج التقليدية القائمة على الالتفاف. يكمن السر في قدرتها على إجراء التعلم بالإشراف الذاتي، والتقاط الميزات دون الحاجة إلى بيانات مصنفة. كان Vision Transformer و Data Efficient Transformer و CLIP و SWIM CLIP من بين النجوم البارزة لنماذج المحولات التي قدمتها.
وضع بعض الأسس المشتركة مع Ultralytics التي تقدم الدعم لـ نموذج Transformer مصمم لاكتشاف الكائنات. يتميز هذا النموذج بترميز هجين فعال، واختيار استعلام مدرك لـ IOU، وسرعة استدلال قابلة للتعديل. والجدير بالذكر أنه يلتزم بالنمط المألوف لنماذج Ultralytics YOLOv8 الأخرى، حيث يقدم خيارات للتنبؤ والتدريب والتحقق والتصدير.
ثم تعمقت ميرفي في الكنز الدفين لعروض HuggingFace، مع أكثر من 8000 نموذج لمهام الرؤية الحاسوبية الكلاسيكية و10000 نموذج للتطبيقات متعددة الوسائط. يضم HuggingFace Hub أكثر من 3000 مجموعة بيانات ضخمة، مما يجعله ملعبًا للمطورين والمتحمسين على حد سواء. أكدت ميرفي على التجربة السلسة، بفضل واجهة برمجة التطبيقات المتسقة (API) الخاصة بـ HuggingFace، التي تقدم نماذج جاهزة للاستخدام لحالات استخدام مختلفة.
انتقل الحديث إلى عروض توضيحية عملية، تعرض مدى سهولة العمل مع النماذج. بدءًا من إنشاء النماذج والمعالجات وصولًا إلى الضبط الدقيق باستخدام واجهة برمجة التطبيقات Trainer، أوضحت ميرفي أن مكتبة HuggingFace Transformers هي أفضل صديق للمطور. حتى أنها قدمت واجهة برمجة التطبيقات Pipeline، وهي المفضلة لديها شخصيًا، مما يبسط سير العمل للمستخدمين.
اختتمت ميرفي الحديث بإطلالة خاطفة على بعض التطبيقات الرائعة، بما في ذلك نموذج Plot للإجابة على الأسئلة المرئية، وBlip لإنشاء تعليقات توضيحية للصور، ونموذج Segment Anything القوي لتقسيم الصور. احتلت Pipeline API الخاصة بـ HuggingFace Ecosystem مركز الصدارة، مما يجعل استخدام النماذج أمرًا سهلاً دون الخوض في التفاصيل التقنية.
كانت اللمسة الأخيرة هي عرض ميرفي لإنشاء أوهام بصرية باستخدام Elysian Diffusion، وهي تجربة آسرة تضيف لمسة ممتعة إلى عالم الذكاء الاصطناعي.
في الختام، تركنا حديث ميرفي (Merve) مُلهمين ومتشوقين لاستكشاف الاحتمالات اللانهائية لرؤية الحاسوب مفتوحة المصدر. لقد جعلت HuggingFace الذكاء الاصطناعي في متناول الجميع وممتعًا ومثيرًا، مما مكّن المطورين من إطلاق العنان لإبداعهم. تحية لمستقبل مجتمع community مفتوح المصدر والابتكارات المذهلة التي يحملها!
شاهد المحاضرة كاملة هنا!