تعرف على YOLO26: جيل جديد من ذكاء الرؤية الاصطناعي.
Ultralytics
الفعاليات

دعم مشاريع الرؤية الحاسوبية بأدوات Hugging Face مفتوحة المصدر

انضم إلينا في مراجعة لكلمة رئيسية من مؤتمر YOLO Vision 2024 تركز على استكشاف كيف تساهم أدوات Hugging Face مفتوحة المصدر في تطوير الذكاء الاصطناعي.

أبأبيرامي فينا
5 min read
دعم مشاريع الرؤية الحاسوبية بأدوات Hugging Face مفتوحة المصدر

اختيار الخوارزميات المناسبة هو مجرد جزء واحد من بناء حلول رؤية حاسوبية ذات تأثير. غالباً ما يعمل مهندسو الذكاء الاصطناعي مع مجموعات بيانات ضخمة، ويقومون بضبط النماذج لمهام محددة، وتحسين أنظمة الذكاء الاصطناعي لتحقيق أداء واقعي. ومع تبني تطبيقات الذكاء الاصطناعي بشكل أسرع، تزداد أيضاً الحاجة إلى أدوات تبسط هذه العمليات.

في YOLO Vision 2024 (YV24)، الحدث الهجين السنوي الذي تدعمه Ultralytics، اجتمع خبراء الذكاء الاصطناعي وعشاق التكنولوجيا لاستكشاف أحدث الابتكارات في الرؤية الحاسوبية. وقد أثار الحدث نقاشات حول مواضيع متنوعة، مثل طرق تسريع تطوير تطبيقات الذكاء الاصطناعي.

كان أحد أبرز أحداث المؤتمر هو الكلمة الرئيسية حول Hugging Face، وهي منصة ذكاء اصطناعي مفتوحة المصدر تعمل على تبسيط تدريب النماذج وتحسينها ونشرها. شارك Pavel Iakubovskii، وهو مهندس تعلم آلة في Hugging Face، كيف تعمل أدواتها على تحسين سير العمل لمهام الرؤية الحاسوبية مثل اكتشاف الكائنات في الصور، وتصنيف الصور إلى مجموعات مختلفة، وإجراء التنبؤات دون تدريب مسبق على أمثلة محددة (التعلم بدون أمثلة أو zero-shot learning).

يستضيف Hugging Face Hub ويوفر الوصول إلى العديد من نماذج الذكاء الاصطناعي والرؤية الحاسوبية مثل Ultralytics YOLO11. في هذه المقالة، سنلخص النقاط الرئيسية من عرض Pavel ونرى كيف يمكن للمطورين استخدام أدوات المصدر المفتوح من Hugging Face لبناء ونشر نماذج الذكاء الاصطناعي بسرعة.

Pavel onstage at YV24

الشكل 1. Pavel على المسرح في YV24.

Link to this sectionHugging Face Hub يدعم تطوير الذكاء الاصطناعي بشكل أسرع#

بدأ Pavel حديثه بتقديم Hugging Face كمنصة ذكاء اصطناعي مفتوحة المصدر تقدم نماذج مدربة مسبقاً لمجموعة متنوعة من التطبيقات. صُممت هذه النماذج لمختلف فروع الذكاء الاصطناعي، بما في ذلك معالجة اللغات الطبيعية (NLP)، والرؤية الحاسوبية، والذكاء الاصطناعي متعدد الوسائط، مما يمكّن الأنظمة من معالجة أنواع مختلفة من البيانات، مثل النصوص والصور والصوت.

ذكر Pavel أن Hugging Face Hub يستضيف الآن أكثر من مليون نموذج، ويمكن للمطورين العثور بسهولة على النماذج المناسبة لمشاريعهم المحددة. يهدف Hugging Face إلى تبسيط تطوير الذكاء الاصطناعي من خلال توفير أدوات لتدريب النماذج، وضبطها، ونشرها. عندما يتمكن المطورون من تجربة نماذج مختلفة، فإن ذلك يبسط عملية دمج الذكاء الاصطناعي في تطبيقات العالم الحقيقي.

على الرغم من أن Hugging Face كانت معروفة في البداية بـ NLP، إلا أنها توسعت منذ ذلك الحين لتشمل الرؤية الحاسوبية والذكاء الاصطناعي متعدد الوسائط، مما مكن المطورين من معالجة نطاق أوسع من مهام الذكاء الاصطناعي. كما أن لديها مجتمعاً قوياً حيث يمكن للمطورين التعاون ومشاركة الأفكار والحصول على الدعم من خلال المنتديات وDiscord وGitHub.

Link to this sectionاستكشاف نماذج Hugging Face لتطبيقات الرؤية الحاسوبية#

بالتعمق في التفاصيل، شرح Pavel كيف تجعل أدوات Hugging Face بناء تطبيقات الرؤية الحاسوبية أسهل. يمكن للمطورين استخدامها لمهام مثل تصنيف الصور، واكتشاف الكائنات، وتطبيقات الرؤية واللغة.

كما أشار إلى أن العديد من مهام الرؤية الحاسوبية هذه يمكن التعامل معها باستخدام نماذج مدربة مسبقاً متاحة على Hugging Face Hub، مما يوفر الوقت عن طريق تقليل الحاجة إلى التدريب من الصفر. في الواقع، تقدم Hugging Face أكثر من 13,000 نموذج مدرب مسبقاً لمهام تصنيف الصور، بما في ذلك نماذج لتصنيف الأطعمة، وتصنيف الحيوانات الأليفة، واكتشاف المشاعر.

تأكيداً على إمكانية الوصول إلى هذه النماذج، قال: "ربما لا تحتاج حتى إلى تدريب نموذج لمشروعك - قد تجد نموذجاً على Hub مدرباً بالفعل بواسطة شخص ما من المجتمع."

Link to this sectionنماذج Hugging Face لاكتشاف الكائنات#

بتقديم مثال آخر، أوضح Pavel كيف يمكن لـ Hugging Face المساعدة في اكتشاف الكائنات، وهي وظيفة رئيسية في الرؤية الحاسوبية تُستخدم لتحديد وتحديد مواقع الكائنات داخل الصور. حتى مع وجود بيانات مصنفة محدودة، يمكن للنماذج المدربة مسبقاً المتاحة على Hugging Face Hub جعل اكتشاف الكائنات أكثر كفاءة.

كما قدم نظرة عامة سريعة على العديد من النماذج المصممة لهذه المهمة والتي يمكنك العثور عليها على Hugging Face:

  • نماذج اكتشاف الكائنات في الوقت الفعلي: بالنسبة للبيئات الديناميكية حيث تكون السرعة أمراً حاسماً، توفر نماذج مثل Detection Transformer (DETR) إمكانات اكتشاف الكائنات في الوقت الفعلي. تم تدريب DETR على مجموعة بيانات COCO وهي مصممة لمعالجة الميزات متعددة النطاقات بكفاءة، مما يجعلها مناسبة للتطبيقات الحساسة للوقت.
  • نماذج الرؤية واللغة: تجمع هذه النماذج بين معالجة الصور والنصوص، مما يجعل من الممكن لأنظمة الذكاء الاصطناعي مطابقة الصور بالأوصاف أو التعرف على الكائنات خارج بيانات التدريب الخاصة بها. تشمل الأمثلة CLIP وSigLIP، والتي تعمل على تحسين البحث في الصور من خلال ربط النص بالمرئيات وتمكين حلول الذكاء الاصطناعي من تحديد كائنات جديدة من خلال فهم سياقها.
  • نماذج اكتشاف الكائنات بدون أمثلة (Zero-shot): يمكنها تحديد الكائنات التي لم ترها من قبل من خلال فهم العلاقة بين الصور والنصوص. تشمل الأمثلة OwlVit وGroundingDINO وOmDet، والتي تستخدم التعلم بدون أمثلة لاكتشاف كائنات جديدة دون الحاجة إلى بيانات تدريب مصنفة.

Link to this sectionكيفية استخدام نماذج Hugging Face#

انتقل Pavel بعد ذلك إلى التركيز على التطبيق العملي لنماذج Hugging Face، شارحاً ثلاث طرق يمكن للمطورين الاستفادة منها: استكشاف النماذج، واختبارها بسرعة، وتخصيصها بشكل أكبر.

لقد أوضح كيف يمكن للمطورين تصفح النماذج مباشرة على Hugging Face Hub دون كتابة أي كود، مما يسهل اختبار النماذج فوراً من خلال واجهة تفاعلية. وأضاف Pavel: "يمكنك تجربتها دون كتابة سطر كود واحد أو تنزيل النموذج على جهاز الكمبيوتر الخاص بك." ونظراً لأن بعض النماذج كبيرة، فإن تشغيلها على Hub يساعد في تجنب قيود التخزين والمعالجة.

How to use Hugging Face models

الشكل 2. كيفية استخدام نماذج Hugging Face.

أيضاً، تسمح Inference API الخاصة بـ Hugging Face للمطورين بتشغيل نماذج الذكاء الاصطناعي باستدعاءات API بسيطة. إنها رائعة للاختبار السريع، ومشاريع إثبات المفهوم، والنماذج الأولية السريعة دون الحاجة إلى إعداد معقد.

بالنسبة لحالات الاستخدام الأكثر تقدماً، يمكن للمطورين استخدام إطار عمل Transformers من Hugging Face، وهو أداة مفتوحة المصدر توفر نماذج مدربة مسبقاً لمهام النصوص والرؤية والصوت مع دعم كل من PyTorch وTensorFlow. شرح Pavel أنه بسطرين فقط من الكود، يمكن للمطورين استرداد نموذج من Hugging Face Hub وربطه بأداة معالجة مسبقة، مثل معالج الصور، لتحليل بيانات الصور لتطبيقات الذكاء الاصطناعي الرؤيوي.

Link to this sectionتحسين سير عمل الذكاء الاصطناعي باستخدام Hugging Face#

بعد ذلك، شرح Pavel كيف يمكن لـ Hugging Face تبسيط سير عمل الذكاء الاصطناعي. أحد المواضيع الرئيسية التي غطاها كان تحسين آلية الانتباه في Transformers، وهي ميزة أساسية لنماذج التعلم العميق التي تساعدها على التركيز على الأجزاء الأكثر صلة من بيانات الإدخال. وهذا يحسن دقة المهام التي تتضمن معالجة اللغات والرؤية الحاسوبية. ومع ذلك، يمكن أن تكون مكثفة من حيث الموارد.

يمكن أن يؤدي تحسين آلية الانتباه إلى تقليل استخدام الذاكرة بشكل كبير مع تحسين السرعة. أشار Pavel إلى ذلك قائلاً: "على سبيل المثال، من خلال التحول إلى تنفيذ انتباه أكثر كفاءة، يمكنك الحصول على أداء أسرع بما يصل إلى 1.8 مرة."

يوفر Hugging Face دعماً مدمجاً لتنفيذات انتباه أكثر كفاءة داخل إطار عمل Transformers. يمكن للمطورين تمكين هذه التحسينات ببساطة عن طريق تحديد تنفيذ انتباه بديل عند تحميل نموذج.

Link to this sectionOptimum وTorch Compile#

تحدث أيضاً عن التكميم (Quantization)، وهي تقنية تجعل نماذج الذكاء الاصطناعي أصغر من خلال تقليل دقة الأرقام التي تستخدمها دون التأثير على الأداء بشكل كبير. يساعد هذا النماذج على استخدام ذاكرة أقل والعمل بشكل أسرع، مما يجعلها أكثر ملاءمة للأجهزة ذات قدرة المعالجة المحدودة، مثل الهواتف الذكية والأنظمة المدمجة.

لتحسين الكفاءة بشكل أكبر، قدم Pavel مكتبة Optimum من Hugging Face، وهي مجموعة من الأدوات المصممة لتحسين ونشر النماذج. ببضعة أسطر من الكود، يمكن للمطورين تطبيق تقنيات التكميم وتحويل النماذج إلى تنسيقات فعالة مثل ONNX (Open Neural Network Exchange)، مما يسمح لها بالعمل بسلاسة على أنواع مختلفة من الأجهزة، بما في ذلك خوادم السحابة وأجهزة الحافة (edge devices).

Pavel speaking about the Optimum library and its features

الشكل 3. تحدث Pavel عن مكتبة Optimum وميزاتها.

وأخيراً، ذكر Pavel فوائد Torch Compile، وهي ميزة في PyTorch تعمل على تحسين كيفية معالجة نماذج الذكاء الاصطناعي للبيانات، مما يجعلها تعمل بشكل أسرع وأكثر كفاءة. يدمج Hugging Face خاصية Torch Compile داخل مكتبات Transformers وOptimum الخاصة به، مما يتيح للمطورين الاستفادة من تحسينات الأداء هذه مع تغييرات طفيفة في الكود.

من خلال تحسين بنية حسابات النموذج، يمكن لـ Torch Compile تسريع أوقات الاستدلال وزيادة معدلات الإطارات من 29 إلى 150 إطاراً في الثانية دون المساس بالدقة أو الجودة.

Link to this sectionنشر النماذج باستخدام أدوات Hugging Face#

بالانتقال إلى الخطوة التالية، تطرق Pavel باختصار إلى كيفية توسيع ونشر نماذج الذكاء الاصطناعي للرؤية باستخدام أدوات Hugging Face بعد اختيار النموذج المناسب واختيار أفضل نهج للتطوير.

على سبيل المثال، يمكن للمطورين نشر تطبيقات الذكاء الاصطناعي التفاعلية باستخدام Gradio وStreamlit. يسمح Gradio للمطورين بإنشاء واجهات قائمة على الويب لنماذج تعلم الآلة، بينما يساعد Streamlit في بناء تطبيقات بيانات تفاعلية باستخدام نصوص Python بسيطة.

أشار Pavel أيضاً إلى قوله: "لا تحتاج إلى البدء في كتابة كل شيء من الصفر"، في إشارة إلى الأدلة، ودفاتر التدريب (notebooks)، ونصوص الأمثلة التي توفرها Hugging Face. تساعد هذه الموارد المطورين على البدء بسرعة دون الحاجة إلى بناء كل شيء من الأساس.

Pavel discussing the capabilities of Hugging Face at YV24

الشكل 4. Pavel يناقش إمكانات Hugging Face في YV24.

Link to this sectionفوائد Hugging Face Hub#

في ختام كلمته، لخص Pavel مزايا استخدام Hugging Face Hub. وأكد كيف أنه يبسط إدارة النماذج والتعاون. كما لفت الانتباه إلى توافر الأدلة، ودفاتر الملاحظات، والدروس التعليمية، والتي يمكن أن تساعد المبتدئين والخبراء على فهم نماذج الذكاء الاصطناعي وتنفيذها.

"هناك الكثير من المساحات الرائعة الموجودة بالفعل على Hub. يمكنك العثور على مساحات مشابهة، واستنساخ الكود المشترك، وتعديل بضعة أسطر، واستبدال النموذج بنموذجك الخاص، وإعادة رفعه مرة أخرى،" كما أوضح، مشجعاً المطورين على الاستفادة من مرونة المنصة.

Link to this sectionأبرز النقاط#

خلال حديثه في YV24، شارك Pavel كيف توفر Hugging Face أدوات تدعم تدريب نماذج الذكاء الاصطناعي وتحسينها ونشرها. على سبيل المثال، يمكن للابتكارات مثل Transformers وOptimum وTorch Compile مساعدة المطورين على تعزيز أداء النماذج.

مع زيادة كفاءة نماذج الذكاء الاصطناعي، أصبحت التطورات في التكميم ونشر الحافة تجعل من السهل تشغيلها على الأجهزة المحدودة الموارد. هذه التحسينات، جنباً إلى جنب مع أدوات مثل Hugging Face ونماذج الرؤية الحاسوبية المتقدمة مثل Ultralytics YOLO11، هي مفتاح بناء تطبيقات ذكاء اصطناعي للرؤية قابلة للتوسع وعالية الأداء.

انضم إلى مجتمعنا المتنامي! استكشف مستودع GitHub الخاص بنا للتعرف على الذكاء الاصطناعي، واطلع على تراخيص YOLO لبدء مشاريع الرؤية الحاسوبية الخاصة بك. هل أنت مهتم بابتكارات مثل الرؤية الحاسوبية في الرعاية الصحية أو الرؤية الحاسوبية في الزراعة؟ قم بزيارة صفحات الحلول الخاصة بنا لاكتشاف المزيد!

Explore solutions

Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد

لنبنِ مستقبل الذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل تعلم الآلة