اكتشف كيف تُحدث آليات الانتباه ثورة في الذكاء الاصطناعي من خلال تعزيز مهام البرمجة اللغوية العصبية والرؤية الحاسوبية مثل الترجمة واكتشاف الأجسام وغيرها!
آلية الانتباه هي تقنية مستخدمة في الشبكات العصبية تحاكي الانتباه المعرفي البشري. وهي تسمح للنموذج بالتركيز بشكل ديناميكي على الأجزاء الأكثر صلة من بيانات المدخلات عند إنتاج مخرجات. فبدلاً من التعامل مع جميع أجزاء المدخلات بشكل متساوٍ، يتعلم النموذج تعيين درجات "انتباه" مختلفة لكل جزء، مما يزيد من تأثير المعلومات المهمة ويقلل من تأثير البيانات غير ذات الصلة. وقد كانت هذه القدرة مفيدة في تحسين أداء النماذج في مختلف المجالات، من معالجة اللغات الطبيعية إلى الرؤية الحاسوبية.
تقوم آلية الانتباه في جوهرها بحساب مجموعة من أوزان الانتباه للمدخلات. تحدد هذه الأوزان مقدار التركيز الذي يجب أن يضعه النموذج على كل عنصر من عناصر تسلسل المدخلات أو الصورة. على سبيل المثال، عند ترجمة جملة طويلة، يحتاج النموذج إلى التركيز على كلمات مصدر محددة لتوليد الكلمة التالية الصحيحة في الترجمة. وقبل آليات الانتباه، كانت النماذج مثل الشبكات العصبية المتكررة التقليدية (RNNs) تعاني قبل آليات الانتباه من مشكلة التسلسلات الطويلة، وغالبًا ما "تنسى" الأجزاء السابقة من المدخلات - وهي مشكلة تُعرف باسم مشكلة التدرج المتلاشي. يتغلب الانتباه على هذه المشكلة من خلال توفير اتصال مباشر بجميع أجزاء المدخلات، مما يسمح للنموذج بالرجوع إلى أي جزء من التسلسل حسب الحاجة، بغض النظر عن طوله. كانت هذه القدرة على التعامل مع التبعيات بعيدة المدى إنجازًا كبيرًا، وقد تم تفصيلها بشكل شهير في الورقة البحثية "الانتباه هو كل ما تحتاجه".
على الرغم من استخدامه في كثير من الأحيان بالتبادل، إلا أنه من المهم التمييز بين آلية الانتباه العام والانتباه الذاتي.
تُعد آليات الانتباه جزءًا لا يتجزأ من العديد من تطبيقات الذكاء الاصطناعي الحديثة:
تسمح منصات مثل Ultralytics HUB للمستخدمين بتدريب النماذج المتقدمة والتحقق من صحتها ونشرها، بما في ذلك النماذج التي تتضمن آليات الانتباه. وغالباً ما تستفيد هذه النماذج من أوزان النماذج المدربة مسبقاً والمتاحة على منصات مثل Hugging Face، كما أنها مبنية باستخدام أطر عمل قوية مثل PyTorch و TensorFlow. لقد دفع تطوير الانتباه حدود ما هو ممكن في مجال التعلم الآلي، مما جعله حجر الزاوية في أبحاث الذكاء الاصطناعي الحديثة والتطوير في مؤسسات مثل DeepMind.