اكتشف كيف تحول نماذج التسلسل إلى التسلسل المدخلات إلى تسلسلات إخراج، مما يدعم مهام الذكاء الاصطناعي مثل الترجمة وبرامج الدردشة والتعرف على الكلام.
نماذج Sequence-to-Sequence (Seq2Seq) هي فئة من نماذج التعلم العميق المصممة لتحويل تسلسل الإدخال إلى تسلسل إخراج، حيث يمكن أن تختلف أطوال الإدخال والإخراج. هذه المرونة تجعلها قوية بشكل استثنائي لمجموعة واسعة من المهام في معالجة اللغات الطبيعية (NLP) وما بعدها. تم تقديم الفكرة الأساسية في أوراق بحثية من قبل باحثين في Google و مختبر يوشوا بنجيو، مما أحدث ثورة في مجالات مثل الترجمة الآلية.
تم بناء نماذج Seq2Seq على هيكل encoder-decoder. يسمح هذا الهيكل للنموذج بمعالجة التسلسلات ذات الأطوال المتغيرة بفعالية.
المشفر: يعالج هذا المكون تسلسل الإدخال بأكمله، مثل جملة باللغة الإنجليزية. يقرأ التسلسل عنصرًا واحدًا في كل مرة (على سبيل المثال، كلمة بكلمة) ويضغط المعلومات في تمثيل رقمي ثابت الطول يسمى متجه السياق أو "متجه الفكر". تقليديًا، يكون المشفر عبارة عن شبكة عصبية متكررة (RNN) أو متغير أكثر تقدمًا مثل ذاكرة طويلة المدى (LSTM)، وهي ماهرة في التقاط المعلومات التسلسلية.
وحدة فك التشفير: يأخذ هذا المكون متجه السياق من المشفر كمدخل أولي له. مهمته هي إنشاء تسلسل الإخراج عنصرًا واحدًا في كل مرة. على سبيل المثال، في مهمة الترجمة، فإنه سينشئ الجملة المترجمة كلمة بكلمة. يتم إرجاع الإخراج من كل خطوة إلى وحدة فك التشفير في الخطوة التالية، مما يسمح لها بإنشاء تسلسل متماسك. تستمر هذه العملية حتى يتم إنتاج رمز خاص لنهاية التسلسل. الابتكار الرئيسي الذي أدى إلى تحسين أداء Seq2Seq بشكل كبير هو آلية الانتباه، والتي تسمح لوحدة فك التشفير بالنظر إلى أجزاء مختلفة من تسلسل الإدخال الأصلي أثناء إنشاء الإخراج.
إن القدرة على تعيين مدخلات ذات أطوال متغيرة إلى مخرجات ذات أطوال متغيرة تجعل نماذج Seq2Seq متعددة الاستخدامات للغاية.
في حين أن نماذج Seq2Seq القائمة على RNNs كانت رائدة، إلا أن المجال قد تطور:
في حين أن Seq2Seq يشير غالبًا إلى هيكل المشفر-المفكك المستند إلى الشبكات العصبية المتكررة (RNN)، إلا أن المبدأ العام المتمثل في تعيين تسلسلات الإدخال إلى تسلسلات الإخراج باستخدام تمثيل وسيط يظل أساسيًا للعديد من البنى الحديثة. توفر أدوات مثل PyTorch و TensorFlow لبنات بناء لتنفيذ نماذج التسلسل التقليدية والحديثة. يمكن تبسيط إدارة عملية التدريب باستخدام منصات مثل Ultralytics HUB، مما يبسط خط أنابيب نشر النموذج بأكمله.