اكتشف كيف تتفوق شبكات الذاكرة طويلة المدى (LSTM) في التعامل مع البيانات التسلسلية، والتغلب على قيود الشبكات العصبية المتكررة (RNN)، وتشغيل مهام الذكاء الاصطناعي مثل معالجة اللغة الطبيعية والتنبؤ.
الذاكرة طويلة المدى (LSTM) هي نوع متخصص من بنية الشبكة العصبية المتكررة (RNN) المصممة لتعلم وتذكر الأنماط عبر تسلسلات طويلة من البيانات. على عكس الشبكات العصبية المتكررة القياسية، التي تعاني من التبعيات طويلة المدى بسبب مشكلة تلاشي التدرج، تستخدم شبكات LSTM آلية بوابات فريدة لتنظيم تدفق المعلومات. يتيح ذلك للشبكة الاحتفاظ بشكل انتقائي بالمعلومات المهمة لفترات طويلة مع تجاهل البيانات غير ذات الصلة، مما يجعلها حجر الزاوية في التعلم العميق الحديث، وخاصة في معالجة اللغة الطبيعية (NLP). وضعت ورقة LSTM التأسيسية التي كتبها Hochreiter و Schmidhuber الأساس لهذه التكنولوجيا القوية.
يكمن مفتاح قدرة LSTM في هيكلها الداخلي، والذي يتضمن "حالة الخلية" والعديد من "البوابات". تعمل حالة الخلية كحزام ناقل، يحمل المعلومات ذات الصلة عبر التسلسل. البوابات - الإدخال والنسيان والإخراج - هي شبكات عصبية تتحكم في المعلومات التي تتم إضافتها إلى حالة الخلية أو إزالتها منها أو قراءتها منها.
تمكن هيكلة البوابة هذه شبكات LSTM من الحفاظ على السياق عبر العديد من الخطوات الزمنية، وهي ميزة حاسمة لفهم البيانات التسلسلية مثل النص أو السلاسل الزمنية (time series). يمكن العثور على تصور تفصيلي في منشور مدونة فهم شبكات LSTMs الشهير هذا.
تم تطبيق LSTMs بنجاح عبر العديد من المجالات التي تتضمن بيانات تسلسلية.
تعد LSTMs جزءًا من عائلة أوسع من النماذج للبيانات التسلسلية.
يمكن تنفيذ LSTMs بسهولة باستخدام أطر عمل التعلم العميق الشائعة مثل PyTorch (راجع وثائق PyTorch LSTM) و TensorFlow (راجع وثائق TensorFlow LSTM). بينما تركز Ultralytics في المقام الأول على نماذج رؤية الكمبيوتر (CV) مثل Ultralytics YOLO لمهام مثل اكتشاف الكائنات و تقسيم المثيلات، فإن فهم النماذج التسلسلية أمر قيم، خاصة وأن الأبحاث تستكشف ربط البرمجة اللغوية العصبية ورؤية الكمبيوتر لمهام مثل فهم الفيديو أو التعليق على الصور. يمكنك استكشاف نماذج ومفاهيم ML المختلفة بشكل أكبر في وثائق Ultralytics. يمكن تبسيط إدارة التدريب و نشر النماذج المختلفة باستخدام منصات مثل Ultralytics HUB. تقدم موارد مثل DeepLearning.AI دورات تدريبية تغطي النماذج التسلسلية، بما في ذلك LSTMs.