تعرف على YOLO26: جيل جديد من ذكاء الرؤية الاصطناعي.
Ultralytics
العودة إلى قاموس مصطلحات Ultralytics

Long Short-Term Memory (LSTM)

استكشف شبكات الذاكرة طويلة قصيرة المدى (LSTM). تعرف على كيفية حل شبكات LSTM لمشكلة تلاشي التدرج في الشبكات العصبية المتكررة (RNNs) لمهام السلاسل الزمنية، ومعالجة اللغات الطبيعية (NLP)، وتحليل الفيديو.

تعد الذاكرة طويلة وقصيرة المدى (LSTM) نوعاً متخصصاً من بنية الشبكات العصبية المتكررة (RNN) القادرة على تعلم الاعتماد على الترتيب في مشكلات التنبؤ بالتسلسل. وخلافاً للشبكات العصبية التقليدية ذات التغذية الأمامية، تمتلك شبكات LSTM وصلات تغذية راجعة تسمح لها بمعالجة ليس فقط نقاط البيانات الفردية (مثل الصور)، بل تسلسلات كاملة من البيانات (مثل الكلام أو الفيديو). تجعلها هذه القدرة مناسبة بشكل فريد للمهام التي يكون فيها السياق المستمد من المدخلات السابقة أمراً حاسماً لفهم البيانات الحالية، مما يعالج قيود "الذاكرة قصيرة المدى" لشبكات RNN التقليدية.

Link to this sectionالمشكلة في شبكات RNN التقليدية#

لفهم الابتكار في شبكات LSTM، من المفيد النظر في التحديات التي تواجهها الشبكات العصبية المتكررة الأساسية. فبينما صُممت شبكات RNN للتعامل مع المعلومات التسلسلية، إلا أنها تعاني عند التعامل مع تسلسلات البيانات الطويلة بسبب مشكلة تلاشي التدرج. ومع انتشار التدرجات (القيم المستخدمة لتحديث أوزان الشبكة) عكسياً عبر الزمن، يمكن أن تصبح أصغر بشكل أسي، مما يمنع الشبكة فعلياً من تعلم الروابط بين الأحداث البعيدة. وهذا يعني أن شبكة RNN التقليدية قد تتذكر كلمة من الجملة السابقة ولكنها تنسى السياق الذي تم تأسيسه قبل ثلاث فقرات. صُممت شبكات LSTM خصيصاً لحل هذه المشكلة من خلال تقديم هيكل داخلي أكثر تعقيداً يمكنه الحفاظ على نافذة سياق لفترات زمنية أطول بكثير.

Link to this sectionكيف تعمل شبكات LSTM#

المفهوم الأساسي وراء شبكة LSTM هو حالة الخلية، التي غالباً ما توصف بأنها سير ناقل يمتد عبر سلسلة الشبكة بأكملها. تسمح هذه الحالة للمعلومات بالتدفق على طولها دون تغيير، مما يحافظ على التبعيات طويلة المدى. تتخذ الشبكة قرارات بشأن ما يجب تخزينه أو تحديثه أو تجاهله من حالة الخلية هذه باستخدام هياكل تسمى البوابات.

  • بوابة النسيان (Forget Gate): تقرر هذه الآلية المعلومات التي لم تعد ذات صلة ويجب إزالتها من حالة الخلية. على سبيل المثال، إذا واجه نموذج لغوي موضوعاً جديداً، فقد "ينسى" جنس الموضوع السابق.
  • بوابة الإدخال (Input Gate): تحدد هذه البوابة المعلومات الجديدة المهمة بما يكفي ليتم تخزينها في حالة الخلية.
  • بوابة الإخراج (Output Gate): أخيراً، تتحكم هذه البوابة في الأجزاء التي يجب إخراجها من الحالة الداخلية إلى الحالة المخفية التالية واستخدامها للتنبؤ الفوري.

من خلال تنظيم تدفق المعلومات هذا، يمكن لشبكات LSTM تجاوز فجوات زمنية تزيد عن 1000 خطوة، متفوقة بذلك بشكل كبير على شبكات RNN التقليدية في المهام التي تتطلب تحليل السلاسل الزمنية.

Link to this sectionتطبيقات العالم الحقيقي#

لقد دعمت شبكات LSTM العديد من الاختراقات الرئيسية في التعلم العميق على مدار العقد الماضي. إليك مثالان بارزان على تطبيقاتها:

  • نمذجة التسلسل إلى تسلسل في الترجمة: تُعد شبكات LSTM أساسية في أنظمة الترجمة الآلية. في هذه البنية، تقوم شبكة LSTM واحدة (المُشفر) بمعالجة جملة الإدخال بلغة واحدة (مثل الإنجليزية) وضغطها في ناقل سياق. ثم تستخدم شبكة LSTM ثانية (فك التشفير) هذا الناقل لإنشاء الترجمة بلغة أخرى (مثل الفرنسية). إن القدرة على التعامل مع تسلسلات الإدخال والإخراج بأطوال مختلفة أمر بالغ الأهمية لـ معالجة اللغات الطبيعية (NLP).
  • تحليل الفيديو والتعرف على الأنشطة: بينما تتفوق الشبكات العصبية التلافيفية (CNNs) مثل ResNet-50 في تحديد الكائنات في الصور الثابتة، فإنها تفتقر إلى إدراك الزمن. من خلال الجمع بين شبكات CNN وشبكات LSTM، يمكن لأنظمة الذكاء الاصطناعي تنفيذ التعرف على الإجراءات في تدفقات الفيديو. تستخرج شبكة CNN السمات من كل إطار، وتحلل شبكة LSTM تسلسل هذه السمات لتحديد ما إذا كان الشخص يمشي أو يركض أو يسقط.

Link to this sectionدمج شبكات LSTM مع الرؤية الحاسوبية#

في الرؤية الحاسوبية الحديثة، غالباً ما تُستخدم شبكات LSTM جنباً إلى جنب مع مستخرجات سمات قوية. على سبيل المثال، قد تستخدم نموذج YOLO لاكتشاف الكائنات في إطارات فردية وشبكة LSTM لتتبع مساراتها أو التنبؤ بالحركة المستقبلية.

إليك مثال مفاهيمي يستخدم torch لتعريف شبكة LSTM بسيطة يمكنها معالجة تسلسل من ناقلات السمات المستخرجة من تدفق فيديو:

import torch
import torch.nn as nn

# Define an LSTM model for processing sequential video features
# Input size: 512 (e.g., features from a CNN), Hidden size: 128
lstm_model = nn.LSTM(input_size=512, hidden_size=128, num_layers=2, batch_first=True)

# Simulate a batch of video sequences: 8 videos, 10 frames each, 512 features per frame
video_features = torch.randn(8, 10, 512)

# Pass the sequence through the LSTM
output, (hidden_state, cell_state) = lstm_model(video_features)

print(f"Output shape: {output.shape}")  # Shape: [8, 10, 128]
print("LSTM successfully processed the temporal sequence.")

Link to this sectionالمفاهيم ذات الصلة والفروقات#

من المفيد تمييز شبكات LSTM عن بنيات معالجة التسلسل الأخرى:

  • شبكات LSTM مقابل شبكات GRU: تُعد وحدة التكرار المسورة (GRU) نوعاً مبسطاً من شبكات LSTM. تدمج شبكات GRU بوابتي النسيان والإدخال في "بوابة تحديث" واحدة وتدمج حالة الخلية والحالة المخفية. هذا يجعل شبكات GRU أكثر كفاءة من الناحية الحسابية وأسرع في التدريب، على الرغم من أن شبكات LSTM قد لا تزال تتفوق عليها في مجموعات البيانات الأكبر والأكثر تعقيداً.
  • شبكات LSTM مقابل المحولات (Transformers): لقد حلت بنية المحول (Transformer)، التي تعتمد على آليات الانتباه الذاتي (self-attention) بدلاً من التكرار، محل شبكات LSTM إلى حد كبير في مهام معالجة اللغات الطبيعية (NLP) مثل تلك التي يؤديها نموذج GPT-4. يمكن للمحولات معالجة تسلسلات كاملة بالتوازي بدلاً من التسلسل، مما يسمح بتدريب أسرع بكثير على مجموعات بيانات ضخمة. ومع ذلك، تظل شبكات LSTM ذات صلة في السيناريوهات ذات البيانات المحدودة أو قيود السلاسل الزمنية المحددة حيث لا تكون هناك حاجة إلى التكاليف الإضافية لآليات الانتباه.

Link to this sectionالتطور والمستقبل#

بينما احتلت آلية الانتباه (attention mechanism) مركز الصدارة في الذكاء الاصطناعي التوليدي (generative AI)، تستمر شبكات LSTM في كونها خياراً قوياً للتطبيقات الأخف وزناً، خاصة في بيئات الذكاء الاصطناعي الطرفي (edge AI) حيث تكون الموارد الحسابية محدودة. يواصل الباحثون استكشاف بنيات هجينة تجمع بين كفاءة الذاكرة في شبكات LSTM والقوة التمثيلية لأنظمة اكتشاف الكائنات (object detection) الحديثة.

بالنسبة لأولئك الذين يتطلعون إلى إدارة مجموعات البيانات لتدريب نماذج التسلسل أو مهام الرؤية المعقدة، توفر منصة Ultralytics أدوات شاملة للتعليق التوضيحي وإدارة البيانات. علاوة على ذلك، فإن فهم كيفية عمل شبكات LSTM يوفر أساساً قوياً لاستيعاب النماذج الزمنية الأكثر تقدماً المستخدمة في المركبات ذاتية القيادة (autonomous vehicles) والروبوتات.

Explore solutions

Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد

لنبنِ مستقبل الذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل تعلم الآلة