Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

Reformer

اكتشف نموذج Reformer: وهو بنية تحويلية رائدة مُحسَّنة للتسلسلات الطويلة مع الانتباه المستند إلى تجزئة LSH والطبقات القابلة للعكس.

المصلح عبارة عن بنية عالية الكفاءة مصممة لتحسين نموذج نموذج المحول القياسي عن طريق تقليل استهلاك الذاكرة والتكاليف الحسابية عند معالجة التسلسلات الطويلة جدًا. بينما أحدثت المحولات التقليدية ثورة في معالجة اللغات الطبيعية (NLP), يتزايد استخدام ذاكرتها بشكل تربيعي مع طول التسلسل، مما يجعلها مكلفة عند تشغيلها على المستندات الطويلة. يعالج يعالج المُصلِح هذا الاختناق، مما يتيح معالجة تسلسلات تصل إلى مليون رمز على وحدة معالجة رسومات واحدة وحدة معالجة رسومات (GPU ) واحدة, مما يفتح إمكانيات جديدة للبحث في التعلُّم العميق (DL).

الابتكارات الأساسية وراء المصلح

يُقدِّم المُصلح تقنيتين أساسيتين لتحقيق التعقيد الخطي $O(L)$$ بدلًا من التربيعي $O(L^2)$, مما يسمح لها بمعالجة كميات هائلة من البيانات بشكل أكثر فعالية من سابقاتها.

  • التجزئة الحساسة للموقع (LSH) الانتباه: في آلية الانتباه القياسية، كل رمز رمز مميز إلى كل رمز مميز آخر، وهو أمر ثقيل من الناحية الحسابية. يستخدم المصلح LSH لتجميع المتجهات المتشابهة في دلاء. ثم يتم حساب الانتباه داخل هذه المجموعات فقط، مما يقرب من مصفوفة الانتباه الكاملة بدقة عالية بدقة عالية ولكن بتكلفة بسيطة. هذا يسمح للنموذج بالتركيز على الأجزاء ذات الصلة من المدخلات دون مسح التسلسل بأكمله.
  • الطبقات المتبقية القابلة للعكس: يتطلب تدريب الشبكات العصبية العميقة الشبكات العصبية العميقة يتطلب عادةً تخزين التنشيطات من كل طبقة لحساب التدرجات أثناء الترحيل العكسي. يستخدم المُصلح الطبقات التي تسمح بإعادة حساب التنشيطات أثناء التمرير العكسي بدلًا من تخزينها في الذاكرة. هذا الابتكار يجعل النموذج أكثر كفاءة في الذاكرة، مما يتيح تدريب شبكات أعمق بكثير.

تطبيقات واقعية

القدرة على معالجة سياقات واسعة النطاق تجعل المصلح مفيدًا بشكل مميز للمهام التي يكون فيها فهم البنية العامة للبيانات أمرًا بالغ الأهمية.

  • التحليل الجينومي: تتكون تسلسلات الحمض النووي من ملايين من الأزواج القاعدية، حيث يمكن أن تؤثر العناصر البعيدة على بعضها البعض. يمكن للمصلح استيعاب هذه التسلسلات الطويلة من أجل تحديد وظائف الجينات أو التنبؤ بتراكيب البروتين، وهي مهمة غالبًا ما تكون كثيفة الذاكرة بالنسبة للنماذج القياسية مثل BERT.
  • تلخيص المستندات الطويلة: في القطاعين القانوني والمالي، غالبًا ما يقوم المتخصصون بتحليل المستندات التي يبلغ طولها مئات الصفحات. يمكن للنماذج القائمة على المصلح معالجة كتب أو عقود قانونية كاملة في مسار واحد لإجراء تلخيص النص أو الإجابة عن الأسئلة، والحفاظ على التماسك على مسافات طويلة على عكس الشبكات العصبية المتكررة (RNNs) التي قد تعاني من التدرجات المتلاشية.
  • توليد صور عالية الدقة: من خلال التعامل مع وحدات البكسل كتسلسل، يمكن تطبيق المصلح على مهام توليد الص ور، مما يؤدي إلى إنشاء مرئيات عالية الدقة بكسل بكسل دون نفاد الذاكرة.

التمييز عن المصطلحات ذات الصلة

من المهم تمييز المصلح عن نماذج التسلسل الأخرى. في حين أن يستهدف Longformer أيضًا التسلسلات الطويلة، فإنه يستخدم آلية آلية انتباه النافذة المنزلقة جنبًا إلى جنب مع الانتباه العام. في المقابل، يعتمد المُصلح على التجزئة (LSH) للعثور على الرموز ذات الصلة ديناميكيًا. بالإضافة إلى ذلك، بينما YOLO11 مُحسَّن للسرعة في الرؤية الحاسوبية، تم تحسين المصلح من أجل كفاءة الذاكرة في نمذجة التسلسل. ومع ذلك، يشترك كلاهما في هدف تحقيق أقصى قدر من الأداء على الأجهزة المقيدة.

تنفيذ الاستدلال الفعال

في حين أن المصلح هو بنية محددة، فإن مفهوم الاستدلال الفعال هو مفهوم عالمي في الذكاء الاصطناعي. يوضح المثال التالي يوضح المثال التالي كيفية إجراء استدلال فعال باستخدام ultralytics على دفق فيديو - وهو شكل من أشكال البيانات المتسلسلة - حيث يعد تحسين السرعة والذاكرة أمرًا بالغ الأهمية.

from ultralytics import YOLO

# Load the YOLO11n model, optimized for speed and efficiency
model = YOLO("yolo11n.pt")

# Run inference on a video source (treating frames as a sequence)
# stream=True uses a generator to process frames one by one, saving memory
results = model.predict(source="https://ultralytics.com/images/bus.jpg", stream=True)

for result in results:
    # Process each frame's detection results efficiently
    print(f"Detected {len(result.boxes)} objects in current frame.")

يعد فهم البنى مثل المصلح أمرًا ضروريًا للتعرف على تطور تطور الذكاء الاصطناعي، لأنها تدفع حدود ما هو ممكن من الناحية الحسابية مع الذكاء الاصطناعي (AI). لمعرفة المزيد حول التدريب الفعال للنماذج، استكشف أدلةUltralytics .

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن