Llama 3: شرح برنامج LLM الجديد مفتوح المصدر من ميتا

تطور نماذج ميتا لاما ميتا

نقدم لك ميتا لاما 3

بنية نموذج لاما 3 من Meta's Llama 3

يعمل Llama 3 على تغيير طريقة تعاملنا مع تدريب النماذج

فتح الأبواب مع لاما 3

مقارنة LLAMA 3 مع LLMs الأخرى

يتم إتاحة Meta Llama 3 على نطاق واسع

الوجبات الجاهزة

عندما قمنا بجمع ابتكارات الذكاء الاصطناعي (AI) في الربع الأول من عام 2024، رأينا أن نماذج LLM، أو النماذج اللغوية الكبيرة، يتم إصدارها يمينًا ويسارًا من قبل مؤسسات مختلفة. استمرارًا لهذا الاتجاه، في 18 أبريل 2024، أصدرت Meta في 18 أبريل 2024، Llama 3، وهو الجيل التالي من أحدث نماذج LLM مفتوحة المصدر.

ربما تفكر: إنه مجرد ماجستير آخر في القانون. لماذا يتحمس مجتمع الذكاء الاصطناعي لهذه الدرجة؟

في حين أنه يمكنك ضبط نماذج مثل GPT-3 أو Gemini للحصول على استجابات مخصصة، إلا أنها لا توفر شفافية كاملة فيما يتعلق بأعمالها الداخلية، مثل بيانات التدريب أو معلمات النموذج أو الخوارزميات. وعلى النقيض من ذلك، فإن نموذج Llama 3 من Meta أكثر شفافية، حيث تتوفر بنيته وأوزانه للتنزيل. بالنسبة لمجتمع الذكاء الاصطناعي، هذا يعني حرية أكبر في التجربة.

في هذه المقالة، سنتعرف في هذه المقالة على ما يمكن أن يفعله Llama 3، وكيف ظهر إلى حيز الوجود، وتأثيره على مجال الذكاء الاصطناعي. لندخل في صلب الموضوع!

تطور نماذج ميتا لاما ميتا

قبل أن نتعمق في Llama 3، دعونا نلقي نظرة على إصداراته السابقة.

أطلقت ميتا Meta برنامج Llama 1 في فبراير 2023، والذي جاء في أربعة متغيرات بمعلمات تتراوح بين 7 مليارات و64 مليار. في التعلم الآلي، تشير "المعلمات" إلى عناصر النموذج التي يتم تعلمها من بيانات التدريب. ونظرًا لقلة عدد معلماته، فقد عانى Llama 1 في بعض الأحيان من صعوبة في الفهم الدقيق وأعطى استجابات غير متسقة.

بعد فترة وجيزة من إطلاق Llama 1، أطلقت Meta Llama 2 في يوليو 2023. تم تدريبه على 2 تريليون رمز. يُمثّل الرمز الرمزي جزءًا من النص، مثل كلمة أو جزء من كلمة، يُستخدم كوحدة أساسية للبيانات للمعالجة في النموذج. تميّز النموذج أيضًا بتحسينات مثل نافذة سياق مضاعفة من 4096 رمزًا لفهم المقاطع الأطول وأكثر من مليون تعليق توضيحي بشري لتقليل الأخطاء. على الرغم من هذه التحسينات، لا يزال Llama 2 بحاجة إلى الكثير من القوة الحاسوبية، وهو أمر تهدف Meta إلى إصلاحه مع Llama 3.

نقدم لك ميتا لاما 3

يأتي برنامج Llama 3 بأربعة متغيرات تم تدريبها على 15 تريليون رمز رمزي مذهل. أكثر من 5% من بيانات التدريب تلك (حوالي 800 مليون رمز) تمثل بيانات ب 30 لغة مختلفة. يمكن تشغيل جميع متغيرات Llama 3 على أنواع مختلفة من الأجهزة الاستهلاكية ويبلغ طول سياقها 8 آلاف رمز.

_w_f_reserved_nherit — الشكل 1. لاما 3 مقابل لاما 2.

تأتي متغيرات النموذج في حجمين: 8B و70B، مما يشير إلى 8 مليار و70 مليار معلمة على التوالي. هناك أيضًا نسختان، نسخة أساسية ونسخة إرشادية. تشير كلمة "أساسي" إلى الإصدار القياسي المُعد مسبقًا. أما "إرشادات" فهي نسخة مُعدّلة ومُحسّنة لتطبيقات أو مجالات محددة من خلال تدريب إضافي على البيانات ذات الصلة.

هذه هي متغيرات طرازات لاما 3:

ميتا لاما 3-8 ب: يوفر نموذج 8B الأساسي قدرات الذكاء الاصطناعي الأساسية، وهو مثالي للمهام العامة مثل تطوير روبوتات الدردشة لخدمة العملاء.
‍
ميتا لاما-3-8ب-تعليمات: نسخة تعليمية مضبوطة بدقة من نموذج 8B تم تحسينها لمهام محددة. على سبيل المثال، يمكن استخدامه لإنشاء أدوات تعليمية تشرح مواضيع معقدة.
‍
Meta-Llama-3-70b: تم تصميم النموذج الأساسي 70B لتطبيقات الذكاء الاصطناعي عالية الأداء. سيعمل هذا النموذج بشكل جيد لتطبيقات مثل معالجة الأدبيات الطبية الحيوية واسعة النطاق لاكتشاف الأدوية.
‍
Meta-Llama-3-70b-instruct: تم ضبط هذا الإصدار بدقة من طراز 70B للتطبيقات عالية الدقة، مثل تحليل المستندات القانونية أو الطبية، حيث تكون الدقة أمرًا بالغ الأهمية.

بنية نموذج لاما 3 من Meta's Llama 3

كما هو الحال مع أي تطورات أخرى في مجال الذكاء الاصطناعي للذكاء الاصطناعي (Meta AI)، تم وضع تدابير صارمة لمراقبة الجودة للحفاظ على سلامة البيانات وتقليل التحيزات أثناء تطوير Llama 3. لذا، فإن المنتج النهائي هو نموذج قوي تم إنشاؤه بمسؤولية.

تتميز بنية نموذج Llama 3 بتركيزها على الكفاءة والأداء في مهام معالجة اللغة الطبيعية. وهو مبني على إطار عمل قائم على المحولات، ويركز على الكفاءة الحسابية، خاصةً أثناء توليد النصوص، باستخدام بنية تعتمد على وحدة فك الترميز فقط.

يُنشئ النموذج مخرجات بناءً على السياق السابق فقط دون الحاجة إلى مُشفِّر لتشفير المدخلات مما يجعله أسرع بكثير.

تحتوي نماذج Llama 3 على أداة ترميز مع مفردات مكونة من 128 ألف رمز. تعني المفردات الأكبر أن النماذج يمكنها فهم النص ومعالجته بشكل أفضل. أيضًا، تستخدم النماذج الآن الانتباه إلى الاستعلام المجمّع (GQA) لتحسين كفاءة الاستدلال. GQA هي تقنية يمكنك اعتبارها بمثابة ضوء كشاف يساعد النماذج على التركيز على الأجزاء ذات الصلة من البيانات المدخلة لتوليد استجابات أسرع وأكثر دقة.

فيما يلي بعض التفاصيل الأكثر إثارة للاهتمام حول بنية نموذج Llama 3:

معالجة المستندات المدركة للحدود: تحافظ Llama 3 على الوضوح عبر حدود المستندات، وهو أمر أساسي لمهام مثل التلخيص.
‍
فهم أفضل للأكواد البرمجية: تتضمن بيانات التدريب الخاصة بـ Llama 3 عينات أكواد أكثر بأربع مرات، مما يعزز قدراته في البرمجة.
‍
مراقبة جودة قوية: تضمن التدابير الصارمة، بما في ذلك الفلاتر الاستدلالية وإزالة NSFW، سلامة البيانات وتقليل التحيزات.

يعمل Llama 3 على تغيير طريقة تعاملنا مع تدريب النماذج

لتدريب أكبر نماذج Llama 3، تم الجمع بين ثلاثة أنواع من التوازي: توازي البيانات، وتوازي النماذج، وتوازي خط الأنابيب.

يقسم توازي البيانات بيانات التدريب على وحدات معالجة رسومات متعددة، بينما يقسم توازي النماذج بنية النموذج لاستخدام القوة الحسابية لكل وحدة معالجة رسومات. تقسم موازاة خط الأنابيب عملية التدريب إلى مراحل متسلسلة، مما يؤدي إلى تحسين الحوسبة والاتصالات.

حقق التطبيق الأكثر كفاءة استخدامًا ملحوظًا للحوسبة حيث تجاوز 400 وحدة معالجة رسومية (GPU) لكل وحدة معالجة رسومية (GPU) عند التدريب على 16,000 وحدة معالجة رسومية (GPU) في وقت واحد. أُجريت عمليات التدريب هذه على مجموعتين مخصصتين لوحدات معالجة الرسومات تضم كل منهما 24,000 وحدة معالجة رسومات. وقد وفرت هذه البنية التحتية الحاسوبية الكبيرة القوة اللازمة لتدريب نماذج Llama 3 واسعة النطاق بكفاءة.

ولزيادة وقت تشغيل وحدة معالجة الرسومات إلى أقصى حد، تم تطوير مكدس تدريب جديد متقدم، مما أدى إلى أتمتة اكتشاف الأخطاء ومعالجتها وصيانتها. تم تحسين موثوقية الأجهزة وآليات الكشف بشكل كبير للتخفيف من مخاطر تلف البيانات الصامتة. أيضًا، تم تطوير أنظمة تخزين جديدة قابلة للتطوير لتقليل نفقات التحقق والتراجع.

وقد أدت هذه التحسينات إلى زيادة فعالية التدريب بنسبة تزيد عن 95%. وقد زادت هذه التحسينات مجتمعةً من كفاءة تدريب Llama 3 بمقدار ثلاثة أضعاف تقريباً مقارنةً بـ Llama 2. هذه الكفاءة ليست مثيرة للإعجاب فحسب، بل إنها تفتح إمكانيات جديدة لأساليب تدريب الذكاء الاصطناعي.

فتح الأبواب مع لاما 3

نظرًا لأن Llama 3 مفتوح المصدر، يمكن للباحثين والطلاب دراسة شيفرته البرمجية وإجراء التجارب والمشاركة في المناقشات حول المخاوف الأخلاقية والتحيزات. ومع ذلك، فإن Llama 3 ليس فقط للأكاديميين. فهو يحقق نجاحًا في التطبيقات العملية أيضًا. فقد أصبح العمود الفقري لواجهة دردشة Meta AI، حيث يندمج بسلاسة في منصات مثل فيسبوك وإنستغرام وواتساب وماسنجر. باستخدام Meta AI، يمكن للمستخدمين الانخراط في محادثات باللغة الطبيعية، والوصول إلى توصيات مخصصة، وأداء المهام، والتواصل مع الآخرين بسهولة.

مقارنة LLAMA 3 مع LLMs الأخرى

يؤدي Llama 3 أداءً جيدًا بشكل استثنائي في العديد من المعايير الرئيسية التي تقيّم قدرات الفهم اللغوي المعقد والاستدلال. فيما يلي بعض المعايير التي تختبر جوانب مختلفة من قدرات Llama 3:

الفهم اللغوي الشامل متعدد المهام (MMLU) - يقيس معرفته في مختلف المجالات.
‍
الإجابة على الأسئلة ذات الأغراض العامة (GPQA) - تقييم قدرة النموذج على توليد إجابات متماسكة وصحيحة لمجموعة واسعة من أسئلة المعرفة العامة.
‍
HumanEval - يركز على مهام البرمجة وحل المشكلات، ويختبر قدرة النموذج على توليد كود برمجة وظيفي وحل تحديات الخوارزميات.

إن نتائج Llama 3 المتميزة في هذه الاختبارات تميزه بوضوح عن منافسيه مثل Gemma 7B من Google، وMistral 7B من Mistral، وClaude 3 Sonnet من Anthropic. ووفقًا للإحصائيات المنشورة، لا سيما الطراز 70B، يتفوق Llama 3 على هذه النماذج في جميع المعايير المذكورة أعلاه.

يتم إتاحة Meta Llama 3 على نطاق واسع

تعمل Meta على توسيع نطاق وصول Llama 3 من خلال إتاحته عبر مجموعة متنوعة من المنصات لكل من المستخدمين العاديين والمطورين. بالنسبة للمستخدمين العاديين، تم دمج Llama 3 في منصات Meta الشهيرة مثل WhatsApp وInstagram وFacebook وMessenger. يمكن للمستخدمين الوصول إلى ميزات متقدمة مثل البحث في الوقت الفعلي والقدرة على إنشاء محتوى إبداعي مباشرةً داخل هذه التطبيقات.

كما يتم دمج Llama 3 في التقنيات القابلة للارتداء مثل نظارات Ray-Ban Meta الذكية وسماعة Meta Quest VR للتجارب التفاعلية.

يتوفر Llama 3 على مجموعة متنوعة من المنصات للمطورين، بما في ذلك AWS وDatabricks وGoogle Cloud وHugging Face وKaggle وIBM WatsonX وMicrosoft Azure وNVIDIA NIM وSnowflake. يمكنك أيضاً الوصول إلى هذه النماذج مباشرةً من Meta. تجعل المجموعة الواسعة من الخيارات من السهل على المطورين دمج إمكانات نماذج الذكاء الاصطناعي المتقدمة هذه في مشاريعهم، سواء كانوا يفضلون العمل مباشرةً مع Meta أو من خلال منصات أخرى شائعة.

الوجبات الجاهزة

تستمر تطورات التعلم الآلي في تغيير طريقة تفاعلنا مع التكنولوجيا كل يوم. يُظهر Llama 3 من Meta أن تعلم الآلة الآلي لم يعد يقتصر على توليد النصوص فقط. فآلات التعلم الآلي تعالج المشاكل المعقدة وتتعامل مع لغات متعددة. وبشكل عام، يجعل Llama 3 من الذكاء الاصطناعي أكثر قابلية للتكيف وسهولة الوصول إليه أكثر من أي وقت مضى. وبالنظر إلى المستقبل، تعد الترقيات المخطط لها ل Llama 3 بمزيد من القدرات، مثل التعامل مع نماذج متعددة وفهم سياقات أكبر.

اطلع على مستودع GitHub الخاص بنا وانضم إلى مجتمعنا لمعرفة المزيد عن الذكاء الاصطناعي. قم بزيارة صفحات الحلول الخاصة بنا لمعرفة كيفية تطبيق الذكاء الاصطناعي في مجالات مثل التصنيع والزراعة.

التعرف على لاما ميتا لاما 3

تطور نماذج ميتا لاما ميتا

نقدم لك ميتا لاما 3

بنية نموذج لاما 3 من Meta's Llama 3

يعمل Llama 3 على تغيير طريقة تعاملنا مع تدريب النماذج

فتح الأبواب مع لاما 3

مقارنة LLAMA 3 مع LLMs الأخرى

يتم إتاحة Meta Llama 3 على نطاق واسع

الوجبات الجاهزة

اقرأ المزيد في هذه الفئة

أتمتة التصنيع باستخدام الذكاء الاصطناعي البصري

شرح إنترنت الأشياء الصناعية (IIoT)

كيف يُصنع الشاي باستخدام تقنيات مثل Vision AI؟

دعونا نبني المستقبل
للذكاء الاصطناعي معاً!

التعرف على لاما ميتا لاما 3

تطور نماذج ميتا لاما ميتا

نقدم لك ميتا لاما 3

بنية نموذج لاما 3 من Meta's Llama 3

يعمل Llama 3 على تغيير طريقة تعاملنا مع تدريب النماذج

فتح الأبواب مع لاما 3

مقارنة LLAMA 3 مع LLMs الأخرى

يتم إتاحة Meta Llama 3 على نطاق واسع

الوجبات الجاهزة

اقرأ المزيد في هذه الفئة

أتمتة التصنيع باستخدام الذكاء الاصطناعي البصري

شرح إنترنت الأشياء الصناعية (IIoT)

كيف يُصنع الشاي باستخدام تقنيات مثل Vision AI؟

دعونا نبني المستقبل للذكاء الاصطناعي معاً!

دعونا نبني المستقبل
للذكاء الاصطناعي معاً!