اكتشف كيف تقوم LoRA بضبط نماذج الذكاء الاصطناعي الكبيرة مثل YOLO بكفاءة، مما يقلل من التكاليف ويتيح نشر الحافة بأقل قدر من الموارد.
تقنية LoRA (التكيف منخفض الرتبة) هي تقنية فعالة تُستخدم لتكييف نماذج التعلم الآلي الكبيرة المدربة مسبقًا، مثل تلك المستخدمة في معالجة اللغة الطبيعية أو الرؤية الحاسوبية، مع مهام أو مجموعات بيانات محددة دون إعادة تدريب النموذج بأكمله. كما أنه يقلل بشكل كبير من التكلفة الحسابية ومتطلبات الذاكرة المرتبطة بضبط النماذج الضخمة، مما يجعل الذكاء الاصطناعي المتقدم أكثر سهولة. تندرج LoRA تحت مظلة أساليب الضبط الدقيق الفعال للمعلمات (PEFT) ، والتي تركز على تكييف النماذج بأقل قدر من التغييرات على معاييرها.
يتضمن الضبط الدقيق التقليدي تحديث جميع المعلمات (أو أوزان النموذج) لنموذج مُدرَّب مسبقاً باستخدام بيانات جديدة. بالنسبة للنماذج التي تحتوي على مليارات المعلمات، مثل العديد من نماذج LLMs الحديثة أو نماذج الرؤية الكبيرة، تتطلب هذه العملية موارد حاسوبية كبيرة، خاصةً GPU والوقت. تعمل LoRA على المبدأ الذي تدعمه الأبحاث، وهو أن التغييرات اللازمة لتكييف نموذج ما غالبًا ما تكون في مساحة منخفضة الأبعاد، مما يعني أنها لا تتطلب تغيير كل وزن على حدة.
وبدلاً من تعديل جميع الأوزان الأصلية، تقوم LoRA بتجميدها وحقن مصفوفات أصغر حجماً وقابلة للتدريب "منخفضة الرتبة" في طبقات محددة من بنية النموذج، وغالباً ما تكون ضمن كتل المحولات (وهو مكون شائع في العديد من النماذج الكبيرة، وقد تم شرحه بمزيد من التفصيل في ورقة "الانتباه هو كل ما تحتاجه"). يتم تحديث هذه المصفوفات المضافة حديثًا فقط (غالبًا ما تسمى المحولات) أثناء عملية الضبط الدقيق. هذا يقلل بشكل كبير من عدد المعلمات القابلة للتدريب، غالبًا بأوامر من حيث الحجم (على سبيل المثال، الملايين بدلاً من المليارات)، مع الاستمرار في تحقيق أداء مماثل للضبط الدقيق الكامل في العديد من الحالات. توفر ورقة بحث LoRA الأصلية مزيدًا من التفاصيل الفنية حول المنهجية وفعاليتها. هذا النهج يجعل عملية الضبط الدقيق أسرع بكثير وأقل استهلاكاً للذاكرة.
الميزة الأساسية لـ LoRA هي كفاءتها، مما يؤدي إلى العديد من الفوائد الرئيسية:
إن كفاءة LoRA تجعلها ذات قيمة في مختلف المجالات:
من المفيد التمييز بين LoRA وتقنيات تكييف النماذج الأخرى:
باختصار، يوفر نظام LoRA طريقة قوية وفعالة من حيث الموارد لتخصيص نماذج أساسية كبيرة مدربة مسبقًا لمجموعة واسعة من المهام المحددة في كل من البرمجة اللغوية العصبية والرؤية الحاسوبية، مما يجعل الذكاء الاصطناعي المتقدم أكثر عملية وسهولة.