Large Language Model (LLM)
استكشف أساسيات نماذج اللغة الكبيرة (LLMs). تعلم عن معمارية المحولات، والترميز، وكيفية دمج LLMs مع Ultralytics YOLO26.
يعد النموذج اللغوي الكبير (LLM) نوعاً متطوراً من الذكاء الاصطناعي (AI) يتم تدريبه على مجموعات بيانات ضخمة لفهم اللغة البشرية وتوليدها ومعالجتها. تمثل هذه النماذج تطوراً كبيراً في التعلم العميق (DL)، حيث تستخدم شبكات عصبية تحتوي على مليارات المعلمات لالتقاط الأنماط اللغوية والقواعد والعلاقات الدلالية المعقدة. وفي جوهرها، تعتمد معظم نماذج LLM الحديثة على بنية Transformer، التي تسمح لها بمعالجة تسلسلات البيانات بالتوازي بدلاً من المعالجة التسلسلية. تستخدم هذه البنية آلية الانتباه الذاتي (self-attention mechanism)، مما يمكّن النموذج من موازنة أهمية الكلمات المختلفة في الجملة بالنسبة لبعضها البعض، بغض النظر عن المسافة بينها في النص.
Link to this sectionالآليات الأساسية لنماذج LLM#
تبدأ وظيفة نموذج LLM بـ الترميز (tokenization)، وهي عملية يتم فيها تقسيم النص الخام إلى وحدات أصغر تسمى رموزاً (كلمات أو أجزاء من كلمات). خلال مرحلة تدريب النموذج (model training)، يحلل النظام بيتابايت من النصوص من الإنترنت والكتب والمقالات. وهو يشارك في التعلم غير الخاضع للإشراف (unsupervised learning) للتنبؤ بالرمز التالي في تسلسل ما، مما يجعله يتعلم الهيكل الإحصائي للغة بشكل فعال.
بعد هذا التدريب الأولي، غالباً ما يطبق المطورون الضبط الدقيق (fine-tuning) لتخصيص النموذج لمهام معينة، مثل التحليل الطبي أو المساعدة في البرمجة. وتعد هذه القدرة على التكيف هي السبب في تصنيف مؤسسات مثل مركز ستانفورد لبحوث نماذج الأساس (Stanford Center for Research on Foundation Models) لها على أنها "نماذج أساس" (foundation models) — أي قواعد واسعة تُبنى عليها تطبيقات محددة.
Link to this sectionتطبيقات العالم الحقيقي#
لقد تجاوزت نماذج LLM الأبحاث النظرية إلى تطبيقات عملية ذات تأثير عالٍ عبر مختلف الصناعات:
- المساعدون الافتراضيون الأذكياء: تعتمد خدمة العملاء الحديثة بشكل كبير على روبوتات الدردشة (chatbots) المدعومة بنماذج LLM. وعلى عكس الأنظمة القديمة القائمة على القواعد، يمكن لهذه الوكلاء التعامل مع الاستفسارات الدقيقة. ولتحسين الدقة وتقليل الهلوسة (hallucinations)، يقوم المطورون بدمج التوليد المعزز بالاسترجاع (RAG)، مما يسمح للنموذج بالرجوع إلى وثائق الشركة الخارجية والمحدثة قبل تقديم الإجابة.
- أنظمة الرؤية واللغة متعددة الوسائط: تربط طليعة الذكاء الاصطناعي بين النص والبيانات المرئية. تسمح نماذج الرؤية واللغة (VLMs) للمستخدمين بالاستعلام عن الصور باستخدام اللغة الطبيعية. على سبيل المثال، دمج واجهة لغوية مع كاشف قوي مثل YOLO26 يُمكّن الأنظمة من تحديد ووصف الكائنات في خلاصات الفيديو المباشرة بناءً على الأوامر المنطوقة.
Link to this sectionالربط بين النص والرؤية باستخدام الكود#
بينما تعالج نماذج LLM القياسية النصوص، تتحول الصناعة نحو الذكاء الاصطناعي متعدد الوسائط (Multimodal AI). يوضح المثال التالي كيف يمكن للمطالبات اللغوية التحكم في مهام رؤية الحاسوب باستخدام YOLO-World، وهو نموذج يفهم الأوصاف النصية للكشف عن المفردات المفتوحة.
from ultralytics import YOLOWorld
# Load a model capable of understanding natural language prompts
model = YOLOWorld("yolov8s-world.pt")
# Define custom classes using text descriptions rather than fixed labels
model.set_classes(["person wearing a red helmet", "blue industrial machine"])
# Run inference to detect these specific text-defined objects
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Show results
results[0].show()Link to this sectionالتمييز بين المفاهيم ذات الصلة#
من المهم التمييز بين نماذج LLM والمصطلحات الأوسع أو الموازية لها:
- LLM مقابل معالجة اللغات الطبيعية (NLP): إن NLP هو المجال الأكاديمي الشامل المعني بالتفاعل بين أجهزة الحاسوب واللغة البشرية. بينما يعد نموذج LLM أداة أو تقنية محددة تُستخدم داخل ذلك المجال لتحقيق نتائج متطورة.
- LLM مقابل الذكاء الاصطناعي التوليدي (Generative AI): الذكاء الاصطناعي التوليدي هو فئة تشمل أي ذكاء اصطناعي قادر على إنشاء محتوى جديد. تعد نماذج LLM هي المجموعة الفرعية القائمة على النص من هذه الفئة، في حين تمثل نماذج مثل Stable Diffusion المجموعة الفرعية لتوليد الصور.
Link to this sectionالتحديات والتوقعات المستقبلية#
على الرغم من قدراتها، تواجه نماذج LLM تحديات تتعلق بـ التحيز في الذكاء الاصطناعي (bias in AI)، حيث يمكنها إعادة إنتاج التحيزات الموجودة في بيانات تدريبها دون قصد. علاوة على ذلك، تثير القوة الحسابية الهائلة المطلوبة لتدريب نماذج مثل GPT-4 أو Google Gemini مخاوف بشأن استهلاك الطاقة. وتركز الأبحاث حالياً على كمية النماذج (model quantization) لجعل هذه الأنظمة فعالة بما يكفي للعمل على أجهزة الحافة.
للحصول على رؤى تقنية أعمق، توفر الورقة البحثية الأصلية Attention Is All You Need النظرية التأسيسية لنماذج Transformers. يمكنك أيضاً استكشاف كيف تقوم NVIDIA بتحسين الأجهزة لهذه المهام الضخمة.






