Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

الجيل المعزز بالاسترجاع (RAG)

اكتشف كيف يعزز الجيل المعزز بالاسترجاع (RAG) نماذج الذكاء الاصطناعي من خلال دمج بيانات خارجية موثوقة وفي الوقت الفعلي للحصول على استجابات دقيقة وحديثة.

الجيل المعزز للاسترجاع (RAG) هو إطار عمل متقدم مصمم لتحسين مخرجات نماذج اللغات الكبيرة (LLMs) من خلال بالرجوع إلى قاعدة معرفية موثوقة خارج بيانات التدريب الأصلية. في أنظمة أنظمة الذكاء الاصطناعي التوليدي القياسية، يعتمد النموذج فقط على المعلومات الثابتة التي تعلمها أثناء التدريب، مما قد يؤدي إلى إجابات قديمة أو أخطاء واقعية تُعرف باسم الهلوسة. يعمل RAG على سد هذه الفجوة من خلال استرجاع المعلومات المحدثة ذات الصلة من مصادر خارجية موثوقة وتغذيتها للنموذج كسياق قبل توليد استجابة. تعمل هذه العملية بفعالية على تأصيل الذكاء الاصطناعي، مما يضمن الدقة والملاءمة العالية دون الحاجة إلى إعادة تدريب مكلفة للنموذج.

كيف يعمل التوليد المعزز للاسترجاع

يدمج سير عمل RAG مكونين أساسيين: نظام الاسترجاع ونموذج التوليد. هذا التآزر يحول كيف معالجة اللغة الطبيعية (NLP) تنفيذ المهام.

  1. الاسترجاع: عندما يقوم المستخدم بإرسال استعلام، يقوم النظام أولاً بالبحث في قاعدة معرفية متخصصة، عادةً ما تكون مخزنة في قاعدة بيانات متجهة. تحتوي قاعدة البيانات هذه على التضمينات -تمثيلات رقميةللنص أو أو البيانات التي تسمح بالبحث الدلالي الفعال. يحدد المسترجع المستندات أو مقتطفات البيانات الأكثر تشابهًا من الناحية الدلالية مع طلب المستخدم.
  2. التعزيز: يتم بعد ذلك دمج المعلومات المسترجعة مع استعلام المستخدم الأصلي باستخدام تقنيات الهندسة الفورية. هذا "المعززة" هذا يزود النموذج بالسياق الواقعي الضروري الذي كان يفتقر إليه في البداية.
  3. التوليد: أخيرًا، يتم تمرير المطالبة المخصّبة إلى نموذج التوليد. يستخدم النموذج السياق المقدم لتوليد إجابة متماسكة وواقعية. غالبًا ما تُستخدم الأطر الرائدة مثل LangChain غالبًا ما تُستخدم لتنسيق هذه الخطوات بسلاسة.

تطبيقات واقعية

يعد RAG ضروريًا في الصناعات التي تتغير فيها البيانات بشكل متكرر أو حيث تكون الدقة أمرًا بالغ الأهمية.

  • إدارة المعرفة المؤسسية: تستخدم المؤسسات RAG لتشغيل روبوتات المحادثة الداخلية التي تساعد الموظفين. على سبيل المثال، يمكن لمساعد الموارد البشرية استرداد أحدث مستندات السياسة من خادم الشركة للإجابة عن الأسئلة المتعلقة بالمزايا. وهذا يضمن التزام الذكاء الاصطناعي ببروتوكولات الشركة المحددة بدلاً من المعرفة العامة بالإنترنت.
  • دعم القرار السريري: في المجال الطبي, يستفيد الذكاء الاصطناعي في مجال الرعاية الصحية بشكل كبير من RAG. حيث يمكن للنظام استرجاع أحدث الأبحاث الطبية أو سجلات التاريخ المرضي لمريض معين لمساعدة الأطباء في التشخيص، مما يضمن أن النمذجة التنبؤية مبنية على أحدث العلم بدلاً من التاريخ النهائي للنموذج.

استرجاع المعلومات المعزز (RAG) في مجال رؤية الحاسوب

على الرغم من أن مفاهيم RAG تعتمد تقليديًا على النصوص، إلا أن مفاهيم RAG تتوسع في الرؤية الحاسوبية (CV). في نموذج متعدد الوسائط، قد يسترجع النظام صور متشابهة أو بيانات وصفية مرئية للمساعدة في اكتشاف الأجسام أو تصنيفها. على سبيل المثال يمكن تحسين عملية تحديد عينة بيولوجية نادرة من خلال استرجاع صور مرجعية من قاعدة بيانات علمية تعزيز التحليل المرئي الذي تقوم به نماذج مثل Ultralytics YOLO11.

ضبط RAG مقابل الضبط الدقيق

من المهم التمييز بين RAG والضبط الدقيق، حيث إنهما لأنهما يحلان مشاكل مختلفة:

  • يربط RAG نموذجًا بحقائق ديناميكية خارجية. إنه الأفضل للتطبيقات التي تتطلب معلومات محدثة معلومات حديثة وقابلية التحقق. لا يغير المعلمات الداخلية للنموذج.
  • ينطوي الضبط الدقيق على مزيد من التدريب النموذج على مجموعة بيانات محدّدة لضبط أوزان النموذج أوزان النموذج. هذا مثالي لتعليم نموذج أسلوب أو نغمة معينة أو سلوك مهمة محددة، لكنه أقل فعالية للحفاظ على قاعدة معرفية من الحقائق المتغيرة بسرعة. غالبًا ما يستخدم المطورون نقل التعلم للجمع بين كلا النهجين لتحقيق الأداء الأمثل.

مثال: تعزيز موجه مع بيانات الكشف

في مثال Python هذا، نقوم بمحاكاة سير عمل RAG الأساسي باستخدام نموذج اكتشاف الكائنات "لاسترداد" حقائق حول صورة ما. ثم تعزز هذه الحقائق مطالبة نصية، مما يؤسس الوصف في البيانات المرئية التي تم التحقق منها.

from ultralytics import YOLO

# Load the YOLO11 model acting as our 'retrieval' mechanism for visual facts
model = YOLO("yolo11n.pt")

# Run inference to retrieve content information from the image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract detected classes to augment the prompt
detected_objects = [model.names[int(cls)] for cls in results[0].boxes.cls]
context_string = ", ".join(set(detected_objects))

# Construct the augmented prompt (RAG concept)
prompt = f"Based on the verified presence of {context_string} in the scene, describe the traffic situation."
print(f"Augmented Prompt: {prompt}")

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن