اكتشف كيف يعزز الجيل المعزز بالاسترجاع (RAG) نماذج الذكاء الاصطناعي من خلال دمج بيانات خارجية موثوقة وفي الوقت الفعلي للحصول على استجابات دقيقة وحديثة.
الجيل المعزز للاسترجاع (RAG) هو إطار عمل متقدم مصمم لتحسين مخرجات نماذج اللغات الكبيرة (LLMs) من خلال بالرجوع إلى قاعدة معرفية موثوقة خارج بيانات التدريب الأصلية. في أنظمة أنظمة الذكاء الاصطناعي التوليدي القياسية، يعتمد النموذج فقط على المعلومات الثابتة التي تعلمها أثناء التدريب، مما قد يؤدي إلى إجابات قديمة أو أخطاء واقعية تُعرف باسم الهلوسة. يعمل RAG على سد هذه الفجوة من خلال استرجاع المعلومات المحدثة ذات الصلة من مصادر خارجية موثوقة وتغذيتها للنموذج كسياق قبل توليد استجابة. تعمل هذه العملية بفعالية على تأصيل الذكاء الاصطناعي، مما يضمن الدقة والملاءمة العالية دون الحاجة إلى إعادة تدريب مكلفة للنموذج.
يدمج سير عمل RAG مكونين أساسيين: نظام الاسترجاع ونموذج التوليد. هذا التآزر يحول كيف معالجة اللغة الطبيعية (NLP) تنفيذ المهام.
يعد RAG ضروريًا في الصناعات التي تتغير فيها البيانات بشكل متكرر أو حيث تكون الدقة أمرًا بالغ الأهمية.
على الرغم من أن مفاهيم RAG تعتمد تقليديًا على النصوص، إلا أن مفاهيم RAG تتوسع في الرؤية الحاسوبية (CV). في نموذج متعدد الوسائط، قد يسترجع النظام صور متشابهة أو بيانات وصفية مرئية للمساعدة في اكتشاف الأجسام أو تصنيفها. على سبيل المثال يمكن تحسين عملية تحديد عينة بيولوجية نادرة من خلال استرجاع صور مرجعية من قاعدة بيانات علمية تعزيز التحليل المرئي الذي تقوم به نماذج مثل Ultralytics YOLO11.
من المهم التمييز بين RAG والضبط الدقيق، حيث إنهما لأنهما يحلان مشاكل مختلفة:
في مثال Python هذا، نقوم بمحاكاة سير عمل RAG الأساسي باستخدام نموذج اكتشاف الكائنات "لاسترداد" حقائق حول صورة ما. ثم تعزز هذه الحقائق مطالبة نصية، مما يؤسس الوصف في البيانات المرئية التي تم التحقق منها.
from ultralytics import YOLO
# Load the YOLO11 model acting as our 'retrieval' mechanism for visual facts
model = YOLO("yolo11n.pt")
# Run inference to retrieve content information from the image
results = model("https://ultralytics.com/images/bus.jpg")
# Extract detected classes to augment the prompt
detected_objects = [model.names[int(cls)] for cls in results[0].boxes.cls]
context_string = ", ".join(set(detected_objects))
# Construct the augmented prompt (RAG concept)
prompt = f"Based on the verified presence of {context_string} in the scene, describe the traffic situation."
print(f"Augmented Prompt: {prompt}")