Explore how prompt enrichment automates input augmentation to improve AI accuracy. Learn to optimize LLMs and vision models like [YOLO26](https://docs.ultralytics.com/models/yolo26/) for better results.
الإثراء الفوري هو عملية آلية لتعزيز المدخلات الأولية للمستخدم بالسياق ذي الصلة أو التعليمات المحددة أو البيانات التكميلية قبل إرسالها إلى نموذج الذكاء الاصطناعي (AI). تعمل هذه التقنية كطبقة برمجية وسيطة ذكية تعمل على تحسين التفاعل بين البشر والآلات، مما يضمن تلقي نماذج اللغة الكبيرة (LLMs) وأنظمة الرؤية الحاسوبية استفسارات شاملة. من خلال إدخال التفاصيل التي قد يغفلها المستخدم — مثل التفضيلات التاريخية أو بيانات الموقع أو القيود التقنية — يعمل الإثراء الفوري على تحسين دقة وتخصيص مخرجات النموذج بشكل كبير دون الحاجة إلى أن يكون المستخدم خبيرًا في صياغة تعليمات مفصلة.
تتمثل الوظيفة الأساسية للإثراء الفوري في سد الفجوة بين النية البشرية الغامضة والمدخلات الدقيقة والغنية بالبيانات التي تتطلبها النماذج لتحقيق الأداء الأمثل. عند تلقي استعلام، يقوم النظام بتحليله واسترداد المعلومات الأساسية الضرورية من رسم بياني معرفي أو قاعدة بيانات منظمة. يتم تنسيق البيانات المستردة برمجياً وإلحاقها بالاستعلام الأصلي.
على سبيل المثال، في عمليات معالجة اللغة الطبيعية (NLP) ، فإن سؤالًا بسيطًا مثل "ما هو الوضع؟" غير كافٍ من الناحية السياقية. يقوم نظام الإثراء بتحديد الجلسة النشطة، واسترداد أحدث رقم طلب من قاعدة بيانات المعاملات، وإعادة كتابة المطالبة إلى: "يسأل المستخدم عن الطلب رقم 998، الذي هو قيد النقل حاليًا. قدم تحديثًا للشحن بناءً على هذه الحالة." غالبًا ما تستخدم هذه العملية قواعد بيانات متجهة للعثور بسرعة على سياق ذي صلة من الناحية الدلالية لإدراجه.
يعد الإثراء الفوري ضروريًا لنشر تطبيقات الذكاء الاصطناعي التوليدي القوية في مختلف الصناعات، وتعزيز الأنظمة القائمة على النصوص والرؤية:
ما يلي Python example demonstrates the concept of prompt enrichment using
the ultralytics package. Here, a user's high-level intent is programmatically enriched into a list of
specific descriptive classes that the model scans for.
from ultralytics import YOLO
def run_enriched_inference(user_mode):
"""Enriches a simple user mode into specific detection prompts."""
# Load a YOLO-World model capable of open-vocabulary detection
model = YOLO("yolov8s-world.pt")
# Enrichment Logic: Map simple user intent to detailed class prompts
context_map = {
"site_safety": ["hard hat", "safety vest", "gloves"],
"traffic": ["car", "bus", "traffic light", "pedestrian"],
}
# Inject the enriched context into the model
enriched_classes = context_map.get(user_mode, ["object"])
model.set_classes(enriched_classes)
# The model now looks for the specific enriched terms
print(f"Mode: {user_mode} -> Enriched Prompt: {enriched_classes}")
run_enriched_inference("site_safety")
لتنفيذ عمليات التعلم الآلي (MLOps)، من المفيد التمييز بين الإثراء الفوري والمصطلحات المشابهة:
As models like Ultralytics YOLO26 and GPT-4 become more capable, the bottleneck often shifts to the quality of the input. Prompt enrichment mitigates hallucinations in LLMs by grounding the model in factual, provided data. In computer vision (CV), it allows for flexible, zero-shot learning detection systems that can adapt to new environments instantly without retraining, simply by modifying the text prompts fed into the system. This flexibility is crucial for building scalable, multi-modal AI solutions that can reason over both text and images. Users looking to manage datasets used for grounding these systems often rely on tools like the Ultralytics Platform to organize and annotate their information effectively.