Prompt Compression

استكشف كيف يعمل ضغط المطالبات على تحسين كفاءة الذكاء الاصطناعي. تعلم تقليل استخدام الرموز في نماذج اللغات الكبيرة، وخفض التكاليف، وتعزيز سرعة الاستدلال باستخدام Ultralytics YOLO26 اليوم.

ضغط المطالبة هو تقنية تحسين متقدمة مصممة لتقليل طول وتعقيد النصوص المدخلة المقدمة إلى نماذج اللغات الكبيرة (LLMs) والنماذج متعددة الوسائط. من خلال إزالة الكلمات الزائدة والسياق غير ذي الصلة وكلمات التوقف خوارزمياً مع الحفاظ على المعنى الدلالي الجوهري، يسمح ضغط المطالبة لأنظمة الذكاء الاصطناعي بمعالجة المعلومات بكفاءة أكبر. وتصبح هذه الطريقة ذات أهمية متزايدة لتقليل التكاليف الحسابية، وتقليل زمن انتقال الاستدلال، ومنع النماذج من تجاوز الحد الأقصى لـ نافذة السياق الخاصة بها.

Link to this sectionكيف يعمل ضغط المطالبة#

على المستوى المعماري، غالباً ما يستخدم ضغط المطالبة نماذج أصغر ومتخصصة أو خوارزميات نظرية المعلومات لتقييم أهمية كل رمز (token) في مطالبة معينة. تحدد تقنيات مثل دمج الرموز والتقليم القائم على الإنتروبيا الرموز التي تساهم بالقليل في المعنى العام وتزيلها. وهذا يضمن أن المدخلات النهائية تحتوي فقط على المعلومات الأكثر كثافة.

تسلط الأبحاث الحديثة من المنظمات الموثوقة الضوء على أن المطالبات المضغوطة للغاية يمكنها الحفاظ على الأداء في مهام الاستدلال المعقدة مع تقليل استهلاك الرموز بشكل كبير. بالنسبة للمطورين الذين يدمجون الذكاء الاصطناعي في تطبيقات قابلة للتوسع، فإن الالتزام بـ إرشادات تحسين المطالبة من OpenAI والاستفادة من أطر عمل الضغط تعد ممارسة قياسية لأفضل الممارسات من أجل النشر الفعال.

Link to this sectionتطبيقات العالم الحقيقي#

يوفر ضغط المطالبة قيمة فورية في السيناريوهات التي تتطلب معالجة سريعة للبيانات النصية أو المرئية المكثفة:

التوليد المعزز بالاسترجاع (RAG): في تطبيقات البحث المؤسسي، غالباً ما تسترجع مسارات RAG عشرات الوثائق الطويلة للإجابة على استعلام واحد للمستخدم. تعمل خوارزميات ضغط المطالبة على تقليص هذه الوثائق المسترجعة، وتقطيرها في ملخصات واقعية موجزة قبل تغذيتها إلى نموذج التوليد. وهذا يمنع فيضان الرموز ويسرع الاستدلال في الوقت الفعلي.
وكلاء الذكاء الاصطناعي المستقلون: يجب على الوكلاء وروبوتات الدردشة الاحتفاظ بذاكرة طويلة المدى لتفاعلات المستخدم. بدلاً من تمرير سجل المحادثة بالكامل في كل استعلام جديد، تلخص تقنيات الضغط أدوار الحوار القديمة، مما يضمن بقاء الوكيل على دراية بالسياق دون تكبد تكاليف حسابية أسية.

Link to this sectionضغط المطالبة مقابل التقنيات ذات الصلة#

لبناء مسارات قوية لـ عمليات تعلم الآلة (MLOps)، من المهم التمييز بين ضغط المطالبة والمفاهيم ذات الصلة:

مقابل تخزين المطالبة مؤقتاً (Prompt Caching): يخزن التخزين المؤقت الحالات الحسابية الداخلية للنصوص التي تمت معالجتها مسبقاً لتجنب إعادة حسابها. من ناحية أخرى، يقوم الضغط بتعديل وتقصير نص الإدخال نفسه بشكل نشط قبل حدوث أي معالجة.
مقابل هندسة المطالبة (Prompt Engineering): هندسة المطالبة هي حرفة بشرية لتصميم تعليمات فعالة. أما الضغط فهو تقليل خوارزمي مؤتمت لتلك التعليمات.
مقابل إثراء المطالبة (Prompt Enrichment): يعمل الإثراء على توسيع المطالبة عن طريق إضافة سياق خارجي، بينما يقللها الضغط. وغالباً ما يتم استخدامهما معاً: قد يقوم النظام بإثراء مطالبة بنتائج قاعدة البيانات ثم ضغط الحمولة النهائية قبل الاستدلال.

Link to this sectionالتنفيذ في الرؤية الحاسوبية#

في الرؤية الحاسوبية (CV)، تنطبق مبادئ ضغط المطالبة عند استخدام نماذج مفتوحة المفردات التي تقبل استعلامات نصية لتحديد الكائنات. الحفاظ على أوصاف الفئات موجزة يضمن تشفيراً نصياً أسرع ويقلل من استهلاك الذاكرة.

بالنسبة لبيئات الإنتاج ذات الفئات الثابتة حيث تكون السرعة أمراً بالغ الأهمية، ينتقل المطورون عادةً من النماذج التي تعتمد على المطالبة النصية إلى نماذج ذات بنية ثابتة ومحسنة للغاية مثل Ultralytics YOLO26. يمكنك إدارة مجموعات البيانات بكفاءة وتدريب هذه النماذج المتطورة باستخدام Ultralytics Platform.

from ultralytics import YOLO

# Load an open-vocabulary YOLO-World model
model = YOLO("yolov8s-world.pt")

# Principle of prompt compression: Use concise, distilled class names
# instead of lengthy, complex descriptions for faster text encoding
compressed_prompts = ["helmet", "vest", "forklift"]
model.set_classes(compressed_prompts)

# Run inference with the optimized class list
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()

Explore solutions

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

Prompt Compression

Link to this sectionكيف يعمل ضغط المطالبة#

Link to this sectionتطبيقات العالم الحقيقي#

Link to this sectionضغط المطالبة مقابل التقنيات ذات الصلة#

Link to this sectionالتنفيذ في الرؤية الحاسوبية#

Explore solutions

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

لنبنِ مستقبل الذكاء الاصطناعي معاً!