Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

الضغط الفوري

اكتشف كيف يعمل الضغط الفوري على تحسين كفاءة الذكاء الاصطناعي. تعرف اليوم على كيفية تقليل استخدام رموز نماذج اللغة الكبيرة (LLM)، وخفض التكاليف، وزيادة سرعة الاستدلال باستخدام Ultralytics .

يُعد ضغط المطالبات تقنية تحسين متقدمة مصممة لتقليل طول وتعقيد النص المدخل المقدم إلى نماذج اللغات الكبيرة (LLMs) و النماذج متعددة الوسائط. من خلال إزالة الكلمات الزائدة والسياق غير ذي الصلة والكلمات الممنوعة بطريقة حسابية مع الحفاظ على المعنى الدلالي الأساسي، يتيح ضغط المطالبة لأنظمة الذكاء الاصطناعي معالجة المعلومات بكفاءة أكبر. تزداد أهمية هذه الطريقة بشكل متزايد من أجل تقليل التكاليف الحسابية، وتقليل زمن الاستجابة الاستدلالية، ومنع النماذج من تجاوز نافذة السياق القصوى الخاصة بها.

كيف يعمل الضغط الفوري

على الصعيد المعماري، غالبًا ما تستخدم عملية ضغط المطالبات نماذج أصغر حجمًا ومتخصصة أو خوارزميات قائمة على نظرية المعلومات لتقييم أهمية كل رمز في مطالبة معينة. وتقوم تقنيات مثل دمج الرموز والتشذيب القائم على الإنتروبيا بتحديد وإزالة الرموز التي لا تسهم كثيرًا في المعنى العام. وهذا يضمن أن المدخلات النهائية لا تحتوي إلا على المعلومات الأكثر كثافة .

تشير الأبحاث الحديثة الصادرة عن مؤسسات مرموقة إلى أن المطالبات شديدة الضغط قادرة على الحفاظ على الأداء في مهام الاستدلال المعقدة مع تقليل استهلاك الرموز بشكل ملحوظ. وبالنسبة للمطورين الذين يدمجون الذكاء الاصطناعي في تطبيقات قابلة للتوسع، يعد الالتزام بإرشادات تحسين المطالبات الصادرة عن OpenAI و الاستفادة من أطر عمل الضغط من أفضل الممارسات القياسية لتحقيق نشر فعال.

تطبيقات واقعية

يوفر الضغط الفوري فائدة مباشرة في الحالات التي تتطلب المعالجة السريعة للبيانات النصية أو المرئية الضخمة:

  • التوليد المعزز بالاسترجاع (RAG): في تطبيقات البحث المؤسسي، غالبًا ما تسترجع مسارات RAG عشرات الوثائق الطويلة للرد على استفسار واحد من المستخدم . تعمل خوارزميات ضغط المطالبات على تقليص حجم هذه الوثائق المسترجعة، وتحويلها إلى ملخصات واقعية موجزة قبل تغذيتها إلى نموذج التوليد. وهذا يمنع تجاوز سعة الرموز ويُسرع عملية الاستدلال في الوقت الفعلي.
  • وكلاء الذكاء الاصطناعي المستقلون: يجب أن يحتفظ الوكلاء و روبوتات الدردشة بذاكرة طويلة المدى لتفاعلات المستخدمين. وبدلاً من تمرير سجل المحادثة بالكامل إلى كل استفسار جديد، تعمل تقنيات الضغط على تلخيص جولات الحوار السابقة، مما يضمن بقاء الوكيل على دراية بالسياق دون تكبد تكاليف حسابية تتزايد بشكل أسي.

الضغط الفوري مقابل التقنيات ذات الصلة

لبناء مسارات عمليات التعلم الآلي (MLOps) قوية، من المهم التمييز بين ضغط المطالبات والمفاهيم ذات الصلة:

  • مقارنةً بالتخزين المؤقت الفوري: يعمل التخزين المؤقت على حفظ الحالات الحسابية الداخلية للنص الذي تمت معالجته سابقًا لتجنب إعادة حسابها. أما الضغط، فإنه يعمل على تغيير النص المدخل نفسه وتقصيره بشكل فعال قبل إجراء أي معالجة.
  • مقارنةً بهندسة المطالبات: هندسة المطالبات هي فن تصميم التعليمات الفعالة الذي يعتمد على العنصر البشري. أما الضغط فهو عملية آلية، تقوم على الخوارزميات، لتقليص حجم تلك التعليمات.
  • مقارنةً بتحسين المطالبة: يعمل التحسين على توسيع نطاق المطالبة بإضافة سياق خارجي، في حين أن الضغط يقلصها. وغالبًا ما يتم استخدامهما معًا: فقد يقوم النظام بتحسين المطالبة باستخدام نتائج قاعدة البيانات، ثم يضغط الحمولة النهائية قبل إجراء الاستدلال.

التطبيق في مجال الرؤية الحاسوبية

في مجال الرؤية الحاسوبية (CV)، تُطبق مبادئ ضغط المطالبات عند استخدام نماذج ذات مفردات مفتوحة تقبل الاستفسارات النصية لتحديد الكائنات. ويضمن إبقاء أوصاف الفئات موجزة تسريع عملية الترميز النصي وتقليل الحمل الزائد على الذاكرة.

في بيئات الإنتاج ذات الفئات الثابتة التي تُعد السرعة فيها عاملاً أساسياً، ينتقل المطورون عادةً من النماذج التي تعتمد على المطالبات النصية إلى نماذج ذات بنية ثابتة ومُحسَّنة للغاية مثل Ultralytics . يمكنك إدارة مجموعات البيانات بكفاءة و تدريب هذه النماذج المتطورة باستخدام Ultralytics .

from ultralytics import YOLO

# Load an open-vocabulary YOLO-World model
model = YOLO("yolov8s-world.pt")

# Principle of prompt compression: Use concise, distilled class names
# instead of lengthy, complex descriptions for faster text encoding
compressed_prompts = ["helmet", "vest", "forklift"]
model.set_classes(compressed_prompts)

# Run inference with the optimized class list
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()

لنبني مستقبل الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة