اكتشف كيف يعمل الضغط الفوري على تحسين كفاءة الذكاء الاصطناعي. تعرف اليوم على كيفية تقليل استخدام رموز نماذج اللغة الكبيرة (LLM)، وخفض التكاليف، وزيادة سرعة الاستدلال باستخدام Ultralytics .
يُعد ضغط المطالبات تقنية تحسين متقدمة مصممة لتقليل طول وتعقيد النص المدخل المقدم إلى نماذج اللغات الكبيرة (LLMs) و النماذج متعددة الوسائط. من خلال إزالة الكلمات الزائدة والسياق غير ذي الصلة والكلمات الممنوعة بطريقة حسابية مع الحفاظ على المعنى الدلالي الأساسي، يتيح ضغط المطالبة لأنظمة الذكاء الاصطناعي معالجة المعلومات بكفاءة أكبر. تزداد أهمية هذه الطريقة بشكل متزايد من أجل تقليل التكاليف الحسابية، وتقليل زمن الاستجابة الاستدلالية، ومنع النماذج من تجاوز نافذة السياق القصوى الخاصة بها.
على الصعيد المعماري، غالبًا ما تستخدم عملية ضغط المطالبات نماذج أصغر حجمًا ومتخصصة أو خوارزميات قائمة على نظرية المعلومات لتقييم أهمية كل رمز في مطالبة معينة. وتقوم تقنيات مثل دمج الرموز والتشذيب القائم على الإنتروبيا بتحديد وإزالة الرموز التي لا تسهم كثيرًا في المعنى العام. وهذا يضمن أن المدخلات النهائية لا تحتوي إلا على المعلومات الأكثر كثافة .
تشير الأبحاث الحديثة الصادرة عن مؤسسات مرموقة إلى أن المطالبات شديدة الضغط قادرة على الحفاظ على الأداء في مهام الاستدلال المعقدة مع تقليل استهلاك الرموز بشكل ملحوظ. وبالنسبة للمطورين الذين يدمجون الذكاء الاصطناعي في تطبيقات قابلة للتوسع، يعد الالتزام بإرشادات تحسين المطالبات الصادرة عن OpenAI و الاستفادة من أطر عمل الضغط من أفضل الممارسات القياسية لتحقيق نشر فعال.
يوفر الضغط الفوري فائدة مباشرة في الحالات التي تتطلب المعالجة السريعة للبيانات النصية أو المرئية الضخمة:
لبناء مسارات عمليات التعلم الآلي (MLOps) قوية، من المهم التمييز بين ضغط المطالبات والمفاهيم ذات الصلة:
في مجال الرؤية الحاسوبية (CV)، تُطبق مبادئ ضغط المطالبات عند استخدام نماذج ذات مفردات مفتوحة تقبل الاستفسارات النصية لتحديد الكائنات. ويضمن إبقاء أوصاف الفئات موجزة تسريع عملية الترميز النصي وتقليل الحمل الزائد على الذاكرة.
في بيئات الإنتاج ذات الفئات الثابتة التي تُعد السرعة فيها عاملاً أساسياً، ينتقل المطورون عادةً من النماذج التي تعتمد على المطالبات النصية إلى نماذج ذات بنية ثابتة ومُحسَّنة للغاية مثل Ultralytics . يمكنك إدارة مجموعات البيانات بكفاءة و تدريب هذه النماذج المتطورة باستخدام Ultralytics .
from ultralytics import YOLO
# Load an open-vocabulary YOLO-World model
model = YOLO("yolov8s-world.pt")
# Principle of prompt compression: Use concise, distilled class names
# instead of lengthy, complex descriptions for faster text encoding
compressed_prompts = ["helmet", "vest", "forklift"]
model.set_classes(compressed_prompts)
# Run inference with the optimized class list
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()
ابدأ رحلتك مع مستقبل تعلم الآلة