نظرة متعمقة على قدرات نموذج GPT-4o Mini من OpenAI
استكشف ميزات وتطبيقات GPT-4o Mini. يوفر أحدث نماذج OpenAI وأكثرها فعالية من حيث التكلفة قدرات ذكاء اصطناعي متقدمة بتكلفة أقل بنسبة 60% من GPT-3.5 Turbo.

في مايو 2024، أطلقت OpenAI نموذج GPT-4o، والآن، بعد ثلاثة أشهر فقط، عادت بنموذج آخر مثير للإعجاب: GPT-4o Mini. في 18 يوليو 2024، قدمت OpenAI نموذج GPT-4o Mini. وهم يصفونه بأنه "نموذجهم الأكثر فعالية من حيث التكلفة"! يُعد GPT-4o Mini نموذجاً مدمجاً يعتمد على قدرات النماذج السابقة ويهدف إلى جعل الذكاء الاصطناعي المتقدم أكثر سهولة وأقل تكلفة.
يدعم GPT-4o Mini حالياً التفاعلات النصية والبصرية، مع توقع تحديثات مستقبلية لإضافة قدرات معالجة الصور ومقاطع الفيديو والصوت. في هذه المقالة، سنستكشف ما هو GPT-4o Mini، وميزاته البارزة، وكيفية استخدامه، والاختلافات بين GPT-4 وGPT-4o Mini، وكيف يمكن استخدامه في حالات استخدام رؤية الكمبيوتر المختلفة. لنبدأ ونكتشف ما يقدمه GPT-4o Mini!
Link to this sectionما هو GPT-4o Mini؟#
يُعد GPT-4o Mini أحدث إضافة إلى مجموعة نماذج الذكاء الاصطناعي من OpenAI، وقد صُمم ليكون أكثر كفاءة من حيث التكلفة وسهولة في الوصول إليه. إنه نموذج لغوي كبير (LLM) متعدد الوسائط، مما يعني أنه يمكنه معالجة وإنشاء أنواع مختلفة من البيانات، مثل النصوص والصور ومقاطع الفيديو والصوت. يعتمد النموذج على نقاط قوة النماذج السابقة مثل GPT-4 وGPT-4o لتقديم قدرات قوية في حزمة مدمجة.
يُعد GPT-4o Mini أرخص بنسبة 60% من GPT-3.5 Turbo، حيث تبلغ تكلفته 15 سنتاً لكل مليون رمز إدخال (وحدات من النص أو البيانات التي يعالجها النموذج) و60 سنتاً لكل مليون رمز إخراج (الوحدات التي ينشئها النموذج استجابةً). لوضع ذلك في منظور صحيح، فإن مليون رمز تعادل تقريباً معالجة 2500 صفحة من النص. مع نافذة سياق تبلغ 128 ألف رمز والقدرة على التعامل مع ما يصل إلى 16 ألف رمز إخراج لكل طلب، صُمم GPT-4o Mini ليكون فعالاً وبأسعار معقولة.

الشكل 1. GPT-4o Mini أرخص بنسبة 60% من GPT-3.5 Turbo.
Link to this sectionالميزات الرئيسية لـ GPT-4o Mini#
يدعم GPT-4o Mini مجموعة من المهام التي تجعله خياراً رائعاً لتطبيقات مختلفة. يمكن استخدامه عند تشغيل عدة عمليات في وقت واحد، مثل استدعاء واجهات برمجة تطبيقات (API) متعددة، والتعامل مع كميات كبيرة من البيانات مثل قواعد الأكواد البرمجية الكاملة أو سجلات المحادثات، وتوفير استجابات سريعة وفورية في روبوتات دعم العملاء.
إليك بعض الميزات الرئيسية الأخرى:
- قاعدة معرفية محدثة: يحتوي النموذج على معلومات محدثة حتى أكتوبر 2023.
- مُرمز (Tokenizer) محسن: يجعل GPT-4o Mini معالجة النصوص غير الإنجليزية أكثر فعالية من حيث التكلفة.
- تدابير أمان قوية: تتضمن هذه التدابير تصفية المحتوى الضار والحماية من المشكلات الأمنية مثل حقن الأوامر (prompt injections) والتلاعب بالنظام.
Link to this sectionالبدء مع GPT-4o Mini#
يمكنك تجربة استخدام GPT-4o Mini من خلال واجهة ChatGPT. إنه متاح لمستخدمي النسخ المجانية وPlus وTeam، ليحل محل GPT-3.5 كما هو موضح أدناه. سيحصل مستخدمو Enterprise أيضاً على حق الوصول قريباً، بما يتماشى مع هدف OpenAI المتمثل في توفير فوائد الذكاء الاصطناعي للجميع. يتوفر GPT-4o Mini أيضاً من خلال واجهة برمجة التطبيقات (API) للمطورين الذين يرغبون في دمج قدراته في تطبيقاتهم. في الوقت الحالي، لا تتوفر قدرات الرؤية إلا من خلال واجهة برمجة التطبيقات.

الشكل 2. خيارات النماذج داخل ChatGPT.
Link to this sectionالفرق بين GPT-4o وGPT-4o Mini#
يقدم كل من GPT-4o وGPT-4o Mini أداءً مثيراً للإعجاب عبر مختلف معايير القياس. في حين أن GPT-4o يتفوق عموماً على GPT-4o Mini، لا يزال GPT-4o Mini حلاً فعالاً من حيث التكلفة للمهام اليومية. تشمل معايير القياس مهام الاستدلال، والبراعة في الرياضيات والبرمجة، والاستدلال متعدد الوسائط. كما هو موضح في الصورة أدناه، يسجل GPT-4o Mini درجات عالية جداً عند مقارنته بنماذج شائعة أخرى.

الشكل 3. مقارنة GPT-4o Mini مع نماذج شائعة أخرى.
Link to this sectionتجربة عملية مع GPT-4o وGPT-4o Mini#
تتضمن إحدى المطالبات (prompts) المثيرة للاهتمام التي تمت مناقشتها عبر الإنترنت مقارنة النماذج اللغوية الكبيرة الشهيرة للأرقام العشرية بشكل غير صحيح. عندما وضعنا GPT-4o وGPT-4o Mini تحت الاختبار، أظهرت قدرات الاستدلال لديهما اختلافات واضحة. في الصورة أدناه، سألنا كلا النموذجين أيهما أكبر: 9.11 أم 9.9، ثم طلبنا منهما شرح استدلالهما.

الشكل 4. اختبار GPT-4o وGPT-4o Mini.
استجاب كلا النموذجين في البداية بشكل غير صحيح وادعيا أن 9.11 أكبر. ومع ذلك، تمكن GPT-4o من التفكير للوصول إلى الإجابة الصحيحة وذكر أن 9.9 أكبر. وقدم شرحاً مفصلاً وقارن الأرقام العشرية بدقة. في المقابل، تمسك GPT-4o Mini بعناد بإجابته الخاطئة الأولية على الرغم من توصله إلى المنطق الكامن وراء كون 9.9 أكبر بشكل صحيح.
يُظهر كلا النموذجين مهارات استدلال قوية. قدرة GPT-4o على تصحيح نفسه تجعله متفوقاً ومفيداً للمهام الأكثر تعقيداً. أما GPT-4o Mini، ورغم كونه أقل قدرة على التكيف، فإنه لا يزال يقدم استدلالاً واضحاً ودقيقاً للمهام الأبسط.
Link to this sectionاستخدام GPT-4o Mini في حالات استخدام رؤية الكمبيوتر المختلفة#
إذا كنت تفضل استكشاف قدرات الرؤية لـ GPT-4o Mini دون الخوض في الكود البرمجي، يمكنك بسهولة اختبار واجهة برمجة التطبيقات (API) على OpenAI Playground. لقد جربنا ذلك بأنفسنا لنرى مدى قدرة GPT-4o Mini على التعامل مع حالات الاستخدام المختلفة المتعلقة برؤية الكمبيوتر.
Link to this sectionتصنيف الصور باستخدام GPT-4o Mini#
طلبنا من GPT-4o Mini تصنيف صورتين: صورة لفراشة وصورة لخريطة. نجح نموذج الذكاء الاصطناعي في تحديد الفراشة والخريطة. هذه مهمة بسيطة جداً نظراً لاختلاف الصورتين بشكل كبير.

الشكل 5. تصنيف الصور بمساعدة GPT-4o Mini.
لقد قمنا بتشغيل صورتين أخريين عبر النموذج: صورة تظهر فراشة تستريح على نبات وأخرى تظهر فراشة تستريح على الأرض. قام الذكاء الاصطناعي بعمل رائع مرة أخرى، حيث حدد بدقة الفراشة الموجودة على النبات والأخرى الموجودة على الأرض. لذا، قمنا باتخاذ خطوة أبعد مرة أخرى.

الشكل 6. تصنيف صور متشابهة بمساعدة GPT-4o Mini.
ثم طلبنا من GPT-4o Mini تصنيف صورتين: صورة تظهر فراشة تتغذى على أزهار "Swamp Milkweed" والأخرى تظهر فراشة تتغذى على زهرة "Zinnia". من المذهل أن النموذج كان قادراً على تصنيف تسمية محددة جداً دون مزيد من الضبط الدقيق (fine-tuning). تُظهر هذه الأمثلة السريعة أن GPT-4o Mini يمكن استخدامه لمهام تصنيف الصور دون الحاجة إلى تدريب مخصص.

الشكل 7. تصنيف صور مفصلة بمساعدة GPT-4o Mini.
Link to this sectionفهم الأوضاع (Poses) باستخدام GPT-4o Mini#
حتى الآن، لا يمكن التعامل مع مهام رؤية الكمبيوتر مثل اكتشاف الكائنات وتجزئة الحالات باستخدام GPT-4o Mini. يواجه GPT-4o صعوبة في الدقة، ولكنه يمكن استخدامه لمثل هذه المهام. وفي هذا السياق، وفيما يتعلق بـ فهم الأوضاع، لا يمكننا اكتشاف أو تقدير الوضع في الصورة، ولكن يمكننا تصنيف الوضع وفهمه.

الشكل 8. استخدام GPT-4o Mini لفهم الأوضاع في صورة.
تُظهر الصورة أعلاه كيف يمكن لـ GPT-4o Mini تصنيف وفهم الأوضاع، على الرغم من عدم قدرته على اكتشاف أو تقدير الإحداثيات الدقيقة للوضع. يمكن أن يكون هذا مفيداً في تطبيقات مختلفة. على سبيل المثال، في تحليلات الرياضة، يمكنه تقييم حركات الرياضيين بشكل عام والمساعدة في منع الإصابات. وبالمثل، في العلاج الطبيعي، يمكنه المساعدة في مراقبة التمارين للتأكد من قيام المرضى بالحركات الصحيحة أثناء إعادة التأهيل. كما يمكنه في المراقبة المساعدة في تحديد الأنشطة المشبوهة من خلال تحليل لغة الجسد العامة. في حين أن GPT-4o Mini لا يمكنه اكتشاف نقاط رئيسية محددة، فإن قدرته على تصنيف الأوضاع العامة تجعله مفيداً في هذه المجالات وغيرها.
Link to this sectionالتطبيقات التي يناسبها GPT-4o Mini#
لقد ألقينا نظرة على ما يمكن لـ GPT-4o Mini القيام به. الآن، دعونا نناقش التطبيقات التي يكون فيها استخدام GPT-4o Mini هو الأمثل.
يعتبر GPT-4o Mini رائعاً للتطبيقات التي تتطلب فهماً متقدماً للغة الطبيعية وتحتاج إلى بصمة حسابية صغيرة. إنه يجعل من الممكن دمج الذكاء الاصطناعي في التطبيقات التي كان من الممكن أن تكون مكلفة للغاية. في الواقع، يُظهر تحليل مفصل بواسطة Artificial Analysis أن GPT-4o Mini يقدم استجابات عالية الجودة بسرعات فائقة مقارنة بمعظم النماذج الأخرى.

الشكل 9. الجودة مقابل سرعة الإخراج لـ GPT-4o Mini.
إليك بعض المجالات الرئيسية التي يمكن أن يتألق فيها في المستقبل:
- المساعدون الافتراضيون وروبوتات المحادثة: يمكن لـ GPT-4o Mini تقديم استجابات سريعة وذكية لتحسين تفاعلات المستخدم.
- الأدوات التعليمية: يمكن استخدام النموذج لبناء أدوات لتقديم دروس خصوصية مخصصة وتوليد محتوى.
- أدوات الإنتاجية: يمكنه تحسين المهام مثل تلخيص المستندات، وصياغة رسائل البريد الإلكتروني، وترجمة اللغات لتعزيز الكفاءة.
- ترجمة اللغات: يمكن استخدام أحدث إصدار من GPT لتطوير مترجمين يوفرون ترجمة دقيقة وفورية للغات من أجل تواصل أفضل عبر اللغات المختلفة.
Link to this sectionGPT-4o Mini يفتح أبواباً جديدة#
يخلق GPT-4o Mini فرصاً جديدة لمستقبل الذكاء الاصطناعي متعدد الوسائط. انخفضت تكلفة معالجة كل جزء من النص أو البيانات، والمعروفة بتكلفة الرمز (cost per token)، بشكل كبير - بنسبة تقارب 99% - منذ عام 2022، عندما تم إصدار text-davinci-003، نموذج GPT-3. يُظهر الانخفاض في التكلفة اتجاهاً واضحاً نحو جعل الذكاء الاصطناعي المتقدم أكثر تكلفة وبأسعار معقولة. ومع استمرار تحسن نماذج الذكاء الاصطناعي، أصبح من المرجح بشكل متزايد أن يكون دمج الذكاء الاصطناعي في كل تطبيق وموقع ويب أمراً مجدياً اقتصادياً!
هل تريد تجربة الذكاء الاصطناعي بشكل عملي؟ تفضل بزيارة مستودع GitHub الخاص بنا لرؤية ابتكاراتنا وأن تصبح جزءاً من مجتمعنا النشط. اكتشف المزيد حول تطبيقات الذكاء الاصطناعي في التصنيع والزراعة على صفحات الحلول الخاصة بنا.






