استكشف ميزات وتطبيقات GPT-4o Mini. أحدث نموذج من OpenAI والأكثر فعالية من حيث التكلفة، يوفر قدرات ذكاء اصطناعي متقدمة بتكلفة أقل بنسبة 60٪ من GPT-3.5 Turbo.
استكشف ميزات وتطبيقات GPT-4o Mini. أحدث نموذج من OpenAI والأكثر فعالية من حيث التكلفة، يوفر قدرات ذكاء اصطناعي متقدمة بتكلفة أقل بنسبة 60٪ من GPT-3.5 Turbo.
في مايو 2024، أطلقت OpenAI نموذج GPT-4o، والآن، بعد ثلاثة أشهر فقط، عادت بنموذج آخر مثير للإعجاب: GPT-4o Mini. في 18 يوليو 2024، قدمت OpenAI نموذج GPT-4o Mini. إنهم يصفونه بأنه “النموذج الأكثر فعالية من حيث التكلفة”! GPT-4o Mini هو نموذج مضغوط يعتمد على قدرات النماذج السابقة ويهدف إلى جعل الذكاء الاصطناعي المتقدم أكثر سهولة وميسور التكلفة.
يدعم GPT-4o Mini حاليًا التفاعلات النصية والمرئية، مع توقع إضافة تحديثات مستقبلية لإمكانيات التعامل مع الصور ومقاطع الفيديو والصوت. في هذه المقالة، سوف نستكشف ماهية GPT-4o Mini، وميزاته البارزة، وكيف يمكن استخدامه، والاختلافات بين GPT-4 و GPT-4o Mini، وكيف يمكن استخدامه في حالات استخدام رؤية الكمبيوتر المختلفة. هيا بنا نتعمق ونرى ما يقدمه GPT-4o Mini!
GPT-4o Mini هو أحدث إضافة إلى مجموعة نماذج الذكاء الاصطناعي من OpenAI، وهو مصمم ليكون أكثر فعالية من حيث التكلفة وسهولة في الوصول إليه. إنه نموذج لغوي كبير (LLM) متعدد الوسائط، مما يعني أنه يمكنه معالجة وإنشاء أنواع مختلفة من البيانات، مثل النصوص والصور ومقاطع الفيديو والصوت. يعتمد النموذج على نقاط القوة في النماذج السابقة مثل GPT-4 و GPT-4o لتقديم قدرات قوية في حزمة مضغوطة.
يعد GPT-4o Mini أرخص بنسبة 60٪ من GPT-3.5 Turbo، حيث تبلغ تكلفته 15 سنتًا لكل مليون رمز إدخال (وحدات النص أو البيانات التي يعالجها النموذج) و 60 سنتًا لكل مليون رمز إخراج (الوحدات التي ينشئها النموذج استجابةً). ولوضع ذلك في نصابه الصحيح، فإن مليون رمز يعادل تقريبًا معالجة 2500 صفحة من النص. بفضل نافذة سياق تبلغ 128 ألف رمز والقدرة على التعامل مع ما يصل إلى 16 ألف رمز إخراج لكل طلب، تم تصميم GPT-4o Mini ليكون فعالاً وميسور التكلفة.

يدعم GPT-4o Mini مجموعة من المهام التي تجعله خيارًا رائعًا لمختلف التطبيقات. يمكن استخدامه عند تشغيل عدة عمليات في وقت واحد، مثل استدعاء واجهات برمجة التطبيقات المتعددة (APIs)، والتعامل مع كميات كبيرة من البيانات مثل قواعد التعليمات البرمجية الكاملة أو سجلات المحادثات، وتقديم استجابات سريعة وفورية في برامج الدردشة الآلية لدعم العملاء.
فيما يلي بعض الميزات الرئيسية الأخرى:
يمكنك تجربة استخدام GPT-4o Mini من خلال واجهة ChatGPT . وهو متاح للمستخدمين المجانيين ومستخدمي Plus والفريق، ليحل محل GPT-3.5 كما هو موضح أدناه. سيحصل مستخدمو المؤسسات أيضًا على إمكانية الوصول إليها قريبًا، بما يتماشى مع هدف OpenAI المتمثل في توفير مزايا الذكاء الاصطناعي للجميع. يتوفر GPT-4o Mini أيضًا من خلال واجهة برمجة التطبيقات (API) للمطورين الذين يرغبون في دمج قدراته في تطبيقاتهم. في الوقت الحالي، لا يمكن الوصول إلى قدرات الرؤية إلا من خلال واجهة برمجة التطبيقات.

يقدم كل من GPT-4o Mini و GPT-4o أداءً مثيرًا للإعجاب عبر مختلف المعايير. في حين أن GPT-4o يتفوق عمومًا على GPT-4o Mini، إلا أن GPT-4o Mini لا يزال حلاً فعالاً من حيث التكلفة للمهام اليومية. تتضمن المعايير مهام الاستدلال والكفاءة في الرياضيات والبرمجة والاستدلال متعدد الوسائط. كما هو موضح في الصورة أدناه، فإن GPT-4o Mini يسجل أداءً عاليًا جدًا عند مقارنته بالنماذج الشائعة الأخرى.

هناك مطالبة مثيرة للاهتمام تتم مناقشتها عبر الإنترنت تتضمن نماذج لغوية كبيرة شائعة تقارن الأرقام العشرية بشكل غير صحيح. عندما وضعنا GPT-4o و GPT-4o Mini قيد الاختبار، أظهرت قدراتهما على الاستدلال اختلافات واضحة. في الصورة أدناه، سألنا كلا النموذجين عن الأكبر: 9.11 أو 9.9، ثم طلبنا منهما شرح منطقهما.

يستجيب كلا النموذجين في البداية بشكل غير صحيح ويدعيان أن 9.11 أكبر. ومع ذلك، فإن GPT-4o قادر على تبرير طريقه للوصول إلى الإجابة الصحيحة ويذكر أن 9.9 أكبر. ويقدم شرحًا تفصيليًا ويقارن الكسور العشرية بدقة. في المقابل، يصر GPT-4o Mini بعناد على إجابته الخاطئة الأولية على الرغم من اكتشافه المنطق وراء كون 9.9 أكبر بشكل صحيح.
يظهر كلا النموذجين مهارات استدلال قوية. إن قدرة GPT-4o على تصحيح نفسه تجعله متفوقًا ومفيدًا للمهام الأكثر تعقيدًا. لا يزال GPT-4o Mini، على الرغم من كونه أقل قدرة على التكيف، يقدم استدلالًا واضحًا ودقيقًا للمهام الأبسط.
إذا كنت تفضل استكشاف قدرات الرؤية في GPT-4o Mini دون الخوض في التعليمات البرمجية، يمكنك بسهولة اختبار واجهة برمجة التطبيقات (API) على OpenAI Playground. لقد جربناها بأنفسنا لمعرفة مدى قدرة GPT-4o Mini على التعامل مع حالات استخدام مختلفة متعلقة برؤية الكمبيوتر.
طلبنا من GPT-4o Mini classify صورتين: إحداهما لفراشة والأخرى لخريطة. نجح نموذج الذكاء الاصطناعي في تحديد الفراشة والخريطة. هذه مهمة بسيطة إلى حد ما نظراً لاختلاف الصورتين اختلافاً كبيراً.

تابعنا ومررنا صورتين إضافيتين عبر النموذج: إحداهما تُظهر فراشة تستريح على نبات والأخرى تُظهر فراشة تستريح على الأرض. قام الذكاء الاصطناعي بعمل رائع مرة أخرى، حيث اكتشف بشكل صحيح الفراشة على النبات والفراشة على الأرض. لذلك، أخذناها خطوة أخرى إلى الأمام مرة أخرى.

طلبنا بعد ذلك من GPT-4o Mini classify صورتين: إحداهما تُظهر فراشة تتغذى على أزهار عشبة المستنقعات اللبنية والأخرى تُظهر فراشة تتغذى على زهرة الزينيا. من المدهش أن النموذج كان قادراً على classify تسمية محددة للغاية دون مزيد من الضبط الدقيق. توضح هذه الأمثلة السريعة إمكانية استخدام GPT-4o Mini في مهام تصنيف الصور دون الحاجة إلى تدريب مخصص.

اعتبارًا من الآن، لا يمكن التعامل مع مهام الرؤية الحاسوبية مثل اكتشاف الأجسام وتجزئة المثيل باستخدام GPT-4o Mini. يكافح GPT-4o من أجل الدقة، ولكن يمكن استخدامه لمثل هذه المهام. على هذا المنوال، فيما يتعلق بفهم الوضعيات، لا يمكننا detect الوضعية في الصورة أو تقديرها، لكن يمكننا classify الوضعية وفهمها.

تُظهر الصورة أعلاه كيف يمكن لـ GPT-4o Mini classify الوضعيات وفهمها، على الرغم من عدم قدرته على detect أو تقدير الإحداثيات الدقيقة للوضعية. يمكن أن يكون هذا مفيداً في تطبيقات مختلفة. على سبيل المثال، في التحليلات الرياضية، يمكنه تقييم حركات الرياضيين على نطاق واسع والمساعدة في منع الإصابات. وبالمثل، في العلاج الطبيعي، يمكن أن يساعد في مراقبة التمارين للتأكد من قيام المرضى بالحركات الصحيحة أثناء إعادة التأهيل. وفي المراقبة أيضاً، يمكن أن يساعد في تحديد الأنشطة المشبوهة من خلال تحليل لغة الجسد العامة. في حين لا يستطيع GPT-4o Mini detect نقاط رئيسية محددة، فإن قدرته على classify الوضعيات العامة تجعله مفيداً في هذه المجالات وغيرها.
لقد ألقينا نظرة على ما يمكن أن يفعله GPT-4o Mini. الآن، دعنا نناقش التطبيقات التي يكون من الأمثل فيها استخدام GPT-4o Mini.
يعد GPT-4o Mini رائعًا للتطبيقات التي تتطلب فهمًا متقدمًا للغة الطبيعية وتحتاج إلى مساحة حاسوبية صغيرة. فهو يجعل من الممكن دمج الذكاء الاصطناعي في التطبيقات التي عادة ما تكون باهظة التكلفة. في الواقع، يُظهر تحليل تفصيلي بواسطة Artificial Analysis أن GPT-4o Mini يقدم استجابات عالية الجودة بسرعات فائقة مقارنة بمعظم النماذج الأخرى.

فيما يلي بعض المجالات الرئيسية التي يمكن أن يتألق فيها في المستقبل:
يخلق GPT-4o Mini فرصًا جديدة لمستقبل الذكاء الاصطناعي متعدد الوسائط. انخفضت تكلفة معالجة كل جزء من النص أو البيانات، والمعروفة باسم التكلفة لكل رمز (Cost per token)، بشكل كبير - بنسبة 99٪ تقريبًا - منذ عام 2022، عندما تم إصدار text-davinci-003، نموذج GPT-3. يُظهر هذا الانخفاض في التكلفة اتجاهًا واضحًا نحو جعل الذكاء الاصطناعي المتقدم ميسور التكلفة. مع استمرار تحسن نماذج الذكاء الاصطناعي، يصبح دمج الذكاء الاصطناعي في كل تطبيق وموقع ويب أمرًا قابلاً للتطبيق اقتصاديًا!
هل ترغب في تجربة الذكاء الاصطناعي بشكل عملي؟ قم بزيارة مستودع GitHub الخاص بنا للاطلاع على ابتكاراتنا وكن جزءًا من مجتمعنا النشط. تعرف على المزيد حول تطبيقات الذكاء الاصطناعي في التصنيع و الزراعة على صفحات الحلول الخاصة بنا.