GPT-4o من OpenAI يعرض إمكانات الذكاء الاصطناعي
استكشف GPT-4o الجديد من OpenAI، والذي يتميز بذكاء اصطناعي متقدم مع تفاعلات واقعية تغير طريقة تواصلنا مع التكنولوجيا. استكشف ميزاته الرائدة!

يوم الاثنين الموافق 13 مايو 2024، أعلنت OpenAI عن إطلاق نموذجها الرائد الجديد GPT-4o، حيث يرمز حرف 'o' إلى 'omni' (شامل). يعد GPT-4o نموذج ذكاء اصطناعي متعدد الوسائط متطور للتفاعل الفوري مع النصوص والصوت والرؤية، مما يوفر معالجة أسرع ودعماً لعدة لغات وتحسيناً في مستوى الأمان.
يقدم هذا النموذج قدرات ذكاء اصطناعي توليدي لم يسبق لها مثيل. وبناءً على نقاط القوة في المحادثة التي يتمتع بها ChatGPT، تمثل ميزات GPT-4o خطوة كبيرة إلى الأمام في كيفية إدراك الناس للذكاء الاصطناعي. يمكننا الآن التحدث مع GPT-4o كما لو كان شخصاً حقيقياً. دعونا نتعمق ونرى بالضبط ما الذي يمكن أن يفعله GPT-4o!
Link to this sectionالتعرف على GPT-4o#
في تحديث الربيع الخاص بـ OpenAI، تم الكشف عن أن GPT-4o، على الرغم من كونه يتمتع بنفس مستوى ذكاء GPT-4، إلا أنه قادر على معالجة البيانات بشكل أسرع وهو مجهز بشكل أفضل للتعامل مع النصوص والرؤية والصوت. وعلى عكس الإصدارات السابقة التي ركزت على جعل النماذج أكثر ذكاءً، تم إعداد هذا الإصدار مع وضع الحاجة إلى جعل الذكاء الاصطناعي أسهل في الاستخدام من قبل الجمهور العام في الاعتبار.

الشكل 1. تحديث الربيع من OpenAI
كان وضع الصوت في ChatGPT، الذي تم إصداره في أواخر العام الماضي، يعتمد على ثلاثة نماذج مختلفة تعمل معاً لنسخ المدخلات الصوتية، وفهم الردود المكتوبة وتوليدها، وتحويل النص إلى كلام ليتمكن المستخدم من سماع الرد. كان هذا الوضع يتعامل مع مشكلات التأخير ولم يبدُ طبيعياً جداً. يمكن لـ GPT-4o معالجة النصوص والرؤية والصوت أصلياً دفعة واحدة لإعطاء المستخدم انطباعاً بأنه يشارك في محادثة طبيعية.
أيضاً، على عكس وضع الصوت السابق، يمكنك الآن مقاطعة GPT-4o أثناء حديثه، وسوف يتفاعل تماماً كما يفعل الشخص. سيتوقف ويستمع، ثم يقدم رده الفوري بناءً على ما قلته. كما يمكنه التعبير عن المشاعر من خلال صوته وفهم نبرة صوتك أيضاً.
Link to this sectionميزات مثيرة في GPT-4o#
يُظهر تقييم نموذج GPT-4o مدى تطوره. كانت إحدى أكثر النتائج إثارة للاهتمام هي أن GPT-4o يحسن التعرف على الكلام بشكل كبير مقارنة بـ Whisper-v3 في جميع اللغات، خاصة تلك الأقل استخداماً.
يقيس أداء ASR (التعرف التلقائي على الكلام) مدى دقة النموذج في تحويل اللغة المنطوقة إلى نص. يتم تتبع أداء GPT-4o بواسطة معدل خطأ الكلمة (WER)، والذي يوضح النسبة المئوية للكلمات المنسوخة بشكل غير صحيح (انخفاض WER يعني جودة أفضل). يعرض المخطط أدناه انخفاض WER الخاص بـ GPT-4o عبر مختلف المناطق، مما يدل على فعاليته في تحسين التعرف على الكلام للغات ذات الموارد الأقل.

الشكل 2. GPT-4o لديه قدرة فائقة على التعرف على الكلام بلغات متعددة.
إليك نظرة على بعض ميزات GPT-4o الفريدة الأخرى:
- أسرع - إنه أسرع بمرتين من GPT-4 Turbo. يمكنه الاستجابة للمدخلات الصوتية في 232 مللي ثانية فقط، وهو ما يشبه أوقات استجابة المحادثة البشرية.
- فعال من حيث التكلفة - إصدار API من GPT-4o أرخص بنسبة 50% من GPT-4 Turbo.
- الذاكرة - يتمتع GPT-4o بالقدرة على الحفاظ على الوعي عبر محادثات مختلفة. يمكنه تذكر ما تتحدث عنه في محادثات مختلفة.
- متعدد اللغات - تم تدريب GPT-4o ليكون أسرع وأفضل جودة في 50 لغة مختلفة.
Link to this sectionأمثلة على ما يمكن لـ GPT-4o القيام به#
يمكنك الآن إخراج هاتفك وفتح GPT-4o، وتشغيل الكاميرا، وطلب من GPT-4o، كما تفعل مع صديق، تخمين حالتك المزاجية بناءً على تعابير وجهك. يمكن لـ GPT-4o رؤيتك من خلال الكاميرا والإجابة.

الشكل 3. GPT-4o يفهم الحالة المزاجية للإنسان عبر الفيديو.
يمكنك حتى استخدامه لمساعدتك في حل مسائل الرياضيات من خلال عرض ما تكتبه لـ GPT-4o عبر الفيديو. وبدلاً من ذلك، يمكنك مشاركة شاشتك، ويمكن أن يصبح معلماً مفيداً على Khan Academy، حيث يطلب منك الإشارة إلى أجزاء مختلفة من مثلث في الهندسة، كما هو موضح أدناه.

الشكل 4. GPT-4o يعمل كمعلم على Khan Academy.
بعيداً عن مساعدة الأطفال في الرياضيات، يمكن للمطورين إجراء محادثات مع GPT-4o لتصحيح أكوادهم البرمجية. هذا ممكن بفضل تقديم ChatGPT كتطبيق سطح مكتب. إذا قمت بتحديد ونسخ الكود الخاص بك باستخدام CTRL “C” أثناء التحدث إلى تطبيق GPT-4o الصوتي لسطح المكتب، فسيتمكن من قراءة الكود الخاص بك. أو يمكنك استخدامه لترجمة المحادثات بين المطورين الذين يتحدثون لغات مختلفة.
تبدو الإمكانات مع GPT-4o لا حصر لها. استخدمت إحدى أكثر العروض التوضيحية إثارة للاهتمام من OpenAI هاتفين لإظهار GPT-4o وهو يتحدث إلى نسخ مختلفة من نفسه ويغنيان معاً.

الشكل 5. الذكاء الاصطناعي يتحدث ويغني مع الذكاء الاصطناعي.
Link to this sectionتطبيقات GPT-4o#
كما هو موضح في عرض توضيحي، يمكن لـ GPT-4o جعل العالم أكثر سهولة في الوصول للأشخاص ذوي الإعاقة البصرية. يمكن أن يساعدهم على التفاعل والتحرك بشكل أكثر أماناً واستقلالية. على سبيل المثال، يمكن للمستخدمين تشغيل الفيديو الخاص بهم وعرض منظر للشارع لـ GPT-4o. يمكن لـ GPT-4o بعد ذلك تقديم أوصاف فورية للبيئة، مثل تحديد العوائق، أو قراءة لافتات الشوارع، أو توجيههم إلى موقع معين. يمكن أن يساعدهم حتى في استدعاء سيارة أجرة عن طريق تنبيههم عند اقتراب سيارة الأجرة.

الشكل 6. GPT-4o ينبه لاقتراب سيارة أجرة.
وبالمثل، يمكن لـ GPT-4o تحويل مختلف الصناعات بقدراته المتقدمة. في التجزئة، يمكنه تحسين خدمة العملاء من خلال تقديم المساعدة الفورية، والإجابة على الاستفسارات، ومساعدة العملاء في العثور على المنتجات عبر الإنترنت وفي المتجر. لنفترض أنك تنظر إلى رف من المنتجات ولا يمكنك العثور على المنتج الذي تبحث عنه، يمكن لـ GPT-4o مساعدتك.
في الرعاية الصحية، يمكن لـ GPT-4o المساعدة في التشخيص من خلال تحليل بيانات المريض، واقتراح حالات محتملة بناءً على الأعراض، وتقديم إرشادات حول خيارات العلاج. يمكنه أيضاً دعم المهنيين الطبيين من خلال تلخيص سجلات المرضى، وتوفير وصول سريع إلى الأدبيات الطبية، وحتى تقديم ترجمة فورية للغة للتواصل مع المرضى الذين يتحدثون لغات مختلفة. هذه مجرد أمثلة قليلة. تجعل تطبيقات GPT-4o الحياة اليومية أسهل من خلال تقديم مساعدة مخصصة ومراعية للسياق وكسر الحواجز أمام المعلومات والتواصل.
Link to this sectionGPT-4o وسلامة النماذج#
تماماً مثل الإصدارات السابقة من GPT، التي أثرت في مئات الملايين من الأرواح، من المرجح أن يتفاعل GPT-4o مع الصوت والفيديو في الوقت الفعلي عالمياً، مما يجعل السلامة عنصراً حاسماً في هذه التطبيقات. كانت OpenAI حذرة جداً في بناء GPT-4o مع التركيز على تخفيف المخاطر المحتملة.
لضمان السلامة والموثوقية، نفذت OpenAI تدابير سلامة صارمة. وتشمل هذه تصفية بيانات التدريب، وتحسين سلوك النموذج بعد التدريب، ودمج أنظمة أمان جديدة لإدارة المخرجات الصوتية. علاوة على ذلك، تم اختبار GPT-4o بشكل مكثف من قبل أكثر من 70 خبيراً خارجياً في مجالات مثل علم النفس الاجتماعي، والتحيز والعدالة، والمعلومات المضللة. يضمن الاختبار الخارجي تحديد ومعالجة أي مخاطر يتم تقديمها أو تضخيمها بواسطة الميزات الجديدة.
للحفاظ على معايير سلامة عالية، تطلق OpenAI ميزات GPT-4o تدريجياً على مدار الأسابيع القليلة المقبلة. يسمح الطرح المرحلي لـ OpenAI بمراقبة الأداء، ومعالجة أي مشكلات، وجمع ملاحظات المستخدمين. يضمن اتخاذ نهج حذر أن يقدم GPT-4o قدرات متقدمة مع الحفاظ على أعلى معايير السلامة والاستخدام الأخلاقي.
Link to this sectionجرب GPT-4o بنفسك#
يتوفر GPT-4o للوصول المجاني. لتجربة قدرات المحادثة الفورية المذكورة أعلاه، يمكنك تنزيل تطبيق ChatGPT من متجر Google Play أو Apple App Store مباشرة على هاتفك.
بعد تسجيل الدخول، ستتمكن من تحديد GPT-4o من القائمة المعروضة عن طريق النقر على النقاط الثلاث في الزاوية اليمنى العليا من الشاشة. بعد الانتقال إلى محادثة مفعل بها GPT-4o، إذا نقرت على علامة الجمع في الزاوية اليسرى السفلية من الشاشة، فسترى خيارات إدخال متعددة. في الزاوية اليمنى السفلية من الشاشة، سترى أيقونة سماعة الرأس. عند تحديد أيقونة سماعة الرأس، سيُطلب منك ما إذا كنت ترغب في تجربة نسخة بدون استخدام اليدين من GPT-4o. بعد الموافقة، ستتمكن من تجربة GPT-4o، كما هو موضح أدناه.

الشكل 7. تجربة GPT-4o على تطبيق الهاتف المحمول ChatGPT.
إذا كنت ترغب في دمج قدرات GPT-4o المتقدمة في مشاريعك الخاصة، فهو متاح كـ API للمطورين. فهو يسمح لك بدمج قدرات التعرف على الكلام القوية، ودعم اللغات المتعددة، وقدرات المحادثة الفورية لـ GPT-4o في تطبيقاتك. باستخدام API، يمكنك تحسين تجارب المستخدم، وبناء تطبيقات أكثر ذكاءً، وجلب تكنولوجيا الذكاء الاصطناعي المتطورة إلى قطاعات مختلفة.
Link to this sectionGPT-4o: ليس بشراً تماماً بعد#
على الرغم من أن GPT-4o أكثر تطوراً بكثير من نماذج الذكاء الاصطناعي السابقة، فمن المهم أن نتذكر أن GPT-4o يأتي مع قيوده الخاصة. ذكرت OpenAI أنه يمكنه أحياناً التبديل عشوائياً بين اللغات أثناء التحدث، من الإنجليزية إلى الفرنسية. كما لاحظوا أن GPT-4o يترجم بشكل غير صحيح بين اللغات. مع قيام المزيد من الأشخاص بتجربة النموذج، سنفهم أين يتفوق GPT-4o وما يحتاج إلى مزيد من التحسين.
Link to this sectionالخلاصة#
يفتح GPT-4o من OpenAI أبواباً جديدة للذكاء الاصطناعي بمعالجته المتقدمة للنصوص والرؤية والصوت، مما يوفر تفاعلات طبيعية تشبه البشر. إنه يتفوق من حيث السرعة وكفاءة التكلفة ودعم اللغات المتعددة. يعد GPT-4o أداة متعددة الاستخدامات للتعليم وسهولة الوصول والمساعدة الفورية. مع استكشاف المستخدمين لقدرات GPT-4o، ستدفع الملاحظات تطوره. يثبت GPT-4o أن الذكاء الاصطناعي يغير عالمنا حقاً ويصبح جزءاً من حياتنا اليومية.
استكشف مستودع GitHub الخاص بنا وانضم إلى مجتمعنا للتعمق أكثر في الذكاء الاصطناعي. تفضل بزيارة صفحات الحلول الخاصة بنا لمعرفة كيف يقوم الذكاء الاصطناعي بتحويل صناعات مثل التصنيع والزراعة.






