تعرف على YOLO26: جيل جديد من ذكاء الرؤية الاصطناعي.
Ultralytics
الذكاء الاصطناعي المرئي

GPT-4o من OpenAI يعرض إمكانات الذكاء الاصطناعي

استكشف GPT-4o الجديد من OpenAI، والذي يتميز بذكاء اصطناعي متقدم مع تفاعلات واقعية تغير طريقة تواصلنا مع التكنولوجيا. استكشف ميزاته الرائدة!

أبأبيرامي فينا
5 min read
GPT-4o من OpenAI يعرض إمكانات الذكاء الاصطناعي

يوم الاثنين الموافق 13 مايو 2024، أعلنت OpenAI عن إطلاق نموذجها الرائد الجديد GPT-4o، حيث يرمز حرف 'o' إلى 'omni' (شامل). يعد GPT-4o نموذج ذكاء اصطناعي متعدد الوسائط متطور للتفاعل الفوري مع النصوص والصوت والرؤية، مما يوفر معالجة أسرع ودعماً لعدة لغات وتحسيناً في مستوى الأمان.

يقدم هذا النموذج قدرات ذكاء اصطناعي توليدي لم يسبق لها مثيل. وبناءً على نقاط القوة في المحادثة التي يتمتع بها ChatGPT، تمثل ميزات GPT-4o خطوة كبيرة إلى الأمام في كيفية إدراك الناس للذكاء الاصطناعي. يمكننا الآن التحدث مع GPT-4o كما لو كان شخصاً حقيقياً. دعونا نتعمق ونرى بالضبط ما الذي يمكن أن يفعله GPT-4o!

Link to this sectionالتعرف على GPT-4o#

في تحديث الربيع الخاص بـ OpenAI، تم الكشف عن أن GPT-4o، على الرغم من كونه يتمتع بنفس مستوى ذكاء GPT-4، إلا أنه قادر على معالجة البيانات بشكل أسرع وهو مجهز بشكل أفضل للتعامل مع النصوص والرؤية والصوت. وعلى عكس الإصدارات السابقة التي ركزت على جعل النماذج أكثر ذكاءً، تم إعداد هذا الإصدار مع وضع الحاجة إلى جعل الذكاء الاصطناعي أسهل في الاستخدام من قبل الجمهور العام في الاعتبار.

تحديث OpenAI الربيعي

الشكل 1. تحديث الربيع من OpenAI

كان وضع الصوت في ChatGPT، الذي تم إصداره في أواخر العام الماضي، يعتمد على ثلاثة نماذج مختلفة تعمل معاً لنسخ المدخلات الصوتية، وفهم الردود المكتوبة وتوليدها، وتحويل النص إلى كلام ليتمكن المستخدم من سماع الرد. كان هذا الوضع يتعامل مع مشكلات التأخير ولم يبدُ طبيعياً جداً. يمكن لـ GPT-4o معالجة النصوص والرؤية والصوت أصلياً دفعة واحدة لإعطاء المستخدم انطباعاً بأنه يشارك في محادثة طبيعية.

أيضاً، على عكس وضع الصوت السابق، يمكنك الآن مقاطعة GPT-4o أثناء حديثه، وسوف يتفاعل تماماً كما يفعل الشخص. سيتوقف ويستمع، ثم يقدم رده الفوري بناءً على ما قلته. كما يمكنه التعبير عن المشاعر من خلال صوته وفهم نبرة صوتك أيضاً.

Link to this sectionميزات مثيرة في GPT-4o#

يُظهر تقييم نموذج GPT-4o مدى تطوره. كانت إحدى أكثر النتائج إثارة للاهتمام هي أن GPT-4o يحسن التعرف على الكلام بشكل كبير مقارنة بـ Whisper-v3 في جميع اللغات، خاصة تلك الأقل استخداماً.

يقيس أداء ASR (التعرف التلقائي على الكلام) مدى دقة النموذج في تحويل اللغة المنطوقة إلى نص. يتم تتبع أداء GPT-4o بواسطة معدل خطأ الكلمة (WER)، والذي يوضح النسبة المئوية للكلمات المنسوخة بشكل غير صحيح (انخفاض WER يعني جودة أفضل). يعرض المخطط أدناه انخفاض WER الخاص بـ GPT-4o عبر مختلف المناطق، مما يدل على فعاليته في تحسين التعرف على الكلام للغات ذات الموارد الأقل.

يتمتع GPT-4o بقدرات فائقة في التعرف على الكلام بلغات متعددة

الشكل 2. GPT-4o لديه قدرة فائقة على التعرف على الكلام بلغات متعددة.

إليك نظرة على بعض ميزات GPT-4o الفريدة الأخرى:

  • أسرع - إنه أسرع بمرتين من GPT-4 Turbo. يمكنه الاستجابة للمدخلات الصوتية في 232 مللي ثانية فقط، وهو ما يشبه أوقات استجابة المحادثة البشرية.
  • فعال من حيث التكلفة - إصدار API من GPT-4o أرخص بنسبة 50% من GPT-4 Turbo.
  • الذاكرة - يتمتع GPT-4o بالقدرة على الحفاظ على الوعي عبر محادثات مختلفة. يمكنه تذكر ما تتحدث عنه في محادثات مختلفة.
  • متعدد اللغات - تم تدريب GPT-4o ليكون أسرع وأفضل جودة في 50 لغة مختلفة.

Link to this sectionأمثلة على ما يمكن لـ GPT-4o القيام به#

يمكنك الآن إخراج هاتفك وفتح GPT-4o، وتشغيل الكاميرا، وطلب من GPT-4o، كما تفعل مع صديق، تخمين حالتك المزاجية بناءً على تعابير وجهك. يمكن لـ GPT-4o رؤيتك من خلال الكاميرا والإجابة.

GPT-4o يفهم الحالة المزاجية للإنسان من خلال الفيديو

الشكل 3. GPT-4o يفهم الحالة المزاجية للإنسان عبر الفيديو.

يمكنك حتى استخدامه لمساعدتك في حل مسائل الرياضيات من خلال عرض ما تكتبه لـ GPT-4o عبر الفيديو. وبدلاً من ذلك، يمكنك مشاركة شاشتك، ويمكن أن يصبح معلماً مفيداً على Khan Academy، حيث يطلب منك الإشارة إلى أجزاء مختلفة من مثلث في الهندسة، كما هو موضح أدناه.

GPT-4o يعمل كمعلم في أكاديمية خان

الشكل 4. GPT-4o يعمل كمعلم على Khan Academy.

بعيداً عن مساعدة الأطفال في الرياضيات، يمكن للمطورين إجراء محادثات مع GPT-4o لتصحيح أكوادهم البرمجية. هذا ممكن بفضل تقديم ChatGPT كتطبيق سطح مكتب. إذا قمت بتحديد ونسخ الكود الخاص بك باستخدام CTRL “C” أثناء التحدث إلى تطبيق GPT-4o الصوتي لسطح المكتب، فسيتمكن من قراءة الكود الخاص بك. أو يمكنك استخدامه لترجمة المحادثات بين المطورين الذين يتحدثون لغات مختلفة.

تبدو الإمكانات مع GPT-4o لا حصر لها. استخدمت إحدى أكثر العروض التوضيحية إثارة للاهتمام من OpenAI هاتفين لإظهار GPT-4o وهو يتحدث إلى نسخ مختلفة من نفسه ويغنيان معاً.

الذكاء الاصطناعي يتحدث ويغني مع الذكاء الاصطناعي

الشكل 5. الذكاء الاصطناعي يتحدث ويغني مع الذكاء الاصطناعي.

Link to this sectionتطبيقات GPT-4o#

كما هو موضح في عرض توضيحي، يمكن لـ GPT-4o جعل العالم أكثر سهولة في الوصول للأشخاص ذوي الإعاقة البصرية. يمكن أن يساعدهم على التفاعل والتحرك بشكل أكثر أماناً واستقلالية. على سبيل المثال، يمكن للمستخدمين تشغيل الفيديو الخاص بهم وعرض منظر للشارع لـ GPT-4o. يمكن لـ GPT-4o بعد ذلك تقديم أوصاف فورية للبيئة، مثل تحديد العوائق، أو قراءة لافتات الشوارع، أو توجيههم إلى موقع معين. يمكن أن يساعدهم حتى في استدعاء سيارة أجرة عن طريق تنبيههم عند اقتراب سيارة الأجرة.

GPT-4o ينبه إلى اقتراب سيارة أجرة

الشكل 6. GPT-4o ينبه لاقتراب سيارة أجرة.

وبالمثل، يمكن لـ GPT-4o تحويل مختلف الصناعات بقدراته المتقدمة. في التجزئة، يمكنه تحسين خدمة العملاء من خلال تقديم المساعدة الفورية، والإجابة على الاستفسارات، ومساعدة العملاء في العثور على المنتجات عبر الإنترنت وفي المتجر. لنفترض أنك تنظر إلى رف من المنتجات ولا يمكنك العثور على المنتج الذي تبحث عنه، يمكن لـ GPT-4o مساعدتك.

في الرعاية الصحية، يمكن لـ GPT-4o المساعدة في التشخيص من خلال تحليل بيانات المريض، واقتراح حالات محتملة بناءً على الأعراض، وتقديم إرشادات حول خيارات العلاج. يمكنه أيضاً دعم المهنيين الطبيين من خلال تلخيص سجلات المرضى، وتوفير وصول سريع إلى الأدبيات الطبية، وحتى تقديم ترجمة فورية للغة للتواصل مع المرضى الذين يتحدثون لغات مختلفة. هذه مجرد أمثلة قليلة. تجعل تطبيقات GPT-4o الحياة اليومية أسهل من خلال تقديم مساعدة مخصصة ومراعية للسياق وكسر الحواجز أمام المعلومات والتواصل.

Link to this sectionGPT-4o وسلامة النماذج#

تماماً مثل الإصدارات السابقة من GPT، التي أثرت في مئات الملايين من الأرواح، من المرجح أن يتفاعل GPT-4o مع الصوت والفيديو في الوقت الفعلي عالمياً، مما يجعل السلامة عنصراً حاسماً في هذه التطبيقات. كانت OpenAI حذرة جداً في بناء GPT-4o مع التركيز على تخفيف المخاطر المحتملة.

لضمان السلامة والموثوقية، نفذت OpenAI تدابير سلامة صارمة. وتشمل هذه تصفية بيانات التدريب، وتحسين سلوك النموذج بعد التدريب، ودمج أنظمة أمان جديدة لإدارة المخرجات الصوتية. علاوة على ذلك، تم اختبار GPT-4o بشكل مكثف من قبل أكثر من 70 خبيراً خارجياً في مجالات مثل علم النفس الاجتماعي، والتحيز والعدالة، والمعلومات المضللة. يضمن الاختبار الخارجي تحديد ومعالجة أي مخاطر يتم تقديمها أو تضخيمها بواسطة الميزات الجديدة.

للحفاظ على معايير سلامة عالية، تطلق OpenAI ميزات GPT-4o تدريجياً على مدار الأسابيع القليلة المقبلة. يسمح الطرح المرحلي لـ OpenAI بمراقبة الأداء، ومعالجة أي مشكلات، وجمع ملاحظات المستخدمين. يضمن اتخاذ نهج حذر أن يقدم GPT-4o قدرات متقدمة مع الحفاظ على أعلى معايير السلامة والاستخدام الأخلاقي.

Link to this sectionجرب GPT-4o بنفسك#

يتوفر GPT-4o للوصول المجاني. لتجربة قدرات المحادثة الفورية المذكورة أعلاه، يمكنك تنزيل تطبيق ChatGPT من متجر Google Play أو Apple App Store مباشرة على هاتفك.

بعد تسجيل الدخول، ستتمكن من تحديد GPT-4o من القائمة المعروضة عن طريق النقر على النقاط الثلاث في الزاوية اليمنى العليا من الشاشة. بعد الانتقال إلى محادثة مفعل بها GPT-4o، إذا نقرت على علامة الجمع في الزاوية اليسرى السفلية من الشاشة، فسترى خيارات إدخال متعددة. في الزاوية اليمنى السفلية من الشاشة، سترى أيقونة سماعة الرأس. عند تحديد أيقونة سماعة الرأس، سيُطلب منك ما إذا كنت ترغب في تجربة نسخة بدون استخدام اليدين من GPT-4o. بعد الموافقة، ستتمكن من تجربة GPT-4o، كما هو موضح أدناه.

تجربة GPT-4o على تطبيق ChatGPT للهواتف المحمولة

الشكل 7. تجربة GPT-4o على تطبيق الهاتف المحمول ChatGPT.

إذا كنت ترغب في دمج قدرات GPT-4o المتقدمة في مشاريعك الخاصة، فهو متاح كـ API للمطورين. فهو يسمح لك بدمج قدرات التعرف على الكلام القوية، ودعم اللغات المتعددة، وقدرات المحادثة الفورية لـ GPT-4o في تطبيقاتك. باستخدام API، يمكنك تحسين تجارب المستخدم، وبناء تطبيقات أكثر ذكاءً، وجلب تكنولوجيا الذكاء الاصطناعي المتطورة إلى قطاعات مختلفة.

Link to this sectionGPT-4o: ليس بشراً تماماً بعد#

على الرغم من أن GPT-4o أكثر تطوراً بكثير من نماذج الذكاء الاصطناعي السابقة، فمن المهم أن نتذكر أن GPT-4o يأتي مع قيوده الخاصة. ذكرت OpenAI أنه يمكنه أحياناً التبديل عشوائياً بين اللغات أثناء التحدث، من الإنجليزية إلى الفرنسية. كما لاحظوا أن GPT-4o يترجم بشكل غير صحيح بين اللغات. مع قيام المزيد من الأشخاص بتجربة النموذج، سنفهم أين يتفوق GPT-4o وما يحتاج إلى مزيد من التحسين.

Link to this sectionالخلاصة#

يفتح GPT-4o من OpenAI أبواباً جديدة للذكاء الاصطناعي بمعالجته المتقدمة للنصوص والرؤية والصوت، مما يوفر تفاعلات طبيعية تشبه البشر. إنه يتفوق من حيث السرعة وكفاءة التكلفة ودعم اللغات المتعددة. يعد GPT-4o أداة متعددة الاستخدامات للتعليم وسهولة الوصول والمساعدة الفورية. مع استكشاف المستخدمين لقدرات GPT-4o، ستدفع الملاحظات تطوره. يثبت GPT-4o أن الذكاء الاصطناعي يغير عالمنا حقاً ويصبح جزءاً من حياتنا اليومية.

استكشف مستودع GitHub الخاص بنا وانضم إلى مجتمعنا للتعمق أكثر في الذكاء الاصطناعي. تفضل بزيارة صفحات الحلول الخاصة بنا لمعرفة كيف يقوم الذكاء الاصطناعي بتحويل صناعات مثل التصنيع والزراعة.

Explore solutions

Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد

لنبنِ مستقبل الذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل تعلم الآلة