OpenAI o1: سلسلة جديدة من نماذج OpenAI لاستدلال الذكاء الاصطناعي
اكتشف المزيد حول نماذج OpenAI o1 التي تم إطلاقها حديثاً وما الذي يجعلها مميزة. سنلقي نظرة أيضاً على كيفية عملها وتأثيرها على مستقبل الذكاء الاصطناعي.

يعج مجتمع الذكاء الاصطناعي بالتكهنات حول الخطوة التالية لـ نماذج GPT من OpenAI، حيث يشير إليها الكثيرون باسم "Project Strawberry". والسبب وراء ذلك هو أنه إذا قمت بـ توجيه أمر لـ GPT-4o بسؤاله عن عدد حرف R في كلمة "strawberry"، فسيخبرك بوجود حرفي R في كلمة "strawberry". قد يبدو هذا غريباً بالنظر إلى مدى قوة GPT-4o. ومع ذلك، تم بناء النموذج لمعالجة السياق الضمني، وليس الكلمات الدقيقة. انتشرت شائعات بأن النموذج القادم سيهدف إلى حل هذه المشكلة. وقد أجج سام ألتمان هذه الشائعات بنشر صور للفراولة على حسابه على X (المعروف سابقاً باسم تويتر).
مع أحدث إعلان لـ OpenAI يوم الخميس، 12 سبتمبر، حصلنا أخيراً على إجابة لهذه التكهنات! تم إصدار OpenAI o1، وهي سلسلة جديدة من نماذج الذكاء الاصطناعي مصممة لتتمهل وتفكر قبل الاستجابة. ومن المثير للاهتمام أن OpenAI o1 يمكنه الاستدلال بشكل أفضل والإجابة على سؤال الفراولة بشكل صحيح! في هذه المقالة، سنناقش ماهية OpenAI o1، وكيف يعمل، وأين يمكن استخدامه، وما يعنيه لمستقبل الذكاء الاصطناعي. لنبدأ!

الشكل 1. مثال على توجيه أمر لـ OpenAI o1 حول الفراولة.
Link to this sectionتطورات جديدة في الذكاء الاصطناعي من OpenAI#
في يوليو 2024، شارك المسؤولون التنفيذيون في OpenAI أن أبحاث OpenAI تقترب من المستوى البشري في حل المشكلات، والذي يشار إليه بـ المستوى 2 من الذكاء الاصطناعي. من الواضح أن هذا المستوى يركز على الاستدلال، حيث تقدم OpenAI سلسلتها الجديدة من النماذج، OpenAI o1، كنموذج يفكر قبل أن يجيب. يعد OpenAI o1 نموذجاً جديداً من نماذج LLM (نموذج لغوي كبير)، وهو نموذج ذكاء اصطناعي يفهم النصوص البشرية ويولدها من خلال تعلم الأنماط من كميات هائلة من البيانات اللغوية. وقد تم تصميمه للتعامل مع المشكلات المعقدة التي تتطلب استدلالاً متعمقاً.

الشكل 2. وجهة نظر OpenAI حول مراحل الذكاء الاصطناعي.
تم تدريب النموذج باستخدام التعلم التعزيزي، وهي تقنية يتعلم فيها النموذج اتخاذ قرارات أفضل من خلال التجربة والخطأ عبر تلقي مكافآت أو عقوبات على أفعاله. تساعد خوارزمية التعلم التعزيزي النموذج على التفكير بشكل أكثر فعالية من خلال اتباع سلسلة من الأفكار. كما شاركت OpenAI أن أداء o1 يستمر في التحسن مع المزيد من التعلم التعزيزي أثناء التدريب ومع قضاء المزيد من الوقت في "التفكير" أثناء حل المشكلات، مما يوضح أن كلاً من التدريب الموسع والمعالجة المتأنية يساعدان في تعزيز قدرات النموذج.
على الرغم من أن OpenAI o1 يمثل تقدماً كبيراً في الاستدلال المعقد، إلا أنه لا يزال نموذجاً مبكراً ويفتقر إلى بعض الميزات التي تجعل ChatGPT مفيداً، مثل تصفح الويب أو تحميل الملفات والصور. بالنسبة للعديد من المهام الشائعة، قد يظل GPT-4o أكثر قدرة في الوقت الحالي. ومع ذلك، يمثل OpenAI o1 خطوة كبيرة إلى الأمام في قدرة الذكاء الاصطناعي على التعامل مع الاستدلال المعقد، وهذا هو السبب في أن OpenAI تبدأ سلسلة جديدة وتسميها OpenAI o1.
Link to this sectionكيف تعزز نماذج OpenAI الجديدة استدلال الذكاء الاصطناعي#
يمكن استخدام OpenAI o1 لمهام مثل فك الشفرات، وحل تحديات البرمجة، والإجابة على المسائل الرياضية، ومعالجة الكلمات المتقاطعة، وحتى التعامل مع مواضيع معقدة في العلوم، والسلامة، والرعاية الصحية. في إشارة طريفة إلى الاسم الكودي للمشروع، أظهرت OpenAI مهارات الاستدلال لدى النموذج من خلال كسر شفرة كشفت عن الرسالة "THERE ARE THREE R’S IN STRAWBERRY."
بعيداً عن حل الشفرات، يتميز OpenAI o1 أيضاً ببراعة في البرمجة. فهو يؤدي أداءً جيداً في تحديات البرمجة التنافسية مثل تلك الموجودة على Codeforces، وهي منصة حيث يحل المبرمجون مشكلات برمجية معقدة في ظل ظروف زمنية محددة. في هذه التحديات، يحقق النموذج تقييمات Elo عالية (نظام تسجيل يقيس مستويات المهارة بناءً على الأداء مقابل منافسين آخرين) ويتفوق على النماذج السابقة. كما أنه يتفوق في الرياضيات ويحقق نتائج جيدة في الامتحانات مثل امتحان الرياضيات الأمريكي المدعو (AIME).

الشكل 3. قياس أداء قدرات البرمجة لـ o1.
تضع هذه التطورات OpenAI o1 كترقية كبيرة عن النماذج السابقة مثل GPT-4o. وهي تفتح آفاقاً جديدة للذكاء الاصطناعي في مجالات مثل الأعمال، والتطوير، والأبحاث، والرعاية الصحية. على سبيل المثال، في أبحاث علم الوراثة، يمكن لـ OpenAI o1 مراجعة عدد كبير من الأوراق البحثية بسرعة، واختيار النتائج الرئيسية والروابط بين العلامات الجينية والأمراض. إنه يفهم اللغة العلمية المعقدة ويمكنه تلخيص النقاط المهمة، مما يساعد الباحثين على التركيز على المعلومات الأكثر صلة.
Link to this sectionنظرة فاحصة على سلسلة الأفكار#
لقد رأينا سابقاً أن OpenAI o1 يقدم عملية استدلال بـ "سلسلة من الأفكار". فهي تمكن النموذج من معالجة المشكلات المعقدة بطريقة مشابهة لاستراتيجيات الإدراك البشري. يمكن للنموذج تقسيم التحديات إلى خطوات أصغر قابلة للإدارة وتحسين نهجه بشكل تكراري. على عكس النماذج السابقة التي اعتمدت على التعرف الفوري على الأنماط، يقوم o1 بتحسين اتخاذ القرار من خلال استكشاف مسارات استدلال متعددة، والتعلم من النجاحات والأخطاء من خلال التعلم التعزيزي.
قررت OpenAI إبقاء سلاسل الأفكار الخام هذه مخفية عن المستخدمين، وبدلاً من ذلك تقدم ملخصات توفر رؤية ثاقبة لاستدلال النموذج دون كشف كل خطوة. يساعد هذا القرار في منع إساءة استخدام عملية تفكير النموذج مع السماح للمطورين بمراقبة وتحسين سلامة ومواءمة الذكاء الاصطناعي. من خلال مراقبة السلاسل المخفية داخلياً، يمكن للمطورين التأكد من أن o1 يلتزم بـ المبادئ التوجيهية الأخلاقية ويتجنب السلوك الضار.
Link to this sectionقياس أداء OpenAI o1#
يُظهر OpenAI o1 تحسينات كبيرة مقارنة بـ GPT-4o في العديد من مقاييس الأداء التي تختبر قدرات الاستدلال وحل المشكلات. في امتحان الرياضيات الأمريكي المدعو (AIME) لعام 2024، وهو امتحان رياضيات صعب لطلاب المدارس الثانوية المتميزين، حقق o1 معدل دقة 74% بعينة واحدة فقط لكل مسألة، مقارنة بـ 12% لـ GPT-4o. ومع الإجماع عبر 64 عينة، زادت دقته إلى 83%، وباستخدام طريقة إعادة ترتيب محسنة مع 1000 عينة، وصل إلى 93%، مما وضعه بين أفضل 500 طالب على المستوى الوطني.
بعيداً عن الرياضيات، أدى o1 أداءً استثنائياً أيضاً في مقاييس الأداء التي تختبر المعرفة العلمية، مثل GPQA Diamond، الذي يغطي أسئلة بمستوى الدكتوراه في الكيمياء، والفيزياء، وعلم الأحياء. واللافت للنظر أن o1 تفوق على الخبراء البشريين الحاصلين على الدكتوراه في هذا الاختبار، مما يجعله أول نموذج ذكاء اصطناعي يقوم بذلك. كما تفوق على GPT-4o في 54 من أصل 57 فئة في مقياس MMLU، الذي يختبر الفهم عبر مجموعة متنوعة من الموضوعات، بما في ذلك التاريخ، والقانون، والعلوم.

الشكل 4. قياس أداء OpenAI o1.
Link to this sectionجرب OpenAI o1 بنفسك#
قدمت OpenAI نموذجين جديدين من الذكاء الاصطناعي في سلسلة o1: o1-preview و o1-mini. تم تصميم نموذج o1-preview ليفكر بعمق أكبر قبل الاستجابة، متفوقاً في مهام الاستدلال المعقدة في العلوم والبرمجة والرياضيات. وهو يوفر قدرات متقدمة لحل المشكلات للمستخدمين الذين يتناولون مشاريع صعبة. في المقابل، يعد o1-mini نموذجاً أصغر وأسرع وأكثر فعالية من حيث التكلفة، تم تحسينه خصيصاً لاستدلال مجالات STEM، خاصة الرياضيات والبرمجة. على الرغم من أن معرفته العامة بالعالم قد تكون أقل، إلا أن o1-mini يطابق تقريباً أداء o1-preview في التقييمات الرئيسية مثل مسابقة الرياضيات AIME وتحديات البرمجة Codeforces، وكل ذلك بتكلفة أقل بنسبة 80%.

الشكل 5. مقارنة نماذج OpenAI.
يمكنك تجربة هذه النماذج من خلال منصات OpenAI المختلفة. يمكن لمستخدمي ChatGPT Plus وTeam الوصول إلى كل من o1-preview و o1-mini عبر أداة اختيار النموذج، وتجربة قدرات استدلال معززة مباشرة في ChatGPT. يمكن للمطورين الحاصلين على وصول API من المستوى 5 البدء في وضع النماذج الأولية باستخدام هذه النماذج، على الرغم من أن بعض الميزات المتقدمة لا تزال قيد التطوير. تخطط OpenAI أيضاً لإتاحة o1-mini لجميع مستخدمي ChatGPT المجانيين قريباً. من خلال استكشاف هذه النماذج، يمكنك تجربة التطورات في استدلال الذكاء الاصطناعي بشكل مباشر واختيار النموذج الذي يناسب احتياجاتك بشكل أفضل.
Link to this sectionاعتبارات الذكاء الاصطناعي الأخلاقي التي وضعتها OpenAI#
ركزت OpenAI على الأخلاقيات والسلامة أثناء تطوير سلسلة نماذج o1. قبل إصدار نماذج o1-preview و o1-mini، أجروا تقييمات شاملة، بما في ذلك اختبارات خارجية وفحوصات داخلية للمخاطر مثل المحتوى غير المسموح به، والهلوسة، والتحيز. تم تصميم النماذج بقدرات استدلال متقدمة لفهم قواعد السلامة واتباعها بشكل أفضل.
نفذت OpenAI أيضاً ضمانات مثل قوائم الحظر ومصنفات السلامة لإدارة المخاطر. يتمتع نموذج o1 بتصنيف مخاطر عام متوسط. ولديه مخاطر منخفضة في مجالات مثل الأمن السيبراني واستقلالية النموذج ومخاطر متوسطة في مجالات مثل محتوى CBRN (الكيميائي، والبيولوجي، والإشعاعي، والنووي) والإقناع. قامت مجموعة OpenAI الاستشارية للسلامة ومجلس الإدارة بمراجعة تدابير السلامة هذه للتأكد من أن النموذج آمن وأخلاقي للاستخدام.

الشكل 6. بطاقة قياس أداء OpenAI o1.
Link to this sectionمن الشائعات إلى الواقع: OpenAI o1 يصعد إلى المسرح#
يعد OpenAI o1 خطوة كبيرة إلى الأمام في استدلال الذكاء الاصطناعي، حيث يحول بعض الشائعات المبكرة إلى حقيقة. على عكس GPT-4o، تفكر سلسلة o1 بعمق أكبر باستخدام نهج "سلسلة الأفكار"، مما يقسم المشكلات المعقدة إلى خطوات أصغر لاستجابات أفضل. متاح حالياً كمعاينة مبكرة في ChatGPT وواجهة برمجة التطبيقات، وتخطط OpenAI لإضافة ميزات مثل تصفح الويب وتحميل الملفات والصور. كما شاركت OpenAI أنها تخطط لمواصلة تطوير وإصدار نماذج في سلسلة GPT، إلى جانب سلسلة OpenAI o1 الجديدة. مع استمرار تطور الذكاء الاصطناعي، تمهد مثل هذه التطورات الطريق لأنظمة ذكاء اصطناعي أكثر قوة وبداهة وتعدداً في الاستخدامات يمكنها مساعدة وفهم الاحتياجات البشرية بشكل أفضل.
واكب أحدث التطورات في الذكاء الاصطناعي من خلال الانضمام إلى مجتمعنا! توجه إلى مستودع GitHub الخاص بنا لرؤية كيف نبتكر حلول الذكاء الاصطناعي في قطاعات مثل التصنيع والرعاية الصحية. 🚀






