Yolo فيجن شنتشن
شنتشن
انضم الآن

OpenAI o1: سلسلة جديدة من نماذج OpenAI لاستدلال الذكاء الاصطناعي

أبيرامي فينا

5 دقائق قراءة

13 سبتمبر 2024

اكتشف المزيد حول نماذج OpenAI o1 التي تم إطلاقها حديثًا وما الذي يجعلها مميزة. سنلقي نظرة أيضًا على كيفية عملها وتأثيرها على مستقبل الذكاء الاصطناعي.

كان مجتمع الذكاء الاصطناعي يعج بالتكهنات حول الخطوة التالية لنماذج GPT الخاصة ب OpenAI، حيث يشير الكثيرون إلى ذلك باسم "مشروع الفراولة". والسبب وراء ذلك هو أنك إذا طلبت من GPT-4o بسؤالك عن عدد حروف الراء في كلمة "فراولة"، سيخبرك أن هناك حرفين R في كلمة"فراولة". قد يبدو الأمر غريباً بالنظر إلى مدى قوة GPT-4o. ومع ذلك، فإن النموذج مصمم لمعالجة النص الفرعي وليس الكلمات بالضبط. وقد أشيع أن النموذج التالي سيهدف إلى حل هذه المشكلة. عزز Sam ألتمان هذه الشائعات من خلال نشر صور الفراولة على حسابه على X (المعروف سابقاً باسم تويتر).

مع إعلان OpenAI الأخير يوم الخميس الموافق 12 سبتمبر، لدينا أخيرًا إجابة للتكهنات! تم إصدار OpenAI o1، وهي سلسلة جديدة من نماذج الذكاء الاصطناعي المصممة للإبطاء والتفكير قبل الرد. ومن المثير للاهتمام أن OpenAI o1 يمكنه التفكير بشكل أفضل والإجابة على السؤال المتعلق بالفراولة بشكل صحيح! في هذه المقالة، سنناقش ماهية OpenAI o1، وكيف يعمل، وأين يمكن استخدامه، وماذا يعني لمستقبل الذكاء الاصطناعي. هيا بنا نبدأ!

__wf_reserved_inherit
الشكل 1. مثال على مطالبة OpenAI o1 حول الفراولة.

تطورات جديدة في الذكاء الاصطناعي من OpenAI

في يوليو 2024، صرح مسؤولون تنفيذيون في OpenAI بأن أبحاث OpenAI تقترب من مستوى القدرة البشرية على حل المشكلات، وهو ما يشار إليه بـ المستوى الثاني من الذكاء الاصطناعي. من الواضح أن هذا المستوى يركز على الاستدلال، حيث تقدم OpenAI سلسلة النماذج الجديدة الخاصة بها، OpenAI o1، باعتبارها تفكر قبل أن تجيب. OpenAI o1 هو نموذج لغوي كبير (LLM) جديد، وهو نموذج ذكاء اصطناعي يفهم وينتج نصوصًا شبيهة بالنصوص البشرية عن طريق تعلم الأنماط من كميات هائلة من البيانات اللغوية. لقد تم تصميمه للتعامل مع المشكلات المعقدة التي تتطلب استدلالًا متعمقًا. 

__wf_reserved_inherit
الشكل 2. منظور OpenAI حول مراحل الذكاء الاصطناعي.

تم تدريب النموذج باستخدام التعلم المعزز، وهي تقنية يتعلم فيها النموذج اتخاذ قرارات أفضل من خلال التجربة والخطأ عن طريق تلقي مكافآت أو عقوبات على أفعاله. تساعد خوارزمية التعلم المعزز النموذج على التفكير بشكل أكثر فعالية من خلال اتباع سلسلة من الأفكار. شاركت OpenAI أيضًا في أن أداء o1 يستمر في التحسن مع المزيد من التعلم المعزز أثناء التدريب ومع المزيد من الوقت الذي يقضيه في "التفكير" أثناء حل المشكلات، مما يدل على أن التدريب المطول والمعالجة المدروسة يساعدان في تعزيز قدرات النموذج.

على الرغم من أن OpenAI o1 يعد تقدمًا كبيرًا في التفكير المعقد، إلا أنه لا يزال نموذجًا مبكرًا ويفتقر إلى بعض الميزات التي تجعل ChatGPT مفيدًا، مثل تصفح الويب أو تحميل الملفات والصور. بالنسبة للعديد من المهام الشائعة، قد لا يزال GPT-4o أكثر قدرة في الوقت الحالي. ومع ذلك، فإن OpenAI o1 يمثل خطوة كبيرة إلى الأمام في قدرة الذكاء الاصطناعي على التعامل مع التفكير المعقد، ولهذا السبب يبدأ OpenAI سلسلة جديدة ويطلق عليها OpenAI o1.

كيف تعزز نماذج OpenAI الجديدة قدرات الاستدلال في الذكاء الاصطناعي

يمكن استخدام OpenAI o1 لمهام مثل فك الشفرات وحل تحديات البرمجة والإجابة على مسائل الرياضيات ومعالجة الكلمات المتقاطعة وحتى معالجة الموضوعات المعقدة في العلوم و السلامة و الرعاية الصحية. في إشارة مسلية إلى الاسم الرمزي للمشروع، أظهرت OpenAI مهارات الاستدلال للنموذج من خلال فك شفرة كشفت عن الرسالة "THERE ARE THREE R’S IN STRAWBERRY". 

بالإضافة إلى حل الشفرات، فإن OpenAI o1 ماهر أيضًا في البرمجة. إنه يؤدي أداءً جيدًا في تحديات البرمجة التنافسية مثل تلك الموجودة على Codeforces، وهي منصة يحل فيها المبرمجون مشاكل البرمجة المعقدة في ظل ظروف محددة بوقت. في هذه التحديات، يحقق النموذج تصنيفات Elo عالية (نظام تسجيل يقيس مستويات المهارة بناءً على الأداء ضد المنافسين الآخرين) ويتفوق على النماذج السابقة. كما أنه يتفوق في الرياضيات ويؤدي أداءً جيدًا في الاختبارات مثل اختبار الرياضيات الأمريكي المدعو (AIME). 

__wf_reserved_inherit
الشكل 3. قياس القدرات البرمجية لـ o1.

تضع هذه التطورات OpenAI o1 كترقية كبيرة من النماذج السابقة مثل GPT-4o. إنه يفتح إمكانيات جديدة للذكاء الاصطناعي في مجالات مثل الأعمال والتطوير و البحث و الرعاية الصحية. على سبيل المثال، في أبحاث علم الوراثة، يمكن لـ OpenAI o1 أن يمر بسرعة عبر عدد كبير من الأوراق البحثية، ويختار النتائج الرئيسية والروابط بين العلامات الوراثية و الأمراض. إنه يفهم اللغة العلمية المعقدة ويمكنه تلخيص النقاط المهمة، مما يساعد الباحثين على التركيز على المعلومات الأكثر صلة. 

نظرة فاحصة على سلسلة الأفكار

رأينا سابقًا أن OpenAI o1 يقدم عملية تفكير "سلسلة الأفكار". فهو يمكّن النموذج من معالجة المشكلات المعقدة بطريقة مماثلة للاستراتيجيات المعرفية البشرية. يمكن للنموذج تقسيم التحديات إلى خطوات أصغر يمكن التحكم فيها وتحسين منهجه بشكل متكرر. على عكس النماذج السابقة التي اعتمدت على التعرف على الأنماط الفوري، فإن o1 يحسن عملية اتخاذ القرار من خلال استكشاف مسارات تفكير متعددة، والتعلم من النجاحات والأخطاء من خلال التعلم المعزز.

قررت OpenAI إبقاء سلاسل الأفكار الأولية هذه مخفية عن المستخدمين، وبدلاً من ذلك تقدم ملخصات توفر نظرة ثاقبة لمنطق النموذج دون الكشف عن كل خطوة. يساعد هذا القرار في منع إساءة استخدام عملية تفكير النموذج مع السماح للمطورين بمراقبة وتحسين سلامة الذكاء الاصطناعي ومواءمته. من خلال مراقبة السلاسل المخفية داخليًا، يمكن للمطورين التأكد من أن o1 يلتزم بالمبادئ التوجيهية الأخلاقية ويتجنب السلوك الضار.

قياس أداء OpenAI o1

تُظهر OpenAI o1 تحسينات كبيرة مقارنة بـ GPT-4o في العديد من المقاييس التي تختبر قدرات الاستدلال وحل المشكلات. في امتحان الرياضيات الأمريكي المدعو (AIME) 2024، وهو امتحان رياضيات صعب لأفضل طلاب المدارس الثانوية، حقق o1 معدل دقة 74٪ بعينة واحدة فقط لكل مشكلة، مقارنة بـ 12٪ لـ GPT-4o. مع الإجماع عبر 64 عينة، زادت دقته إلى 83٪، وباستخدام طريقة إعادة ترتيب محسنة مع 1000 عينة، وصل إلى 93٪، مما وضعه بين أفضل 500 طالب على مستوى البلاد. 

بالإضافة إلى الرياضيات، أظهر o1 أيضًا أداءً جيدًا بشكل استثنائي في المعايير التي تختبر المعرفة العلمية، مثل GPQA Diamond، الذي يغطي أسئلة على مستوى الدكتوراه في الكيمياء و الفيزياء و علم الأحياء. والجدير بالذكر أن o1 تفوق على الخبراء البشريين الحاصلين على درجة الدكتوراه في هذا الاختبار، مما يجعله أول نموذج ذكاء اصطناعي يفعل ذلك. كما تفوق على GPT-4o في 54 فئة من أصل 57 فئة في معيار MMLU، الذي يختبر الفهم عبر مجموعة متنوعة من الموضوعات، بما في ذلك التاريخ و القانون والعلوم.

__wf_reserved_inherit
الشكل 4. قياس أداء OpenAI o1.

انطلق عمليًا مع OpenAI o1

قدمت OpenAI نموذجين جديدين للذكاء الاصطناعي في سلسلة o1: o1-preview و o1-mini. تم تصميم نموذج o1-preview للتفكير بشكل أعمق قبل الرد، والتفوق في مهام الاستدلال المعقدة في العلوم والبرمجة والرياضيات. إنه يوفر قدرات متقدمة لحل المشكلات للمستخدمين الذين يتعاملون مع المشاريع الصعبة. في المقابل، o1-mini هو نموذج أصغر وأسرع وأكثر فعالية من حيث التكلفة ومُحسَّن خصيصًا للاستدلال في مجالات العلوم والتكنولوجيا والهندسة والرياضيات (STEM)، وخاصة الرياضيات والبرمجة. على الرغم من أنه قد يكون لديه معرفة عالمية أقل اتساعًا، إلا أن o1-mini يضاهي تقريبًا أداء o1-preview في التقييمات الرئيسية مثل مسابقة الرياضيات AIME وتحديات البرمجة Codeforces، وكل ذلك بتكلفة أقل بنسبة 80٪.

__wf_reserved_inherit
الشكل 5. مقارنة نماذج OpenAI.

يمكنك تجربة هذه النماذج من خلال منصات OpenAI المختلفة. يمكن لمستخدمي ChatGPT Plus و Team الوصول إلى كل من o1-preview و o1-mini عبر منتقي النماذج، وتجربة قدرات التفكير المحسّنة مباشرةً في ChatGPT. يمكن للمطوّرين الذين لديهم إمكانية الوصول إلى المستوى 5 من استخدام واجهة برمجة التطبيقات البدء في وضع النماذج الأولية باستخدام هذه النماذج، على الرغم من أن بعض الميزات المتقدمة لا تزال قيد التطوير. تخطط OpenAI أيضاً لإتاحة o1-mini لجميع مستخدمي ChatGPT المجاني قريباً. من خلال استكشاف هذه النماذج، يمكنك تجربة التطورات في مجال التفكير بالذكاء الاصطناعي بشكل مباشر واختيار النموذج الذي يناسب احتياجاتك.

اعتبارات الذكاء الاصطناعي الأخلاقية التي وضعتها OpenAI

ركزت OpenAI على الأخلاقيات والسلامة أثناء تطوير سلسلة نماذج o1. قبل إصدار نموذجي o1-preview و o1-mini، أجروا تقييمات شاملة، بما في ذلك اختبارات خارجية وفحوصات داخلية للمخاطر مثل المحتوى المحظور والهلوسة والتحيز. تم تصميم النماذج بقدرات استنتاج متقدمة لفهم قواعد السلامة واتباعها بشكل أفضل. 

قامت OpenAI أيضًا بتطبيق إجراءات حماية مثل القوائم المحظورة ومصنفات السلامة لإدارة المخاطر. يحمل نموذج o1 تصنيفًا متوسطًا للمخاطر الإجمالية. لديه مخاطر منخفضة في مجالات مثل الأمن السيبراني واستقلالية النموذج ومخاطر متوسطة في مجالات مثل محتوى CBRN (الكيميائي والبيولوجي والإشعاعي والنووي) والإقناع. قامت المجموعة الاستشارية للسلامة والمجلس التابعان لـ OpenAI بمراجعة إجراءات السلامة هذه لضمان أن النموذج آمن وأخلاقي للاستخدام.

__wf_reserved_inherit
الشكل 6. بطاقة أداء OpenAI o1.

من الشائعات إلى الواقع: OpenAI o1 يصعد إلى المسرح

يُعد OpenAI o1 خطوة كبيرة إلى الأمام في مجال التفكير بالذكاء الاصطناعي، محولاً بعض الشائعات المبكرة إلى حقيقة. على عكس GPT-4o، فإن سلسلة o1 تفكر بشكل أعمق باستخدام نهج "سلسلة الأفكار"، حيث تقوم بتقسيم المشاكل المعقدة إلى خطوات أصغر للحصول على استجابات أفضل. متوفرة حالياً كمعاينة مبكرة في ChatGPT وواجهة برمجة التطبيقات، وتخطط OpenAI لإضافة ميزات مثل تصفح الويب وتحميل الملفات والصور. كما شارك OpenAI أيضاً أنهم يخططون لمواصلة تطوير وإصدار نماذج في سلسلة GPT، إلى جانب سلسلة OpenAI o1 الجديدة. مع استمرار تطور الذكاء الاصطناعي، فإن مثل هذه التطورات تمهد الطريق لأنظمة ذكاء اصطناعي أكثر قوة وبديهية وتنوعاً يمكنها مساعدة وفهم الاحتياجات البشرية بشكل أفضل.

واكب آخر التطورات في مجال الذكاء الاصطناعي من خلال الانضمام إلى مجتمعنا! توجه إلى مستودع GitHub الخاص بنا لترى كيف أننا رواد حلول الذكاء الاصطناعي في قطاعات مثل التصنيع و الرعاية الصحية. 🚀

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا