يولو فيجن شنتشن
شنتشن
انضم الآن

OpenAI o1: سلسلة جديدة من نماذج OpenAI لاستدلال الذكاء الاصطناعي

أبيرامي فينا

5 دقائق قراءة

13 سبتمبر 2024

اكتشف المزيد حول نماذج OpenAI o1 التي تم إطلاقها حديثًا وما الذي يجعلها مميزة. سنلقي نظرة أيضًا على كيفية عملها وتأثيرها على مستقبل الذكاء الاصطناعي.

كان مجتمع الذكاء الاصطناعي يعج بالتكهنات حول الخطوة التالية لنماذج GPT من OpenAI، حيث يشير إليها الكثيرون باسم "Project Strawberry". والسبب وراء ذلك هو أنه إذا قمت بمطالبة GPT-4o بالسؤال عن عدد الحروف "R" الموجودة في كلمة "strawberry"، فسيخبرك أن هناك حرفين "R" في كلمة "strawberry". قد يبدو الأمر غريبًا، بالنظر إلى مدى قوة GPT-4o. ومع ذلك، تم تصميم النموذج لمعالجة النص الفرعي، وليس الكلمات الدقيقة. ترددت شائعات بأن النموذج التالي سيهدف إلى حل هذه المشكلة. زاد Sam Altman من هذه الشائعات من خلال نشر صور للفراولة على حسابه على X (المعروف سابقًا باسم Twitter).

مع إعلان OpenAI الأخير يوم الخميس الموافق 12 سبتمبر، لدينا أخيرًا إجابة للتكهنات! تم إصدار OpenAI o1، وهي سلسلة جديدة من نماذج الذكاء الاصطناعي المصممة للإبطاء والتفكير قبل الرد. ومن المثير للاهتمام أن OpenAI o1 يمكنه التفكير بشكل أفضل والإجابة على السؤال المتعلق بالفراولة بشكل صحيح! في هذه المقالة، سنناقش ماهية OpenAI o1، وكيف يعمل، وأين يمكن استخدامه، وماذا يعني لمستقبل الذكاء الاصطناعي. هيا بنا نبدأ!

__wf_reserved_inherit
الشكل 1. مثال على مطالبة OpenAI o1 حول الفراولة.

تطورات جديدة في الذكاء الاصطناعي من OpenAI

في يوليو 2024، صرح مسؤولون تنفيذيون في OpenAI بأن أبحاث OpenAI تقترب من مستوى القدرة البشرية على حل المشكلات، وهو ما يشار إليه بـ المستوى الثاني من الذكاء الاصطناعي. من الواضح أن هذا المستوى يركز على الاستدلال، حيث تقدم OpenAI سلسلة النماذج الجديدة الخاصة بها، OpenAI o1، باعتبارها تفكر قبل أن تجيب. OpenAI o1 هو نموذج لغوي كبير (LLM) جديد، وهو نموذج ذكاء اصطناعي يفهم وينتج نصوصًا شبيهة بالنصوص البشرية عن طريق تعلم الأنماط من كميات هائلة من البيانات اللغوية. لقد تم تصميمه للتعامل مع المشكلات المعقدة التي تتطلب استدلالًا متعمقًا. 

__wf_reserved_inherit
الشكل 2. منظور OpenAI حول مراحل الذكاء الاصطناعي.

تم تدريب النموذج باستخدام التعلم المعزز، وهي تقنية يتعلم فيها النموذج اتخاذ قرارات أفضل من خلال التجربة والخطأ عن طريق تلقي مكافآت أو عقوبات على أفعاله. تساعد خوارزمية التعلم المعزز النموذج على التفكير بشكل أكثر فعالية من خلال اتباع سلسلة من الأفكار. شاركت OpenAI أيضًا في أن أداء o1 يستمر في التحسن مع المزيد من التعلم المعزز أثناء التدريب ومع المزيد من الوقت الذي يقضيه في "التفكير" أثناء حل المشكلات، مما يدل على أن التدريب المطول والمعالجة المدروسة يساعدان في تعزيز قدرات النموذج.

في حين أن OpenAI o1 هو تقدم كبير في التفكير المعقد، إلا أنه لا يزال نموذجًا مبكرًا ويفتقر إلى بعض الميزات التي تجعل ChatGPT مفيدًا، مثل تصفح الويب أو تحميل الملفات والصور. بالنسبة للعديد من المهام الشائعة، قد يكون GPT-4o أكثر قدرة في الوقت الحالي. ومع ذلك، فإن OpenAI o1 يمثل خطوة كبيرة إلى الأمام في قدرة الذكاء الاصطناعي على التعامل مع التفكير المعقد، ولهذا السبب تبدأ OpenAI سلسلة جديدة وتطلق عليها OpenAI o1.

كيف تعزز نماذج OpenAI الجديدة قدرات الاستدلال في الذكاء الاصطناعي

يمكن استخدام OpenAI o1 لمهام مثل فك الشفرات وحل تحديات البرمجة والإجابة على مسائل الرياضيات ومعالجة الكلمات المتقاطعة وحتى معالجة الموضوعات المعقدة في العلوم و السلامة و الرعاية الصحية. في إشارة مسلية إلى الاسم الرمزي للمشروع، أظهرت OpenAI مهارات الاستدلال للنموذج من خلال فك شفرة كشفت عن الرسالة "THERE ARE THREE R’S IN STRAWBERRY". 

بالإضافة إلى حل الشفرات، فإن OpenAI o1 ماهر أيضًا في البرمجة. إنه يؤدي أداءً جيدًا في تحديات البرمجة التنافسية مثل تلك الموجودة على Codeforces، وهي منصة يحل فيها المبرمجون مشاكل البرمجة المعقدة في ظل ظروف محددة بوقت. في هذه التحديات، يحقق النموذج تصنيفات Elo عالية (نظام تسجيل يقيس مستويات المهارة بناءً على الأداء ضد المنافسين الآخرين) ويتفوق على النماذج السابقة. كما أنه يتفوق في الرياضيات ويؤدي أداءً جيدًا في الاختبارات مثل اختبار الرياضيات الأمريكي المدعو (AIME). 

__wf_reserved_inherit
الشكل 3. قياس القدرات البرمجية لـ o1.

تضع هذه التطورات OpenAI o1 كترقية كبيرة من النماذج السابقة مثل GPT-4o. إنه يفتح إمكانيات جديدة للذكاء الاصطناعي في مجالات مثل الأعمال والتطوير و البحث و الرعاية الصحية. على سبيل المثال، في أبحاث علم الوراثة، يمكن لـ OpenAI o1 أن يمر بسرعة عبر عدد كبير من الأوراق البحثية، ويختار النتائج الرئيسية والروابط بين العلامات الوراثية و الأمراض. إنه يفهم اللغة العلمية المعقدة ويمكنه تلخيص النقاط المهمة، مما يساعد الباحثين على التركيز على المعلومات الأكثر صلة. 

نظرة فاحصة على سلسلة الأفكار

رأينا سابقًا أن OpenAI o1 يقدم عملية تفكير "سلسلة الأفكار". فهو يمكّن النموذج من معالجة المشكلات المعقدة بطريقة مماثلة للاستراتيجيات المعرفية البشرية. يمكن للنموذج تقسيم التحديات إلى خطوات أصغر يمكن التحكم فيها وتحسين منهجه بشكل متكرر. على عكس النماذج السابقة التي اعتمدت على التعرف على الأنماط الفوري، فإن o1 يحسن عملية اتخاذ القرار من خلال استكشاف مسارات تفكير متعددة، والتعلم من النجاحات والأخطاء من خلال التعلم المعزز.

قررت OpenAI إبقاء سلاسل الأفكار الأولية هذه مخفية عن المستخدمين، وبدلاً من ذلك تقدم ملخصات توفر نظرة ثاقبة لمنطق النموذج دون الكشف عن كل خطوة. يساعد هذا القرار في منع إساءة استخدام عملية تفكير النموذج مع السماح للمطورين بمراقبة وتحسين سلامة الذكاء الاصطناعي ومواءمته. من خلال مراقبة السلاسل المخفية داخليًا، يمكن للمطورين التأكد من أن o1 يلتزم بالمبادئ التوجيهية الأخلاقية ويتجنب السلوك الضار.

قياس أداء OpenAI o1

تُظهر OpenAI o1 تحسينات كبيرة مقارنة بـ GPT-4o في العديد من المقاييس التي تختبر قدرات الاستدلال وحل المشكلات. في امتحان الرياضيات الأمريكي المدعو (AIME) 2024، وهو امتحان رياضيات صعب لأفضل طلاب المدارس الثانوية، حقق o1 معدل دقة 74٪ بعينة واحدة فقط لكل مشكلة، مقارنة بـ 12٪ لـ GPT-4o. مع الإجماع عبر 64 عينة، زادت دقته إلى 83٪، وباستخدام طريقة إعادة ترتيب محسنة مع 1000 عينة، وصل إلى 93٪، مما وضعه بين أفضل 500 طالب على مستوى البلاد. 

بالإضافة إلى الرياضيات، أظهر o1 أيضًا أداءً جيدًا بشكل استثنائي في المعايير التي تختبر المعرفة العلمية، مثل GPQA Diamond، الذي يغطي أسئلة على مستوى الدكتوراه في الكيمياء و الفيزياء و علم الأحياء. والجدير بالذكر أن o1 تفوق على الخبراء البشريين الحاصلين على درجة الدكتوراه في هذا الاختبار، مما يجعله أول نموذج ذكاء اصطناعي يفعل ذلك. كما تفوق على GPT-4o في 54 فئة من أصل 57 فئة في معيار MMLU، الذي يختبر الفهم عبر مجموعة متنوعة من الموضوعات، بما في ذلك التاريخ و القانون والعلوم.

__wf_reserved_inherit
الشكل 4. قياس أداء OpenAI o1.

انطلق عمليًا مع OpenAI o1

قدمت OpenAI نموذجين جديدين للذكاء الاصطناعي في سلسلة o1: o1-preview و o1-mini. تم تصميم نموذج o1-preview للتفكير بشكل أعمق قبل الرد، والتفوق في مهام الاستدلال المعقدة في العلوم والبرمجة والرياضيات. إنه يوفر قدرات متقدمة لحل المشكلات للمستخدمين الذين يتعاملون مع المشاريع الصعبة. في المقابل، o1-mini هو نموذج أصغر وأسرع وأكثر فعالية من حيث التكلفة ومُحسَّن خصيصًا للاستدلال في مجالات العلوم والتكنولوجيا والهندسة والرياضيات (STEM)، وخاصة الرياضيات والبرمجة. على الرغم من أنه قد يكون لديه معرفة عالمية أقل اتساعًا، إلا أن o1-mini يضاهي تقريبًا أداء o1-preview في التقييمات الرئيسية مثل مسابقة الرياضيات AIME وتحديات البرمجة Codeforces، وكل ذلك بتكلفة أقل بنسبة 80٪.

__wf_reserved_inherit
الشكل 5. مقارنة نماذج OpenAI.

يمكنك تجربة هذه النماذج من خلال منصات OpenAI المختلفة. يمكن لمستخدمي ChatGPT Plus و Team الوصول إلى كل من o1-preview و o1-mini عبر منتقي النماذج، وتجربة قدرات استدلال محسنة مباشرة في ChatGPT. يمكن للمطورين الذين لديهم مستوى وصول 5 لاستخدام واجهة برمجة التطبيقات (API) البدء في عمل نماذج أولية باستخدام هذه النماذج، على الرغم من أن بعض الميزات المتقدمة لا تزال قيد التطوير. تخطط OpenAI أيضًا لجعل o1-mini متاحًا لجميع مستخدمي ChatGPT Free قريبًا. من خلال استكشاف هذه النماذج، يمكنك تجربة التطورات في الاستدلال بالذكاء الاصطناعي بشكل مباشر واختيار النموذج الذي يناسب احتياجاتك على أفضل وجه.

اعتبارات الذكاء الاصطناعي الأخلاقية التي وضعتها OpenAI

ركزت OpenAI على الأخلاقيات والسلامة أثناء تطوير سلسلة نماذج o1. قبل إصدار نموذجي o1-preview و o1-mini، أجروا تقييمات شاملة، بما في ذلك اختبارات خارجية وفحوصات داخلية للمخاطر مثل المحتوى المحظور والهلوسة والتحيز. تم تصميم النماذج بقدرات استنتاج متقدمة لفهم قواعد السلامة واتباعها بشكل أفضل. 

قامت OpenAI أيضًا بتطبيق إجراءات حماية مثل القوائم المحظورة ومصنفات السلامة لإدارة المخاطر. يحمل نموذج o1 تصنيفًا متوسطًا للمخاطر الإجمالية. لديه مخاطر منخفضة في مجالات مثل الأمن السيبراني واستقلالية النموذج ومخاطر متوسطة في مجالات مثل محتوى CBRN (الكيميائي والبيولوجي والإشعاعي والنووي) والإقناع. قامت المجموعة الاستشارية للسلامة والمجلس التابعان لـ OpenAI بمراجعة إجراءات السلامة هذه لضمان أن النموذج آمن وأخلاقي للاستخدام.

__wf_reserved_inherit
الشكل 6. بطاقة أداء OpenAI o1.

من الشائعات إلى الواقع: OpenAI o1 يصعد إلى المسرح

تعتبر OpenAI o1 خطوة كبيرة إلى الأمام في استدلال الذكاء الاصطناعي، حيث حولت بعض الشائعات المبكرة إلى حقيقة. على عكس GPT-4o، يفكر o1 بشكل أعمق باستخدام نهج "سلسلة الأفكار"، وتقسيم المشكلات المعقدة إلى خطوات أصغر للحصول على استجابات أفضل. متاح حاليًا كمعاينة مبكرة في ChatGPT و API، وتخطط OpenAI لإضافة ميزات مثل تصفح الويب وتحميل الملفات والصور. شاركت OpenAI أيضًا أنها تخطط لمواصلة تطوير وإصدار نماذج في سلسلة GPT، جنبًا إلى جنب مع سلسلة OpenAI o1 الجديدة. مع استمرار تطور الذكاء الاصطناعي، فإن التطورات مثل هذه تمهد الطريق لأنظمة ذكاء اصطناعي أكثر قوة وبديهية وتنوعًا يمكنها المساعدة بشكل أفضل وفهم الاحتياجات البشرية.

واكب آخر التطورات في مجال الذكاء الاصطناعي من خلال الانضمام إلى مجتمعنا! توجه إلى مستودع GitHub الخاص بنا لترى كيف أننا رواد حلول الذكاء الاصطناعي في قطاعات مثل التصنيع و الرعاية الصحية. 🚀

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا
تم نسخ الرابط إلى الحافظة