أحدث تحديثات OpenAI: Canvas، والضبط الدقيق للرؤية، والمزيد
انضم إلينا بينما نلقي نظرة فاحصة على تحديثات ChatGPT الأخيرة التي أصدرتها OpenAI. سنستكشف Canvas، والضبط الدقيق لقدرات الرؤية، وميزة البحث الأحدث.

بعد أن ألقينا نظرة في سبتمبر الماضي على نماذج OpenAI o1 (التي صُممت لتحسين الاستنتاج)، تمت إضافة العديد من الميزات الجديدة والمثيرة إلى ChatGPT. بعض هذه الإصدارات موجهة للمطورين، بينما صُمم البعض الآخر لتحسين تجربة المستخدم. وبشكل عام، تساهم كل ترقية في جعل التفاعلات مع ChatGPT أكثر سهولة وفعالية.
لقد أثارت تحديثات مثل Canvas، المصممة للتعاون في الكتابة والبرمجة، والضبط الدقيق لـ قدرات الرؤية التي تحسن كيفية عمل ChatGPT مع الصور، الكثير من الاهتمام، مما شجع المستخدمين على استكشاف المزيد من الإمكانيات الإبداعية. في غضون ذلك، تعالج التحديثات التقنية، مثل واجهات برمجة التطبيقات الجديدة وتقارير اختبارات النزاهة، جوانب مثل تكامل النماذج وممارسات الذكاء الاصطناعي الأخلاقي. لنبدأ ونكتسب فهمًا أفضل لأحدث ميزات ChatGPT من OpenAI!
Link to this sectionنظرة عامة على ميزة Canvas من OpenAI#
تعد Canvas أول تحديث رئيسي لواجهة مستخدم ChatGPT منذ إطلاقه. إنها واجهة جديدة بتصميم ثنائي الشاشة، حيث توجد المطالبات في الشريط الجانبي الأيسر، بينما تظهر الردود في نافذة الشاشة اليمنى. تلغي واجهة المستخدم الجديدة هيكل الشاشة الواحدة المعتاد في المحادثات وتنتقل إلى تصميم ثنائي الشاشة يناسب أغراض تعدد المهام لتعزيز الإنتاجية.

الشكل 1. Canvas تجلب تحديثات واجهة المستخدم إلى ChatGPT.
قبل تقديم Canvas، كان العمل على المستندات الطويلة في ChatGPT يعني الاضطرار إلى التمرير للأعلى وللأسفل كثيرًا. في التصميم الجديد، يتم عرض المطالبات على الشريط الجانبي الأيسر، ويشغل المستند النصي أو مقتطف الكود الجزء الأكبر من الشاشة. إذا لزم الأمر، يمكنك حتى تخصيص حجم الشريط الجانبي الأيسر وشاشة المخرجات. كما يمكنك اختيار جزء من النص أو قسم من الكود وتعديل ذلك القسم تحديدًا دون تغيير المستند بأكمله.

الشكل 2. تعديل أقسام محددة من النص باستخدام Canvas.
إذا كنت تستخدم Canvas، فستلاحظ عدم وجود زر أو مفتاح تبديل محدد لفتحه في واجهة ChatGPT. بدلًا من ذلك، عند العمل مع نموذج GPT-4o، تفتح Canvas تلقائيًا إذا اكتشفت أنك تقوم بـ التحرير أو الكتابة أو البرمجة. أما بالنسبة للمطالبات الأبسط، فتظل غير نشطة. إذا كنت ترغب في فتحها يدويًا، يمكنك استخدام مطالبات مثل "Open the Canvas" أو "Get me the Canvas layout."
حالياً، Canvas في مرحلة تجريبية ومتاحة فقط مع GPT-4o. ومع ذلك، ذكرت OpenAI أن Canvas ستكون متاحة لجميع المستخدمين المجانيين عند خروجها من المرحلة التجريبية.
Link to this sectionتحديثات API الخاصة بـ ChatGPT#
أصدرت OpenAI ثلاثة تحديثات جديدة لـ ChatGPT API تهدف إلى تحسين الكفاءة وقابلية التوسع وتعدد الاستخدامات. لنلقِ نظرة فاحصة على كل من هذه التحديثات.
Link to this sectionتقطير النموذج (Model distillation)#
باستخدام ميزة تقطير النموذج عبر OpenAI APIs، يمكن للمطورين استخدام مخرجات النماذج المتقدمة مثل GPT-4o أو o1-preview لتعزيز أداء النماذج الأصغر والأكثر كفاءة من حيث التكلفة مثل GPT-4o mini. تقطير النموذج هو عملية تتضمن تدريب النماذج الأصغر لتقليد سلوك النماذج الأكثر تقدمًا، مما يجعلها أكثر كفاءة لـ مهام محددة.
قبل تقديم هذه الميزة، كان يتعين على المطورين تنسيق مجموعة متنوعة من المهام يدوياً باستخدام أدوات مختلفة. تضمنت هذه المهام إنشاء datasets، وقياس model performance، وfine-tuning النماذج، وهو ما جعل العملية غالباً معقدة وعرضة للأخطاء. يتيح تحديث تقطير النموذج (Model Distillation) للمطورين استخدام Stored Completions، وهي أداة تسمح لهم بـ generate datasets تلقائياً من خلال التقاط وتخزين أزواج المدخلات والمخرجات الناتجة عن النماذج المتقدمة عبر الـ API.
ميزة أخرى لتقطير النموذج، وهي Evals (حالياً في المرحلة التجريبية)، تساعد في قياس مدى أداء النموذج في مهام محددة، دون الحاجة إلى إنشاء برامج نصية مخصصة لـ التقييم أو استخدام أدوات منفصلة. باستخدام مجموعات البيانات التي تم إنشاؤها عبر Stored Completions وتقييم الأداء باستخدام Evals، يمكن للمطورين ضبط نماذج GPT المخصصة الخاصة بهم.

الشكل 3. يمكنك استخدام Evals لقياس أداء النموذج.
Link to this sectionتخزين المطالبات مؤقتًا (Prompt caching)#
في كثير من الأحيان عند بناء تطبيقات الذكاء الاصطناعي، وخاصة روبوتات الدردشة، سيتم استخدام نفس السياق (المعلومات الخلفية أو سجل المحادثات السابق اللازم لفهم الطلب الحالي) بشكل متكرر لعدة طلبات API. يجعل تخزين المطالبات مؤقتًا (Prompt Caching) من الممكن للمطورين إعادة استخدام رموز الإدخال المستخدمة مؤخرًا (قطاعات النص التي يعالجها النموذج لفهم المطالبة وإنشاء استجابة)، مما يساعد في تقليل التكلفة وزمن الانتقال.
منذ الأول من أكتوبر، طبقت OpenAI تلقائيًا تخزين المطالبات مؤقتًا على نماذجها مثل GPT-4o وGPT-4o mini وo1-preview وo1-mini. هذا يعني أنه عندما يستخدم المطورون API للتفاعل مع نموذج يحتوي على مطالبة طويلة (أكثر من 1,024 رمزًا)، يقوم النظام بحفظ الأجزاء التي عالجها بالفعل.
بهذه الطريقة، إذا تم استخدام نفس المطالبات أو مطالبات مشابهة مرة أخرى، فيمكنه تخطي إعادة حساب تلك الأجزاء. يقوم النظام تلقائيًا بتخزين أطول جزء من المطالبة واجهه سابقًا، بدءًا من 1,024 رمزًا وإضافة كتل من 128 رمزًا مع زيادة طول المطالبة.
Link to this sectionRealtime API#
يتطلب إنشاء مساعد صوتي بشكل عام الحاجة إلى تحويل الصوت إلى نص، ومعالجة النص، ثم تحويله مرة أخرى إلى صوت لتشغيل الاستجابة. تهدف Realtime API من OpenAI إلى التعامل مع هذه العملية بأكملها بطلب API واحد. من خلال تبسيط العملية، تتيح هذه الواجهة إجراء محادثات في الوقت الفعلي مع الذكاء الاصطناعي.
على سبيل المثال، يمكن للمساعد الصوتي المدمج مع Realtime API تنفيذ إجراءات محددة، مثل تقديم طلب أو العثور على معلومات، بناءً على طلبات المستخدم. تجعل الواجهة المساعد الصوتي أكثر استجابة وقدرة على التكيف بسرعة مع احتياجات المستخدمين. أصبحت Realtime API متاحة من خلال الإصدار التجريبي العام في الأول من أكتوبر، مع ستة أصوات. في 30 أكتوبر، تمت إضافة خمسة أصوات أخرى، مما يجعل إجمالي عدد الأصوات المتاحة أحد عشر صوتًا.

الشكل 4. مثال على استخدام Realtime API لممارسة المحادثات بلغة جديدة.
Link to this sectionالضبط الدقيق لـ ChatGPT لمهام الرؤية#
في الأصل، كان يمكن ضبط نموذج لغة الرؤية GPT-4o وتخصيصه فقط باستخدام مجموعات بيانات نصية فقط. الآن، مع إصدار واجهة برمجة تطبيقات الضبط الدقيق للرؤية، يمكن للمطورين تدريب وتخصيص GPT-4o باستخدام مجموعات بيانات الصور. منذ إصداره، أصبح الضبط الدقيق للرؤية موضوع اهتمام رئيسي بين المطورين ومهندسي رؤية الكمبيوتر.
لإجراء ضبط دقيق لقدرات الرؤية في GPT-4o، يمكن للمطورين استخدام مجموعات بيانات صور تتراوح من 100 صورة إلى 50,000 صورة. بعد التأكد من مطابقة مجموعة البيانات للتنسيق المطلوب من قبل OpenAI، يمكن تحميلها على منصة OpenAI، ويمكن إجراء الضبط الدقيق للنموذج لتطبيقات محددة.
على سبيل المثال، استخدمت شركة الأتمتة Automat مجموعة بيانات من لقطات الشاشة لـ تدريب GPT-4o لتكون قادرة على تحديد عناصر واجهة المستخدم على الشاشة بناءً على الوصف. يساعد هذا في تبسيط أتمتة العمليات الروبوتية (RPA) من خلال تسهيل تفاعل الروبوتات مع واجهات المستخدم. بدلاً من الاعتماد على إحداثيات ثابتة أو قواعد محدد معقدة، يمكن للنموذج تحديد عناصر واجهة المستخدم بناءً على أوصاف بسيطة، مما يجعل إعدادات الأتمتة أكثر قدرة على التكيف وأسهل في الصيانة عند تغير الواجهات.

الشكل 5. استخدام نسخة تم ضبطها بدقة من نموذج GPT-4o لاكتشاف عناصر واجهة المستخدم.
Link to this sectionنزاهة ChatGPT واكتشاف التحيز#
تعد المخاوف الأخلاقية المحيطة بـ تطبيقات الذكاء الاصطناعي موضوعًا بارزًا للنقاش مع زيادة تقدم الذكاء الاصطناعي. نظرًا لأن استجابات ChatGPT تعتمد على المطالبات المقدمة من المستخدم والبيانات المتاحة على الإنترنت، فقد يكون من الصعب ضبط لغته لتكون مسؤولة طوال الوقت. تشير التقارير إلى أن إجابات ChatGPT متحيزة فيما يتعلق بالاسم والجنس والعرق. لمعالجة هذه المشكلة، أجرى الفريق الداخلي في OpenAI اختبار نزاهة من منظور الشخص الأول.
غالبًا ما تحمل الأسماء إشارات دقيقة حول ثقافتنا والعوامل الجغرافية. في معظم الحالات، سيتجاهل ChatGPT الإشارات الدقيقة في الأسماء. ومع ذلك، في بعض الحالات، تؤدي الأسماء التي تعكس العرق أو الثقافة إلى ردود مختلفة من ChatGPT، حيث يعكس حوالي 1% منها لغة ضارة. تعد إزالة التحيزات واللغة الضارة مهمة صعبة بالنسبة لـ نموذج لغوي. ومع ذلك، من خلال مشاركة هذه النتائج علنًا والاعتراف بقيود النموذج، تساعد OpenAI المستخدمين على تحسين مطالباتهم لتحقيق إجابات أكثر حيادية وغير متحيزة.

الشكل 6. مثال على اختلاف الاستجابات بسبب اسم المستخدم.
Link to this sectionفهم البحث في ChatGPT#
عند إطلاق ChatGPT لأول مرة، كانت هناك مناقشات في مجتمع الذكاء الاصطناعي حول ما إذا كان يمكنه استبدال تصفح الويب التقليدي. الآن، يستخدم العديد من المستخدمين ChatGPT بدلًا من بحث Google.
تحديث OpenAI الجديد، ميزة البحث، يأخذ هذا الأمر خطوة أخرى إلى الأمام. مع البحث، ينشئ ChatGPT استجابات محدثة ويتضمن روابط للمصادر ذات الصلة. اعتبارًا من 31 أكتوبر، أصبحت ميزة البحث متاحة لجميع مستخدمي ChatGPT Plus وTeam، مما يجعل ChatGPT يعمل بشكل أقرب إلى محرك بحث مدعوم بالذكاء الاصطناعي.

الشكل 7. مثال على استخدام ميزة البحث الجديدة في ChatGPT.
Link to this sectionالطريق إلى الأمام#
تركز تحديثات ChatGPT الأخيرة على جعل الذكاء الاصطناعي أكثر فائدة ومرونة وعدالة. تساعد ميزة Canvas الجديدة المستخدمين على العمل بكفاءة أكبر، بينما يسمح الضبط الدقيق للرؤية للمطورين بتخصيص النماذج للتعامل بشكل أفضل مع المهام المرئية. تعد معالجة العدالة وتقليل التحيز أيضًا من الأولويات الرئيسية، مما يضمن عمل الذكاء الاصطناعي بشكل جيد للجميع، بغض النظر عن هويتهم. سواء كنت مطورًا يقوم بضبط النماذج أو تستخدم الميزات الأحدث فقط، فإن ChatGPT يتطور لتلبية مجموعة واسعة من الاحتياجات. مع القدرات في الوقت الفعلي والتكامل المرئي والتركيز على الاستخدام المسؤول، تعمل هذه التحديثات على بناء تجربة ذكاء اصطناعي أكثر جدارة بالثقة وموثوقية للجميع.
استكشف المزيد حول الذكاء الاصطناعي من خلال زيارة مستودع GitHub الخاص بنا والانضمام إلى مجتمعنا. تعرف على المزيد حول تطبيقات الذكاء الاصطناعي في القيادة الذاتية والرعاية الصحية.






