ميزات ChatGPT الجديدة: الرؤية، والبحث، والمزيد

بعد أن ألقينا نظرة أخيرة على نماذج o1 من OpenAI في سبتمبر (والتي صُممت لتحسين التفكير المنطقي)، تمت إضافة العديد من الميزات الجديدة والمثيرة إلى ChatGPT. بعض هذه الإصدارات موجهة للمطورين، والبعض الآخر مصمم لتحسين تجربة المستخدم. بشكل عام، تساعد كل ترقية في جعل التفاعل مع ChatGPT أكثر سهولة وفعالية.

وقد أثارت تحديثات مثل Canvas، المصممة للكتابة التعاونية والترميز، والضبط الدقيق لإمكانيات الرؤية التي تُحسِّن من كيفية عمل ChatGPT مع الصور، الكثير من الاهتمام، مما شجع المستخدمين على استكشاف المزيد من الإمكانيات الإبداعية. وفي الوقت نفسه، تعالج الترقيات التقنية، مثل واجهات برمجة التطبيقات الجديدة وتقارير اختبار الإنصاف، جوانب مثل تكامل النماذج، وممارسات الذكاء الاصطناعي الأخلاقية . دعنا نتعمق في الأمر ونحصل على فهم أفضل لأحدث ميزات ChatGPT من OpenAI!

نظرة عامة على ميزة Canvas من OpenAI

Canvas هو أول تحديث رئيسي لواجهة مستخدم ChatGPT(UI) منذ إصداره. إنها واجهة جديدة ذات تخطيط بشاشتين، والمطالبات على الشريط الجانبي الأيسر، والردود في النافذة الجانبية اليمنى. تتخلص واجهة المستخدم الجديدة من سير العمل المعتاد لبنية الدردشة التي تشبه الشاشة الواحدة وتنتقل إلى تخطيط من شاشتين يناسب أغراض تعدد المهام لتعزيز الإنتاجية.

الشكل 1. يجلب Canvas تحديثات واجهة المستخدم إلى ChatGPT.

‍

قبل تقديم Canvas، كان العمل مع المستندات الطويلة على ChatGPT يعني الاضطرار إلى التمرير لأعلى ولأسفل قليلاً. في التصميم الجديد، يتم عرض المطالبات على الشريط الجانبي الأيسر، ويشغل المستند النصي أو مقتطف التعليمات البرمجية معظم الشاشة. إذا لزم الأمر، يمكنك حتى تخصيص حجم الشريط الجانبي الأيسر وشاشة الإخراج. كما يمكنك أيضًا تحديد جزء من النص أو جزء من التعليمات البرمجية وتحرير الجزء المحدد دون تغيير المستند بأكمله.

الشكل 2. تحرير أقسام معينة من النص باستخدام Canvas.

‍

إذا كنت تستخدم Canvas، ستلاحظ عدم وجود زر أو مفتاح تبديل محدد لفتحه على واجهة ChatGPT . بدلًا من ذلك، عندما تعمل مع نموذج GPT-4o، تفتح Canvas تلقائيًا إذا اكتشفت أنك تقوم بالتحرير أو الكتابة أو الترميز. بالنسبة للمطالبات الأبسط، يبقى غير نشط. إذا كنت تريد فتحه يدويًا، يمكنك استخدام مطالبات مثل "افتح اللوحة القماشية" أو "أحضر لي تخطيط اللوحة القماشية."

حاليًا، Canvas في مرحلة تجريبية ومتاح فقط مع GPT-4o. ومع ذلك، ذكرت OpenAI أن Canvas سيكون متاحًا لجميع المستخدمين المجانيين عندما يخرج من المرحلة التجريبية.

تحديثات واجهة برمجة تطبيقات ChatGPT

أصدرت OpenAI ثلاثة تحديثات جديدة لواجهة برمجة تطبيقات ChatGPT تهدف إلى تحسين الكفاءة وقابلية التوسع والتنوع. دعنا نلقي نظرة فاحصة على كل من هذه التحديثات.

تقطير النموذج

باستخدام ميزة تقطير النموذج من خلال واجهات برمجة تطبيقات OpenAI، يمكن للمطورين استخدام مخرجات النماذج المتقدمة مثل GPT-4o أو o1-preview لتحسين أداء النماذج الأصغر والأكثر فعالية من حيث التكلفة مثل GPT-4o mini. تقطير النموذج هو عملية تتضمن تدريب نماذج أصغر لتقليد سلوك النماذج الأكثر تقدمًا، مما يجعلها أكثر كفاءة في مهام محددة.

قبل تقديم هذه الميزة، كان على المطورين تنسيق مجموعة متنوعة من المهام يدويًا باستخدام أدوات مختلفة. تضمنت هذه المهام إنشاء مجموعات البيانات، وقياس أداء النموذج، و الضبط الدقيق للنماذج، مما جعل العملية غالبًا معقدة وعرضة للأخطاء. يتيح تحديث Model Distillation للمطورين استخدام Stored Completions، وهي أداة تتيح لهم إنشاء مجموعات بيانات تلقائيًا عن طريق التقاط وتخزين أزواج الإدخال والإخراج التي تنتجها النماذج المتقدمة من خلال واجهة برمجة التطبيقات (API).

ميزة أخرى في Model Distillation، وهي Evals (حاليًا في المرحلة التجريبية)، تساعد في قياس مدى جودة أداء النموذج في مهام محددة، دون الحاجة إلى إنشاء برامج تقييم مخصصة أو استخدام أدوات منفصلة. باستخدام مجموعات البيانات التي تم إنشاؤها باستخدام Stored Completions و تقييم الأداء باستخدام Evals، يمكن للمطورين إجراء تعديلات دقيقة على نماذج GPT المخصصة الخاصة بهم.

الشكل 3. يمكنك استخدام Evals لقياس أداء النموذج.

‍

التخزين المؤقت للموجهات

في كثير من الأحيان عند بناء تطبيقات الذكاء الاصطناعي، وخاصة برامج الدردشة الآلية (chatbots)، سيتم استخدام نفس السياق (المعلومات الأساسية أو سجل المحادثة السابق اللازم لفهم الطلب الحالي) بشكل متكرر لمكالمات واجهة برمجة التطبيقات (API) المتعددة. يتيح التخزين المؤقت للموجهات للمطورين إعادة استخدام رموز الإدخال المستخدمة مؤخرًا (أجزاء من النص التي يعالجها النموذج لفهم الموجه وإنشاء استجابة)، مما يساعد على تقليل التكلفة والوقت المستغرق.

اعتبارًا من 1 أكتوبر، طبقت OpenAI تلقائيًا التخزين المؤقت للموجهات على نماذجها مثل GPT-4o و GPT-4o mini و o1-preview و o1-mini. هذا يعني أنه عندما يستخدم المطورون واجهة برمجة التطبيقات (API) للتفاعل مع نموذج يحتوي على موجه طويل (أكثر من 1,024 رمزًا)، يحفظ النظام الأجزاء التي تمت معالجتها بالفعل.

بهذه الطريقة، إذا تم استخدام نفس الموجهات أو موجهات مماثلة مرة أخرى، فيمكنه تخطي إعادة حساب تلك الأجزاء. يقوم النظام تلقائيًا بتخزين أطول جزء من الموجه الذي واجهه مسبقًا مؤقتًا، بدءًا من 1,024 رمزًا وإضافة أجزاء بحجم 128 رمزًا كلما أصبح الموجه أطول.

واجهة برمجة التطبيقات (API) في الوقت الفعلي

يتضمن إنشاء مساعد صوتي عمومًا الحاجة إلى تحويل الصوت إلى نص، ومعالجة النص، ثم تحويله مرة أخرى إلى صوت لتشغيل الاستجابة. تهدف واجهة برمجة التطبيقات (API) في الوقت الفعلي من OpenAI إلى التعامل مع هذه العملية بأكملها بطلب واجهة برمجة تطبيقات (API) واحد. من خلال تبسيط العملية، تتيح واجهة برمجة التطبيقات (API) إجراء محادثات في الوقت الفعلي مع الذكاء الاصطناعي.

على سبيل المثال، يمكن للمساعد الصوتي المدمج مع واجهة برمجة التطبيقات (API) في الوقت الفعلي تنفيذ إجراءات محددة، مثل تقديم طلب أو العثور على معلومات، بناءً على طلبات المستخدم. تجعل واجهة برمجة التطبيقات (API) المساعد الصوتي أكثر استجابة وقدرة على التكيف بسرعة مع احتياجات المستخدمين. أصبحت واجهة برمجة التطبيقات (API) في الوقت الفعلي متاحة من خلال الإصدار التجريبي العام في 1 أكتوبر، مع ستة أصوات. في 30 أكتوبر، تمت إضافة خمسة أصوات أخرى، ليصبح المجموع أحد عشر صوتًا متاحًا.

الشكل 4. مثال على استخدام واجهة برمجة التطبيقات (API) في الوقت الفعلي لممارسة المحادثات بلغة جديدة.

‍

ضبط ChatGPT الدقيق لمهام الرؤية

في الأصل، كان من الممكن فقط إجراء الضبط الدقيق وتخصيص نموذج لغة الرؤية GPT-4o باستخدام مجموعات بيانات نصية فقط. الآن، مع إصدار واجهة برمجة تطبيقات (API) الضبط الدقيق للرؤية، يمكن للمطورين تدريب وتخصيص GPT-4o باستخدام مجموعات بيانات الصور. منذ إطلاقه، أصبح الضبط الدقيق للرؤية موضوعًا رئيسيًا للاهتمام بين المطورين ومهندسي رؤية الكمبيوتر.

لتحسين قدرات الرؤية في نموذج GPT-4o، يمكن للمطورين استخدام مجموعات بيانات صور تتراوح من 100 صورة إلى 50,000 صورة. بعد التأكد من أن مجموعة البيانات تطابق التنسيق المطلوب من قبل OpenAI، يمكن تحميلها إلى منصة OpenAI، ويمكن تحسين النموذج لتطبيقات محددة.

على سبيل المثال، استخدمت Automat، وهي شركة أتمتة، مجموعة بيانات من لقطات الشاشة لتدريب GPT-4o لتكون قادرة على تحديد عناصر واجهة المستخدم على الشاشة بناءً على وصف. يساعد هذا في تبسيط أتمتة العمليات الروبوتية (RPA) من خلال تسهيل تفاعل الروبوتات مع واجهات المستخدم. بدلاً من الاعتماد على إحداثيات ثابتة أو قواعد محدد معقدة، يمكن للنموذج تحديد عناصر واجهة المستخدم بناءً على أوصاف بسيطة، مما يجعل إعدادات الأتمتة أكثر قابلية للتكيف وأسهل في الصيانة عند تغيير الواجهات.

الشكل 5. استخدام نسخة معدلة من نموذج GPT-4o detect عناصر واجهة المستخدم.

‍

عدالة ChatGPT والكشف عن التحيز

تُعد المخاوف الأخلاقية المحيطة بتطبيقات الذكاء الاصطناعي موضوعاً بارزاً للنقاش مع تزايد تقدم الذكاء الاصطناعي. ونظراً لأن إجابات ChatGPTتستند إلى المطالبات التي يقدمها المستخدم والبيانات المتاحة على الإنترنت، فقد يكون من الصعب ضبط لغتها لتكون مسؤولة طوال الوقت. تشير التقارير إلى أن إجاباتChatGPTمتحيزة بشأن الاسم والجنس والعرق. ولمعالجة هذه المشكلة، أجرى فريق OpenAI الداخلي اختباراً للإنصاف من منظور الشخص الأول.

غالباً ما تحمل الأسماء إشارات خفية عن ثقافتنا وعوامل جغرافية. في معظم الحالات، يتجاهل ChatGPT الإشارات الخفية في الأسماء. ومع ذلك، في بعض الحالات، تؤدي الأسماء التي تعكس العرق أو الثقافة إلى استجابات مختلفة من ChatGPT حيث تعكس حوالي 1% منها لغة ضارة. يُعد القضاء على التحيزات واللغة الضارة مهمة صعبة لنموذج اللغة. ومع ذلك، من خلال مشاركة هذه النتائج علنًا والاعتراف بمحدودية النموذج، يساعد OpenAI المستخدمين على تحسين مطالباتهم لتحقيق إجابات أكثر حيادية وغير متحيزة.

الشكل 6. مثال على الاستجابات المختلفة بسبب اسم المستخدم.

‍

فهم بحث ChatGPT

عندما ChatGPT إطلاق ChatGPT لأول مرة، دارت مناقشات في مجتمع الذكاء الاصطناعي حول ما إذا كان بإمكانه أن يحل محل التصفح التقليدي للويب. والآن، يستخدم العديد من المستخدمين ChatGPT من Google .

يأخذ التحديث الجديد لـ OpenAI، خاصية البحث، هذا الأمر خطوة إلى الأمام. مع خاصية البحث، تُنشئ ChatGPT إجابات محدّثة وتتضمن روابط لمصادر ذات صلة. اعتباراً من 31 أكتوبر، أصبحت خاصية البحث متاحة لجميع مستخدمي ChatGPT Plus و Team، مما يجعل ChatGPT يعمل كمحرك بحث مدعوم بالذكاء الاصطناعي.

الشكل 7. مثال على استخدام ميزة البحث الجديدة في ChatGPT.

‍

الطريق إلى الأمام

تركز تحديثات ChatGPT الأخيرة على جعل الذكاء الاصطناعي أكثر فائدة ومرونة وإنصافاً. تساعد خاصية Canvas الجديدة المستخدمين على العمل بكفاءة أكبر، بينما يسمح الضبط الدقيق للرؤية للمطورين بتخصيص النماذج للتعامل مع المهام المرئية بشكل أفضل. تُعد معالجة الإنصاف والحد من التحيز من الأولويات الرئيسية أيضاً، لضمان عمل الذكاء الاصطناعي بشكل جيد للجميع، بغض النظر عن هويتهم. سواء كنت مطورًا يقوم بضبط النماذج بشكل دقيق أو مجرد استخدام أحدث الميزات، فإن ChatGPT يتطور لتلبية مجموعة واسعة من الاحتياجات. مع إمكانات الوقت الحقيقي، والتكامل المرئي، والتركيز على الاستخدام المسؤول، تعمل هذه التحديثات على بناء تجربة ذكاء اصطناعي أكثر جدارة بالثقة والموثوقية للجميع.

استكشف المزيد حول الذكاء الاصطناعي من خلال زيارة مستودع GitHub الخاص بنا والانضمام إلى مجتمعنا. تعرف على المزيد حول تطبيقات الذكاء الاصطناعي في القيادة الذاتية و الرعاية الصحية.

آخر تحديثات OpenAI: Canvas، والضبط الدقيق للرؤية، والمزيد

نظرة عامة على ميزة Canvas من OpenAI

تحديثات واجهة برمجة تطبيقات ChatGPT

تقطير النموذج

التخزين المؤقت للموجهات

واجهة برمجة التطبيقات (API) في الوقت الفعلي

ضبط ChatGPT الدقيق لمهام الرؤية

عدالة ChatGPT والكشف عن التحيز

فهم بحث ChatGPT

الطريق إلى الأمام

اقرأ المزيد في هذه الفئة

12 حالة استخدام للصور الجوية مدعومة بالرؤية الحاسوبية

أدوات الرؤية الاصطناعية لتشخيص الرعاية الصحية

من البيانات إلى القرارات: استخدام الذكاء الاصطناعي البصري في استراتيجية المؤسسة

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

آخر تحديثات OpenAI: Canvas، والضبط الدقيق للرؤية، والمزيد

نظرة عامة على ميزة Canvas من OpenAI

تحديثات واجهة برمجة تطبيقات ChatGPT

تقطير النموذج

التخزين المؤقت للموجهات

واجهة برمجة التطبيقات (API) في الوقت الفعلي

ضبط ChatGPT الدقيق لمهام الرؤية

عدالة ChatGPT والكشف عن التحيز

فهم بحث ChatGPT

الطريق إلى الأمام

اقرأ المزيد في هذه الفئة

12 حالة استخدام للصور الجوية مدعومة بالرؤية الحاسوبية

أدوات الرؤية الاصطناعية لتشخيص الرعاية الصحية

من البيانات إلى القرارات: استخدام الذكاء الاصطناعي البصري في استراتيجية المؤسسة

لنبنِ مستقبل الذكاء الاصطناعي معًا!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!