انضم إلينا بينما نلقي نظرة فاحصة على تحديثات ChatGPT الأخيرة التي أصدرتها OpenAI. سنستكشف Canvas والضبط الدقيق لقدرات الرؤية وميزة البحث الأحدث.
انضم إلينا بينما نلقي نظرة فاحصة على تحديثات ChatGPT الأخيرة التي أصدرتها OpenAI. سنستكشف Canvas والضبط الدقيق لقدرات الرؤية وميزة البحث الأحدث.
بعد أن ألقينا نظرة أخيرة على نماذج o1 من OpenAI في سبتمبر (التي صُممت لتحسين الاستدلال)، تمت إضافة العديد من الميزات الجديدة والمثيرة إلى ChatGPT. بعض هذه الإصدارات موجهة للمطورين، والبعض الآخر مصمم لتحسين تجربة المستخدم. بشكل عام، يساعد كل ترقية على جعل التفاعلات مع ChatGPT أكثر سهولة وفعالية.
تحديثات مثل Canvas، المصممة للكتابة والبرمجة التعاونية، والضبط الدقيق لقدرات الرؤية التي تحسن كيفية عمل ChatGPT مع الصور، أثارت الكثير من الاهتمام، مما شجع المستخدمين على استكشاف المزيد من الإمكانيات الإبداعية. وفي الوقت نفسه، تعالج الترقيات التقنية، مثل واجهات برمجة التطبيقات الجديدة وتقارير اختبارات النزاهة، جوانب مثل تكامل النموذج وممارسات الذكاء الاصطناعي الأخلاقية. دعنا نتعمق ونحصل على فهم أفضل لأحدث ميزات ChatGPT من OpenAI!
Canvas هو أول تحديث رئيسي لواجهة مستخدم ChatGPT (UI) منذ إصداره. إنها واجهة جديدة بتصميم ثنائي الشاشة، ومطالبات على الشريط الجانبي الأيسر، وردود في نافذة الجانب الأيمن. تلغي واجهة المستخدم الجديدة سير العمل المعتاد لهيكل الشاشة الواحدة الشبيه بالدردشة وتنتقل إلى تصميم ثنائي الشاشة يناسب أغراض تعدد المهام لتعزيز الإنتاجية.

قبل تقديم Canvas، كان العمل مع المستندات الطويلة على ChatGPT يعني الاضطرار إلى التمرير لأعلى ولأسفل كثيرًا. في التصميم الجديد، يتم عرض المطالبات على الشريط الجانبي الأيسر، ويشغل المستند النصي أو مقتطف الشفرة غالبية الشاشة. إذا لزم الأمر، يمكنك حتى تخصيص حجم الشريط الجانبي الأيسر وشاشة الإخراج. أيضًا، يمكنك تحديد جزء من النص أو قسم من التعليمات البرمجية وتعديل القسم المحدد دون تغيير المستند بأكمله.

إذا كنت تستخدم Canvas، فستلاحظ عدم وجود زر أو مفتاح تبديل محدد لفتحه على واجهة ChatGPT. بدلاً من ذلك، عندما تعمل مع نموذج GPT-4o، يفتح Canvas تلقائيًا إذا اكتشف أنك تقوم بالتحرير أو الكتابة أو البرمجة. بالنسبة للمطالبات الأبسط، يظل غير نشط. إذا كنت ترغب في فتحه يدويًا، يمكنك استخدام مطالبات مثل "افتح Canvas" أو "أحضر لي تصميم Canvas".
حاليًا، Canvas في مرحلة تجريبية ومتاح فقط مع GPT-4o. ومع ذلك، ذكرت OpenAI أن Canvas سيكون متاحًا لجميع المستخدمين المجانيين عندما يخرج من المرحلة التجريبية.
أصدرت OpenAI ثلاثة تحديثات جديدة لواجهة برمجة تطبيقات ChatGPT تهدف إلى تحسين الكفاءة وقابلية التوسع والتنوع. دعنا نلقي نظرة فاحصة على كل من هذه التحديثات.
باستخدام ميزة تقطير النموذج من خلال واجهات برمجة تطبيقات OpenAI، يمكن للمطورين استخدام مخرجات النماذج المتقدمة مثل GPT-4o أو o1-preview لتحسين أداء النماذج الأصغر والأكثر فعالية من حيث التكلفة مثل GPT-4o mini. تقطير النموذج هو عملية تتضمن تدريب نماذج أصغر لتقليد سلوك النماذج الأكثر تقدمًا، مما يجعلها أكثر كفاءة في مهام محددة.
قبل تقديم هذه الميزة، كان على المطورين تنسيق مجموعة متنوعة من المهام يدويًا باستخدام أدوات مختلفة. تضمنت هذه المهام إنشاء مجموعات البيانات، وقياس أداء النموذج، و الضبط الدقيق للنماذج، مما جعل العملية غالبًا معقدة وعرضة للأخطاء. يتيح تحديث Model Distillation للمطورين استخدام Stored Completions، وهي أداة تتيح لهم إنشاء مجموعات بيانات تلقائيًا عن طريق التقاط وتخزين أزواج الإدخال والإخراج التي تنتجها النماذج المتقدمة من خلال واجهة برمجة التطبيقات (API).
ميزة أخرى في Model Distillation، وهي Evals (حاليًا في المرحلة التجريبية)، تساعد في قياس مدى جودة أداء النموذج في مهام محددة، دون الحاجة إلى إنشاء برامج تقييم مخصصة أو استخدام أدوات منفصلة. باستخدام مجموعات البيانات التي تم إنشاؤها باستخدام Stored Completions و تقييم الأداء باستخدام Evals، يمكن للمطورين إجراء تعديلات دقيقة على نماذج GPT المخصصة الخاصة بهم.

في كثير من الأحيان عند بناء تطبيقات الذكاء الاصطناعي، وخاصة برامج الدردشة الآلية (chatbots)، سيتم استخدام نفس السياق (المعلومات الأساسية أو سجل المحادثة السابق اللازم لفهم الطلب الحالي) بشكل متكرر لمكالمات واجهة برمجة التطبيقات (API) المتعددة. يتيح التخزين المؤقت للموجهات للمطورين إعادة استخدام رموز الإدخال المستخدمة مؤخرًا (أجزاء من النص التي يعالجها النموذج لفهم الموجه وإنشاء استجابة)، مما يساعد على تقليل التكلفة والوقت المستغرق.
اعتبارًا من 1 أكتوبر، طبقت OpenAI تلقائيًا التخزين المؤقت للموجهات على نماذجها مثل GPT-4o و GPT-4o mini و o1-preview و o1-mini. هذا يعني أنه عندما يستخدم المطورون واجهة برمجة التطبيقات (API) للتفاعل مع نموذج يحتوي على موجه طويل (أكثر من 1,024 رمزًا)، يحفظ النظام الأجزاء التي تمت معالجتها بالفعل.
بهذه الطريقة، إذا تم استخدام نفس الموجهات أو موجهات مماثلة مرة أخرى، فيمكنه تخطي إعادة حساب تلك الأجزاء. يقوم النظام تلقائيًا بتخزين أطول جزء من الموجه الذي واجهه مسبقًا مؤقتًا، بدءًا من 1,024 رمزًا وإضافة أجزاء بحجم 128 رمزًا كلما أصبح الموجه أطول.
يتضمن إنشاء مساعد صوتي عمومًا الحاجة إلى تحويل الصوت إلى نص، ومعالجة النص، ثم تحويله مرة أخرى إلى صوت لتشغيل الاستجابة. تهدف واجهة برمجة التطبيقات (API) في الوقت الفعلي من OpenAI إلى التعامل مع هذه العملية بأكملها بطلب واجهة برمجة تطبيقات (API) واحد. من خلال تبسيط العملية، تتيح واجهة برمجة التطبيقات (API) إجراء محادثات في الوقت الفعلي مع الذكاء الاصطناعي.
على سبيل المثال، يمكن للمساعد الصوتي المدمج مع واجهة برمجة التطبيقات (API) في الوقت الفعلي تنفيذ إجراءات محددة، مثل تقديم طلب أو العثور على معلومات، بناءً على طلبات المستخدم. تجعل واجهة برمجة التطبيقات (API) المساعد الصوتي أكثر استجابة وقدرة على التكيف بسرعة مع احتياجات المستخدمين. أصبحت واجهة برمجة التطبيقات (API) في الوقت الفعلي متاحة من خلال الإصدار التجريبي العام في 1 أكتوبر، مع ستة أصوات. في 30 أكتوبر، تمت إضافة خمسة أصوات أخرى، ليصبح المجموع أحد عشر صوتًا متاحًا.

في الأصل، كان من الممكن فقط إجراء الضبط الدقيق وتخصيص نموذج لغة الرؤية GPT-4o باستخدام مجموعات بيانات نصية فقط. الآن، مع إصدار واجهة برمجة تطبيقات (API) الضبط الدقيق للرؤية، يمكن للمطورين تدريب وتخصيص GPT-4o باستخدام مجموعات بيانات الصور. منذ إطلاقه، أصبح الضبط الدقيق للرؤية موضوعًا رئيسيًا للاهتمام بين المطورين ومهندسي رؤية الكمبيوتر.
لتحسين قدرات الرؤية في نموذج GPT-4o، يمكن للمطورين استخدام مجموعات بيانات صور تتراوح من 100 صورة إلى 50,000 صورة. بعد التأكد من أن مجموعة البيانات تطابق التنسيق المطلوب من قبل OpenAI، يمكن تحميلها إلى منصة OpenAI، ويمكن تحسين النموذج لتطبيقات محددة.
على سبيل المثال، استخدمت Automat، وهي شركة أتمتة، مجموعة بيانات من لقطات الشاشة لتدريب GPT-4o لتكون قادرة على تحديد عناصر واجهة المستخدم على الشاشة بناءً على وصف. يساعد هذا في تبسيط أتمتة العمليات الروبوتية (RPA) من خلال تسهيل تفاعل الروبوتات مع واجهات المستخدم. بدلاً من الاعتماد على إحداثيات ثابتة أو قواعد محدد معقدة، يمكن للنموذج تحديد عناصر واجهة المستخدم بناءً على أوصاف بسيطة، مما يجعل إعدادات الأتمتة أكثر قابلية للتكيف وأسهل في الصيانة عند تغيير الواجهات.

تعد الاعتبارات الأخلاقية المحيطة بـ تطبيقات الذكاء الاصطناعي موضوعًا بارزًا للمحادثة مع ازدياد تقدم الذكاء الاصطناعي. نظرًا لأن استجابات ChatGPT تعتمد على الموجهات والبيانات التي يقدمها المستخدمون والمتوفرة على الإنترنت، فقد يكون من الصعب إجراء الضبط الدقيق للغتها لتكون مسؤولة طوال الوقت. تفيد التقارير بأن إجابات ChatGPT متحيزة بشأن الاسم والجنس والعرق. لمعالجة هذه المشكلة، أجرى فريق OpenAI الداخلي اختبار إنصاف من منظور الشخص الأول.
غالبًا ما تحمل الأسماء إشارات خفية حول ثقافتنا والعوامل الجغرافية. في معظم الحالات، سيتجاهل ChatGPT الإشارات الخفية في الأسماء. ومع ذلك، في بعض الحالات، تؤدي الأسماء التي تعكس العرق أو الثقافة إلى استجابات مختلفة من ChatGPT، حيث يعكس حوالي 1٪ من هذه الاستجابات لغة ضارة. يعد القضاء على التحيزات واللغة الضارة مهمة صعبة بالنسبة إلى نموذج لغوي. ومع ذلك، من خلال مشاركة هذه النتائج علنًا والاعتراف بقيود النموذج، تساعد OpenAI المستخدمين على تحسين موجهاتهم لتحقيق إجابات أكثر حيادية وغير متحيزة.

عندما تم إطلاق ChatGPT لأول مرة، كانت هناك مناقشات في مجتمع الذكاء الاصطناعي حول ما إذا كان يمكن أن يحل محل تصفح الويب التقليدي. الآن، يستخدم العديد من المستخدمين ChatGPT بدلاً من بحث Google.
تأخذ التحديثات الجديدة من OpenAI، ميزة البحث، هذا إلى أبعد من ذلك. باستخدام البحث، ينشئ ChatGPT استجابات محدثة ويتضمن روابط لمصادر ذات صلة. اعتبارًا من 31 أكتوبر، تتوفر ميزة البحث لجميع مستخدمي ChatGPT Plus و Team، مما يجعل وظيفة ChatGPT أشبه بمحرك بحث مدعوم بالذكاء الاصطناعي.

تركز تحديثات ChatGPT الأخيرة على جعل الذكاء الاصطناعي أكثر فائدة ومرونة وعدلاً. تساعد ميزة Canvas الجديدة المستخدمين على العمل بكفاءة أكبر، بينما يسمح الضبط الدقيق للرؤية للمطورين بتخصيص النماذج للتعامل بشكل أفضل مع المهام المرئية. كما أن معالجة العدالة والحد من التحيز من الأولويات الرئيسية، مما يضمن عمل الذكاء الاصطناعي بشكل جيد للجميع، بغض النظر عن هويتهم. سواء كنت مطورًا يقوم بضبط النماذج بدقة أو مجرد استخدام أحدث الميزات، فإن ChatGPT يتطور لتلبية مجموعة واسعة من الاحتياجات. بفضل الإمكانات في الوقت الفعلي والتكامل المرئي والتركيز على الاستخدام المسؤول، تبني هذه التحديثات تجربة ذكاء اصطناعي أكثر جدارة بالثقة وموثوقية للجميع.
استكشف المزيد حول الذكاء الاصطناعي من خلال زيارة مستودع GitHub الخاص بنا والانضمام إلى مجتمعنا. تعرف على المزيد حول تطبيقات الذكاء الاصطناعي في القيادة الذاتية و الرعاية الصحية.