انضم إلينا ونحن نلقي نظرة فاحصة على تحديثات ChatGPT الأخيرة التي أصدرتها OpenAI. سنستكشف Canvas، والضبط الدقيق لإمكانيات الرؤية، وأحدث ميزة البحث.
انضم إلينا ونحن نلقي نظرة فاحصة على تحديثات ChatGPT الأخيرة التي أصدرتها OpenAI. سنستكشف Canvas، والضبط الدقيق لإمكانيات الرؤية، وأحدث ميزة البحث.
بعد أن ألقينا نظرة أخيرة على نماذج o1 من OpenAI في سبتمبر (والتي صُممت لتحسين التفكير المنطقي)، تمت إضافة العديد من الميزات الجديدة والمثيرة إلى ChatGPT. بعض هذه الإصدارات موجهة للمطورين، والبعض الآخر مصمم لتحسين تجربة المستخدم. بشكل عام، تساعد كل ترقية في جعل التفاعل مع ChatGPT أكثر سهولة وفعالية.
وقد أثارت تحديثات مثل Canvas، المصممة للكتابة التعاونية والترميز، والضبط الدقيق لإمكانيات الرؤية التي تُحسِّن من كيفية عمل ChatGPT مع الصور، الكثير من الاهتمام، مما شجع المستخدمين على استكشاف المزيد من الإمكانيات الإبداعية. وفي الوقت نفسه، تعالج الترقيات التقنية، مثل واجهات برمجة التطبيقات الجديدة وتقارير اختبار الإنصاف، جوانب مثل تكامل النماذج، وممارسات الذكاء الاصطناعي الأخلاقية . دعنا نتعمق في الأمر ونحصل على فهم أفضل لأحدث ميزات ChatGPT من OpenAI!
Canvas هو أول تحديث رئيسي لواجهة مستخدم ChatGPT(UI) منذ إصداره. إنها واجهة جديدة ذات تخطيط بشاشتين، والمطالبات على الشريط الجانبي الأيسر، والردود في النافذة الجانبية اليمنى. تتخلص واجهة المستخدم الجديدة من سير العمل المعتاد لبنية الدردشة التي تشبه الشاشة الواحدة وتنتقل إلى تخطيط من شاشتين يناسب أغراض تعدد المهام لتعزيز الإنتاجية.

قبل تقديم Canvas، كان العمل مع المستندات الطويلة على ChatGPT يعني الاضطرار إلى التمرير لأعلى ولأسفل قليلاً. في التصميم الجديد، يتم عرض المطالبات على الشريط الجانبي الأيسر، ويشغل المستند النصي أو مقتطف التعليمات البرمجية معظم الشاشة. إذا لزم الأمر، يمكنك حتى تخصيص حجم الشريط الجانبي الأيسر وشاشة الإخراج. كما يمكنك أيضًا تحديد جزء من النص أو جزء من التعليمات البرمجية وتحرير الجزء المحدد دون تغيير المستند بأكمله.

إذا كنت تستخدم Canvas، ستلاحظ عدم وجود زر أو مفتاح تبديل محدد لفتحه على واجهة ChatGPT . بدلًا من ذلك، عندما تعمل مع نموذج GPT-4o، تفتح Canvas تلقائيًا إذا اكتشفت أنك تقوم بالتحرير أو الكتابة أو الترميز. بالنسبة للمطالبات الأبسط، يبقى غير نشط. إذا كنت تريد فتحه يدويًا، يمكنك استخدام مطالبات مثل "افتح اللوحة القماشية" أو "أحضر لي تخطيط اللوحة القماشية."
حاليًا، Canvas في مرحلة تجريبية ومتاح فقط مع GPT-4o. ومع ذلك، ذكرت OpenAI أن Canvas سيكون متاحًا لجميع المستخدمين المجانيين عندما يخرج من المرحلة التجريبية.
أصدرت OpenAI ثلاثة تحديثات جديدة لواجهة برمجة تطبيقات ChatGPT تهدف إلى تحسين الكفاءة وقابلية التوسع والتنوع. دعنا نلقي نظرة فاحصة على كل من هذه التحديثات.
باستخدام ميزة تقطير النموذج من خلال واجهات برمجة تطبيقات OpenAI، يمكن للمطورين استخدام مخرجات النماذج المتقدمة مثل GPT-4o أو o1-preview لتحسين أداء النماذج الأصغر والأكثر فعالية من حيث التكلفة مثل GPT-4o mini. تقطير النموذج هو عملية تتضمن تدريب نماذج أصغر لتقليد سلوك النماذج الأكثر تقدمًا، مما يجعلها أكثر كفاءة في مهام محددة.
قبل تقديم هذه الميزة، كان على المطورين تنسيق مجموعة متنوعة من المهام يدويًا باستخدام أدوات مختلفة. تضمنت هذه المهام إنشاء مجموعات البيانات، وقياس أداء النموذج، و الضبط الدقيق للنماذج، مما جعل العملية غالبًا معقدة وعرضة للأخطاء. يتيح تحديث Model Distillation للمطورين استخدام Stored Completions، وهي أداة تتيح لهم إنشاء مجموعات بيانات تلقائيًا عن طريق التقاط وتخزين أزواج الإدخال والإخراج التي تنتجها النماذج المتقدمة من خلال واجهة برمجة التطبيقات (API).
ميزة أخرى في Model Distillation، وهي Evals (حاليًا في المرحلة التجريبية)، تساعد في قياس مدى جودة أداء النموذج في مهام محددة، دون الحاجة إلى إنشاء برامج تقييم مخصصة أو استخدام أدوات منفصلة. باستخدام مجموعات البيانات التي تم إنشاؤها باستخدام Stored Completions و تقييم الأداء باستخدام Evals، يمكن للمطورين إجراء تعديلات دقيقة على نماذج GPT المخصصة الخاصة بهم.

في كثير من الأحيان عند بناء تطبيقات الذكاء الاصطناعي، وخاصة برامج الدردشة الآلية (chatbots)، سيتم استخدام نفس السياق (المعلومات الأساسية أو سجل المحادثة السابق اللازم لفهم الطلب الحالي) بشكل متكرر لمكالمات واجهة برمجة التطبيقات (API) المتعددة. يتيح التخزين المؤقت للموجهات للمطورين إعادة استخدام رموز الإدخال المستخدمة مؤخرًا (أجزاء من النص التي يعالجها النموذج لفهم الموجه وإنشاء استجابة)، مما يساعد على تقليل التكلفة والوقت المستغرق.
اعتبارًا من 1 أكتوبر، طبقت OpenAI تلقائيًا التخزين المؤقت للموجهات على نماذجها مثل GPT-4o و GPT-4o mini و o1-preview و o1-mini. هذا يعني أنه عندما يستخدم المطورون واجهة برمجة التطبيقات (API) للتفاعل مع نموذج يحتوي على موجه طويل (أكثر من 1,024 رمزًا)، يحفظ النظام الأجزاء التي تمت معالجتها بالفعل.
بهذه الطريقة، إذا تم استخدام نفس الموجهات أو موجهات مماثلة مرة أخرى، فيمكنه تخطي إعادة حساب تلك الأجزاء. يقوم النظام تلقائيًا بتخزين أطول جزء من الموجه الذي واجهه مسبقًا مؤقتًا، بدءًا من 1,024 رمزًا وإضافة أجزاء بحجم 128 رمزًا كلما أصبح الموجه أطول.
يتضمن إنشاء مساعد صوتي عمومًا الحاجة إلى تحويل الصوت إلى نص، ومعالجة النص، ثم تحويله مرة أخرى إلى صوت لتشغيل الاستجابة. تهدف واجهة برمجة التطبيقات (API) في الوقت الفعلي من OpenAI إلى التعامل مع هذه العملية بأكملها بطلب واجهة برمجة تطبيقات (API) واحد. من خلال تبسيط العملية، تتيح واجهة برمجة التطبيقات (API) إجراء محادثات في الوقت الفعلي مع الذكاء الاصطناعي.
على سبيل المثال، يمكن للمساعد الصوتي المدمج مع واجهة برمجة التطبيقات (API) في الوقت الفعلي تنفيذ إجراءات محددة، مثل تقديم طلب أو العثور على معلومات، بناءً على طلبات المستخدم. تجعل واجهة برمجة التطبيقات (API) المساعد الصوتي أكثر استجابة وقدرة على التكيف بسرعة مع احتياجات المستخدمين. أصبحت واجهة برمجة التطبيقات (API) في الوقت الفعلي متاحة من خلال الإصدار التجريبي العام في 1 أكتوبر، مع ستة أصوات. في 30 أكتوبر، تمت إضافة خمسة أصوات أخرى، ليصبح المجموع أحد عشر صوتًا متاحًا.

في الأصل، كان من الممكن فقط إجراء الضبط الدقيق وتخصيص نموذج لغة الرؤية GPT-4o باستخدام مجموعات بيانات نصية فقط. الآن، مع إصدار واجهة برمجة تطبيقات (API) الضبط الدقيق للرؤية، يمكن للمطورين تدريب وتخصيص GPT-4o باستخدام مجموعات بيانات الصور. منذ إطلاقه، أصبح الضبط الدقيق للرؤية موضوعًا رئيسيًا للاهتمام بين المطورين ومهندسي رؤية الكمبيوتر.
لتحسين قدرات الرؤية في نموذج GPT-4o، يمكن للمطورين استخدام مجموعات بيانات صور تتراوح من 100 صورة إلى 50,000 صورة. بعد التأكد من أن مجموعة البيانات تطابق التنسيق المطلوب من قبل OpenAI، يمكن تحميلها إلى منصة OpenAI، ويمكن تحسين النموذج لتطبيقات محددة.
على سبيل المثال، استخدمت Automat، وهي شركة أتمتة، مجموعة بيانات من لقطات الشاشة لتدريب GPT-4o لتكون قادرة على تحديد عناصر واجهة المستخدم على الشاشة بناءً على وصف. يساعد هذا في تبسيط أتمتة العمليات الروبوتية (RPA) من خلال تسهيل تفاعل الروبوتات مع واجهات المستخدم. بدلاً من الاعتماد على إحداثيات ثابتة أو قواعد محدد معقدة، يمكن للنموذج تحديد عناصر واجهة المستخدم بناءً على أوصاف بسيطة، مما يجعل إعدادات الأتمتة أكثر قابلية للتكيف وأسهل في الصيانة عند تغيير الواجهات.

تُعد المخاوف الأخلاقية المحيطة بتطبيقات الذكاء الاصطناعي موضوعاً بارزاً للنقاش مع تزايد تقدم الذكاء الاصطناعي. ونظراً لأن إجابات ChatGPTتستند إلى المطالبات التي يقدمها المستخدم والبيانات المتاحة على الإنترنت، فقد يكون من الصعب ضبط لغتها لتكون مسؤولة طوال الوقت. تشير التقارير إلى أن إجاباتChatGPTمتحيزة بشأن الاسم والجنس والعرق. ولمعالجة هذه المشكلة، أجرى فريق OpenAI الداخلي اختباراً للإنصاف من منظور الشخص الأول.
غالباً ما تحمل الأسماء إشارات خفية عن ثقافتنا وعوامل جغرافية. في معظم الحالات، يتجاهل ChatGPT الإشارات الخفية في الأسماء. ومع ذلك، في بعض الحالات، تؤدي الأسماء التي تعكس العرق أو الثقافة إلى استجابات مختلفة من ChatGPT حيث تعكس حوالي 1% منها لغة ضارة. يُعد القضاء على التحيزات واللغة الضارة مهمة صعبة لنموذج اللغة. ومع ذلك، من خلال مشاركة هذه النتائج علنًا والاعتراف بمحدودية النموذج، يساعد OpenAI المستخدمين على تحسين مطالباتهم لتحقيق إجابات أكثر حيادية وغير متحيزة.

عندما تم إطلاق ChatGPT لأول مرة، كانت هناك مناقشات في مجتمع الذكاء الاصطناعي حول ما إذا كان بإمكانه أن يحل محل تصفح الويب التقليدي. والآن، يستخدم العديد من المستخدمين ChatGPT بدلاً من بحث Google .
يأخذ التحديث الجديد لـ OpenAI، خاصية البحث، هذا الأمر خطوة إلى الأمام. مع خاصية البحث، تُنشئ ChatGPT إجابات محدّثة وتتضمن روابط لمصادر ذات صلة. اعتباراً من 31 أكتوبر، أصبحت خاصية البحث متاحة لجميع مستخدمي ChatGPT Plus و Team، مما يجعل ChatGPT يعمل كمحرك بحث مدعوم بالذكاء الاصطناعي.

تركز تحديثات ChatGPT الأخيرة على جعل الذكاء الاصطناعي أكثر فائدة ومرونة وإنصافاً. تساعد خاصية Canvas الجديدة المستخدمين على العمل بكفاءة أكبر، بينما يسمح الضبط الدقيق للرؤية للمطورين بتخصيص النماذج للتعامل مع المهام المرئية بشكل أفضل. تُعد معالجة الإنصاف والحد من التحيز من الأولويات الرئيسية أيضاً، لضمان عمل الذكاء الاصطناعي بشكل جيد للجميع، بغض النظر عن هويتهم. سواء كنت مطورًا يقوم بضبط النماذج بشكل دقيق أو مجرد استخدام أحدث الميزات، فإن ChatGPT يتطور لتلبية مجموعة واسعة من الاحتياجات. مع إمكانات الوقت الحقيقي، والتكامل المرئي، والتركيز على الاستخدام المسؤول، تعمل هذه التحديثات على بناء تجربة ذكاء اصطناعي أكثر جدارة بالثقة والموثوقية للجميع.
استكشف المزيد حول الذكاء الاصطناعي من خلال زيارة مستودع GitHub الخاص بنا والانضمام إلى مجتمعنا. تعرف على المزيد حول تطبيقات الذكاء الاصطناعي في القيادة الذاتية و الرعاية الصحية.