الذكاء الاصطناعي المرئي

xAI تطلق Grok 2.0 مع تكامل FLUX.1

تعرف على Grok 2.0 من xAI التابعة لـ Elon Musk وتكامله مع FLUX.1. استكشف تفاصيل مثل الميزات، ومعايير القياس، ومقارنات النماذج، وكيفية تجربته.

أبأبيرامي فينا

4 min readSeptember 5, 2024

في 14 أغسطس، أعلنت شركة الذكاء الاصطناعي xAI التابعة لـ إيلون ماسك عن إطلاق Grok 2.0، وهو chatbot مدمج مع FLUX.1، وهو نموذج لتوليد الصور من تطوير Black Forest Labs، وذلك عبر منصة X (تويتر سابقاً). يعد FLUX.1 نموذجاً متطوراً قادراً على إنشاء صور واقعية للغاية، بما في ذلك تلك التي قد تُعتبر حساسة أو مضللة.

على عكس العديد من مولدات الصور الشهيرة التي تحظر أو تفلتر أنواعاً معينة من المحتوى، مثل الصور العنيفة أو الصريحة أو الخادعة، فإن FLUX.1 لديه قيود أقل. يرى البعض في ذلك انتصاراً لحرية التعبير، بينما يبدي آخرون إعجابهم بقدراته المتقدمة. ومع ذلك، هناك مخاوف أيضاً بشأن الآثار الأخلاقية والاحتمالات المحتملة لسوء استخدام هذه التكنولوجيا القوية. دعنا نتعمق ونستكشف ما يقدمه Grok 2.0، وما الذي يجعل FLUX.1 متميزاً، وكيف يمكنك تجربة هذه الأدوات المبتكرة بنفسك.

Link to this sectionالتعرف على FLUX.1: مولد صور بالذكاء الاصطناعي#

يُعد FLUX.1 مولد صور متطوراً ومفتوح المصدر بالذكاء الاصطناعي أطلقته شركة Black Forest Labs في الأول من أغسطس 2024. Black Forest Labs هي شركة ناشئة أسسها مهندسون سابقون في Stability AI معروفون بعملهم على نماذج الانتشار (Stable Diffusion models). صُمم FLUX.1 للمنافسة مباشرة مع لاعبين راسخين مثل MidJourney و DALL-E 3، وهو يضفي مستوى جديداً من الجودة والمرونة على الصور المولدة بالذكاء الاصطناعي. على سبيل المثال، يتفوق FLUX.1 في التعامل مع التفاصيل الدقيقة التي تعاني منها العديد من النماذج، مثل توليد أيدٍ بشرية واقعية أو نصوص مقروءة على اللافتات.

توفر Black Forest Labs ثلاثة إصدارات مختلفة من FLUX.1 يمكن استخدامها في تطبيقات متنوعة. إليك نظرة فاحصة على هذه الإصدارات:

FLUX.1 [pro]: النموذج الرائد مخصص للاستخدام التجاري ومصمم لتقديم أعلى جودة للمخرجات.
FLUX.1 [dev]: نسخة ذات أوزان مفتوحة متاحة للاستخدام غير التجاري، وهي مثالية للبحث والتطوير.
FLUX.1 [schnell]: نموذج مُحسَّن للسرعة بموجب ترخيص Apache 2.0، وهو مثالي للمشاريع الشخصية والتطوير المحلي حيث تكون الحاجة إلى توليد سريع للصور.

رسم تخطيطي لتنويعات FLUX.1

الشكل 1. فهم إصدارات FLUX.1

Link to this sectionكيف يعمل FLUX.1؟#

يستخدم FLUX.1 بنية نموذج هجينة تجمع بين تقنيات Transformer ونماذج الانتشار، بحجم نموذج يبلغ 12 مليار بارامتر (الأجزاء القابلة للتعديل في الشبكة العصبية التي تساعدها على التعلم من البيانات). تُعد Transformers نوعاً من الشبكات العصبية التي يمكنها فهم التسلسلات مثل النصوص والصور من خلال التعرف على الأنماط والعلاقات داخل البيانات. تعمل نماذج الانتشار عن طريق البدء بضوضاء عشوائية وصقلها خطوة بخطوة حتى تتشكل صورة واضحة. من خلال الجمع بين هاتين المقاربتين، يمكن لـ FLUX.1 استخدام نقاط القوة في كلا البنيتين لإنتاج صور عالية الجودة تطابق المطالبات النصية المقدمة.

يستخدم FLUX.1 أيضاً تقنيات متقدمة مثل التضمينات الموضعية الدورانية (rotary positional embeddings) ومطابقة التدفق (flow matching). تساعد التضمينات الموضعية الدورانية النموذج على فهم ترتيب وموقع العناصر في النصوص والصور لضمان ترابط المعنى. مطابقة التدفق هي تقنية تُستخدم في النماذج التوليدية لجعل عملية إنشاء الصور من الضوضاء العشوائية أكثر سلاسة وكفاءة.

Link to this sectionقياس أداء FLUX.1#

عند مقارنة FLUX.1 بنماذج شائعة أخرى مثل MidJourney v6.0 و DALL·E 3 (HD) و SD3-Ultra، يضع FLUX.1 معياراً جديداً في توليد الصور بالذكاء الاصطناعي. وهو يتفوق في مجالات رئيسية مثل جودة الصورة، ومدى الالتزام بالمطالبات، وتنوع المخرجات، ودعم مختلف الأحجام ونسب العرض إلى الارتفاع. تبرز نماذج FLUX.1 [pro] و [dev] في إنتاج صور عالية الجودة تطابق بدقة ما يريده المستخدمون، وغالباً ما تتفوق هذه النماذج على غيرها في تقديم نتائج واضحة ودقيقة. من ناحية أخرى، يُعد FLUX.1 [schnell] واحداً من أكثر النماذج تقدماً لتوليد الصور السريع، ويؤدي بشكل أفضل من نماذج أكثر تعقيداً مثل MidJourney.

مقارنة بين Midjourney v6 و FLUX.1 [pro]

الشكل 2. مقارنة بين Midjourney v6 و FLUX.1[pro]

Link to this sectionGrok 2.0: الأحدث من شركة xAI التابعة لـ إيلون ماسك#

Grok 2.0 هو أحدث نموذج لغوي كبير تطوره شركة الذكاء الاصطناعي xAI التابعة لـ إيلون ماسك. أُطلق Grok 2.0 في أغسطس 2024، وهو متاح لمشتركي X Premium و Premium+ على منصة X (تويتر سابقاً). كما أنه سيكون متاحاً قريباً للمطورين والشركات عبر API للمؤسسات.

مثال على Grok 2.0 وهو يشرح ميم

الشكل 3. مثال على Grok 2.0 يشرح ميم.

بُني Grok 2.0 على بنية Transformer، ومقارنة بإصداره السابق Grok 1.5، فهو أكثر قدرة على اتباع التعليمات، والتعليل المنطقي لحل المشكلات، وتقديم معلومات دقيقة. تم اختبار الـ chatbot مقابل نماذج ذكاء اصطناعي رائدة أخرى وأظهر نتائج مبهرة. يتفوق Grok 2.0 على نماذج شائعة مثل GPT-4 Turbo و Claude 3.5 Sonnet و Llama 3 405B في اختبارات قياسية تشمل أسئلة علمية بمستوى الدراسات العليا، والمعلومات العامة، والمشكلات الرياضية المعقدة. يجيد Grok 2.0 أيضاً المهام التي تتطلب فهماً بصرياً، وقد حقق درجات عالية في التفكير الرياضي البصري والإجابة على الأسئلة المستندة إلى المستندات.

Link to this sectionالرابط بين Grok 2.0 و FLUX.1#

تم دمج FLUX.1 في Grok 2.0 لتوفير مزيج سلس من توليد النصوص والصور. وبينما يُعد الجمع بين تقنيات مختلفة أمراً شائعاً اليوم لتحسين الوظائف وتجربة المستخدم، فإن هذا الدمج تحديداً حظي باهتمام كبير.

من ناحية، نال دمج FLUX.1 إشادة البعض لإضافته عنصراً "ممتعاً" إلى Grok 2.0. يمكن للمستخدمين تجربة توليد صور إبداعية وأحياناً جريئة - وهي أمور كانت ستكون مقيدة أو خاضعة لرقابة مشددة بواسطة أدوات ذكاء اصطناعي أخرى. على سبيل المثال، شارك مستخدمون على X صوراً تصور شخصيات عامة في مواقف غير لائقة أو مثيرة للجدل، زاعمين أن ذلك يدعم مفهوم حرية التعبير.

من ناحية أخرى، يجادل النقاد بأن افتقار FLUX.1 لمبادئ توجيهية أخلاقية واضحة قد يؤدي إلى قضايا أخلاقية واجتماعية خطيرة مثل التضليل والتزييف العميق. يخشى البعض من أن الجمع بين توليد نصوص وصور قوي وغير خاضع للرقابة على واحدة من أكثر منصات التواصل الاجتماعي تأثيراً قد يؤدي إلى تصاعد انتشار المعلومات المضللة.

Link to this sectionGrok 2.0 ونهجه غير المقيد#

لا يتعلق الأمر بتوليد الصور فحسب. Grok 2.0 نفسه أكثر تحرراً من أدوات الذكاء الاصطناعي الأخرى التي اعتدنا عليها مؤخراً، مثل ChatGPT. هذا النقص في الرقابة يجعل من الممكن للنموذج تجاوز الحدود بطرق يجدها البعض مثيرة بينما يجدها آخرون مقلقة.

على سبيل المثال، لوحظ أن Grok 2.0 يولد محتوى نصياً يمكن تفسيره بسهولة كأخبار كاذبة أو مضللة. تضمنت حادثة حديثة قيام Grok 2.0 بإنشاء قصة كاذبة عن لاعب الـ NBA كلاي تومسون زاعمة أنه كان في "حملة تخريب بالطوب". أساء الـ chatbot فهم مصطلح كرة السلة "throwing bricks"، الذي يشير ببساطة إلى التسديدات الفاشلة. وبدلاً من ذلك، أخذ Grok 2.0 المصطلح حرفياً واختلق قصة عن قيام تومسون بأعمال تخريب بطوب حقيقي. انتشر المنشور بسرعة على X، مع قيام بعض المستخدمين بإضافة حسابات ضحايا وهمية لتأجيج التضليل.

منشور على X كتبه Grok 2

الشكل 4. المنشور على منصة X الذي كتبه Grok 2.

على الرغم من هذه المخاوف، يقدر بعض المستخدمين موقف Grok 2.0 تجاه "حرية التعبير". فهم يجادلون بأنه يسمح بمزيد من المحادثات المفتوحة والحرية الإبداعية مقارنة بنماذج الذكاء الاصطناعي الخاضعة لرقابة مشددة. ويرون في Grok 2.0 ترياقاً لما يعتبرونه ذكاءً اصطناعياً "مستيقظاً" (woke AI) يتسم بالحذر المفرط ويحد من النقاش حول الموضوعات الحساسة. بالنسبة لهؤلاء المستخدمين، يقدم Grok 2.0 منصة تبدو أقل تقيداً بالأعراف المجتمعية.

Link to this sectionجرب FLUX.1 و Grok 2.0 بنفسك#

هناك عدة خيارات مختلفة لتجربة FLUX.1 و Grok 2.0. يمكن الوصول إلى FLUX.1 مباشرة من خلال منصات الذكاء الاصطناعي مثل Hugging Face و Replicate و Fal.ai. في الوقت نفسه، Grok 2.0 متاح فقط لمشتركي X Premium و Premium+.

Link to this sectionأبرز النقاط#

تدفع أدوات FLUX.1 و Grok 2.0 حدود الذكاء الاصطناعي وتثير محادثات ثاقبة. لقد وضع FLUX.1 معياراً جديداً في الصور المولدة بالذكاء الاصطناعي بفضل قدرته على إنتاج صور مفصلة وواقعية للغاية. يستخدم Grok 2.0 نموذج FLUX.1 لتعزيز قدراته بما يتجاوز التفاعلات النصية فقط. من ناحية، يشعر المتحمسون بسعادة غامرة تجاه الحرية الإبداعية والاستكشاف غير المقيد الذي توفره هذه الأدوات. من ناحية أخرى، يقرع النقاد أجراس الإنذار بشأن مخاطر التضليل والتزييف العميق والآثار الأخلاقية لمثل هذه القدرات غير المنظمة على منصة مؤثرة مثل X. مع تطور FLUX.1 و Grok 2.0، فإنهما يقفان في مركز نقاش حول الحرية والإبداع والمسؤولية في العصر الرقمي - وهو نقاش سيشكل على الأرجح مستقبل الذكاء الاصطناعي لسنوات قادمة.

لمعرفة المزيد حول Ultralytics، تفقد مستودع GitHub الخاص بنا، وانضم إلى مجتمعنا، واستكشف أحدث حلول الذكاء الاصطناعي لدينا في صناعات مثل الرعاية الصحية و التصنيع! 🚀

Explore solutions

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

xAI تطلق Grok 2.0 مع تكامل FLUX.1

Link to this sectionالتعرف على FLUX.1: مولد صور بالذكاء الاصطناعي#

Link to this sectionكيف يعمل FLUX.1؟#

Link to this sectionقياس أداء FLUX.1#

Link to this sectionGrok 2.0: الأحدث من شركة xAI التابعة لـ إيلون ماسك#

Link to this sectionالرابط بين Grok 2.0 و FLUX.1#

Link to this sectionGrok 2.0 ونهجه غير المقيد#

Link to this sectionجرب FLUX.1 و Grok 2.0 بنفسك#

Link to this sectionأبرز النقاط#

Explore solutions

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

لنبنِ مستقبل الذكاء الاصطناعي معاً!