اكتشف Stable Diffusion، وهو نموذج ذكاء اصطناعي متطور لإنشاء صور واقعية من مطالبات نصية، مما يحدث ثورة في الإبداع والكفاءة.
Stable Diffusion هو نموذج ذكاء اصطناعي توليدي مفتوح المصدر قوي وشائع تم إصداره بواسطة Stability AI في عام 2022. وهو معروف في المقام الأول بقدرته على إنشاء صور مفصلة وعالية الجودة من أوصاف نصية بسيطة، وهي عملية تعرف باسم توليد النص إلى صورة. باعتباره نموذج انتشار كامن، فإنه يمثل تقدمًا كبيرًا في جعل توليد الصور عالي الأداء في متناول جمهور أوسع من المطورين والفنانين والباحثين نظرًا لطبيعته مفتوحة المصدر ومتطلباته الحسابية المتواضعة نسبيًا مقارنة بالنماذج واسعة النطاق الأخرى.
في جوهرها، تعمل Stable Diffusion على مبادئ عملية الانتشار. يتم تدريب النموذج أولاً عن طريق أخذ عدد كبير من الصور وإضافة "ضوضاء" (ثابتة عشوائية) تدريجيًا حتى يتم حجب الصورة الأصلية تمامًا. ثم يتعلم كيفية عكس هذه العملية، بدءًا من الضوضاء النقية وتقليلها تدريجيًا خطوة بخطوة لتشكيل صورة متماسكة تتطابق مع مطالبة نصية معينة.
ما يجعل Stable Diffusion فعالاً بشكل خاص هو أنه ينفذ عملية الانتشار هذه في "فضاء كامن" منخفض الأبعاد بدلاً من الفضاء عالي الأبعاد للبكسل. هذا النهج، الموضح في ورقة بحثية أصلية لنموذج الانتشار الكامن، يقلل بشكل كبير من القدرة الحاسوبية اللازمة لكل من التدريب و الاستدلال، مما يسمح للنموذج بالعمل على وحدات معالجة الرسومات (GPUs) من الدرجة الاستهلاكية. يستخدم النموذج برنامج ترميز نصوص، مثل CLIP، لتفسير المطالبة النصية للمستخدم وتوجيه عملية إزالة التشويش نحو الصورة المطلوبة.
يتميز Stable Diffusion عن النماذج التوليدية البارزة الأخرى من خلال خصائصه الفريدة:
أدت مرونة Stable Diffusion وإمكانية الوصول إليها إلى اعتمادها في العديد من المجالات.
يتم تسهيل العمل مع Stable Diffusion من خلال نظام بيئي غني بالأدوات والمكتبات. تعتبر أطر العمل مثل PyTorch أساسية لعملها. أصبحت مكتبة Hugging Face Diffusers معيارًا لتنزيل وتشغيل وتجربة Stable Diffusion ونماذج الانتشار الأخرى بسهولة. في حين أن Stable Diffusion تتفوق في التوليد، فإن منصات مثل Ultralytics HUB توفر بيئة شاملة لدورة حياة التعلم الآلي الأوسع، بما في ذلك إدارة مجموعات البيانات ونشر نماذج الذكاء الاصطناعي التمييزية لمهام مثل تجزئة الصور والتصنيف. كما أن صعود مثل هذه الأدوات التوليدية القوية يضع في المقدمة مناقشات مهمة حول أخلاقيات الذكاء الاصطناعي، بما في ذلك احتمال إنشاء التزييف العميق وتعزيز التحيز الخوارزمي.