مسرد المصطلحات

نقل النمط العصبي

اكتشف قوة نقل النمط العصبي! امزج المحتوى والأنماط الفنية مع الذكاء الاصطناعي لإنشاء مرئيات مذهلة للفن والتصميم وغير ذلك الكثير.

نقل النمط العصبي (NST) هي تقنية رائعة في التعلم العميق (DL) تسمح بتطبيق النمط الفني لصورة ما ("صورة النمط") على محتوى صورة أخرى ("صورة المحتوى")، مما يؤدي إلى إنشاء صورة جديدة تمزج بين محتوى إحداهما مع النمط الجمالي للصورة الأخرى. تستفيد هذه التقنية من قوة الشبكات العصبية التلافيفية (CNNs)، التي عادةً ما يتم تدريبها مسبقًا على مجموعات بيانات كبيرة مثل ImageNet، لفصل عناصر المحتوى والأسلوب في الصور وإعادة تجميعها. وقد شاعت هذه التقنية من خلال ورقة بحثيةبعنوان "خوارزمية عصبية للأسلوب الفني" من تأليف غاتيس وإيكر وبيثج.

كيف يعمل نقل النمط العصبي

تتمثل الفكرة الأساسية وراء شبكة NST في استخدام الطبقات الوسيطة لشبكة CNN المدربة مسبقًا، مثل شبكة VGG المستخدمة على نطاق واسع، لاستخراج تمثيلات لكل من المحتوى والأسلوب.

تمثيل المحتوى: تُستخدم عمليات التنشيط من الطبقات العميقة في شبكة CNN لالتقاط المحتوى عالي المستوى للصورة. يتم تعريف دالة الخسارة (فقدان المحتوى) لتقليل الفرق بين تمثيل المحتوى لصورة المحتوى الأصلية والصورة التي تم إنشاؤها. يضمن ذلك احتفاظ الصورة التي تم إنشاؤها بموضوع صورة المحتوى. فهم استخراج الميزة هو المفتاح هنا.
تمثيل النمط: يتم التقاط النمط من خلال تحليل الارتباطات بين التنشيطات عبر خرائط السمات المختلفة داخل طبقات متعددة من شبكة CNN. وتلتقط هذه الارتباطات، التي غالبًا ما يتم تمثيلها باستخدام مصفوفة غرام، الملمس وأنماط الألوان والميزات الشبيهة بضربة الفرشاة، بشكل مستقل عن الأجسام المحددة الموجودة. تعمل دالة فقدان النمط على تقليل الفرق بين تمثيل النمط لصورة النمط والصورة التي تم إنشاؤها.
التحسين: تُستخدَم خوارزمية التحسين، مثل نزول التدرج، لتعديل صورة الضوضاء الأولية (أو صورة المحتوى نفسها) بشكل تكراري لتقليل دالة الخسارة المجمّعة، وهي عبارة عن مجموع مرجّح لخسارة المحتوى وخسارة النمط. يمكن إضافة خسارة تباين كلي اختياري لتشجيع النعومة المكانية في صورة الخرج. تنقل هذه العملية النمط بفعالية مع الحفاظ على المحتوى.

المفاهيم والتقنيات الرئيسية

تعتمد NST بشكل كبير على مفاهيم من التعلم العميق والرؤية الحاسوبية (CV):

النماذج المدربة مسبقًا: يعد استخدام نماذج CNNs المدربة مسبقًا على مجموعات بيانات كبيرة (مثل النماذج المدربة على COCO) أمرًا بالغ الأهمية. وقد تعلمت هذه النماذج بالفعل ميزات هرمية غنية مفيدة لاستخراج المحتوى والأسلوب على حد سواء. هذا هو شكل من أشكال التعلُّم التحويلي.
مساحات الميزات: إن فهم أن الطبقات المختلفة في شبكة CNN تلتقط الميزات في مستويات مختلفة من التجريد (الحواف والأنسجة في الطبقات الأولى، وأجزاء الكائنات المعقدة في الطبقات الأعمق) أمر أساسي في تقنية NST.
وظائف الخسارة: يوجه التصميم الدقيق لدوال خسارة المحتوى والأسلوب عملية التحسين نحو المخرجات الفنية المطلوبة.