تضمين الجار العشوائي الموزع ر الموزع ر (t-SNE)
استكشف t-SNE، وهي تقنية قوية لتصور البيانات عالية الأبعاد. تعرف على استخداماتها وفوائدها وتطبيقاتها في الذكاء الاصطناعي والتعلم الآلي.
التضمين العشوائي للمجاورة الموزعة (t-SNE) هي تقنية قوية وغير خطية لتقليل الأبعاد تستخدم بشكل أساسي لتصور البيانات. تسمح هذه التقنية للباحثين والممارسين في مجال التعلم الآلي (ML) بتصور مجموعات البيانات عالية الأبعاد في مساحة منخفضة الأبعاد، عادةً ما تكون ثنائية الأبعاد أو ثلاثية الأبعاد. تم تطويره من قبل لورينس فان دير ماتن وجيفري هينتون، وتكمن قوته الرئيسية في قدرته الرائعة على الكشف عن البنية المحلية الأساسية للبيانات، مثل العناقيد والمتشعبات، والتي قد تفوتها التقنيات الأخرى. وتتوفر تطبيقاتها على نطاق واسع في مكتبات مثل Scikit-learn وأطر مثل PyTorch.
تتمثل الفكرة الأساسية ل t-SNE في وضع نقاط البيانات المتشابهة قريبة من بعضها البعض ونقاط متباعدة عن بعضها البعض في خريطة منخفضة الأبعاد. وهي تحقق ذلك من خلال تحويل المسافات الإقليدية عالية الأبعاد بين نقاط البيانات إلى احتمالات شرطية تمثل أوجه التشابه. ثم يستخدم بعد ذلك توزيعًا احتماليًا متشابهًا في الخريطة منخفضة الأبعاد ويقلل التباعد بين هذين التوزيعين.
التطبيقات في Ai و Ml
تُستخدم t-SNE على نطاق واسع للاستكشاف البصري في مختلف مجالات الذكاء الاصطناعي.
- تصور ميزات الشبكة العصبية: في مجال الرؤية الحاسوبية (CV)، تُعدّ t-SNE لا تُقدّر بثمن لفهم ما تعلّمه نموذج التعلّم العميق. على سبيل المثال، يمكنك أخذ تضمينات الميزات من طبقة وسيطة لشبكة عصبية تلافيفية (CNN) مدربة لتصنيف الصور واستخدام t-SNE لرسمها. إذا كان النموذج، مثل نموذج Ultralytics YOLO، مدربًا جيدًا على مجموعة بيانات مثل CIFAR-10، فإن المخطط الناتج سيُظهر مجموعات مميزة تتوافق مع فئات الصور المختلفة (على سبيل المثال، "القطط" و"الكلاب" و"السيارات"). يوفر هذا تأكيدًا مرئيًا لقوة النموذج التمييزية.
- استكشاف البيانات النصية: في معالجة اللغة الطبيعية (NLP)، يمكن لـ t-SNE تصور تضمينات الكلمات عالية الأبعاد مثل Word2Vec أو GloVe. يساعد ذلك في فهم العلاقات الدلالية بين الكلمات؛ على سبيل المثال، كلمات مثل "ملك" و"ملكة" و"أمير" و"أميرة" تتجمع معًا. تُفيد مثل هذه التصورات في استكشاف مجموعات النصوص وتصحيح نماذج اللغة المستخدمة في مهام مثل تصنيف المستندات.
- المعلوماتية الحيوية والتصوير الطبي: يستخدم الباحثون t-SNE لتصور البيانات البيولوجية المعقدة، مثل أنماط التعبير الجيني من المصفوفات المجهرية، لتحديد مجموعات الخلايا أو الأنواع الفرعية للأمراض. كما يُستخدم أيضًا في تحليل الصور الطبية لتجميع أنواع مختلفة من الأنسجة أو الأورام، كما هو الحال في مجموعة بيانات أورام الدماغ.
T-SNE مقابل T-SNE. تقنيات أخرى
من المهم تمييز t-SNE عن طرق تقليل الأبعاد الأخرى.
- تحليل المكونات الرئيسية (PCA): تحليل PCA هو أسلوب خطي يركز على الحفاظ على التباين الأقصى في البيانات، وهو ما يتوافق مع الحفاظ على البنية العامة واسعة النطاق. وعلى النقيض من ذلك، فإن تحليل المكوّنات الرئيسية هو طريقة غير خطية تتفوق في الكشف عن البنية المحلية (أي كيفية تجميع نقاط البيانات الفردية معًا). في حين أن تحليل PCA أسرع وحتمي، إلا أن طبيعته الخطية قد تفشل في التقاط العلاقات المعقدة التي يمكن أن تلتقطها طريقة t-SNE. من الممارسات الشائعة استخدام تحليل PCA أولًا لتقليل مجموعة البيانات إلى عدد وسيط من الأبعاد (على سبيل المثال، 30-50) قبل تطبيق t-SNE لتقليل العبء الحسابي والضوضاء.
- أجهزة الترميز التلقائي: أجهزة الترميز التلقائي هي نوع من الشبكات العصبية التي يمكنها تعلم تمثيلات قوية وغير خطية للبيانات. وعلى الرغم من أنها أكثر مرونة من PCA و t-SNE، إلا أنها غالبًا ما تكون أقل قابلية للتفسير وأكثر تكلفة من الناحية الحسابية في التدريب. وهي تُستخدم في المقام الأول لاستخراج السمات بدلاً من التصور المباشر.
الاعتبارات والقيود
على الرغم من قوتها، إلا أن لها بعض القيود التي يجب على المستخدمين أخذها في الاعتبار.
- التكلفة الحسابية: تحتوي الخوارزمية على تعقيد زمني ومكاني تربيعي في عدد نقاط البيانات، مما يجعلها بطيئة بالنسبة لمجموعات البيانات التي تحتوي على مئات الآلاف من العينات. تقدم تقنيات مثل Barnes-Hut t-SNE تحسينات كبيرة في الأداء.
- حساسية المعامل الفائق: يمكن أن تتأثر النتائج بشكل كبير بالمعاملات الفائقة، خاصةً "الحساسية المفرطة"، وهي تخمين حول عدد الجيران القريبين لكل نقطة. لا توجد قيمة واحدة هي الأفضل عالميًا للبيرباميتر. من المصادر الممتازة لفهم هذه التأثيرات مقالة"كيفية استخدام t-SNE بفعالية".
- تفسير البنية العالمية: يجب تفسير تصورات t-SNE بحذر. فالأحجام النسبية للمجموعات والمسافات بينها في المخطط النهائي لا تعكس بالضرورة الفصل الفعلي في الفضاء الأصلي عالي الأبعاد. ينصب تركيز الخوارزمية على الحفاظ على الأحياء المحلية وليس على الهندسة العالمية. تسمح أدوات مثل TensorFlow Projector بالاستكشاف التفاعلي الذي يمكن أن يساعد في بناء الحدس. يمكن تبسيط إدارة وتصور مثل هذه التحليلات باستخدام منصات مثل Ultralytics HUB.