مسرد المصطلحات

تحليل المكونات الرئيسية (PCA)

تبسيط البيانات عالية الأبعاد باستخدام تحليل المكونات الرئيسية (PCA). عزز كفاءة الذكاء الاصطناعي ونماذج التعلم الآلي وتصور البيانات اليوم!

تحليل المكونات الرئيسية (PCA) هو تقنية أساسية لتقليل الأبعاد في التعلم الآلي (ML). هدفها الأساسي هو تبسيط تعقيد البيانات عالية الأبعاد مع الاحتفاظ بأكبر قدر ممكن من المعلومات الأصلية (التباين). ويحقق ذلك من خلال تحويل مجموعة المتغيرات الأصلية إلى مجموعة جديدة أصغر من المتغيرات غير المترابطة تسمى "المكونات الرئيسية". يتم ترتيب هذه المكونات بحيث تحتفظ المكونات القليلة الأولى بمعظم التباين الموجود في مجموعة البيانات الأصلية. هذا يجعل من تحليل PCA أداة لا تقدر بثمن للمعالجة المسبقة للبيانات واستكشاف البيانات وتصور البيانات.

كيف يعمل تحليل المكونات الرئيسية

يحدد تحليل PCA في جوهره اتجاهات التباين الأقصى في مجموعة البيانات. تخيل مخطط مبعثر من نقاط البيانات؛ يجد PCA الخط الذي يلتقط أفضل انتشار للبيانات. يمثل هذا الخط المكون الرئيسي الأول. أما المكوّن الرئيسي الثاني فهو خط آخر عمودي على الخط الأول، وهو يلتقط أكبر قدر من التباين التالي. من خلال إسقاط البيانات الأصلية على هذه المكونات الجديدة، ينشئ تحليل PCA تمثيلاً منخفض الأبعاد يقوم بتصفية الضوضاء وإبراز الأنماط الأكثر أهمية. تعد هذه العملية ضرورية لتحسين أداء النموذج من خلال تقليل مخاطر الإفراط في التركيب وتقليل الموارد الحاسوبية اللازمة للتدريب.

تطبيقات الذكاء الاصطناعي/التعلم الآلي في العالم الحقيقي

يُستخدم تحليل PCA على نطاق واسع في مختلف مجالات الذكاء الاصطناعي والرؤية الحاسوبية.

  1. التعرف على الوجه وضغط الصور: في مجال الرؤية الحاسوبية، الصور عبارة عن بيانات عالية الأبعاد حيث يمثل كل بكسل ميزة. يمكن استخدام PCA لضغط الصور عن طريق تقليل عدد الأبعاد اللازمة لتمثيلها. من التطبيقات الشهيرة في مجال التعرف على الوجوه، حيث تستخدم التقنية المعروفة باسم "الوجوه الأصلية" PCA لتحديد أهم السمات (المكونات الرئيسية) للوجوه. هذا التمثيل المبسط يجعل تخزين الوجوه ومقارنتها أكثر كفاءة، وهو أمر حيوي لمهام مثل تصنيف الصور والأمن البيومتري. للتعمق أكثر في هذا الموضوع، راجع هذه المقدمة عن الوجوه الأصلية.
  2. المعلوماتية الحيوية والتحليل الجيني: غالبًا ما تحتوي مجموعات البيانات الجينومية على آلاف الخصائص، مثل مستويات التعبير الجيني لآلاف الجينات عبر العديد من العينات. يمثل تحليل مثل هذه البيانات عالية الأبعاد تحديًا بسبب لعنة الأبعاد. يساعد تحليل PCA الباحثين في مؤسسات مثل المعهد الوطني لبحوث الجينوم البشري على تقليل هذا التعقيد وتصور البيانات وتحديد مجموعات المرضى أو العينات ذات السمات الجينية المتشابهة. ويمكن أن يكشف ذلك عن الأنماط المتعلقة بالأمراض أو الاستجابات للعلاج، مما يسرع من الأبحاث في مجال الطب الشخصي.

تحليل PCA مقابل التقنيات الأخرى

تحليل PCA هو أسلوب خطي، بمعنى أنه يفترض أن العلاقات بين المتغيرات خطية. على الرغم من قوتها وقابليتها للتفسير، إلا أنها قد لا تلتقط الهياكل المعقدة وغير الخطية بشكل فعال.

وعلى الرغم من وجود تقنيات أكثر تقدمًا، إلا أن تحليل البُعد الواحد PCA يظل أداة قيّمة، وغالبًا ما يُستخدم كخط أساس أو خطوة أولية في استكشاف البيانات وخطوط المعالجة المسبقة. وضمن منظومة Ultralytics، بينما تستخدم نماذج مثل Ultralytics YOLO استخراج الميزات المدمجة في العمود الفقري لشبكة CNN، فإن مبادئ تقليل الأبعاد هي المفتاح. وتساعد منصات مثل Ultralytics HUB في إدارة سير عمل تعلّم الآلة بالكامل، بدءاً من تنظيم مجموعات البيانات إلى نشر النماذج، حيث تُعد خطوات المعالجة المسبقة هذه ضرورية لتحقيق أفضل النتائج.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة