قم بتبسيط البيانات عالية الأبعاد باستخدام تحليل المكونات الرئيسية (PCA). عزز كفاءة الذكاء الاصطناعي ونماذج تعلم الآلة وتصور البيانات اليوم!
تحليل المكونات الرئيسية (PCA) هو أسلوب أساسي لـ تقليل الأبعاد في التعلم الآلي (ML). هدفه الأساسي هو تبسيط تعقيد البيانات عالية الأبعاد مع الاحتفاظ بأكبر قدر ممكن من المعلومات الأصلية (التباين). ويحقق ذلك عن طريق تحويل المجموعة الأصلية من المتغيرات إلى مجموعة جديدة أصغر من المتغيرات غير المترابطة تسمى "المكونات الرئيسية". يتم ترتيب هذه المكونات بحيث تحتفظ المكونات القليلة الأولى بمعظم التباين الموجود في مجموعة البيانات الأصلية. وهذا يجعل PCA أداة لا تقدر بثمن لـ المعالجة المسبقة للبيانات واستكشاف البيانات و تصور البيانات.
في جوهرها، تحدد PCA اتجاهات التباين الأقصى في مجموعة البيانات. تخيل مخططًا مبعثرًا لنقاط البيانات؛ تجد PCA الخط الذي يلتقط أفضل انتشار للبيانات. يمثل هذا الخط المكون الرئيسي الأول. المكون الرئيسي الثاني هو خط آخر، عمودي على الأول، يلتقط أكبر قدر تالي من التباين. من خلال إسقاط البيانات الأصلية على هذه المكونات الجديدة، تنشئ PCA تمثيلًا منخفض الأبعاد يقوم بتصفية الضوضاء وإبراز الأنماط الأكثر أهمية. هذه العملية ضرورية لتحسين أداء النموذج عن طريق تقليل خطر التجاوز وتقليل الموارد الحسابية اللازمة للتدريب.
يستخدم PCA على نطاق واسع في مختلف المجالات داخل الذكاء الاصطناعي (AI) و رؤية الحاسوب (CV).
PCA هي تقنية خطية، مما يعني أنها تفترض أن العلاقات بين المتغيرات خطية. على الرغم من أنها قوية وقابلة للتفسير، إلا أنها قد لا تلتقط الهياكل المعقدة وغير الخطية بشكل فعال.
في حين توجد تقنيات أكثر تقدمًا، يظل PCA أداة قيمة، وغالبًا ما يستخدم كخط أساس أو خطوة أولية في استكشاف البيانات ومسارات المعالجة المسبقة. داخل نظام Ultralytics البيئي، في حين أن نماذج مثل Ultralytics YOLO تستخدم استخراج الميزات مدمجًا داخل CNN الخاص بها، فإن مبادئ تقليل الأبعاد أساسية. تساعد منصات مثل Ultralytics HUB في إدارة سير عمل التعلم الآلي بأكمله، من تنظيم مجموعات البيانات إلى نشر النماذج، حيث تعتبر خطوات المعالجة المسبقة هذه ضرورية لتحقيق أفضل النتائج.