يولو فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تحليل المكونات الرئيسية (PCA)

قم بتبسيط البيانات عالية الأبعاد باستخدام تحليل المكونات الرئيسية (PCA). عزز كفاءة الذكاء الاصطناعي ونماذج تعلم الآلة وتصور البيانات اليوم!

تحليل المكونات الرئيسية (PCA) هو أسلوب أساسي لـ تقليل الأبعاد في التعلم الآلي (ML). هدفه الأساسي هو تبسيط تعقيد البيانات عالية الأبعاد مع الاحتفاظ بأكبر قدر ممكن من المعلومات الأصلية (التباين). ويحقق ذلك عن طريق تحويل المجموعة الأصلية من المتغيرات إلى مجموعة جديدة أصغر من المتغيرات غير المترابطة تسمى "المكونات الرئيسية". يتم ترتيب هذه المكونات بحيث تحتفظ المكونات القليلة الأولى بمعظم التباين الموجود في مجموعة البيانات الأصلية. وهذا يجعل PCA أداة لا تقدر بثمن لـ المعالجة المسبقة للبيانات واستكشاف البيانات و تصور البيانات.

كيفية عمل تحليل المكونات الرئيسية

في جوهرها، تحدد PCA اتجاهات التباين الأقصى في مجموعة البيانات. تخيل مخططًا مبعثرًا لنقاط البيانات؛ تجد PCA الخط الذي يلتقط أفضل انتشار للبيانات. يمثل هذا الخط المكون الرئيسي الأول. المكون الرئيسي الثاني هو خط آخر، عمودي على الأول، يلتقط أكبر قدر تالي من التباين. من خلال إسقاط البيانات الأصلية على هذه المكونات الجديدة، تنشئ PCA تمثيلًا منخفض الأبعاد يقوم بتصفية الضوضاء وإبراز الأنماط الأكثر أهمية. هذه العملية ضرورية لتحسين أداء النموذج عن طريق تقليل خطر التجاوز وتقليل الموارد الحسابية اللازمة للتدريب.

تطبيقات الذكاء الاصطناعي/تعلم الآلة الواقعية

يستخدم PCA على نطاق واسع في مختلف المجالات داخل الذكاء الاصطناعي (AI) و رؤية الحاسوب (CV).

  1. التعرف على الوجه وضغط الصور: في رؤية الكمبيوتر، تكون الصور عبارة عن بيانات عالية الأبعاد حيث تكون كل بكسل عبارة عن ميزة. يمكن استخدام PCA لضغط الصور عن طريق تقليل عدد الأبعاد اللازمة لتمثيلها. أحد التطبيقات الشهيرة هو في التعرف على الوجه، حيث تستخدم التقنية المعروفة باسم "eigenfaces" PCA لتحديد أهم ميزات (المكونات الرئيسية) للوجوه. هذا التمثيل المبسط يجعل تخزين الوجوه ومقارنتها أكثر كفاءة، وهو أمر حيوي لمهام مثل تصنيف الصور والأمن البيومتري. للحصول على نظرة متعمقة، راجع هذا مقدمة إلى eigenfaces.
  2. المعلوماتية الحيوية والتحليل الجيني (Bioinformatics and Genetic Analysis): غالبًا ما تحتوي مجموعات البيانات الجينومية على آلاف الميزات، مثل مستويات التعبير الجيني لآلاف الجينات عبر العديد من العينات. يعد تحليل هذه البيانات عالية الأبعاد أمرًا صعبًا بسبب لعنة الأبعاد (curse of dimensionality). يساعد PCA الباحثين في مؤسسات مثل المعهد الوطني لبحوث الجينوم البشري (National Human Genome Research Institute) على تقليل هذا التعقيد وتصور البيانات وتحديد مجموعات المرضى أو العينات ذات الملفات الجينية المتشابهة. يمكن أن يكشف هذا عن أنماط متعلقة بالأمراض أو الاستجابات للعلاج، مما يسرع البحث في الطب الشخصي.

PCA مقابل التقنيات الأخرى

PCA هي تقنية خطية، مما يعني أنها تفترض أن العلاقات بين المتغيرات خطية. على الرغم من أنها قوية وقابلة للتفسير، إلا أنها قد لا تلتقط الهياكل المعقدة وغير الخطية بشكل فعال.

في حين توجد تقنيات أكثر تقدمًا، يظل PCA أداة قيمة، وغالبًا ما يستخدم كخط أساس أو خطوة أولية في استكشاف البيانات ومسارات المعالجة المسبقة. داخل نظام Ultralytics البيئي، في حين أن نماذج مثل Ultralytics YOLO تستخدم استخراج الميزات مدمجًا داخل CNN الخاص بها، فإن مبادئ تقليل الأبعاد أساسية. تساعد منصات مثل Ultralytics HUB في إدارة سير عمل التعلم الآلي بأكمله، من تنظيم مجموعات البيانات إلى نشر النماذج، حيث تعتبر خطوات المعالجة المسبقة هذه ضرورية لتحقيق أفضل النتائج.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة