يولو فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التطبيع

اكتشف قوة التسوية في تعلم الآلة! تعرف على كيف يعزز تدريب النموذج، ويعزز الأداء، ويضمن حلول ذكاء اصطناعي قوية.

التطبيع هو أسلوب حاسم في معالجة البيانات الأولية في التعلم الآلي (ML) و الذكاء الاصطناعي (AI). وهو ينطوي على تحويل الميزات العددية لمجموعة البيانات إلى مقياس مشترك دون تشويه الاختلافات في نطاقاتها. تعتبر عملية القياس هذه حيوية لأداء واستقرار العديد من الخوارزميات، وخاصة تلك الحساسة لحجم قيم الإدخال، مثل طرق التحسين القائمة على التدرج المستخدمة في تدريب الشبكات العصبية (NN). من خلال التأكد من أن جميع الميزات تساهم بشكل متناسب في عملية تعلم النموذج، يساعد التطبيع على تسريع التدريب وتحسين دقة النموذج الإجمالية.

لماذا يعتبر التطبيع مهمًا؟

بدون التسوية، يمكن للميزات ذات المقاييس الأكبر أن تهيمن على عملية تعلم النموذج. على سبيل المثال، في مجموعة بيانات للتنبؤ بأسعار المنازل، سيكون للميزة مثل "المساحة المربعة" (على سبيل المثال، 1000-3000) نطاق أكبر بكثير من "عدد غرف النوم" (على سبيل المثال، 2-5). يمكن أن يتسبب هذا التباين في استغراق خوارزميات مثل تدرج النزول وقتًا أطول للتقارب أو التعثر في الحدود الدنيا المحلية. تعمل التسوية على تخفيف ذلك عن طريق وضع جميع الميزات على قدم المساواة، مما يؤدي إلى:

  • تقارب أسرع: تتدرب النماذج بسرعة أكبر لأن خوارزمية التحسين يمكنها التنقل في مشهد الخسارة بكفاءة أكبر.
  • تحسين الأداء: إنه ضروري للخوارزميات التي تستخدم مقاييس المسافة، مثل k-Nearest Neighbors (k-NN)، أو تلك التي تعتمد على تحديثات التدرج، مثل الشبكات العصبية التلافيفية (CNNs).
  • تقليل خطر عدم الاستقرار العددي: يساعد على منع مشكلات مثل توسع التدرجات أثناء عملية الانتشار العكسي.
  • المساهمة المتسقة للميزات: يضمن عدم تأثير أي ميزة بشكل غير متناسب على النموذج ببساطة بسبب حجمها. هذا جانب رئيسي في هندسة الميزات المناسبة.

التطبيع مقابل التقييس مقابل التطبيع الدفعي

في حين يتم استخدام مصطلحي التسوية والتوحيد القياسي بشكل تبادلي غالبًا، إلا أنهما تقنيتان متميزتان. من المهم أيضًا التمييز بين تسوية البيانات وتسوية الدُفعات (Batch Normalization).

  • التطبيع (توسيع النطاق الأدنى-الأقصى): تعمل هذه التقنية على توسيع نطاق البيانات إلى نطاق ثابت، عادةً. يكون ذلك مفيدًا عندما لا يكون توزيع البيانات Gaussian أو عندما لا تفترض الخوارزمية أي توزيع معين. إنها خطوة شائعة في معالجة البيانات الأولية.
  • التوحيد القياسي (تسوية النتيجة المعيارية): تعمل هذه التقنية على إعادة تحجيم البيانات بحيث يكون متوسطها 0 وانحرافها المعياري 1. على عكس تحجيم min-max، ليس لها نطاق محدد. غالبًا ما يفضل التوحيد القياسي عندما تتبع البيانات توزيعًا Gaussian، وهو أقل تأثرًا بالقيم المتطرفة.
  • تطبيع الدُفعة (Batch Normalization): هذه ليست خطوة معالجة مسبقة للبيانات ولكنها طبقة مستخدمة داخل نموذج التعلم العميق (deep learning). إنها تطبع المدخلات إلى طبقة لكل دفعة صغيرة أثناء التدريب. يساعد هذا في مكافحة تحول المتغير الداخلي، مما يثبت ويسرع تدريب الشبكات العميقة. إنه مكون قياسي في العديد من البنى الحديثة، بما في ذلك نماذج Ultralytics YOLO، ويتم تنفيذه في أطر عمل مثل PyTorch و TensorFlow.

تطبيقات التسوية (Normalization)

التطبيع هو ممارسة قياسية عبر مختلف المجالات، وخاصة في رؤية الكمبيوتر (CV). تعمل منصات مثل Ultralytics HUB على تبسيط سير العمل حيث تكون هذه المعالجة الأولية ضرورية لتدريب النماذج عالية الأداء.

  • المعالجة المسبقة لبيانات الصور: في رؤية الكمبيوتر، تتكون الصور من قيم البكسل، والتي تتراوح عادةً من 0 إلى 255. قبل إدخال صورة في نموذج لمهام مثل تصنيف الصور أو اكتشاف الكائنات، يتم دائمًا تطبيع قيم البكسل هذه تقريبًا. يضمن تغيير حجمها إلى نطاق أو [-1، 1] الاتساق عبر جميع الصور في مجموعة البيانات، وهو أمر بالغ الأهمية للنماذج مثل YOLO11 لتعلم الميزات بشكل فعال.
  • تحليل الصور الطبية: في مجالات مثل الذكاء الاصطناعي في الرعاية الصحية، غالبًا ما تأتي الفحوصات الطبية مثل التصوير بالرنين المغناطيسي أو التصوير المقطعي المحوسب من أجهزة مختلفة بإعدادات مختلفة، مما يؤدي إلى مقاييس كثافة مختلفة. عند استخدام الذكاء الاصطناعي للكشف عن الأورام، فإن تطبيع هذه الفحوصات يعد خطوة حاسمة. فهو يضمن أن تحليل النموذج قابل للمقارنة عبر مختلف المرضى والمعدات، مما يؤدي إلى تنبؤات تشخيصية أكثر موثوقية ودقة. هذا مفهوم أساسي في تحليل الصور الطبية.
  • النمذجة التنبؤية في التمويل: عند بناء نماذج للتنبؤ بأسعار الأسهم أو تقييم المخاطر الائتمانية، غالبًا ما تتضمن مجموعات البيانات ميزات ذات مقاييس مختلفة اختلافًا كبيرًا، مثل حجم التداول (بالملايين) ونسبة السعر إلى الأرباح (على سبيل المثال، 10-50). يعد تطبيع هذه الميزات أمرًا ضروريًا للخوارزميات القائمة على المسافة ويضمن عدم انحراف التعلم القائم على التدرج gradient-based learning بسبب الميزات ذات الأحجام الأكبر، وهي ممارسة شائعة في الرؤية الحاسوبية في التمويل computer vision in finance.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة