مسرد المصطلحات

التطبيع

اكتشف قوة التطبيع في التعلم الآلي! تعرّف على كيفية تحسين تدريب النموذج، وتعزيز الأداء، وضمان حلول ذكاء اصطناعي قوية.

يُعد التطبيع تقنية حاسمة للمعالجة المسبقة للبيانات في التعلم الآلي (ML) والذكاء الاصطناعي (AI). وهي تتضمن تحويل السمات العددية لمجموعة بيانات إلى مقياس مشترك دون تشويه الاختلافات في نطاقاتها. تُعد عملية القياس هذه ضرورية لأداء واستقرار العديد من الخوارزميات، خاصةً تلك التي تتسم بالحساسية لمقدار قيم المدخلات، مثل طرق التحسين القائمة على التدرج المستخدمة في تدريب الشبكات العصبية (NN). من خلال ضمان أن جميع الميزات تساهم بشكل متناسب في عملية تعلم النموذج، يساعد التطبيع على تسريع التدريب وتحسين دقة النموذج بشكل عام.

ما أهمية التطبيع؟

بدون تطبيع، يمكن للسمات ذات المقاييس الأكبر أن تهيمن على عملية تعلم النموذج. على سبيل المثال، في مجموعة بيانات للتنبؤ بأسعار المنازل، قد يكون لخاصية مثل "المساحة المربعة" (على سبيل المثال، 1000-3000) نطاق أكبر بكثير من "عدد غرف النوم" (على سبيل المثال، 2-5). يمكن أن يتسبب هذا التباين في أن تستغرق خوارزميات مثل النسب المتدرجة وقتًا أطول للتقارب أو أن تتعثر في الحالات المثلى المحلية. يخفف التطبيع من هذا الأمر من خلال وضع جميع الميزات على قدم المساواة، مما يؤدي إلى:

  • تقارب أسرع: تتدرب النماذج بسرعة أكبر لأن خوارزمية التحسين يمكنها التنقل في مشهد الخسارة بشكل أكثر كفاءة.
  • تحسين الأداء: من الضروري للخوارزميات التي تستخدم مقاييس المسافة، مثل k-Nearest Nebours (k-NN)، أو تلك التي تعتمد على تحديثات التدرج، مثل الشبكات العصبية التلافيفية (CNNs).
  • تقليل مخاطر عدم الاستقرار العددي: يساعد على منع حدوث مشكلات مثل انفجار التدرجات أثناء عملية الترحيل العكسي.
  • مساهمة الميزة المتسقة: يضمن عدم وجود ميزة واحدة تؤثر بشكل غير متناسب على النموذج لمجرد حجمها. هذا جانب أساسي في هندسة الميزة المناسبة.

التطبيع مقابل التوحيد القياسي مقابل التطبيع على دفعات

على الرغم من استخدامهما بالتبادل في كثير من الأحيان، إلا أن التطبيع والتوحيد القياسي هما تقنيتان مختلفتان. ومن المهم أيضًا التمييز بين تطبيع البيانات وتطبيع الدُفعات.

  • التطبيع (القياس الأدنى والأقصى): تقوم هذه التقنية بقياس البيانات إلى نطاق ثابت، عادةً. وهي مفيدة عندما يكون توزيع البيانات غير غاوسي أو عندما لا تفترض الخوارزمية أي توزيع محدد. وهي خطوة شائعة في المعالجة المسبقة للبيانات.
  • التوحيد القياسي (تطبيع الدرجة Z): تعمل هذه التقنية على إعادة قياس البيانات بحيث يكون المتوسط 0 والانحراف المعياري 1. وعلى عكس القياس بالحد الأدنى والأقصى فإنه لا يحتوي على نطاق محدد. وغالبًا ما يُفضل التوحيد القياسي عندما تتبع البيانات توزيعًا غاوسيًا، ويكون أقل تأثرًا بالقيم المتطرفة.
  • تطبيع الدُفعات: هذه ليست خطوة معالجة مسبقة للبيانات ولكنها طبقة مستخدمة داخل نموذج التعلم العميق. تقوم بتطبيع المدخلات إلى طبقة لكل دفعة صغيرة أثناء التدريب. يساعد ذلك على مكافحة التحول الداخلي للمتغيرات المتشابهة واستقرار وتسريع تدريب الشبكات العميقة. إنه مكوّن قياسي في العديد من البنى الحديثة، بما في ذلك نماذج Ultralytics YOLO، ويتم تنفيذه في أطر عمل مثل PyTorch و TensorFlow.

تطبيقات التطبيع

يُعد التطبيع ممارسة قياسية في مختلف المجالات، خاصةً في مجال الرؤية الحاسوبية. تعمل المنصات مثل Ultralytics HUB على تبسيط سير العمل حيث تكون هذه المعالجة المسبقة ضرورية لتدريب النماذج عالية الأداء.

  • المعالجة المسبقة لبيانات الصور: في الرؤية الحاسوبية، تتكون الصور من قيم بكسل، والتي تتراوح عادةً من 0 إلى 255. قبل إدخال الصورة في نموذج لمهام مثل تصنيف الصور أو اكتشاف الأجسام، يتم دائمًا تقريبًا تطبيع قيم البكسل هذه. يضمن تحجيمها إلى نطاق [-1، 1] اتساق جميع الصور في مجموعة البيانات، وهو أمر بالغ الأهمية لنماذج مثل YOLO11 لتعلم الميزات بفعالية.
  • تحليل الصور الطبية: في مجالات مثل الذكاء الاصطناعي في مجال الرعاية الصحية، غالبًا ما تأتي الفحوصات الطبية مثل التصوير بالرنين المغناطيسي أو التصوير المقطعي المحوسب من أجهزة مختلفة بإعدادات مختلفة، مما يؤدي إلى مقاييس شدة مختلفة. عند استخدام الذكاء الاصطناعي للكشف عن الأورام، فإن تطبيع هذه الفحوصات يعد خطوة حاسمة. فهي تضمن أن يكون تحليل النموذج قابلاً للمقارنة بين مختلف المرضى والأجهزة، مما يؤدي إلى تنبؤات تشخيصية أكثر موثوقية ودقة. هذا مفهوم أساسي في تحليل الصور الطبية.
  • النمذجة التنبؤية في مجال التمويل: عند بناء النماذج للتنبؤ بأسعار الأسهم أو تقييم مخاطر الائتمان، غالبًا ما تتضمن مجموعات البيانات ميزات ذات مقاييس مختلفة إلى حد كبير، مثل حجم التداول (بالملايين) ونسبة السعر إلى الأرباح (على سبيل المثال، 10-50). يعد تطبيع هذه الميزات أمرًا ضروريًا للخوارزميات القائمة على المسافة ويضمن عدم انحراف التعلم القائم على التدرج من خلال الميزات ذات المقادير الأكبر، وهي ممارسة شائعة في الرؤية الحاسوبية في مجال التمويل.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة