Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التطبيع

اكتشف كيف تعمل التطبيع على تحسين تدريب النموذج ودقته. تعرف على مقياس Min-Max، وتوحيد Z-score، ودوره في مشاريع Ultralytics .

التطبيع هو تقنية أساسية في معالجة البيانات المسبقة تتضمن إعادة قياس السمات الرقمية إلى نطاق قياسي. في سياق التعلم الآلي (ML)، غالبًا ما تحتوي مجموعات البيانات على سمات ذات نطاقات متفاوتة، مثل الفئات العمرية (0-100) مقابل مستويات الدخل (0-100,000). إذا تُركت هذه التفاوتات دون معالجة، فقد تتسبب في تحيز خوارزمية التحسين نحو القيم الأكبر، مما يؤدي إلى تباطؤ التقارب والأداء دون المستوى الأمثل. من خلال تطبيع البيانات، يضمن المهندسون أن تساهم كل ميزة بشكل متناسب في النتيجة النهائية، مما يسمح للشبكات العصبية بالتعلم بشكل أكثر كفاءة.

تقنيات التطبيع الشائعة

هناك عدة طرق قياسية لتحويل البيانات، كل منها مناسب لتوزيعات ومتطلبات خوارزمية مختلفة .

  • تحجيم الحد الأدنى والحد الأقصى: هذا هو الشكل الأكثر بديهية للتطبيع. يعيد تحجيم البيانات إلى نطاق ثابت، عادةً ما يكون [0، 1]. يتم إجراء هذا التحويل عن طريق طرح القيمة الدنيا وقسمتها على النطاق (الحد الأقصى ناقص الحد الأدنى). يستخدم على نطاق واسع في معالجة الصور حيث من المعروف أن شدة البكسلات تتراوح بين 0 و 255.
  • توحيد Z-Score: على الرغم من أنه غالبًا ما يستخدم بالتبادل مع التوحيد، فإن التوحيد يحول البيانات بشكل خاص لتكون متوسطها 0 و انحرافها المعياري 1. وهذا مفيد بشكل خاص عندما تتبع البيانات توزيعًا غاوسيًا وهو أمر ضروري لخوارزميات مثل آلات الدعم المتجهية (SVM) التي تفترض توزيعًا طبيعيًا للبيانات.
  • قياس اللوغاريتم: بالنسبة للبيانات التي تحتوي على قيم متطرفة أو تتبع قانون القوة، يمكن أن يؤدي تطبيق التحويل اللوغاريتمي إلى ضغط نطاق القيم. وهذا يجعل التوزيع أكثر قابلية للإدارة بالنسبة لمحرك الاستدلال لتفسيره بشكل فعال دون أن يتأثر بالارتفاعات الهائلة في القيم.

تطبيقات واقعية

التطبيع هو خطوة قياسية في خطوط أنابيب أنظمة الذكاء الاصطناعي عالية الأداء في مختلف الصناعات.

  1. الرؤية الحاسوبية (CV): في مهام مثل الكشف عن الكائنات وتصنيف الصور، تتكون الصور الرقمية من قيم بكسل تتراوح من 0 إلى 255. قد يؤدي إدخال هذه الأعداد الصحيحة الكبيرة مباشرة إلى الشبكة إلى إبطاء انحدار التدرج. تتضمن خطوة المعالجة المسبقة القياسية قسمة قيم البكسل على 255.0 لتطبيعها إلى النطاق [0، 1]. تضمن هذه الممارسة اتساق المدخلات للنماذج المتقدمة مثل YOLO26، مما يحسن استقرار التدريب على Ultralytics .
  2. تحليل الصور الطبية: غالبًا ما تأتي الفحوصات الطبية، مثل تلك المستخدمة في الذكاء الاصطناعي في الرعاية الصحية، من أجهزة مختلفة ذات مقاييس كثافة متفاوتة. يضمن التوحيد أن تكون كثافة البكسل من التصوير بالرنين المغناطيسي أو التصوير المقطعي المحوسب قابلة للمقارنة بين المرضى والأجهزة المختلفة. هذا الاتساق ضروري للكشف الدقيق عن الأورام، مما يسمح للنموذج بالتركيز على الشذوذ الهيكلي بدلاً من تباينات السطوع.

التمييز بين المفاهيم ذات الصلة

من المهم التمييز بين التطبيع والمصطلحات المماثلة المتعلقة بالمعالجة المسبقة والهندسة المعمارية الموجودة في التعلم العميق .

  • مقابل تطبيع الدُفعات: تطبيع البيانات هو خطوة معالجة مسبقة تُطبق على مجموعة البيانات الأولية المدخلة قبل دخولها إلى الشبكة. على العكس من ذلك، يعمل تطبيع الدُفعات داخليًا بين الطبقات في جميع أنحاء الشبكة أثناء تدريب النموذج. وهو يعمل على تطبيع ناتج طبقة التنشيط السابقة لتثبيت عملية التعلم.
  • مقابل تكبير الصورة: بينما يغير التوحيد مقياس قيم البكسل، فإن التكبير يغير محتوى أو هندسة الصورة (على سبيل المثال، قلبها أو تدويرها أو تغيير ألوانها) لزيادة تنوع مجموعة البيانات. تُستخدم أدوات مثل Albumentations للتكبير، بينما التوحيد هو عملية تحجيم رياضية.

مثال على التنفيذ

في الرؤية الحاسوبية، غالبًا ما تكون التطبيع هي الخطوة الأولى في سلسلة العمليات. ما يلي Python كيفية تطبيع بيانات الصور يدويًا باستخدام NumPy ، وهي عملية تحدث تلقائيًا داخل محمل البيانات Ultralytics أثناء التدريب.

import numpy as np

# Simulate a 2x2 pixel image with values ranging from 0 to 255
raw_image = np.array([[0, 255], [127, 64]], dtype=np.float32)

# Apply Min-Max normalization to scale values to [0, 1]
# This standardizes the input for the neural network
normalized_image = raw_image / 255.0

print(f"Original Range: {raw_image.min()} - {raw_image.max()}")
print(f"Normalized Range: {normalized_image.min()} - {normalized_image.max()}")

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن