اكتشف كيف تعمل خرائط الميزات كعيون لشبكات CNN. تعرف على كيفية استخدام Ultralytics لهذه التمثيلات الداخلية detect وتعزيز الرؤية الحاسوبية.
خريطة الميزات هي الناتج الأساسي الذي يتم إنتاجه عندما يقوم مرشح التحويل بمعالجة صورة مدخلة أو طبقة سابقة داخل شبكة عصبية. في سياق الرؤية الحاسوبية (CV)، تعمل هذه الخرائط ك تمثيل داخلي للبيانات، حيث تسلط الضوء على أنماط محددة مثل الحواف أو القوام أو الأشكال الهندسية المعقدة التي تعلم النموذج التعرف عليها. بشكل أساسي، تعمل خرائط الميزات كـ"عيون" الشبكة العصبية التلافيفية (CNN)، حيث تحول قيم البكسل الخام إلى تجريدات ذات معنى تسهل مهام مثل اكتشاف الكائنات وتصنيفها.
يتم إنشاء خريطة الميزات من خلال عملية حسابية تعرف باسم التلافيف. خلال هذه العملية، تنزلق مصفوفة صغيرة من المعلمات القابلة للتعلم، تسمى النواة أو المرشح، عبر بيانات الإدخال. في كل موضع، تقوم النواة بإجراء عمليات الضرب والجمع على أساس العناصر، مما ينتج عنه قيمة واحدة في شبكة الإخراج.
خرائط الميزات هي غرفة المحركات لتطبيقات الذكاء الاصطناعي الحديثة، حيث تسمح للأنظمة بتفسير البيانات المرئية بفهم شبيه بالفهم البشري .
في حين أن خرائط الميزات هي هياكل داخلية، فإن فهم أبعادها أمر بالغ الأهمية عند تصميم البنى. فيما يلي PyTorch كيف تقوم طبقة تلافيفية واحدة بتحويل صورة مدخلة إلى خريطة ميزات.
import torch
import torch.nn as nn
# Define a convolution layer: 1 input channel, 1 output filter, 3x3 kernel
conv_layer = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=3, bias=False)
# Create a random dummy image (Batch Size=1, Channels=1, Height=5, Width=5)
input_image = torch.randn(1, 1, 5, 5)
# Pass the image through the layer to generate the feature map
feature_map = conv_layer(input_image)
print(f"Input shape: {input_image.shape}")
# The output shape will be smaller (3x3) due to the kernel size and no padding
print(f"Feature Map shape: {feature_map.shape}")
من المفيد التمييز بين خرائط الميزات والمصطلحات المماثلة لتجنب الالتباس أثناء تدريب النموذج:
في البنى المتقدمة مثل YOLO26، تلعب خرائط الميزات دورًا محوريًا في "العمود الفقري" و"رأس" النموذج. يستخرج العمود الفقري الميزات على مقاييس مختلفة (هرم الميزات)، مما يضمن قدرة النموذج detect الأجسام الصغيرة والكبيرة بفعالية. يمكن للمستخدمين الذين يستفيدون من Ultralytics للتدريب تصور كيفية أداء هذه النماذج، ومراقبة فعالية خرائط الميزات الأساسية بشكل غير مباشر من خلال مقاييس مثل الدقة والاسترجاع. يتضمن تحسين هذه الخرائط تدريبًا مكثفًا على مجموعات البيانات المُعلّقة، وغالبًا ما يستخدم تقنيات مثل استخراج الميزات لنقل المعرفة من النماذج المدربة مسبقًا إلى المهام الجديدة.