Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

الالتفاف

تعرف على كيف يعزز الالتفاف الذكاء الاصطناعي في الرؤية الحاسوبية، مما يتيح مهام مثل الكشف عن العناصر والتعرف على الصور والتصوير الطبي بدقة.

التلافيف هي عملية رياضية متخصصة تُعد بمثابة اللبنة الأساسية في أنظمة أنظمة الرؤية الحاسوبية الحديثة. في سياق الذكاء الاصطناعي (AI), يمكّن التلافيف النماذج من معالجة البيانات الشبيهة بالشبكة، مثل الصور، من خلال تصفية المدخلات بشكل منهجي لاستخراج أنماط ذات معنى. على عكس الخوارزميات التقليدية التي تتطلب وضع قواعد يدوية، يسمح الالتفاف للشبكة العصبية للشبكة العصبية أن تتعلم تلقائياً التسلسلات التسلسل الهرمي للميزات المكانية - بدءاً من الحواف والأنسجة البسيطة إلى أشكال الأجسام المعقدة - محاكاةً للعمليات البيولوجية التي لوحظت في القشرة البصرية للدماغ.

ميكانيكا الالتفاف

تعمل العملية عن طريق تحريك مصفوفة صغيرة من الأرقام، تُعرف باسم نواة أو مرشح، عبر صورة المدخلات. عند كل موضع، تقوم النواة بإجراء عملية ضرب العناصر مع قيم البكسل المتداخلة وتجمع النتائج لإنتاج لإنتاج بكسل مخرج واحد. تُنشئ هذه العملية خريطة مميزة، والتي تسلط الضوء على المناطق التي يتم فيها اكتشاف أنماط محددة.

تتضمن المعلمات الرئيسية التي تحدد سلوك الالتفاف ما يلي:

  • حجم النواة: أبعاد المرشح (على سبيل المثال، 3 × 3 أو 5 × 5)، والتي تحدد مساحة المدخلات المعتبرة في آن واحد، وغالبًا ما يشار إليها باسم المجال الاستقبالي.
  • الخطوة: حجم الخطوة التي يتحرك بها المرشح عبر الصورة. ينتج عن الخطوة أكبر ينتج عنه مخرجات أصغر أصغر، مما يقلل من حجم البيانات بشكل فعال.
  • الحشو: إضافة وحدات بكسل حدية (عادةً ما تكون أصفارًا) إلى المدخلات للتحكم في الحجم المكاني ل الإخراج، وهو مفهوم مفصّل في في وثائقPyTorch .

الملاءمة في التعلم العميق

التلافيف هو المحرك الأساسي وراء الشبكات العصبية التلافيفية (CNNs). تكمن أهميته في خاصيتين رئيسيتين: مشاركة المعلمات و والمحلية المكانية. باستخدام نفس نفس أوزان النموذج (النواة) عبر الصورة بأكملها، تظل الشبكة تظل الشبكة فعالة من الناحية الحسابية وقادرة على ثبات الترجمة, بمعنى أنه يمكنها التعرّف على الجسم بغض النظر عن مكان ظهوره في الإطار. تسمح هذه الكفاءة بتطوير المتطورة مثل YOLO11 بإجراء الاستدلال في الوقت الحقيقي على أجهزة متنوعة، بدءًا من وحدات معالجة الرسومات القوية وحتى أجهزة أجهزة الذكاء الاصطناعي المتطورة.

تطبيقات واقعية

تمتد فائدة الالتفاف عبر جميع الصناعات تقريبًا التي تستخدم البيانات المرئية:

الالتفاف مقابل الطبقات المتصلة بالكامل

من المهم التمييز بين التلافيف والطبقات المتصلة بالكامل (الكثيفة). في طبقة متصلة بالكامل تتصل كل خلية عصبية مدخلة بكل خلية عصبية مخرجة، وهو أمر مكلف حسابياً ويتجاهل البنية المكانية للصور. وعلى العكس من ذلك، يحافظ التلافيف على العلاقات المكانية ويقلل بشكل كبير من عدد البارامترات، مما يمنع الإفراط في تركيب عالية الأبعاد. بينما تُستخدم الطبقات الكثيفة غالبًا للتصنيف النهائي، بينما تتولى الطبقات التلافيفية عملية رفع استخراج السمات.

تنفيذ التلافيف باستخدام Ultralytics

يمكنك تصور البنية التلافيفية لكاشفات الأجسام الحديثة باستخدام ultralytics الحزمة. يقوم الرمز التالي بتحميل YOLO11 نموذجًا ويطبع هيكله، كاشفًا عن Conv2d الطبقات المستخدمة في المعالجة.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Print the model architecture to observe Conv2d layers
# These layers perform the convolution operations to extract features
print(model.model)

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن