Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

الشبكة العصبية الالتفافية (CNN)

اكتشف كيف تُحدث الشبكات العصبية التلافيفية (CNNs) ثورة في الرؤية الحاسوبية، مما يدعم الذكاء الاصطناعي في الرعاية الصحية والسيارات ذاتية القيادة والمزيد.

الشبكة العصبية التلافيفية (CNN) هي بنية متخصصة للتعلم العميق مصممة لمعالجة البيانات ذات الطوبولوجيا الشبكية، ولا سيما الصور الرقمية. مستوحاة من البنية البيولوجية لقشرة الدماغ البصرية، تتمتع الشبكات العصبية التلافيفية بقدرة فريدة على الحفاظ على العلاقات المكانية داخل البيانات المدخلة. على عكس الشبكات العصبية التقليدية التي تعمل على تسوية الصورة إلى قائمة طويلة من الأرقام، تقوم شبكات CNN بتحليل المناطق الصغيرة المتداخلة من الصورة لتتعلم تلقائيًا التسلسل الهرمي للسمات — من الحواف والأنسجة البسيطة إلى الأشكال والأجسام المعقدة. هذه القدرة تجعلها التكنولوجيا الأساسية وراء أنظمة الرؤية الحاسوبية الحديثة (CV).

كيفية عمل الشبكات العصبية التلافيفية

تكمن قوة CNN في قدرتها على تقليل صورة معقدة إلى شكل يسهل معالجته دون فقدان الميزات المهمة للحصول على تنبؤ جيد. ويتحقق ذلك من خلال سلسلة من الطبقات المتميزة:

  1. الطبقة التلافيفية: هذه هي اللبنة الأساسية. وهي تستخدم مجموعة من المرشحات القابلة للتعلم (أو النواة) التي تنزلق فوق الصورة المدخلة مثل مصباح يدوي. في كل موضع، يقوم المرشح بعملية حسابية تسمى التلافيف، مما ينتج عنه خريطة ميزات تبرز أنماطًا محددة مثل الخطوط الأفقية أو التدرجات اللونية.
  2. وظيفة التنشيط: بعد التحويل، يتم تطبيق وظيفة غير خطية على الناتج. الخيار الأكثر شيوعًا هو ReLU (وحدة خطية مصححة)، والتي تحول قيم البكسل السالبة إلى صفر. وهذا يؤدي إلى عدم الخطية، مما يسمح للشبكة بتعلم أنماط معقدة تتجاوز العلاقات الخطية البسيطة.
  3. طبقة التجميع: تُعرف أيضًا باسم تقليل الدقة، وتقلل هذه الطبقة من أبعاد خرائط الميزات. تحتفظ تقنيات مثل التجميع الأقصى بأهم الميزات فقط (القيم الأعلى) في منطقة ما، مما يقلل من الحمل الحسابي ويساعد على منع التكيف المفرط.
  4. الطبقة المتصلة بالكامل: في المرحلة النهائية، يتم تسوية الميزات المعالجة وإدخالها في شبكة عصبية قياسية (NN). تستخدم هذه الطبقة الميزات عالية المستوى التي حددتها الطبقات السابقة لإجراء تصنيف أو تنبؤ نهائي، مثل "قطة" أو "كلب".

تطبيقات واقعية

لقد أحدثت شبكات CNN تحولاً في الصناعات من خلال أتمتة المهام البصرية بدقة فائقة .

  • التشخيص الطبي: في مجال الرعاية الصحية، تساعد الشبكات العصبية الاصطناعية أطباء الأشعة في تحديد الحالات الشاذة في الفحوصات الطبية بسرعة أكبر من العين البشرية. على سبيل المثال، تحلل نماذج التعلم العميق فحوصات التصوير بالرنين المغناطيسي والتصوير المقطعي المحوسب detect العلامات detect لسرطان الثدي أو الرئة. تسلط الأبحاث التي أجرتها المعاهد الوطنية للصحة (NIH) الضوء على كيفية تحسين هذه الأدوات لاتساق التشخيص وسرعته.
  • الأنظمة المستقلة: تعتمد السيارات ذاتية القيادة بشكل كبير على شبكات CNN لرؤية محيطها. تستخدم نماذج مثل YOLO26 شبكات CNN فعالة لأداء الكشف عن الأجسام في الوقت الفعلي، وتحديد المشاة وإشارات المرور والمركبات الأخرى لاتخاذ قرارات القيادة في أجزاء من الثانية.

CNNs مقابل محولات الرؤية (ViT)

في حين أن شبكات CNN كانت لفترة طويلة المعيار لمهام الرؤية، ظهرت بنية أحدث تسمى Vision Transformer (ViT).

  • تقوم شبكات CNN بمعالجة الصور باستخدام الميزات المحلية وتتميز بكفاءة عالية في مجموعات البيانات الصغيرة بسبب "التحيز الاستقرائي" (تفترض أن البكسلات القريبة مرتبطة ببعضها البعض).
  • تقوم ViTs بتقسيم الصور إلى رقع ومعالجتها باستخدام آليات الانتباه الذاتي الشامل. وهذا يسمح لها بالتقاط التبعيات بعيدة المدى عبر الصورة، ولكنها تتطلب عادةً مجموعات بيانات ضخمة وقدرة حاسوبية أكبر للتدريب بفعالية.

مثال على التنفيذ

تجعل المكتبات الحديثة من السهل استخدام النماذج القائمة على CNN. ultralytics توفر الحزمة إمكانية الوصول إلى أحدث النماذج مثل YOLO26، التي تتميز بهياكل CNN محسّنة للغاية من أجل الاستدلال السريع.

يوضح المثال التالي كيفية تحميل نموذج CNN مدرب مسبقًا وتشغيل تنبؤ:

from ultralytics import YOLO

# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")

# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the prediction results
results[0].show()

أدوات للتنمية

يتم دعم تطوير شبكات CNNs من خلال نظام بيئي قوي من الأدوات مفتوحة المصدر. عادةً ما يستخدم المهندسون أطر عمل مثل PyTorch أو TensorFlow لبناء بنى مخصصة. توفر هذه المكتبات tensor منخفضة المستوى اللازمة للتلافيف والانتشار العكسي.

بالنسبة للفرق التي تسعى إلى تبسيط دورة حياة مشاريع الرؤية الحاسوبية — من جمع البيانات إلى النشر — توفر Ultralytics حلاً شاملاً. فهي تبسط سير العمل المعقد، مما يسمح للمطورين بالتركيز على تطبيق شبكات CNN لحل مشكلات الأعمال بدلاً من إدارة البنية التحتية. بالإضافة إلى ذلك، يمكن تصدير النماذج إلى تنسيقات مثل ONNX أو TensorRT لنشر عالي الأداء على الأجهزة الطرفية .

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن