Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

المجال الاستقبالي

اكتشف كيف يحدد المجال الاستقبالي ما تراه الشبكة العصبية. تعرف على كيفية قيام Ultralytics بتحسين السياق المكاني detect من جميع الأحجام بفعالية.

في مجال الرؤية الحاسوبية (CV) والتعلم العميق ، يشير المجال الاستقبالي إلى المنطقة المحددة من صورة الإدخال التي "تراها" أو تحللها خلية عصبية معينة في شبكة عصبية (NN). من الناحية النظرية، يعمل بشكل مشابه لمجال رؤية العين البشرية أو عدسة الكاميرا. وهو يحدد مقدار السياق المكاني الذي يمكن للنموذج إدراكه في أي طبقة معينة. مع تقدم البيانات عبر شبكة عصبية تلافيفية (CNN)، يتوسع المجال الاستقبالي عادةً، مما يسمح للنظام بالانتقال من تحديد التفاصيل الصغيرة والمحلية — مثل الحواف أو الزوايا — إلى فهم الهياكل المعقدة والشاملة مثل الكائنات أو المشاهد بأكملها.

آليات الحقول الاستقبالية

يتم تحديد حجم وعمق المجال الاستقبالي من خلال بنية الشبكة. في الطبقات الأولية، عادةً ما يكون للخلايا العصبية مجال استقبال صغير، يركز على مجموعة صغيرة من وحدات البكسل لالتقاط نسيج دقيق. مع تعمق الشبكة، تعمل عمليات مثل طبقات التجميع و التلافيف المتدرجة على تقليل دقة خرائط الميزات بشكل فعال. تسمح هذه العملية للخلايا العصبية اللاحقة بتجميع المعلومات من جزء أكبر بكثير من المدخلات الأصلية.

تم تصميم البنى الحديثة، بما في ذلك أحدث Ultralytics ، لتحقيق التوازن بين هذه المجالات بدقة. إذا كان المجال الاستقبالي ضيقًا جدًا، فقد يفشل النموذج في التعرف على الكائنات الكبيرة لأنه لا يمكنه إدراك الشكل بالكامل. وعلى العكس، إذا كان المجال واسعًا للغاية دون الحفاظ على الدقة، فقد يفوت النموذج الأجسام الصغيرة. لمعالجة هذه المشكلة، غالبًا ما يستخدم المهندسون التلافيف الموسعة (المعروفة أيضًا باسم التلافيف الأتروس) لتوسيع المجال الاستقبالي دون تقليل الدقة المكانية، وهي تقنية حيوية للمهام عالية الدقة مثل التقسيم الدلالي.

تطبيقات واقعية

يعد تحسين المجال الاستقبالي أمرًا بالغ الأهمية لنجاح مختلف حلول الذكاء الاصطناعي.

  • القيادة الذاتية: في الذكاء الاصطناعي للسيارات، track أنظمة الإدراك التفاصيل track والعوائق الكبيرة في آن واحد. تحتاج السيارة إلى مجال استقبال صغير للتعرف على إشارات المرور البعيدة، بينما تحتاج في الوقت نفسه إلى مجال استقبال كبير لفهم مسار شاحنة قريبة أو انحناء حارة الطريق. يضمن هذا الإدراك متعدد المستويات أمانًا أفضل للذكاء الاصطناعي واتخاذ قرارات أفضل.
  • التشخيص الطبي: عند تطبيق الذكاء الاصطناعي في الرعاية الصحية، يعتمد أخصائيو الأشعة على النماذج للكشف عن الحالات الشاذة في الفحوصات. ولتحديد أورام الدماغ، تحتاج الشبكة إلى مجال استقبالي كبير لفهم التناسق والبنية العامة للدماغ. ومع ذلك، detect في التصوير الشعاعي للثدي، يعتمد النموذج على الطبقات المبكرة ذات المجالات الاستقبالية الصغيرة الحساسة للتغيرات الطفيفة في النسيج.

التمييز بين المفاهيم ذات الصلة

لفهم تصميم الشبكة بشكل كامل، من المفيد التمييز بين المجال الاستقبالي والمصطلحات المماثلة:

  • المجال الاستقبالي مقابل النواة: يحدد حجم النواة (أو المرشح) أبعاد النافذة المنزلقة (على سبيل المثال، 3x3) لعملية تلافيف واحدة. المجال الاستقبالي هو خاصية ناشئة تمثل إجمالي مساحة الإدخال المتراكمة التي تؤثر على الخلية العصبية. ستؤدي مجموعة من نوى 3x3 متعددة إلى مجال استقبالي أكبر بكثير من 3x3.
  • الحقل الاستقبالي مقابل خريطة الميزات: خريطة الميزات هي حجم الإخراج الذي تنتجه الطبقة، وتحتوي على التمثيلات المكتسبة. يصف الحقل الاستقبالي العلاقة بين نقطة واحدة على خريطة الميزات تلك والصورة المدخلة الأصلية.
  • المجال الاستقبالي مقابل نافذة السياق: بينما يشير كلا المصطلحين إلى نطاق البيانات المدركة، فإن "نافذة السياق" تستخدم عادةً في معالجة اللغة الطبيعية (NLP) أو تحليل الفيديو للإشارة إلى فترة زمنية أو متسلسلة (على سبيل المثال، حد الرموز). يشير المجال الاستقبالي بشكل صارم إلى المساحة المكانية في البيانات الشبكية (الصور).

الاستخدام العملي في الكود

تستخدم النماذج الحديثة مثل YOLO26 الأحدث شبكات هرم الميزات (FPN) للحفاظ على مجالات استقبال فعالة للكائنات من جميع الأحجام. يوضح المثال التالي كيفية تحميل نموذج وإجراء الكشف عن الكائنات، بالاستفادة من هذه التحسينات الداخلية للبنية تلقائيًا. يمكن للمستخدمين الذين يرغبون في تدريب نماذجهم الخاصة باستخدام بنى محسّنة استخدام Ultralytics لإدارة مجموعات البيانات بسلاسة و التدريب السحابي.

from ultralytics import YOLO

# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")

# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results, detecting both large (bus) and small (person) objects
results[0].show()

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن