استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

شبكة U-Net

اكتشف U-Net، بنية الشبكة العصبية الالتفافية (CNN) القوية للتجزئة الدلالية. تعلم تطبيقاتها في التصوير الطبي والفضائي والمستقل.

U-Net عبارة عن هيكلية شبكة عصبية التفافية (CNN) مصممة لتقسيم الصور بسرعة ودقة. تم تطويره في الأصل لتقسيم الصور الطبية الحيوية، وقد جعلته بنيته المبتكرة على شكل حرف U نموذجًا تأسيسيًا في مجال رؤية الكمبيوتر (CV). تعتبر الهيكلية فعالة بشكل خاص لأنه يمكن تدريبها من طرف إلى طرف على عدد صغير نسبيًا من الصور ولا تزال تنتج أقنعة تقسيم دقيقة للغاية، مما يجعلها مثالية للمجالات التي تكون فيها البيانات نادرة. يمكنك معرفة المزيد حول مفاهيمها الأساسية في دليلنا حول هيكلية U-Net وتطبيقاتها.

آلية عمل U-Net

تستمد بنية U-Net اسمها من شكلها المميز الذي يشبه حرف U. وهي تتكون من مسارين رئيسيين: مسار تقلص (المشفر) لالتقاط السياق ومسار توسع متماثل (وحدة فك التشفير) التي تتيح تحديد الموقع بدقة. يسمح هذا التصميم بدمج المعلومات السياقية عالية المستوى بشكل فعال مع التفاصيل المكانية الدقيقة.

  • مسار الانكماش (المشفر): هذا شبكة عصبية التفافية نموذجية. يتكون من كتل متكررة من التفاف وعمليات التجميع. يقوم المشفر تدريجيًا بتقليل حجم الصورة، وتقليل أبعادها المكانية مع زيادة عدد قنوات الميزات. تتيح هذه العملية للشبكة تعلم الميزات الهرمية والتقاط السياق الأوسع للصورة.

  • مسار التوسع (وحدة فك التشفير): مهمة وحدة فك التشفير هي أخذ تمثيل الميزات المضغوط من المشفر وإعادة بناء خريطة تجزئة عالية الدقة. وهي تفعل ذلك من خلال سلسلة من "الالتواءات التصاعدية" (أو الالتواءات المنقولة) التي تزيد من الأبعاد المكانية مع تقليل قنوات الميزات.

  • اتصالات التخطي: الابتكار الأكثر أهمية في U-Net هو استخدام اتصالات التخطي. تربط هذه الاتصالات مباشرةً خرائط الميزات من المشفر بالطبقات المقابلة في وحدة فك التشفير. يتيح ذلك لوحدة فك التشفير إعادة استخدام الميزات عالية الدقة من طبقات المشفر المبكرة، مما يساعدها على استعادة التفاصيل الدقيقة التي غالبًا ما تضيع أثناء عملية تقليل العينات. هذا الاندماج بين الميزات الضحلة والعميقة هو المفتاح لقدرات تحديد الموقع الدقيقة لـ U-Net. تقدم ورقة U-Net الأصلية تفصيلاً فنيًا مفصلاً.

تطبيقات واقعية

أدت قدرة U-Net على إجراء تجزئة دقيقة ببيانات محدودة إلى اعتماده في العديد من المجالات بخلاف تركيزه الطبي الأصلي.

  • تحليل الصور الطبية: يستخدم U-Net على نطاق واسع لمهام مثل تقسيم الأورام في فحوصات الدماغ، وتحديد الخلايا في صور المجهر، وتحديد الأعضاء للتخطيط الجراحي. على سبيل المثال، في مجال الذكاء الاصطناعي في الرعاية الصحية، يمكن تدريب نموذج U-Net على مجموعة بيانات من فحوصات التصوير بالرنين المغناطيسي لتحديد أورام الدماغ تلقائيًا، مما يساعد أخصائيي الأشعة على إجراء تشخيصات أسرع وأكثر دقة. يمكنك استكشاف مجموعات بيانات التصوير الطبي العامة لرؤية نوع البيانات المستخدمة.

  • تحليل صور الأقمار الصناعية: في نظم المعلومات الجغرافية (GIS)، تُستخدم نماذج U-Net لتحليل صور الأقمار الصناعية. يمكن تدريب نموذج لتحديد وتقسيم أنواع مختلفة من الغطاء الأرضي (الغابات والمسطحات المائية والمناطق الحضرية) أو لرسم خرائط لشبكات الطرق من الصور الجوية. هذا أمر بالغ الأهمية للتخطيط الحضري والمراقبة البيئية والتطبيقات في الزراعة الذكية. تعتمد مشاريع مثل مبادرة NASA Earthdata على مثل هذه التقنيات.

مقارنة بين U-Net والنماذج الأخرى

على الرغم من قوته، من المهم التمييز بين U-Net ونماذج رؤية الكمبيوتر الأخرى.

  • U-Net مقابل YOLO للتجزئة: تقوم نماذج مثل Ultralytics YOLO أيضًا بتنفيذ تجزئة الصور. ومع ذلك، فإن البنى مثل YOLO11 مصممة في المقام الأول للأداء في الوقت الفعلي في مهام مثل اكتشاف الكائنات و تجزئة المثيلات. U-Net هي بنية كلاسيكية معروفة بدقتها العالية في التجزئة الدلالية، حيث يتم تصنيف كل بكسل، ولكنها قد لا تضاهي سرعة النماذج الحديثة والمحسّنة للغاية. يمكنك مقارنة أداء النماذج المختلفة لفهم هذه المفاضلات.

  • التقسيم الدلالي مقابل تقسيم المثيل: U-Net هو في الأساس نموذج تقسيم دلالي. يقوم بتعيين تسمية فئة لكل بكسل (على سبيل المثال، "سيارة"، "طريق"، "مبنى"). في المقابل، يميز تقسيم المثيل بين مثيلات مختلفة من نفس الفئة (على سبيل المثال، "سيارة 1"، "سيارة 2"). في حين أن بنية U-Net الأساسية مخصصة للتقسيم الدلالي، فقد تم تكييف مبادئها في نماذج أكثر تعقيدًا، مثل Mask R-CNN، لإجراء تقسيم المثيل.

تراث وتطور U-Net

لا يزال U-Net يمثل علامة فارقة مهمة في التعلم العميق. أظهر نجاحه أن البنى المعمارية المتطورة يمكن أن تحقق نتائج ممتازة حتى بدون مجموعات بيانات ضخمة. كان مفهوم الاتصالات المتخطية مؤثراً للغاية وهو الآن ميزة شائعة في العديد من البنى المعمارية للشبكات المتقدمة، بما في ذلك تلك التي تعتمد على المحولات.

في حين أن U-Net لا تزال أساسًا قويًا، إلا أن العديد من حلول التجزئة الحديثة تعتمد على أفكارها. بالنسبة للمطورين الذين يتطلعون إلى بناء تطبيقات الرؤية الخاصة بهم، توفر منصات مثل PyTorch و TensorFlow الأدوات اللازمة لتنفيذ U-Net والنماذج المماثلة. للحصول على تجربة متكاملة بدون تعليمات برمجية، يمكنك استخدام Ultralytics HUB لتدريب نماذج تجزئة مخصصة على البيانات الخاصة بك.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة