مسرد المصطلحات

يو-نت

اكتشف U-Net، بنية CNN القوية للتجزئة الدلالية. تعرّف على تطبيقاتها في التصوير الطبي والأقمار الصناعية والتصوير المستقل.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

الشبكة العصبية التلافيفية ( U-Net) هي بنية متخصصة للشبكة العصبية التلافيفية (CNN) تم تطويرها في الأصل لمهام تجزئة الصور الطبية الحيوية. ويتيح هيكلها المميز على شكل حرف U تحديد الموقع الدقيق للأشياء وتجزئتها داخل الصور، حتى مع وجود بيانات تدريب محدودة. قدمها أولاف رونيبرغر وفيليب فيشر وتوماس بروكس في ورقتهم البحثية لعام 2015"U-Net: الشبكات التلافيفية لتجزئة الصور الطبية الحيوية"، وسرعان ما أصبحت شبكة U-Net مؤثرة خارج نطاقها الأولي نظرًا لفعاليتها في تطبيقات الرؤية الحاسوبية المختلفة التي تتطلب تصنيفًا على مستوى البكسل.

البنية الأساسية

تتكون بنية شبكة U-Net من مسارين رئيسيين متصلين بطريقة تشبه حرف "U": مسار انكماش (يُعرف أيضًا باسم المشفر) ومسار توسعي (يُعرف أيضًا باسم مفكك التشفير).

  1. مسار التعاقد (أداة التشفير): يتبع هذا المسار البنية النموذجية لشبكة CNN. وهو يتألف من تطبيقات متكررة لالتفافين 3 × 3 (التلافيف غير المبطنة)، يتبع كل منها دالة تنشيط الوحدة الخطية المعدلة (ReLU) ، ثم عملية تجميع 2 × 2 كحد أقصى مع الخطوة 2 لتقليل العينات. في كل خطوة تصغير، يتم مضاعفة عدد القنوات المميزة. يلتقط هذا المسار سياق صورة الإدخال، مما يقلل تدريجيًا من الدقة المكانية مع زيادة معلومات الميزة.
  2. المسار التوسعي (فك التشفير): يتألف هذا المسار من خطوات متكررة لأخذ عينات متكررة من خريطة الميزة متبوعة بالتفاف 2x2 ("التحويل إلى الأعلى") الذي يقلل عدد قنوات الميزة إلى النصف، ثم التسلسل مع خريطة الميزة المقتطعة في المقابل من مسار الاقتصاص، ثم عمليتي التفاف 3x3، يتبع كل منهما إعادة ترميز. يعد الاقتصاص ضروريًا بسبب فقدان وحدات البكسل الحدودية في كل عملية التقاء. تستخدم الطبقة الأخيرة التلافيف 1 × 1 لتعيين كل متجه سمة إلى العدد المطلوب من الفئات. يتيح هذا المسار توطينًا دقيقًا من خلال زيادة دقة المخرجات تدريجيًا ودمجها مع ميزات عالية الدقة من مسار الاقتصاص عبر وصلات التخطي. تعتبر بنيات التشفير وفك التشفير مثل U-Net شائعة في مهام التجزئة.
  3. وصلات التخطي: الابتكار الرئيسي الذي يربط بين هذين المسارين هو استخدام وصلات التخطي. تقوم هذه الوصلات بنسخ خرائط الملامح من الطبقات في مسار التقلص وتسلسلها مع خرائط الملامح المقابلة ذات العينات الأعلى في المسار التوسعي. يسمح ذلك لوحدة فك التشفير بالوصول مباشرةً إلى الميزات عالية الدقة التي تعلمتها وحدة التشفير، وهو أمر بالغ الأهمية لإنتاج خرائط تجزئة بتفاصيل دقيقة.

الميزات والمزايا الرئيسية

يوفر تصميم U-Net العديد من المزايا، خاصة لمهام التجزئة:

  • توطين دقيق: يسمح المسار الموسع إلى جانب اتصالات التخطي للشبكة بإنشاء أقنعة التجزئة بتفاصيل دقيقة للغاية.
  • الكفاءة مع مجموعات البيانات الصغيرة: يمكن تدريب شبكة U-Net بشكل فعال حتى مع مجموعات بيانات التدريب الصغيرة نسبيًا، وهو أمر شائع في تحليل الصور الطبية. غالبًا ما يتم استخدام زيادة البيانات المكثفة إلى جانب شبكة U-Net لتعليم الشبكة الثوابت المطلوبة.
  • تدريب شامل: يمكن تدريب الشبكة بأكملها من صور المدخلات إلى خرائط تجزئة المخرجات مباشرة، مما يبسّط خط أنابيب التدريب.
  • التعميم الجيد: لقد أظهر أداءً قويًا ليس فقط في التصوير الطبي ولكن أيضًا في المجالات الأخرى التي تتطلب تجزئة دقيقة.

التطبيقات الواقعية

على الرغم من تصميمه في البداية للتصوير الطبي الحيوي، إلا أن بنية U-Net متعددة الاستخدامات وتم تكييفها للعديد من التطبيقات:

تمييز شبكة U-Net عن المفاهيم المماثلة

تركز U-Net في المقام الأول على التجزئة الدلالية، وتعيين تسمية فئة (على سبيل المثال، "ورم"، "طريق"، "مبنى") لكل بكسل في الصورة. وهذا يختلف عن:

التدريب والأدوات

يتطلّب تدريب شبكة U-Net بيانات مشروحة على مستوى البكسل، حيث يتم تصنيف كل بكسل في صور التدريب بفئته المقابلة. قد تتطلب عملية التعليق التوضيحي للبيانات هذه عمالة مكثفة، خاصةً بالنسبة للصور الطبية أو صور الأقمار الصناعية المعقدة. عادةً ما يتم تنفيذ نماذج شبكة U-Net وتدريبها باستخدام أطر التعلم العميق الشائعة مثل PyTorchPyTorch الموقع الرسمي لPyTorch ) و TensorFlowTensorFlow ). وغالباً ما تُستخدم مكتبات مثل OpenCV لتحميل الصور ومعالجتها مسبقاً. يمكن أن تساعد المنصات مثل Ultralytics HUB في إدارة مجموعات البيانات وتبسيط عملية تدريب النموذج، حتى بالنسبة لمهام التجزئة المعقدة. غالبًا ما يتضمن التدريب الفعال ضبطًا دقيقًا للمعامل الفائق واستكشاف خوارزميات التحسين المختلفة.

قراءة الكل