اكتشف U-Net، بنية CNN القوية للتجزئة الدلالية. تعرّف على تطبيقاتها في التصوير الطبي والأقمار الصناعية والتصوير المستقل.
الشبكة العصبية التلافيفية ( U-Net) هي بنية متخصصة للشبكة العصبية التلافيفية (CNN) تم تطويرها في الأصل لمهام تجزئة الصور الطبية الحيوية. ويتيح هيكلها المميز على شكل حرف U تحديد الموقع الدقيق للأشياء وتجزئتها داخل الصور، حتى مع وجود بيانات تدريب محدودة. قدمها أولاف رونيبرغر وفيليب فيشر وتوماس بروكس في ورقتهم البحثية لعام 2015"U-Net: الشبكات التلافيفية لتجزئة الصور الطبية الحيوية"، وسرعان ما أصبحت شبكة U-Net مؤثرة خارج نطاقها الأولي نظرًا لفعاليتها في تطبيقات الرؤية الحاسوبية المختلفة التي تتطلب تصنيفًا على مستوى البكسل.
تتكون بنية شبكة U-Net من مسارين رئيسيين متصلين بطريقة تشبه حرف "U": مسار انكماش (يُعرف أيضًا باسم المشفر) ومسار توسعي (يُعرف أيضًا باسم مفكك التشفير).
يوفر تصميم U-Net العديد من المزايا، خاصة لمهام التجزئة:
على الرغم من تصميمه في البداية للتصوير الطبي الحيوي، إلا أن بنية U-Net متعددة الاستخدامات وتم تكييفها للعديد من التطبيقات:
تركز U-Net في المقام الأول على التجزئة الدلالية، وتعيين تسمية فئة (على سبيل المثال، "ورم"، "طريق"، "مبنى") لكل بكسل في الصورة. وهذا يختلف عن:
يتطلّب تدريب شبكة U-Net بيانات مشروحة على مستوى البكسل، حيث يتم تصنيف كل بكسل في صور التدريب بفئته المقابلة. قد تتطلب عملية التعليق التوضيحي للبيانات هذه عمالة مكثفة، خاصةً بالنسبة للصور الطبية أو صور الأقمار الصناعية المعقدة. عادةً ما يتم تنفيذ نماذج شبكة U-Net وتدريبها باستخدام أطر التعلم العميق الشائعة مثل PyTorchPyTorch الموقع الرسمي لPyTorch ) و TensorFlowTensorFlow ). وغالباً ما تُستخدم مكتبات مثل OpenCV لتحميل الصور ومعالجتها مسبقاً. يمكن أن تساعد المنصات مثل Ultralytics HUB في إدارة مجموعات البيانات وتبسيط عملية تدريب النموذج، حتى بالنسبة لمهام التجزئة المعقدة. غالبًا ما يتضمن التدريب الفعال ضبطًا دقيقًا للمعامل الفائق واستكشاف خوارزميات التحسين المختلفة.