مسرد المصطلحات

يو-نت

اكتشف U-Net، بنية CNN القوية للتجزئة الدلالية. تعرّف على تطبيقاتها في التصوير الطبي والأقمار الصناعية والتصوير المستقل.

الشبكة العصبية التلافيفية ( U-Net) هي بنية متخصصة للشبكة العصبية التلافيفية (CNN) تم تطويرها في الأصل لمهام تجزئة الصور الطبية الحيوية. ويتيح هيكلها المميز على شكل حرف U تحديد الموقع الدقيق للأشياء وتجزئتها داخل الصور، حتى مع وجود بيانات تدريب محدودة. قدمها أولاف رونيبرغر وفيليب فيشر وتوماس بروكس في ورقتهم البحثية لعام 2015"U-Net: الشبكات التلافيفية لتجزئة الصور الطبية الحيوية"، وسرعان ما أصبحت شبكة U-Net مؤثرة خارج نطاقها الأولي نظرًا لفعاليتها في تطبيقات الرؤية الحاسوبية المختلفة التي تتطلب تصنيفًا على مستوى البكسل.

البنية الأساسية

تتكون بنية شبكة U-Net من مسارين رئيسيين متصلين بطريقة تشبه حرف "U": مسار انكماش (يُعرف أيضًا باسم المشفر) ومسار توسعي (يُعرف أيضًا باسم مفكك التشفير).

مسار التعاقد (أداة التشفير): يتبع هذا المسار البنية النموذجية لشبكة CNN. وهو يتألف من تطبيقات متكررة لالتفافين 3 × 3 (التلافيف غير المبطنة)، يتبع كل منها دالة تنشيط الوحدة الخطية المعدلة (ReLU) ، ثم عملية تجميع 2 × 2 كحد أقصى مع الخطوة 2 لتقليل العينات. في كل خطوة تصغير، يتم مضاعفة عدد القنوات المميزة. يلتقط هذا المسار سياق صورة الإدخال، مما يقلل تدريجيًا من الدقة المكانية مع زيادة معلومات الميزة.
المسار التوسعي (فك التشفير): يتألف هذا المسار من خطوات متكررة لأخذ عينات متكررة من خريطة الميزة متبوعة بالتفاف 2x2 ("التحويل إلى الأعلى") الذي يقلل عدد قنوات الميزة إلى النصف، ثم التسلسل مع خريطة الميزة المقتطعة في المقابل من مسار الاقتصاص، ثم عمليتي التفاف 3x3، يتبع كل منهما إعادة ترميز. يعد الاقتصاص ضروريًا بسبب فقدان وحدات البكسل الحدودية في كل عملية التقاء. تستخدم الطبقة الأخيرة التلافيف 1 × 1 لتعيين كل متجه سمة إلى العدد المطلوب من الفئات. يتيح هذا المسار توطينًا دقيقًا من خلال زيادة دقة المخرجات تدريجيًا ودمجها مع ميزات عالية الدقة من مسار الاقتصاص عبر وصلات التخطي. تعتبر بنيات التشفير وفك التشفير مثل U-Net شائعة في مهام التجزئة.
وصلات التخطي: الابتكار الرئيسي الذي يربط بين هذين المسارين هو استخدام وصلات التخطي. تقوم هذه الوصلات بنسخ خرائط الملامح من الطبقات في مسار التقلص وتسلسلها مع خرائط الملامح المقابلة ذات العينات الأعلى في المسار التوسعي. يسمح ذلك لوحدة فك التشفير بالوصول مباشرةً إلى الميزات عالية الدقة التي تعلمتها وحدة التشفير، وهو أمر بالغ الأهمية لإنتاج خرائط تجزئة بتفاصيل دقيقة.

الميزات والمزايا الرئيسية

يوفر تصميم U-Net العديد من المزايا، خاصة لمهام التجزئة:

توطين دقيق: يسمح المسار الموسع إلى جانب اتصالات التخطي للشبكة بإنشاء أقنعة التجزئة بتفاصيل دقيقة للغاية.
الكفاءة مع مجموعات البيانات الصغيرة: يمكن تدريب شبكة U-Net بشكل فعال حتى مع مجموعات بيانات التدريب الصغيرة نسبيًا، وهو أمر شائع في تحليل الصور الطبية. غالبًا ما يتم استخدام زيادة البيانات المكثفة إلى جانب شبكة U-Net لتعليم الشبكة الثوابت المطلوبة.
تدريب شامل: يمكن تدريب الشبكة بأكملها من صور المدخلات إلى خرائط تجزئة المخرجات مباشرة، مما يبسّط خط أنابيب التدريب.
التعميم الجيد: لقد أظهر أداءً قويًا ليس فقط في التصوير الطبي ولكن أيضًا في المجالات الأخرى التي تتطلب تجزئة دقيقة.

التطبيقات الواقعية

على الرغم من تصميمه في البداية للتصوير الطبي الحيوي، إلا أن بنية U-Net متعددة الاستخدامات وتم تكييفها للعديد من التطبيقات:

تحليل الصور الطبية: يظل تطبيقه الأساسي في تجزئة الصور الطبية مثل فحوصات التصوير بالرنين المغناطيسي(مثال مجموعة بيانات أورام الدماغ)، والأشعة المقطعية، وصور الفحص المجهري لمهام مثل الكشف عن الأورامUltralytics مدونةUltralytics حول الكشف عن الأورام)، وتجزئة الأعضاء، وعد الخلايا. اقرأ المزيد في مراجعات تجزئة الصور الطبية الحيوية. يساعد في أتمتة التحليل المتوافق مع معايير مثل DICOM.
تحليل صور الأقمار الصناعية: يُستخدم U-Net لتصنيف الغطاء الأرضي، واستخراج شبكة الطرق، وتجزئة بصمة المبنى، ورصد التغيرات البيئية من صور الأقمار الصناعية أو الصور الجوية. استكشاف تطبيقات الاستشعار عن بُعد المختلفة.
القيادة الذاتية: تقسيم حارات الطريق والمشاة والمركبات الأخرى لفهم المشهد.
مراقبة الجودة الصناعية: الكشف عن العيوب أو تجزئة المكونات في عمليات التصنيع(الذكاء الاصطناعي في التصنيع).
الزراعة: تقسيم المحاصيل أو الأعشاب الضارة أو تقييم صحة النبات من صور الطائرات بدون طيار(الذكاء الاصطناعي في الزراعة).

تمييز شبكة U-Net عن المفاهيم المماثلة

تركز U-Net في المقام الأول على التجزئة الدلالية، وتعيين تسمية فئة (على سبيل المثال، "ورم"، "طريق"، "مبنى") لكل بكسل في الصورة. وهذا يختلف عن:

تجزئة المثيل: لا تقوم هذه المهمة بتصنيف وحدات البكسل فحسب، بل تميز أيضًا بين الحالات الفردية للأشياء التي تنتمي إلى نفس الفئة (على سبيل المثال، تصنيف السيارة_1، السيارة_2، السيارة_3 بشكل مميز). في حين يمكن تكييف شبكة U-Net لتجزئة النماذج، غالبًا ما تكون النماذج مثل Mask R-CNN أكثر ملاءمة بشكل مباشر لهذا الغرض.
اكتشاف الأجسام: يتضمن ذلك تحديد الكائنات ورسم مربعات محددة حولها، بدلاً من تصنيف كل بكسل. نماذج مثل Ultralytics YOLO هي الأحدث في اكتشاف الأجسام، وهي معروفة بسرعتها ودقتها.
نماذج التجزئة الحديثة: بينما لا تزال شبكة U-Net مؤثرة، إلا أن البنى الأحدث، بما في ذلك نماذج التجزئة المختلفة لنماذج مثل Ultralytics YOLOv8 و YOLO11توفر إمكانات تجزئة قوية، وغالبًا ما يتم تحسينها للاستدلال في الوقت الحقيقي بشكل أسرع والاستفادة من التطورات في التعلم العميق مثل كتل المحولات أو التصاميم الخالية من الارتكاز.

التدريب والأدوات

يتطلّب تدريب شبكة U-Net بيانات مشروحة على مستوى البكسل، حيث يتم تصنيف كل بكسل في صور التدريب بفئته المقابلة. قد تتطلب عملية التعليق التوضيحي للبيانات هذه عمالة مكثفة، خاصةً بالنسبة للصور الطبية أو صور الأقمار الصناعية المعقدة. عادةً ما يتم تنفيذ نماذج شبكة U-Net وتدريبها باستخدام أطر التعلم العميق الشائعة مثل PyTorch PyTorch الموقع الرسمي لPyTorch ) و TensorFlow TensorFlow ). وغالباً ما تُستخدم مكتبات مثل OpenCV لتحميل الصور ومعالجتها مسبقاً. يمكن أن تساعد المنصات مثل Ultralytics HUB في إدارة مجموعات البيانات وتبسيط عملية تدريب النموذج، حتى بالنسبة لمهام التجزئة المعقدة. غالبًا ما يتضمن التدريب الفعال ضبطًا دقيقًا للمعامل الفائق واستكشاف خوارزميات التحسين المختلفة.

يو-نت

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

حل الترخيص المرن للمؤسسات لتعزيز ابتكاراتك

تدريب نماذج الذكاء الاصطناعي في ثوانٍ باستخدام Ultralytics YOLO

تدريب النماذج YOLO ببساطة باستخدام Ultralytics HUB

البنية الأساسية

الميزات والمزايا الرئيسية

التطبيقات الواقعية

تمييز شبكة U-Net عن المفاهيم المماثلة

التدريب والأدوات

قراءة المزيد من المدونات

انضم إلى مجتمع Ultralytics

يو-نت

تدريب YOLO النماذجببساطة مع Ultralytics HUB

حل الترخيص المرن للمؤسسات لتعزيز ابتكاراتك

تدريب نماذج الذكاء الاصطناعي في ثوانٍ باستخدام Ultralytics YOLO

تدريب النماذج YOLO ببساطة باستخدام Ultralytics HUB

البنية الأساسية

الميزات والمزايا الرئيسية

التطبيقات الواقعية

تمييز شبكة U-Net عن المفاهيم المماثلة

التدريب والأدوات

قراءة المزيد من المدونات

انضم إلى مجتمع Ultralytics

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB