اكتشف U-Net، بنية الشبكة العصبية الالتفافية (CNN) القوية للتجزئة الدلالية. تعلم تطبيقاتها في التصوير الطبي والفضائي والمستقل.
U-Net هي بنية متخصصة لـ الشبكات العصبية التلافيفية (CNNs) مصممة لإجراء تصنيف دقيق على مستوى البكسل يُعرف باسم التجزئة الدلالية. على عكس نماذج التصنيف التقليدية التي تعيّن تصنيفاً واحداً للصورة بأكملها، تتنبأ شبكة U-Net بفئة لكل بكسل، مما يؤدي إلى إنشاء خريطة مفصّلة تحدد الشكل والموقع الدقيق للأجسام. تم تطويره في الأصل من أجل في الأصل لتحليل الصور الطبية الحيوية، وقد أصبحت بنية أساسية في مجال الرؤية الحاسوبية (CV) بسبب قدرتها على العمل بفعالية مع بيانات التدريب المحدودة مع الحصول على نتائج عالية الدقة.
يُشتق اسم "U-Net" من الرسم البياني المتماثل على شكل حرف U، والذي يعدل القياسي القياسي. تتألف البنية من ثلاثة أقسام رئيسية تتعاون معًا لاستخراج الميزات وإعادة بناء الصورة باستخدام أقنعة تجزئة مفصلة.
تم تقديم شبكة U-Net في الورقة البحثية الأساسية "U-Net: الشبكات التلافيفية لتقسيم الصور الطبية الحيوية" وقد تم تكييفها منذ ذلك الحين للعديد من الصناعات التي تتطلب دقة دقيقة.
في مجال الرعاية الصحية، الدقة أمر بالغ الأهمية. تُستخدم شبكة U-Net على نطاق واسع في تحليل الصور الطبية في أتمتة اكتشاف التشوهات. على سبيل المثال، يساعد سير عمل أخصائي الأشعة عن طريق تقسيم الأورام في التصوير بالرنين المغناطيسي أو عد الخلايا المنفردة في صور الفحص المجهري، مما يؤدي إلى تحقيق تقدم في الذكاء الاصطناعي في مجال الرعاية الصحية.
الهندسة المعمارية حيوية أيضًا لـ تحليل صور الأقمار الصناعية. يمكن لنماذج U-Net segment أنواع الغطاء الأرضي - التمييز بين المياه والغابات والمناطق الحضرية - track إزالة الغابات أو مراقبة صحة المحاصيل من أجل الزراعة الذكية.
يتطلب فهم شبكة U-Net تمييزها عن مهام الرؤية الأخرى:
في حين أن تنفيذ شبكة U-Net الخام غالبًا ما ينطوي على كتابة كود مطول في أطر مثل PyTorch أو TensorFlowوالمكتبات الحديثة لتبسيط هذه العملية. يوفر نظام Ultralytics البيئي نماذج تجزئة محسنة تستفيد من مبادئ معمارية مماثلة للأداء في الوقت الحقيقي.
يوضِّح المثال التالي كيفية استخدام نموذج تجزئةYOLO11 لتوليد أقنعة على مستوى البكسل:
from ultralytics import YOLO
# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image to detect and segment objects
results = model("path/to/image.jpg")
# Display the results with segmentation masks overlaid
results[0].show()
يتيح سير العمل المبسط هذا للمطورين دمج إمكانات التجزئة المعقدة في التطبيقات من أجل نشر النماذج على الأجهزة المتطورة. عند تدريب هذه النماذج على مجموعات بيانات مخصصة، فإن استخدام زيادة البيانات يوصى بشدة يوصى بشدة لمنع الإفراط في التركيبوهو تحدٍ شائع عند العمل مع شروح دقيقة على مستوى البكسل.