مسرد المصطلحات

التقسيم الدلالي

اكتشف قوة التجزئة الدلالية - قم بتصنيف كل بكسل في الصور لفهم المشهد بدقة. استكشف التطبيقات والأدوات الآن!

التجزئة الدلالية هي مهمة أساسية في مجال الرؤية الحاسوبية (CV) تتضمن تعيين تسمية فئة محددة لكل بكسل واحد داخل الصورة. وخلافاً لمهام الرؤية الأخرى التي قد تحدد الأجسام أو تصنف الصورة بأكملها، فإن التجزئة الدلالية توفر فهماً كثيفاً على مستوى البكسل لمحتوى المشهد. وهذا يعني أنه لا يكتشف وجود سيارة فحسب، بل يحدد بدقة وحدات البكسل التي تنتمي إلى فئة السيارة، ويميزها عن وحدات البكسل التي تنتمي إلى الطريق أو السماء أو المشاة. ويهدف إلى تقسيم الصورة إلى مناطق ذات مغزى تتوافق مع فئات الكائنات المختلفة، مما يوفر فهماً شاملاً للبيئة المرئية.

كيفية عمل التقسيم الدلالي

الهدف الأساسي للتقسيم الدلالي هو تصنيف كل بكسل في الصورة إلى مجموعة محددة مسبقًا من الفئات. على سبيل المثال، في صورة تحتوي على العديد من السيارات والمشاة والأشجار، يقوم نموذج التجزئة الدلالية بتصنيف جميع وحدات البكسل التي تشكل أي سيارة على أنها "سيارة"، وجميع وحدات البكسل لأي مشاة على أنها "مشاة"، وجميع وحدات البكسل لأي شجرة على أنها "شجرة". يعامل جميع مثيلات نفس فئة الكائن بشكل متطابق.

يعتمد التجزئة الدلالية الحديثة اعتمادًا كبيرًا على التعلّم العميق، وخاصةً الشبكات العصبية التلافيفية (CNNs). وعادةً ما يتم تدريب هذه النماذج باستخدام تقنيات التعلّم تحت الإشراف، مما يتطلب مجموعات بيانات كبيرة مع شروح مفصلة على مستوى البكسل. تتضمن العملية إدخال صورة في الشبكة، والتي تقوم بعد ذلك بإخراج خريطة تجزئة. هذه الخريطة هي في الأساس صورة حيث تتوافق قيمة كل بكسل (غالبًا ما يتم تمثيلها بالألوان) مع تصنيف فئتها المتوقعة، مما يفصل بصريًا بين الفئات المختلفة مثل "طريق" أو "مبنى" أو "شخص" وما إلى ذلك. تُعد جودة تصنيف البيانات أمرًا بالغ الأهمية لتدريب نماذج دقيقة.

الاختلافات الرئيسية عن مهام التقسيم الأخرى

من المهم التمييز بين التجزئة الدلالية ومهام الرؤية الحاسوبية ذات الصلة:

تصنيف الصور: يعين تسمية واحدة للصورة بأكملها (على سبيل المثال، "تحتوي هذه الصورة على قطة"). لا يقوم بتحديد موقع الكائنات أو تحديدها.
اكتشاف الأجسام: يحدد الأجسام ويحدد موقعها باستخدام المربعات المحدودة. يخبرك بمكان الأجسام ولكنه لا يوفر شكلها الدقيق على مستوى البكسل.
تجزئة المثيل: يخطو خطوة أبعد من التجزئة الدلالية من خلال عدم الاكتفاء بتصنيف كل بكسل فحسب، بل أيضًا التمييز بين المثيلات المختلفة لفئة الكائن نفسها. على سبيل المثال، يقوم بتعيين معرف وقناع فريد لكل سيارة على حدة في المشهد. راجع هذا الدليل الذي يقارن بين التجزئة المثالية والدلالية لمزيد من التفاصيل.
التجزئة الشاملة: يجمع بين التجزئة الدلالية وتجزئة المثيلات، حيث يوفر كلاً من تسمية فئة لكل بكسل ومعرفات مثيلات فريدة للأشياء التي يمكن عدها ("الأشياء") مع تجميع مناطق الخلفية غير القابلة للعد ("الأشياء") مثل السماء أو الطريق.

التطبيقات الواقعية

يعد الفهم التفصيلي للمشهد الذي يوفره التجزئة الدلالية أمرًا بالغ الأهمية للعديد من التطبيقات الواقعية:

القيادة الذاتية: تستخدم السيارات ذاتية القيادة التجزئة الدلالية لفهم محيطها بدقة. من خلال تصنيف وحدات البكسل التي تنتمي إلى الطرق والممرات والأرصفة والمشاة والمركبات الأخرى والعوائق، يمكن لنظام القيادة الذاتية اتخاذ قرارات ملاحة أكثر أماناً. وهذا عنصر أساسي في الذكاء الاصطناعي لحلول السيارات.
تحليل الصور الطبية: في مجال الرعاية الصحية، يساعد التجزئة الدلالية في تحليل الفحوصات الطبية مثل التصوير بالرنين المغناطيسي أو التصوير المقطعي المحوسب. ويمكنه تحديد الأعضاء تلقائيًا، وتحديد الأورام أو الآفات وقياسها، وإبراز التشوهات بدقة على مستوى البكسل. على سبيل المثال، يمكن استخدام نماذجUltralytics YOLO للكشف عن الأورام، ومساعدة أخصائيي الأشعة في التشخيص وتخطيط العلاج بناءً على تقنيات التصوير الطبي المفصلة.
تحليل صور الأقمار الصناعية: يستخدم لتصنيف الغطاء الأرضي ورصد إزالة الغابات والتخطيط الحضري والتطبيقات الزراعية. ويمكنه التفريق بين الغابات والمسطحات المائية والحقول والمناطق المبنية من صور الأقمار الصناعية، كما هو موضح في أمثلة من مرصد الأرض التابع لوكالة ناسا. استكشف المزيد حول استخدام الرؤية الحاسوبية لتحليل صور الأقمار الصناعية.
الروبوتات: تمكين الروبوتات من إدراك بيئتها والتفاعل معها بشكل أكثر فعالية من خلال فهم التخطيط والأشياء داخل المشهد. تعرف على كيفية دمج الرؤية الحاسوبية في الروبوتات.

النماذج والأدوات

وغالباً ما يستخدم التجزئة الدلالية نماذج التعلّم العميق، وخاصةً البنى المستمدة من شبكات سي إن إن.

البنى: تشمل البنى المبكرة الشائعة الشبكات التلافيفية بالكامل (FCN)، والتي استبدلت الطبقات المتصلة بالكامل في شبكات التصنيف بطبقات تلافيفية لإخراج الخرائط المكانية، وشبكة U-Net، التي تستخدم بنية مشفر-مفك تشفير مع وصلات تخطي، وهي فعالة بشكل خاص في تجزئة الصور الطبية الحيوية.
النماذج الحديثة: النماذج الحديثة مثل Ultralytics YOLOv8 وأحدث YOLO11 توفر أيضًا قدرات قوية لمختلف مهام التجزئة، وتوازن بين السرعة والدقة.
منصات التدريب: تقدم أدوات مثل Ultralytics HUB منصات لإدارة مجموعات البيانات مثل مجموعة بيانات COCO Segmentation Segmentation المستخدمة على نطاق واسع، وتدريب النماذج المخصصة، واستكشاف خيارات نشر النماذج.
أطر العمل: غالبًا ما يستخدم التطوير أطر عمل مثل PyTorch و TensorFlow. تُستخدم تقنيات مثل زيادة البيانات بشكل شائع لتحسين متانة النموذج.

التقسيم الدلالي

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

حل الترخيص المرن للمؤسسات لتعزيز ابتكاراتك

تدريب نماذج الذكاء الاصطناعي في ثوانٍ باستخدام Ultralytics YOLO

تدريب النماذج YOLO ببساطة باستخدام Ultralytics HUB

كيفية عمل التقسيم الدلالي

الاختلافات الرئيسية عن مهام التقسيم الأخرى

التطبيقات الواقعية

النماذج والأدوات

قراءة المزيد من المدونات

انضم إلى مجتمع Ultralytics

التقسيم الدلالي

تدريب YOLO النماذجببساطة مع Ultralytics HUB

حل الترخيص المرن للمؤسسات لتعزيز ابتكاراتك

تدريب نماذج الذكاء الاصطناعي في ثوانٍ باستخدام Ultralytics YOLO

تدريب النماذج YOLO ببساطة باستخدام Ultralytics HUB

كيفية عمل التقسيم الدلالي

الاختلافات الرئيسية عن مهام التقسيم الأخرى

التطبيقات الواقعية

النماذج والأدوات

قراءة المزيد من المدونات

انضم إلى مجتمع Ultralytics

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB