يولو فيجن شنتشن
شنتشن
انضم الآن

ما هو تقسيم الحالات (Instance Segmentation)؟ دليل سريع

أبيرامي فينا

6 دقائق قراءة

6 مارس، 2025

انضموا إلينا في نظرة فاحصة على ماهية تجزئة المثيلات، وكيفية عملها، واستخدامها في تطبيقات رؤية الكمبيوتر المختلفة، والتأثير الذي يمكن أن تحدثه.

أصبحت تطبيقات رؤية الحاسوب أكثر شيوعًا في حياتنا اليومية، بدءًا من كاميرات المرور التي تراقب أحوال الطريق وحتى أنظمة الدفع الذاتي في المتاجر. من خلال تمكين الآلات من فهم البيانات المرئية بطريقة مشابهة للبشر، تُحدث رؤية الذكاء الاصطناعي تأثيرًا في مجموعة من الصناعات.

تعتمد العديد من هذه التطبيقات على اكتشاف الكائنات، وهي مهمة رؤية حاسوبية تضع مربعات إحاطة حول الكائنات الرئيسية في الصور. في حين أن هذا النهج غالبًا ما يعمل بشكل جيد، إلا أن بعض حلول تحليل الصور تحتاج إلى دقة أكبر.

على سبيل المثال، يتطلب التصوير الطبي أكثر من مجرد اكتشاف ورم - من الضروري تحديد شكله الدقيق. وبالمثل، في مجال الروبوتات، تحتاج الآلات إلى التعرف على الخطوط الدقيقة للكائن لفهمه بشكل صحيح. ولمعالجة هذه التحديات، يقدم تجزئة المثيل حلاً أكثر دقة.

تجزئة المثيل هي مهمة رؤية حاسوبية مصممة لدعم حالات الاستخدام التي لا يكون فيها اكتشاف الكائنات كافيًا - فهي توفر دقة على مستوى البكسل. يمكن استخدام نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 لتطبيق تجزئة المثيل على الصور ومقاطع الفيديو بسهولة. 

__wf_reserved_inherit
الشكل 1. مثال على استخدام YOLO11 لتقسيم الحالات.

في هذا الدليل، سنشرح كيفية عمل تجزئة المثيلات (instance segmentation)، وتطبيقاتها، وكيف يمكن تدريب Ultralytics YOLO11 بشكل مخصص لمهام تجزئة معينة.

ما هو تقسيم الحالات (Instance Segmentation)؟

لنفترض أن هناك صورة جماعية لأشخاص يقفون بالقرب من بعضهم البعض. يمكن أن يساعد اكتشاف الكائنات في رسم مربعات حول كل شخص، لكن هذا لا يخبرك بالشكل الدقيق لكل منهم. 

تجزئة المثيلات، من ناحية أخرى، تشبه التتبع الدقيق حول كل شخص حتى تتمكن من رؤية مخططهم الكامل، حتى لو كانوا متداخلين. بدلاً من مجرد تحديد مكان وجود شيء ما بمربع، فإنه يحدد الشكل الدقيق لكل كائن على مستوى البكسل، مما يسهل فهم الصور المعقدة.

والنتيجة هي قناع مفصل يملأ شكل الكائن، ويحدد بدقة وحدات البكسل التي تنتمي إليه. هذا المستوى من الدقة مفيد في العديد من التطبيقات الواقعية حيث يكون فهم الشكل والحدود الدقيقة للكائنات أمرًا مهمًا.

__wf_reserved_inherit
الشكل 2. عرض دعم YOLO11 لتقسيم الحالات.

تجزئة المثيل مقابل التجزئة الدلالية

أثناء استكشاف تجزئة المثيلات، قد تصادف مفهوم التجزئة الدلالية.

تساعد كلتا التقنيتين أجهزة الكمبيوتر على فهم الصور على مستوى البكسل، لكنهما تخدمان أغراضًا مختلفة. يقوم تجزئة المعنى بتسمية كل بكسل بناءً على فئته، وتجميع جميع الكائنات من نفس النوع معًا. على سبيل المثال، في صورة بها سيارات متعددة، سيقوم تجزئة المعنى بتمييزها جميعًا على أنها "سيارة" دون تمييز بين المركبات الفردية.

من ناحية أخرى، يأخذها تجزئة المثيل خطوة إلى الأمام من خلال تحديد كل كائن على حدة. يقوم بتعيين تسميات فريدة للمثيلات الفردية وإنشاء أقنعة دقيقة حول أشكالها. لذلك في نفس الصورة، لن يصنف تجزئة المثيل كل شيء على أنه "سيارة" فحسب، بل سيتعرف على كل سيارة ويحددها بشكل فردي.

الفرق الرئيسي بين الاثنين هو أن التقسيم الدلالي يجمع الكائنات حسب الفئة، بينما يميز تقسيم المثيل كل كائن ككيان فريد بحدود واضحة. يعتمد اختيار المهمة التي سيتم استخدامها على التطبيق المحدد - سواء كان يكفي معرفة ما هو موجود في الصورة أو إذا كان من المهم التمييز بين الكائنات الفردية.

__wf_reserved_inherit
الشكل 3. تجزئة المثيلات مقابل التجزئة الدلالية (على اليمين واليسار على التوالي).

نماذج تجزئة المثيلات الشائعة

تتوفر العديد من نماذج تجزئة المثيلات لمجتمع Vision AI في الوقت الحاضر. بعضها أسرع، وبعضها أكثر دقة، وبعضها أسهل في الاستخدام. 

على الرغم من فائدة هذه الخيارات، إلا أنها قد تثير تساؤلاً: أيها هو الخيار الصحيح للاستخدام في مهمة معينة؟ من بين الخيارات المتاحة، تحظى نماذج Ultralytics YOLO بشعبية كبيرة لأنها تركز على السرعة والدقة. 

أيضًا، تطورت هذه النماذج بشكل كبير على مر السنين. على سبيل المثال، قامت Ultralytics YOLOv5 بتبسيط النشر باستخدام أطر عمل مثل PyTorch، مما جعل Vision AI المتقدم في متناول جمهور أوسع دون الحاجة إلى خبرة فنية عميقة.

بالاعتماد على هذا النجاح، قدمت Ultralytics YOLOv8 دعمًا محسنًا لمهام الرؤية الحاسوبية مثل تجزئة المثيلات وتقدير الوضع وتصنيف الصور. 

الآن، ينقل YOLO11 الأداء إلى مستوى جديد. فهو يحقق متوسط دقة أعلى (mAP) على مجموعة بيانات COCO مع عدد أقل من المعلمات بنسبة 22٪ من YOLOv8m، مما يعني أنه يمكنه التعرف على الكائنات بدقة أكبر مع استخدام موارد أقل.

__wf_reserved_inherit
الشكل 4. قياس أداء YOLO11.

ببساطة، يقدم YOLO11 دقة متطورة دون المساومة على الكفاءة، مما يجعله يغير قواعد اللعبة في هذا المجال.

فهم كيفية عمل تجزئة المثيل

بعد ذلك، دعنا نستكشف كيف يعمل تجزئة المثيلات عادةً. تستخدم نماذج رؤية الكمبيوتر الأقدم نهجًا من خطوتين. 

أولاً، يكتشفون الكائنات عن طريق رسم مربعات إحاطة حولها. ثم، يقومون بإنشاء قناع على مستوى البكسل لتحديد الشكل الدقيق لكل كائن. مثال معروف هو Mask R-CNN، الذي يعتمد على نماذج اكتشاف الكائنات عن طريق إضافة خطوة تنبؤ بالقناع. في حين أن هذه الطريقة فعالة، إلا أنها يمكن أن تكون بطيئة لأنها تعالج الصورة على مراحل متعددة، مما يجعل التطبيقات في الوقت الفعلي أكثر صعوبة.

في غضون ذلك، تعالج نماذج مثل YOLO11 الصور دفعة واحدة، وتتوقع في الوقت نفسه مربعات إحاطة الكائنات وأقنعة تجزئة المثيلات. هذا النهج المبسط يجعله أسرع بكثير مع الحفاظ على دقة عالية. ونتيجة لذلك، فهو مفيد بشكل خاص للتطبيقات في الوقت الفعلي مثل القيادة الذاتية وتحليل الفيديو والروبوتات، حيث السرعة والدقة أمران حاسمان.

تدريب مخصص لـ YOLO11 لتقسيم الصور

يأتي YOLO11 جاهزًا للاستخدام كنموذج مُدرَّب مسبقًا. لقد تم تدريبه على مجموعة بيانات COCO-Seg، التي تغطي الأشياء اليومية لتقسيم الصور إلى أجزاء. ومع ذلك، تدعم حزمة Ultralytics Python التدريب المخصص، وهو أمر ضروري للتطبيقات المتخصصة حيث يجب تقسيم كائنات فريدة.

لماذا يعتبر التدريب المخصص أو الضبط الدقيق للنموذج أمرًا مهمًا؟ التدريب المخصص يستفيد من التعلم بالنقل من خلال البناء على المعرفة المضمنة بالفعل في النماذج المدربة مسبقًا. بدلاً من البدء من الصفر، فإنه يكيف نموذجًا موجودًا لمهام جديدة باستخدام مجموعات بيانات أصغر وموارد حوسبة أقل، كل ذلك مع الحفاظ على دقة عالية.

كيفية تدريب YOLO11 بشكل مخصص

إليك نظرة فاحصة على الخطوات المتضمنة في الضبط الدقيق لـ YOLO11 لتقسيم المثيلات: 

  • إعداد البيانات: اجمع الصور وقم بتوصيفها بناءً على التطبيق المحدد الخاص بك. توفر Ultralytics دعمًا لعدة مجموعات بيانات صور، ولكن يمكنك أيضًا التدريب باستخدام مجموعة البيانات الخاصة بك عن طريق إعداد الصور والتعليقات التوضيحية بتنسيق YOLO المطلوب.
  • استخدام نموذج مدرب مسبقًا: بدلاً من البدء من الصفر، استخدم نموذج Ultralytics YOLO11 مدرب مسبقًا. 
  • تدريب النموذج: اضبط إعدادات التدريب الحيوية مثل حجم الدفعة (الصور التي تتم معالجتها لكل تكرار)، وحجم الصورة (دقة الإدخال المستهدفة)، والحقب (إجمالي دورات التدريب) وقم بتدريب النموذج. 
  • تقييم الأداء: بعد اكتمال تدريب النموذج، يمكنك اختبار دقة النموذج باستخدام مقاييس الأداء مثل mAP. توفر حزمة Ultralytics Python أيضًا وظائف مدمجة لتقييم النموذج.

تطبيقات تجزئة المثيل المدعومة بواسطة YOLO11

يمكن استخدام تجزئة المثيل لحل تحديات العالم الحقيقي من خلال مساعدة الآلات على رؤية وفهم الكائنات بدقة أكبر. من تحسين الأتمتة إلى حماية البيئة، فإنه يلعب دورًا رئيسيًا في العديد من المجالات. دعنا نستعرض بعض الأمثلة على تأثيره.

السلامة في مواقع البناء والمراقبة باستخدام YOLO11

يمكن أن يكون تجزئة المثيل جزءًا مهمًا من ضمان السلامة والكفاءة في مواقع البناء. على سبيل المثال، يمكن استخدامه لمراقبة الآلات الثقيلة. 

يمكن ضبط YOLO11 بدقة لتقسيم وتحديد أنواع مختلفة من المعدات بدقة، مثل الرافعات والحفارات والجرافات، وتتبع مواقعها في الوقت الفعلي. يتيح ذلك لمديري المواقع التأكد من أن الآلات تعمل بدقة داخل المناطق المخصصة ولا تتعدى على المناطق التي يتواجد فيها العمال أو توجد فيها مخاطر. 

أيضًا، يتيح دمج هذه الحلول مع أنظمة التنبيه في الوقت الفعلي اتخاذ إجراءات تصحيحية سريعة. بالإضافة إلى ذلك، يمكن أن تساعد الرؤى التي تم جمعها في تحسين تخطيط الموقع وسير العمل، مما يقلل من المخاطر ويعزز الإنتاجية.

__wf_reserved_inherit
الشكل 5. مراقبة الآلات الثقيلة باستخدام YOLO11.

مراقبة الحيوانات باستخدام التجزئة و YOLO11

تساعد مراقبة سلوك الحيوان الباحثين والمزارعين والمحافظين على رعاية الحيوانات بشكل أفضل في البيئات المختلفة. يلعب تجزئة المثيل دورًا مفيدًا في هذه الأنظمة من خلال تحديد وتجزئة الحيوانات الفردية في المزارع وحدائق الحيوان والموائل الطبيعية. على عكس اكتشاف الكائنات التقليدي الذي يستخدم مربعات إحاطة، يوفر تجزئة المثيل تحديدًا على مستوى البكسل لكل حيوان، وهو أمر مفيد بشكل خاص عندما تكون الحيوانات على مقربة من بعضها البعض.

تسهل عملية التجزئة التفصيلية تتبعًا أكثر دقة للحركات والسلوكيات. يمكن التعرف على الحيوانات المتداخلة أو المتجمعة بشكل وثيق بشكل مميز، وتوفر تحليلًا أكثر دقة للتفاعلات والتقييمات الصحية وأنماط النشاط. بشكل عام، تعزز الرؤى الأعمق لسلوك الحيوان ممارسات رعاية الحيوان وإدارته.

__wf_reserved_inherit
الشكل 6. مراقبة الماشية باستخدام تقسيم المثيل.

YOLO11 في تحليلات الرياضة وتتبع اللاعبين

يعد التتبع الدقيق للاعبين والأحداث جزءًا كبيرًا من التحليل الرياضي. تعتمد طرق التتبع التقليدية على وضع العلامات اليدوي، والتي قد لا تلتقط تفاعلات مفصلة. يمكن استخدام رؤية الكمبيوتر لتقسيم التفاصيل مثل كل لاعب والكرة والحدث الرئيسي على مستوى البكسل للحصول على رؤى تفصيلية.

على سبيل المثال، يمكن أن يساعد تجزئة المثيل (instance segmentation) في اكتشاف أحداث مثل الأخطاء أو الحوادث الخارجة عن الكرة من خلال فصل كل لاعب وكائن بوضوح. توفر هذه المراقبة الدقيقة التي تتيحها نماذج مثل YOLO11 للمحللين معلومات أوضح لدراسة أنماط الحركة والموقع المكاني والتفاعلات بدقة عالية. تتمثل الفائدة الرئيسية لهذه الرؤى في أنها تساعد الفرق على تحسين استراتيجياتها وتعزيز الأداء العام.

إيجابيات وسلبيات تجزئة الحالات

فيما يلي بعض الفوائد الرئيسية التي يمكن أن يجلبها تجزئة المثيلات لمختلف الصناعات:

  • أتمتة محسنة: من خلال أتمتة مهام مثل مراقبة الجودة والسلامة، يقلل تجزئة المثيلات من الحاجة إلى التدخل اليدوي ويقلل من الخطأ البشري.
  • فهم أفضل للمشهد: من خلال تحديد دقيق لكل كائن، يساهم تقسيم الحالات في فهم أعمق للمشاهد المعقدة، مما يدعم اتخاذ قرارات أكثر استنارة.
  • معالجة لاحقة فعالة: تبسّط المخرجات على مستوى البكسل مهام مثل إزالة الخلفية، وعدّ العناصر، والتحليل المكاني، مما يقلل الحاجة إلى خطوات معالجة إضافية.

في حين أن هذه الفوائد تسلط الضوء على كيفية تأثير تجزئة المثيل على حالات الاستخدام المختلفة، فمن الضروري أيضًا مراعاة التحديات التي تنطوي عليها عملية التنفيذ. 

فيما يلي بعض القيود الرئيسية لتجزئة المثيلات:

  • تحديات الشفافية: يعد تقسيم الكائنات الشفافة أو العاكسة مثل الزجاج والماء أمرًا صعبًا، مما يؤدي إلى حدود غير دقيقة.
  • تكاليف الصيانة العامة: للحفاظ على دقة النماذج وملاءمتها، من الضروري إجراء تحديثات وضبط دقيق مستمر مع تغير الظروف البيئية ومجموعات البيانات.
  • جهد عالٍ في إضافة التعليقات التوضيحية: يتطلب تدريب نماذج تقسيم الحالات إضافة تعليقات توضيحية مفصلة على مستوى البكسل، مما يزيد بشكل كبير من الوقت والتكلفة المتضمنة في إعداد البيانات.

النقاط الرئيسية

يمكّن تجزئة المثيل من تمييز الكائنات الفردية بدقة، حتى عندما تتداخل. من خلال التقاط حدود الكائن على مستوى البكسل، فإنه يوفر فهمًا أعمق للبيانات المرئية مقارنة بمهام الرؤية الحاسوبية التقليدية مثل اكتشاف الكائنات.

لقد جعلت التطورات الأخيرة في رؤية الكمبيوتر تجزئة المثيلات أسرع وأسهل في الاستخدام. على وجه الخصوص، تعمل نماذج رؤية الكمبيوتر مثل Ultralytics YOLO11 على تبسيط العملية، مما يتيح التجزئة في الوقت الفعلي بأقل إعداد، مما يجعلها أكثر سهولة لمختلف الصناعات والتطبيقات.

هل أنت مهتم بالذكاء الاصطناعي؟ قم بزيارة مستودع GitHub الخاص بنا وتواصل مع مجتمعنا لمواصلة الاستكشاف. تعرف على الابتكارات مثل الذكاء الاصطناعي في السيارات ذاتية القيادة و الرؤية الحاسوبية في الزراعة في صفحات الحلول الخاصة بنا. تحقق من خيارات الترخيص الخاصة بنا وابدأ مشروع الرؤية الحاسوبية!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا
تم نسخ الرابط إلى الحافظة