انضموا إلينا في نظرة فاحصة على ماهية تجزئة المثيلات، وكيفية عملها، واستخدامها في تطبيقات رؤية الكمبيوتر المختلفة، والتأثير الذي يمكن أن تحدثه.

انضموا إلينا في نظرة فاحصة على ماهية تجزئة المثيلات، وكيفية عملها، واستخدامها في تطبيقات رؤية الكمبيوتر المختلفة، والتأثير الذي يمكن أن تحدثه.

أصبحت تطبيقات رؤية الحاسوب أكثر شيوعًا في حياتنا اليومية، بدءًا من كاميرات المرور التي تراقب أحوال الطريق وحتى أنظمة الدفع الذاتي في المتاجر. من خلال تمكين الآلات من فهم البيانات المرئية بطريقة مشابهة للبشر، تُحدث رؤية الذكاء الاصطناعي تأثيرًا في مجموعة من الصناعات.
تعتمد العديد من هذه التطبيقات على اكتشاف الكائنات، وهي مهمة رؤية حاسوبية تضع مربعات إحاطة حول الكائنات الرئيسية في الصور. في حين أن هذا النهج غالبًا ما يعمل بشكل جيد، إلا أن بعض حلول تحليل الصور تحتاج إلى دقة أكبر.
على سبيل المثال، يتطلب التصوير الطبي أكثر من مجرد اكتشاف ورم - من الضروري تحديد شكله الدقيق. وبالمثل، في مجال الروبوتات، تحتاج الآلات إلى التعرف على الخطوط الدقيقة للكائن لفهمه بشكل صحيح. ولمعالجة هذه التحديات، يقدم تجزئة المثيل حلاً أكثر دقة.
تجزئة المثيل هي مهمة رؤية حاسوبية مصممة لدعم حالات الاستخدام التي لا يكون فيها اكتشاف الكائنات كافيًا - فهي توفر دقة على مستوى البكسل. يمكن استخدام نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 لتطبيق تجزئة المثيل على الصور ومقاطع الفيديو بسهولة.

في هذا الدليل، سنشرح كيفية عمل تجزئة المثيلات (instance segmentation)، وتطبيقاتها، وكيف يمكن تدريب Ultralytics YOLO11 بشكل مخصص لمهام تجزئة معينة.
لنفترض أن هناك صورة جماعية لأشخاص يقفون بالقرب من بعضهم البعض. يمكن أن يساعد اكتشاف الكائنات في رسم مربعات حول كل شخص، لكن هذا لا يخبرك بالشكل الدقيق لكل منهم.
تجزئة المثيلات، من ناحية أخرى، تشبه التتبع الدقيق حول كل شخص حتى تتمكن من رؤية مخططهم الكامل، حتى لو كانوا متداخلين. بدلاً من مجرد تحديد مكان وجود شيء ما بمربع، فإنه يحدد الشكل الدقيق لكل كائن على مستوى البكسل، مما يسهل فهم الصور المعقدة.
والنتيجة هي قناع مفصل يملأ شكل الكائن، ويحدد بدقة وحدات البكسل التي تنتمي إليه. هذا المستوى من الدقة مفيد في العديد من التطبيقات الواقعية حيث يكون فهم الشكل والحدود الدقيقة للكائنات أمرًا مهمًا.

أثناء استكشاف تجزئة المثيلات، قد تصادف مفهوم التجزئة الدلالية.
تساعد كلتا التقنيتين أجهزة الكمبيوتر على فهم الصور على مستوى البكسل، لكنهما تخدمان أغراضًا مختلفة. يقوم تجزئة المعنى بتسمية كل بكسل بناءً على فئته، وتجميع جميع الكائنات من نفس النوع معًا. على سبيل المثال، في صورة بها سيارات متعددة، سيقوم تجزئة المعنى بتمييزها جميعًا على أنها "سيارة" دون تمييز بين المركبات الفردية.
من ناحية أخرى، يأخذها تجزئة المثيل خطوة إلى الأمام من خلال تحديد كل كائن على حدة. يقوم بتعيين تسميات فريدة للمثيلات الفردية وإنشاء أقنعة دقيقة حول أشكالها. لذلك في نفس الصورة، لن يصنف تجزئة المثيل كل شيء على أنه "سيارة" فحسب، بل سيتعرف على كل سيارة ويحددها بشكل فردي.
الفرق الرئيسي بين الاثنين هو أن التقسيم الدلالي يجمع الكائنات حسب الفئة، بينما يميز تقسيم المثيل كل كائن ككيان فريد بحدود واضحة. يعتمد اختيار المهمة التي سيتم استخدامها على التطبيق المحدد - سواء كان يكفي معرفة ما هو موجود في الصورة أو إذا كان من المهم التمييز بين الكائنات الفردية.

تتوفر العديد من نماذج تجزئة المثيلات لمجتمع Vision AI في الوقت الحاضر. بعضها أسرع، وبعضها أكثر دقة، وبعضها أسهل في الاستخدام.
على الرغم من فائدة هذه الخيارات، إلا أنها قد تثير تساؤلاً: أيها هو الخيار الصحيح للاستخدام في مهمة معينة؟ من بين الخيارات المتاحة، تحظى نماذج Ultralytics YOLO بشعبية كبيرة لأنها تركز على السرعة والدقة.
أيضًا، تطورت هذه النماذج بشكل كبير على مر السنين. على سبيل المثال، قامت Ultralytics YOLOv5 بتبسيط النشر باستخدام أطر عمل مثل PyTorch، مما جعل Vision AI المتقدم في متناول جمهور أوسع دون الحاجة إلى خبرة فنية عميقة.
بالاعتماد على هذا النجاح، قدمت Ultralytics YOLOv8 دعمًا محسنًا لمهام الرؤية الحاسوبية مثل تجزئة المثيلات وتقدير الوضع وتصنيف الصور.
الآن، ينقل YOLO11 الأداء إلى مستوى جديد. فهو يحقق متوسط دقة أعلى (mAP) على مجموعة بيانات COCO مع عدد أقل من المعلمات بنسبة 22٪ من YOLOv8m، مما يعني أنه يمكنه التعرف على الكائنات بدقة أكبر مع استخدام موارد أقل.

ببساطة، يقدم YOLO11 دقة متطورة دون المساومة على الكفاءة، مما يجعله يغير قواعد اللعبة في هذا المجال.
بعد ذلك، دعنا نستكشف كيف يعمل تجزئة المثيلات عادةً. تستخدم نماذج رؤية الكمبيوتر الأقدم نهجًا من خطوتين.
أولاً، يكتشفون الكائنات عن طريق رسم مربعات إحاطة حولها. ثم، يقومون بإنشاء قناع على مستوى البكسل لتحديد الشكل الدقيق لكل كائن. مثال معروف هو Mask R-CNN، الذي يعتمد على نماذج اكتشاف الكائنات عن طريق إضافة خطوة تنبؤ بالقناع. في حين أن هذه الطريقة فعالة، إلا أنها يمكن أن تكون بطيئة لأنها تعالج الصورة على مراحل متعددة، مما يجعل التطبيقات في الوقت الفعلي أكثر صعوبة.
في غضون ذلك، تعالج نماذج مثل YOLO11 الصور دفعة واحدة، وتتوقع في الوقت نفسه مربعات إحاطة الكائنات وأقنعة تجزئة المثيلات. هذا النهج المبسط يجعله أسرع بكثير مع الحفاظ على دقة عالية. ونتيجة لذلك، فهو مفيد بشكل خاص للتطبيقات في الوقت الفعلي مثل القيادة الذاتية وتحليل الفيديو والروبوتات، حيث السرعة والدقة أمران حاسمان.
يأتي YOLO11 جاهزًا للاستخدام كنموذج مُدرَّب مسبقًا. لقد تم تدريبه على مجموعة بيانات COCO-Seg، التي تغطي الأشياء اليومية لتقسيم الصور إلى أجزاء. ومع ذلك، تدعم حزمة Ultralytics Python التدريب المخصص، وهو أمر ضروري للتطبيقات المتخصصة حيث يجب تقسيم كائنات فريدة.
لماذا يعتبر التدريب المخصص أو الضبط الدقيق للنموذج أمرًا مهمًا؟ التدريب المخصص يستفيد من التعلم بالنقل من خلال البناء على المعرفة المضمنة بالفعل في النماذج المدربة مسبقًا. بدلاً من البدء من الصفر، فإنه يكيف نموذجًا موجودًا لمهام جديدة باستخدام مجموعات بيانات أصغر وموارد حوسبة أقل، كل ذلك مع الحفاظ على دقة عالية.
إليك نظرة فاحصة على الخطوات المتضمنة في الضبط الدقيق لـ YOLO11 لتقسيم المثيلات:
يمكن استخدام تجزئة المثيل لحل تحديات العالم الحقيقي من خلال مساعدة الآلات على رؤية وفهم الكائنات بدقة أكبر. من تحسين الأتمتة إلى حماية البيئة، فإنه يلعب دورًا رئيسيًا في العديد من المجالات. دعنا نستعرض بعض الأمثلة على تأثيره.
يمكن أن يكون تجزئة المثيل جزءًا مهمًا من ضمان السلامة والكفاءة في مواقع البناء. على سبيل المثال، يمكن استخدامه لمراقبة الآلات الثقيلة.
يمكن ضبط YOLO11 بدقة لتقسيم وتحديد أنواع مختلفة من المعدات بدقة، مثل الرافعات والحفارات والجرافات، وتتبع مواقعها في الوقت الفعلي. يتيح ذلك لمديري المواقع التأكد من أن الآلات تعمل بدقة داخل المناطق المخصصة ولا تتعدى على المناطق التي يتواجد فيها العمال أو توجد فيها مخاطر.
أيضًا، يتيح دمج هذه الحلول مع أنظمة التنبيه في الوقت الفعلي اتخاذ إجراءات تصحيحية سريعة. بالإضافة إلى ذلك، يمكن أن تساعد الرؤى التي تم جمعها في تحسين تخطيط الموقع وسير العمل، مما يقلل من المخاطر ويعزز الإنتاجية.

تساعد مراقبة سلوك الحيوان الباحثين والمزارعين والمحافظين على رعاية الحيوانات بشكل أفضل في البيئات المختلفة. يلعب تجزئة المثيل دورًا مفيدًا في هذه الأنظمة من خلال تحديد وتجزئة الحيوانات الفردية في المزارع وحدائق الحيوان والموائل الطبيعية. على عكس اكتشاف الكائنات التقليدي الذي يستخدم مربعات إحاطة، يوفر تجزئة المثيل تحديدًا على مستوى البكسل لكل حيوان، وهو أمر مفيد بشكل خاص عندما تكون الحيوانات على مقربة من بعضها البعض.
تسهل عملية التجزئة التفصيلية تتبعًا أكثر دقة للحركات والسلوكيات. يمكن التعرف على الحيوانات المتداخلة أو المتجمعة بشكل وثيق بشكل مميز، وتوفر تحليلًا أكثر دقة للتفاعلات والتقييمات الصحية وأنماط النشاط. بشكل عام، تعزز الرؤى الأعمق لسلوك الحيوان ممارسات رعاية الحيوان وإدارته.

يعد التتبع الدقيق للاعبين والأحداث جزءًا كبيرًا من التحليل الرياضي. تعتمد طرق التتبع التقليدية على وضع العلامات اليدوي، والتي قد لا تلتقط تفاعلات مفصلة. يمكن استخدام رؤية الكمبيوتر لتقسيم التفاصيل مثل كل لاعب والكرة والحدث الرئيسي على مستوى البكسل للحصول على رؤى تفصيلية.
على سبيل المثال، يمكن أن يساعد تجزئة المثيل (instance segmentation) في اكتشاف أحداث مثل الأخطاء أو الحوادث الخارجة عن الكرة من خلال فصل كل لاعب وكائن بوضوح. توفر هذه المراقبة الدقيقة التي تتيحها نماذج مثل YOLO11 للمحللين معلومات أوضح لدراسة أنماط الحركة والموقع المكاني والتفاعلات بدقة عالية. تتمثل الفائدة الرئيسية لهذه الرؤى في أنها تساعد الفرق على تحسين استراتيجياتها وتعزيز الأداء العام.
فيما يلي بعض الفوائد الرئيسية التي يمكن أن يجلبها تجزئة المثيلات لمختلف الصناعات:
في حين أن هذه الفوائد تسلط الضوء على كيفية تأثير تجزئة المثيل على حالات الاستخدام المختلفة، فمن الضروري أيضًا مراعاة التحديات التي تنطوي عليها عملية التنفيذ.
فيما يلي بعض القيود الرئيسية لتجزئة المثيلات:
يمكّن تجزئة المثيل من تمييز الكائنات الفردية بدقة، حتى عندما تتداخل. من خلال التقاط حدود الكائن على مستوى البكسل، فإنه يوفر فهمًا أعمق للبيانات المرئية مقارنة بمهام الرؤية الحاسوبية التقليدية مثل اكتشاف الكائنات.
لقد جعلت التطورات الأخيرة في رؤية الكمبيوتر تجزئة المثيلات أسرع وأسهل في الاستخدام. على وجه الخصوص، تعمل نماذج رؤية الكمبيوتر مثل Ultralytics YOLO11 على تبسيط العملية، مما يتيح التجزئة في الوقت الفعلي بأقل إعداد، مما يجعلها أكثر سهولة لمختلف الصناعات والتطبيقات.
هل أنت مهتم بالذكاء الاصطناعي؟ قم بزيارة مستودع GitHub الخاص بنا وتواصل مع مجتمعنا لمواصلة الاستكشاف. تعرف على الابتكارات مثل الذكاء الاصطناعي في السيارات ذاتية القيادة و الرؤية الحاسوبية في الزراعة في صفحات الحلول الخاصة بنا. تحقق من خيارات الترخيص الخاصة بنا وابدأ مشروع الرؤية الحاسوبية!