Yolo فيجن شنتشن
شنتشن
انضم الآن

كل ما تحتاج معرفته حول مهام رؤية الكمبيوتر

أبيرامي فينا

4 دقائق قراءة

16 أبريل، 2025

تعرّف على كيفية عمل مهام الرؤية الحاسوبية مثل تتبع الأجسام، وتجزئة المثيلات، وتصنيف الصور، وكيف يدعمهاYOLO11 Ultralytics YOLO11 .

بفضل الكاميرات والتطورات في مجال الذكاء الاصطناعي (AI)، أصبحت أجهزة الكمبيوتر والآلات الآن قادرة على رؤية العالم بطريقة مشابهة لما يراه البشر. على سبيل المثال، يمكنها التعرف على الأشخاص track الأشياء وحتى فهم سياق ما يحدث في الفيديو.

على وجه التحديد، رؤية الكمبيوتر هي فرع من فروع الذكاء الاصطناعي الذي يمكّن الآلات من فهم وتفسير المعلومات المرئية من العالم من حولها. تتضمن رؤية الكمبيوتر مجموعة متنوعة من المهام، تم تصميم كل منها لاستخراج نوع معين من الرؤى من الصور أو مقاطع الفيديو. على سبيل المثال، يساعد الكشف عن الكائنات في تحديد وتحديد مواقع العناصر المختلفة في الصورة، بينما تساعد المهام الأخرى مثل التتبع والتجزئة وتقدير الوضع الآلات على فهم الحركة والأشكال والمواضع بدقة أكبر.

تعتمد مهمة الرؤية الحاسوبية المستخدمة في تطبيق معين على نوع الرؤى التي تحتاجها. نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 تدعم العديد من مهام الرؤية الحاسوبية المختلفة، مما يجعلها خيارًا موثوقًا لبناء أنظمة ذكاء اصطناعي للرؤية في العالم الحقيقي.

في هذا الدليل، سنلقي نظرة فاحصة على مهام الرؤية الحاسوبية التي تدعمها نماذج مثل YOLO11. سنستكشف كيفية عمل كل مهمة وكيفية استخدامها في مختلف الصناعات. لنبدأ!

ما هي مهام الرؤية الحاسوبية؟

تهدف مهام الرؤية الحاسوبية إلى محاكاة قدرات الرؤية البشرية بطرق مختلفة. يمكن أن تساعد هذه المهام الآلات على detect الأجسام track حركاتها وتقدير أوضاعها وحتى تحديد العناصر الفردية في الصور ومقاطع الفيديو. وعادةً ما يتم تمكين مهام الرؤية الحاسوبية من خلال نماذج تقسم البيانات المرئية إلى أجزاء أصغر حتى تتمكن من تفسير ما يحدث بشكل أوضح. 

تدعم نماذج الذكاء الاصطناعي للرؤية مثل نماذج Ultralytics YOLO مهام متعددة، مثل الكشف والتتبع والتجزئة في إطار عمل واحد. وبفضل هذا التنوع في الاستخدام، يسهل اعتماد نماذج YOLO11 لمجموعة متنوعة من حالات الاستخدام.

__wf_reserved_inherit
الشكل 1. مهام الرؤية الحاسوبية التي يدعمها YOLO11.

ومن الأمثلة الجيدة على ذلك في التحليلات الرياضية. يمكن استخدام YOLO11 detect كل لاعب في الملعب باستخدام خاصية اكتشاف الأجسام، ثم يمكنه متابعتهم طوال المباراة باستخدام تتبع الأجسام. وفي الوقت نفسه، يمكن أن تساعد قدرات YOLO11 في تقدير الوضعية في تحليل حركات اللاعبين وتقنياتهم، ويمكن أن يساعد تجزئة المثيل في فصل كل لاعب عن الخلفية، مما يضيف دقة إلى التحليل. 

تُنشئ مهام الرؤية الحاسوبية YOLO11 هذه معًا صورة كاملة لما يحدث أثناء اللعبة، مما يمنح الفرق رؤى أعمق حول أداء اللاعبين والتكتيكات والاستراتيجية العامة.

لمحة عامة عن مهام الرؤية الحاسوبية التي يدعمها YOLO11

والآن بعد أن ألقينا نظرة على ماهية مهام الرؤية الحاسوبية، دعونا نتعمق في فهم كل مهمة مدعومة من YOLO11 بمزيد من التفصيل، باستخدام أمثلة واقعية.

دعم YOLO11لتصنيف الصور في YOLO11

عندما تنظر إلى صورة ما، يمكن لمعظم الناس بسهولة معرفة ما إذا كانت الصورة تُظهر كلباً أو جبلاً أو إشارة مرور، لأننا تعلمنا جميعاً كيف تبدو هذه الأشياء عادةً. يساعد تصنيف الصور الآلات على فعل الشيء نفسه من خلال تعليمها كيفية classify الصورة وتسميتها بناءً على الكائن الرئيسي فيها - سواء كانت "سيارة" أو "موزة" أو "أشعة سينية مع كسر". وتساعد هذه التسمية أنظمة الرؤية الحاسوبية على فهم المحتوى المرئي حتى تتمكن من الاستجابة أو اتخاذ القرارات وفقاً لذلك.

أحد التطبيقات المثيرة للاهتمام لمهمة الرؤية الحاسوبية هذه هو مراقبة الحياة البرية. يمكن استخدام تصنيف الصور لتحديد أنواع الحيوانات المختلفة من الصور الملتقطة في البرية. ومن خلال تصنيف الصور تلقائيًا، يمكن للباحثين track مجموعات الحيوانات ومراقبة أنماط الهجرة وتحديد الأنواع المهددة بالانقراض بسهولة أكبر لدعم جهود الحفاظ على البيئة.

__wf_reserved_inherit
الشكل 2. مثال على استخدام YOLO11 لتصنيف الصور.

قدرات YOLO11على اكتشاف الأجسام في YOLO11

في حين أن تصنيف الصور مفيد للحصول على فكرة عامة عما تحتويه الصورة، إلا أنه يعين تسمية واحدة فقط للصورة بأكملها. في الحالات التي تتطلب معلومات مفصلة، مثل الموقع الدقيق وهوية كائنات متعددة، يصبح اكتشاف الكائنات ضروريًا.

اكتشاف الكائنات هو عملية تحديد الكائنات الفردية وتحديد موقعها داخل الصورة، وغالبًا ما يتم ذلك عن طريق رسم مربعات محددة حولها. يؤديYOLO11 Ultralytics YOLO11 أداءً جيدًا بشكل خاص في اكتشاف الكائنات في الوقت الفعلي، مما يجعله مثاليًا لمجموعة كبيرة من التطبيقات.

خذ على سبيل المثال حلول الرؤية الحاسوبية المستخدمة في متاجر البيع بالتجزئة لتخزين الرفوف. يمكن أن يساعد اكتشاف الأجسام في عد الفواكه والخضروات والمواد الأخرى، مما يضمن جردًا دقيقًا. في الحقول الزراعية، يمكن لنفس التكنولوجيا مراقبة نضج المحاصيل لمساعدة المزارعين على تحديد أفضل وقت للحصاد، حتى أنها تميز بين المنتجات الناضجة وغير الناضجة.

__wf_reserved_inherit
الشكل 3. الكشف عن الفاكهة باستخدام Ultralytics YOLO11.

استخدام YOLO11 لتجزئة المثيل

يستخدم الكشف عن الأجسام مربعات الإحاطة لتحديد وتعيين مواقع الأجسام في الصورة، ولكنه لا يلتقط أشكالها الدقيقة. هذا هو المكان الذي يأتي فيه تقسيم المثيلات. بدلاً من رسم مربع حول جسم ما، يتتبع تقسيم المثيلات محيطه الدقيق.

يمكنك التفكير في الأمر على النحو التالي: بدلاً من مجرد الإشارة إلى أنه "توجد تفاحة في هذه المنطقة"، فإنه يحدد بعناية الشكل الدقيق للتفاحة ويملأه. تساعد هذه العملية التفصيلية أنظمة الذكاء الاصطناعي على فهم حدود الكائن بوضوح، خاصة عندما تكون الكائنات متقاربة من بعضها البعض.

يمكن تطبيق تجزئة المثيل على العديد من التطبيقات، بدءًا من عمليات فحص البنية التحتية إلى المسوحات الجيولوجية. على سبيل المثال، يمكن تحليل البيانات المستمدة من المسوحات الجيولوجية باستخدام YOLO11 segment الشقوق أو الشذوذات السطحية الكبيرة والصغيرة على حد سواء. من خلال رسم حدود دقيقة حول هذه التشوهات، يمكن للمهندسين تحديد المشكلات ومعالجتها قبل بدء المشروع. 

__wf_reserved_inherit
الشكل 4. تجزئة التصدع YOLO11.

تتبع الأجسام: تتبع الأجسام عبر الإطارات باستخدام YOLO11

حتى الآن، تركز مهام الرؤية الحاسوبية التي نظرنا إليها على محتوى صورة واحدة. ومع ذلك، عندما يتعلق الأمر بمقاطع الفيديو، نحتاج إلى رؤى تتجاوز إطارًا واحدًا. يمكن استخدام مهمة تتبع الكائنات لهذا الغرض.

يمكن لقدرة YOLO11 على تتبع جسم معين، مثل شخص أو سيارة، أثناء تحركه عبر سلسلة من إطارات الفيديو. حتى إذا تغيرت زاوية الكاميرا أو ظهرت أجسام أخرى، يستمر النظام في تتبع الهدف نفسه. 

وهذا أمر بالغ الأهمية للتطبيقات التي تتطلب المراقبة بمرور الوقت، مثل تتبع السيارات في حركة المرور. في الواقع، يمكن YOLO11 track المركبات بدقة، وتتبع كل سيارة للمساعدة في تقدير سرعتها في الوقت الفعلي. وهذا يجعل تتبع الأجسام عنصراً أساسياً في أنظمة مثل مراقبة حركة المرور.

__wf_reserved_inherit
الشكل 5. يمكن استخدام دعم YOLO11لتتبع الأجسام لتقدير السرعة.

اكتشاف المربعات المحدودة الموجهة (OBB) باستخدام YOLO11

الأجسام في العالم الحقيقي ليست دائمًا محاذاة تمامًا - يمكن أن تكون مائلة أو جانبية أو في زوايا غريبة. على سبيل المثال، في صور الأقمار الصناعية، غالبًا ما تظهر السفن والمباني مستدارة. 

تستخدم طرق الكشف عن الكائنات التقليدية مربعات مستطيلة ثابتة لا تتكيف مع اتجاه الكائن، مما يجعل من الصعب التقاط هذه الأشكال المدورة بدقة. يكشف الصندوق المحيط الموجه (OBB) يحل هذه المشكلة باستخدام مربعات تدور لتناسب بشكل مريح حول الكائن، وتتماشى مع زاويته للكشف الأكثر دقة.

فيما يتعلق بمراقبة الموانئ، يمكن أن يساعد دعم YOLO11للكشف عن ثنائي الفينيل متعدد البروم ثنائي الفينيل متعدد البروم في تحديد track السفن بدقة بغض النظر عن اتجاهها، مما يضمن مراقبة كل سفينة تدخل الميناء أو تغادره بشكل صحيح. يوفر هذا الاكتشاف الدقيق معلومات في الوقت الفعلي عن مواقع السفن وتحركاتها، وهو أمر بالغ الأهمية لإدارة الموانئ المزدحمة ومنع التصادمات.

__wf_reserved_inherit
الشكل 6. الكشف عن القوارب باستخدام كشف OBB و YOLO11.

تقدير الوضعية و YOLO11: تتبع النقاط الرئيسية 

تقدير الوضعية هو أسلوب رؤية حاسوبية يتتبع النقاط الرئيسية، مثل المفاصل أو الأطراف أو العلامات الأخرى، لفهم كيفية تحرك الجسم. بدلاً من التعامل مع الجسم بأكمله كوحدة كاملة واحدة، تقسمه هذه الطريقة إلى أجزائه الرئيسية. وهذا يجعل من الممكن تحليل الحركات والإيماءات والتفاعلات بالتفصيل.

أحد التطبيقات الشائعة لهذه التقنية هو تقدير وضعية الإنسان. من خلال تتبع مواضع أجزاء الجسم المختلفة في الوقت الفعلي، فإنه يوفر صورة واضحة لكيفية تحرك الشخص. يمكن استخدام هذه المعلومات لمجموعة متنوعة من الأغراض، من التعرف على الإيماءات ومراقبة النشاط إلى تحليل الأداء في الألعاب الرياضية. 

وبالمثل، في إعادة التأهيل البدني، يمكن للمعالجين استخدام تقدير الوضع البشري و YOLO11 لمراقبة حركات المرضى أثناء التمارين. يساعد ذلك على التأكد من أن كل حركة تتم بشكل صحيح مع تتبع التقدم المحرز مع مرور الوقت.

__wf_reserved_inherit
الشكل 7. يمكن لـ YOLO11 مراقبة التمرين باستخدام تقدير الوضعية.

استكشاف كيفية دعم YOLO11 لمهام الرؤية الحاسوبية المختلفة

والآن بعد أن استكشفنا جميع مهام الرؤية الحاسوبية التي يدعمها YOLO11 بالتفصيل، دعنا نستعرض كيفية دعم YOLO11 لها. 

إن YOLO11 ليس مجرد نموذج واحد - إنه مجموعة من النماذج المتخصصة، كل منها مصمم لمهمة رؤية حاسوبية محددة. وهذا يجعل YOLO11 أداة متعددة الاستخدامات يمكن تكييفها مع مجموعة واسعة من التطبيقات. يمكنك أيضًا ضبط هذه النماذج على مجموعات بيانات مخصصة لمعالجة التحديات الفريدة لمشاريعك.

فيما يلي متغيرات نموذجYOLO11 التي تم تدريبها مسبقاً على مهام رؤية محددة:

  • YOLO11: يقوم هذا النموذج باكتشاف وتسمية كائنات متعددة في الوقت الفعلي، مما يجعله مثاليًا للتعرف البصري عالي السرعة.

  • YOLO11: يركز هذا المتغير على التجزئة باستخدام أقنعة تفصيلية لفصل الأجسام عن خلفياتها.

  • obb: صُمم هذا النموذج detect الأجسام المدورة من خلال رسم مربعات محددة تتماشى مع اتجاه كل جسم.

  • YOLO11: يصنف هذا المتغير الصور من خلال تعيين تسمية فئة واحدة بناءً على المحتوى الكلي.

  • YOLO11 هذا النموذج النقاط الرئيسية في الجسم track وضعية الجسم ووضعيات الأطراف والحركة.

يتوفر كل متغير بأحجام مختلفة، مما يسمح للمستخدمين باختيار التوازن الصحيح بين السرعة والدقة لتلبية احتياجاتهم الخاصة.

النقاط الرئيسية

تغير مهام الرؤية الحاسوبية الطريقة التي تفهم بها الآلات العالم وتتفاعل معه. من خلال تقسيم الصور ومقاطع الفيديو إلى عناصر أساسية، تسهل هذه التقنيات تحليل الكائنات والحركات والتفاعلات بالتفصيل. 

بدءاً من تحسين السلامة المرورية والأداء الرياضي إلى تبسيط العمليات الصناعية، يمكن لنماذج مثل YOLO11 أن توفر رؤى في الوقت الفعلي تدفع الابتكار. مع استمرار تطور الذكاء الاصطناعي المرئي في التطور، من المرجح أن يلعب دوراً متزايد الأهمية في كيفية تفسيرنا للبيانات المرئية واستخدامنا لها كل يوم.

انضم إلى مجتمعنا وقم بزيارة مستودع GitHub الخاص بنا لرؤية الذكاء الاصطناعي قيد التنفيذ. استكشف خيارات الترخيص الخاصة بنا واكتشف المزيد حول الذكاء الاصطناعي في الزراعة و الرؤية الحاسوبية في التصنيع في صفحات الحلول الخاصة بنا. 

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا