تعرّف على كيفية عمل مهام الرؤية الحاسوبية مثل تتبع الكائنات، وتقسيم الحالات، وتصنيف الصور، وكيف يدعمها Ultralytics YOLO11.

تعرّف على كيفية عمل مهام الرؤية الحاسوبية مثل تتبع الكائنات، وتقسيم الحالات، وتصنيف الصور، وكيف يدعمها Ultralytics YOLO11.
بفضل الكاميرات والتطورات في الذكاء الاصطناعي (AI)، أصبحت أجهزة الحاسوب والآلات قادرة الآن على رؤية العالم بطريقة مماثلة لكيفية رؤية البشر له. على سبيل المثال، يمكنهم التعرف على الأشخاص، وتتبع الأشياء، وحتى فهم سياق ما يحدث في الفيديو.
على وجه التحديد، رؤية الكمبيوتر هي فرع من فروع الذكاء الاصطناعي الذي يمكّن الآلات من فهم وتفسير المعلومات المرئية من العالم من حولها. تتضمن رؤية الكمبيوتر مجموعة متنوعة من المهام، تم تصميم كل منها لاستخراج نوع معين من الرؤى من الصور أو مقاطع الفيديو. على سبيل المثال، يساعد الكشف عن الكائنات في تحديد وتحديد مواقع العناصر المختلفة في الصورة، بينما تساعد المهام الأخرى مثل التتبع والتجزئة وتقدير الوضع الآلات على فهم الحركة والأشكال والمواضع بدقة أكبر.
تعتمد مهمة رؤية الحاسوب المستخدمة لتطبيق معين على نوع الرؤى التي تحتاجها. تدعم نماذج رؤية الحاسوب مثل Ultralytics YOLO11 مهام رؤية حاسوب متنوعة، مما يجعلها خيارًا موثوقًا به لبناء أنظمة رؤية الذكاء الاصطناعي الواقعية.
في هذا الدليل، سنلقي نظرة فاحصة على مهام رؤية الكمبيوتر التي تدعمها نماذج مثل YOLO11. وسوف نستكشف كيف تعمل كل مهمة وكيف يتم استخدامها في مختلف الصناعات. هيا بنا نبدأ!
تهدف مهام الرؤية الحاسوبية إلى تكرار قدرات الرؤية البشرية بطرق مختلفة. يمكن أن تساعد هذه المهام الآلات على اكتشاف الكائنات وتتبع حركاتها وتقدير أوضاعها وحتى تحديد العناصر الفردية في الصور ومقاطع الفيديو. عادةً ما يتم تمكين مهام الرؤية الحاسوبية بواسطة نماذج تقسم البيانات المرئية إلى أجزاء أصغر حتى تتمكن من تفسير ما يحدث بشكل أكثر وضوحًا.
تدعم نماذج الرؤية بالذكاء الاصطناعي مثل نماذج Ultralytics YOLO مهام متعددة، مثل الاكتشاف والتتبع والتجزئة، في إطار عمل واحد. نظرًا لهذا التنوع، يسهل اعتماد نماذج YOLO11 لمجموعة واسعة من حالات الاستخدام.
من الأمثلة الجيدة على ذلك التحليلات الرياضية. يمكن استخدام YOLO11 لاكتشاف كل لاعب في الملعب باستخدام اكتشاف الكائنات، ثم يمكنه تتبعهم طوال المباراة من خلال تتبع الكائنات. وفي الوقت نفسه، يمكن لقدرات تقدير الوضعية في YOLO11 المساعدة في تحليل حركات وتقنيات اللاعبين، ويمكن لتجزئة المثيلات فصل كل لاعب عن الخلفية، مما يضيف دقة إلى التحليل.
تخلق مهام الرؤية الحاسوبية التي تدعمها YOLO11 معًا صورة كاملة لما يحدث أثناء اللعبة، مما يمنح الفرق رؤى أعمق حول أداء اللاعبين والتكتيكات والاستراتيجية الشاملة.
الآن بعد أن ألقينا نظرة على مهام رؤية الكمبيوتر، دعنا نتعمق في فهم كل مهمة يدعمها YOLO11 بمزيد من التفصيل، باستخدام أمثلة واقعية.
عندما تنظر إلى صورة، يمكن لمعظم الناس بسهولة معرفة ما إذا كانت تظهر كلبًا أو جبلًا أو علامة مرور لأننا تعلمنا جميعًا كيف تبدو هذه الأشياء عادةً. يساعد تصنيف الصور الآلات على فعل الشيء نفسه عن طريق تعليمها كيفية تصنيف صورة وتسميتها بناءً على كائنها الرئيسي - سواء كانت "سيارة" أو "موزة" أو "صورة أشعة سينية مع كسر". تساعد هذه التسمية أنظمة رؤية الكمبيوتر على فهم المحتوى المرئي حتى تتمكن من الاستجابة أو اتخاذ القرارات وفقًا لذلك.
أحد التطبيقات المثيرة للاهتمام لمهمة رؤية الكمبيوتر هذه هو مراقبة الحياة البرية. يمكن استخدام تصنيف الصور لتحديد أنواع الحيوانات المختلفة من الصور الملتقطة في البرية. من خلال تصنيف الصور تلقائيًا، يمكن للباحثين تتبع التجمعات السكانية ومراقبة أنماط الهجرة وتحديد الأنواع المهددة بالانقراض بسهولة أكبر لدعم جهود الحفظ.
في حين أن تصنيف الصور مفيد للحصول على فكرة عامة عما تحتويه الصورة، إلا أنه يعين تسمية واحدة فقط للصورة بأكملها. في الحالات التي تتطلب معلومات مفصلة، مثل الموقع الدقيق وهوية كائنات متعددة، يصبح اكتشاف الكائنات ضروريًا.
الكشف عن الأجسام هو عملية تحديد وتعيين مواقع الأجسام الفردية داخل الصورة، غالبًا عن طريق رسم مربعات إحاطة حولها. يتفوق Ultralytics YOLO11 بشكل خاص في الكشف عن الأجسام في الوقت الفعلي، مما يجعله مثاليًا لمجموعة واسعة من التطبيقات.
خذ على سبيل المثال حلول الرؤية الحاسوبية المستخدمة في متاجر البيع بالتجزئة لتخزين الرفوف. يمكن أن يساعد اكتشاف الأجسام في عد الفواكه والخضروات والمواد الأخرى، مما يضمن جردًا دقيقًا. في الحقول الزراعية، يمكن لنفس التكنولوجيا مراقبة نضج المحاصيل لمساعدة المزارعين على تحديد أفضل وقت للحصاد، حتى أنها تميز بين المنتجات الناضجة وغير الناضجة.
يستخدم الكشف عن الأجسام مربعات الإحاطة لتحديد وتعيين مواقع الأجسام في الصورة، ولكنه لا يلتقط أشكالها الدقيقة. هذا هو المكان الذي يأتي فيه تقسيم المثيلات. بدلاً من رسم مربع حول جسم ما، يتتبع تقسيم المثيلات محيطه الدقيق.
يمكنك التفكير في الأمر على النحو التالي: بدلاً من مجرد الإشارة إلى أنه "توجد تفاحة في هذه المنطقة"، فإنه يحدد بعناية الشكل الدقيق للتفاحة ويملأه. تساعد هذه العملية التفصيلية أنظمة الذكاء الاصطناعي على فهم حدود الكائن بوضوح، خاصة عندما تكون الكائنات متقاربة من بعضها البعض.
يمكن تطبيق تجزئة المثيل على العديد من التطبيقات، من عمليات فحص البنية التحتية إلى المسوحات الجيولوجية. على سبيل المثال، يمكن تحليل البيانات من المسوحات الجيولوجية باستخدام YOLO11 لتقسيم كل من الشقوق أو التشوهات السطحية الكبيرة والصغيرة. من خلال رسم حدود دقيقة حول هذه الحالات الشاذة، يمكن للمهندسين تحديد المشكلات ومعالجتها قبل بدء المشروع.
حتى الآن، تركز مهام الرؤية الحاسوبية التي نظرنا إليها على محتوى صورة واحدة. ومع ذلك، عندما يتعلق الأمر بمقاطع الفيديو، نحتاج إلى رؤى تتجاوز إطارًا واحدًا. يمكن استخدام مهمة تتبع الكائنات لهذا الغرض.
تستطيع خاصية تتبع الكائنات في YOLO11 تتبع كائن معين، مثل شخص أو سيارة، أثناء تحركه عبر سلسلة من إطارات الفيديو. حتى إذا تغيرت زاوية الكاميرا أو ظهرت كائنات أخرى، يواصل النظام تتبع الهدف نفسه.
هذا أمر بالغ الأهمية للتطبيقات التي تتطلب المراقبة بمرور الوقت، مثل تتبع السيارات في حركة المرور. في الواقع، يمكن لـ YOLO11 تتبع المركبات بدقة، ومتابعة كل سيارة للمساعدة في تقدير سرعتها في الوقت الفعلي. هذا يجعل تتبع الكائنات مكونًا رئيسيًا في أنظمة مثل مراقبة حركة المرور.
الأجسام في العالم الحقيقي ليست دائمًا محاذاة تمامًا - يمكن أن تكون مائلة أو جانبية أو في زوايا غريبة. على سبيل المثال، في صور الأقمار الصناعية، غالبًا ما تظهر السفن والمباني مستدارة.
تستخدم طرق الكشف عن الكائنات التقليدية مربعات مستطيلة ثابتة لا تتكيف مع اتجاه الكائن، مما يجعل من الصعب التقاط هذه الأشكال المدورة بدقة. يكشف الصندوق المحيط الموجه (OBB) يحل هذه المشكلة باستخدام مربعات تدور لتناسب بشكل مريح حول الكائن، وتتماشى مع زاويته للكشف الأكثر دقة.
فيما يتعلق بمراقبة الموانئ، يمكن لدعم YOLO11 لاكتشاف OBB أن يساعد في تحديد وتتبع السفن بدقة بغض النظر عن اتجاهها، مما يضمن مراقبة كل سفينة تدخل الميناء أو تغادره بشكل صحيح. يوفر هذا الاكتشاف الدقيق معلومات في الوقت الفعلي عن مواقع السفن وحركاتها، وهو أمر بالغ الأهمية لإدارة الموانئ المزدحمة ومنع الاصطدامات.
تقدير الوضعية هو أسلوب رؤية حاسوبية يتتبع النقاط الرئيسية، مثل المفاصل أو الأطراف أو العلامات الأخرى، لفهم كيفية تحرك الجسم. بدلاً من التعامل مع الجسم بأكمله كوحدة كاملة واحدة، تقسمه هذه الطريقة إلى أجزائه الرئيسية. وهذا يجعل من الممكن تحليل الحركات والإيماءات والتفاعلات بالتفصيل.
أحد التطبيقات الشائعة لهذه التقنية هو تقدير وضعية الإنسان. من خلال تتبع مواضع أجزاء الجسم المختلفة في الوقت الفعلي، فإنه يوفر صورة واضحة لكيفية تحرك الشخص. يمكن استخدام هذه المعلومات لمجموعة متنوعة من الأغراض، من التعرف على الإيماءات ومراقبة النشاط إلى تحليل الأداء في الألعاب الرياضية.
وبالمثل، في إعادة التأهيل البدني، يمكن للمعالجين استخدام تقدير وضعية الإنسان و YOLO11 لمراقبة حركات المرضى أثناء التمارين. يساعد هذا في التأكد من أن كل حركة تتم بشكل صحيح مع تتبع التقدم بمرور الوقت.
الآن بعد أن استكشفنا جميع مهام رؤية الكمبيوتر التي يدعمها YOLO11 بالتفصيل، دعنا نستعرض كيف يدعمها YOLO11.
YOLO11 ليس مجرد نموذج واحد - بل هو مجموعة من متغيرات النماذج المتخصصة، تم تصميم كل منها لمهمة رؤية حاسوبية محددة. هذا يجعل YOLO11 أداة متعددة الاستخدامات يمكن تكييفها مع مجموعة واسعة من التطبيقات. يمكنك أيضًا ضبط هذه النماذج بدقة على مجموعات البيانات المخصصة لمعالجة التحديات الفريدة لمشاريعك.
إليك متغيرات نموذج YOLO11 المدربة مسبقًا لمهام رؤية محددة:
يتوفر كل متغير بأحجام مختلفة، مما يسمح للمستخدمين باختيار التوازن الصحيح بين السرعة والدقة لتلبية احتياجاتهم الخاصة.
تغير مهام الرؤية الحاسوبية الطريقة التي تفهم بها الآلات العالم وتتفاعل معه. من خلال تقسيم الصور ومقاطع الفيديو إلى عناصر أساسية، تسهل هذه التقنيات تحليل الكائنات والحركات والتفاعلات بالتفصيل.
من تحسين السلامة المرورية والأداء الرياضي إلى تبسيط العمليات الصناعية، يمكن لنماذج مثل YOLO11 توفير رؤى في الوقت الفعلي تدفع الابتكار. مع استمرار تطور الرؤية الحاسوبية، فمن المحتمل أن تلعب دورًا متزايد الأهمية في كيفية تفسيرنا واستخدامنا للبيانات المرئية كل يوم.
انضم إلى مجتمعنا وقم بزيارة مستودع GitHub الخاص بنا لرؤية الذكاء الاصطناعي قيد التنفيذ. استكشف خيارات الترخيص الخاصة بنا واكتشف المزيد حول الذكاء الاصطناعي في الزراعة و الرؤية الحاسوبية في التصنيع في صفحات الحلول الخاصة بنا.