استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024

دليل للتعمق في اكتشاف الكائنات في عام 2025

أبيرامي فينا

6 دقائق قراءة

6 فبراير، 2025

تعرف على اكتشاف الكائنات وأهميته في الذكاء الاصطناعي وكيف تقوم نماذج مثل YOLO11 بتحويل صناعات مثل السيارات ذاتية القيادة والرعاية الصحية والأمن.

تقوم العديد من الصناعات بدمج حلول الذكاء الاصطناعي (AI) بسرعة في عملياتها. من بين العديد من تقنيات الذكاء الاصطناعي المتاحة اليوم، تعد رؤية الكمبيوتر واحدة من أكثر التقنيات شيوعًا. رؤية الكمبيوتر هي فرع من فروع الذكاء الاصطناعي يساعد أجهزة الكمبيوتر على رؤية وفهم محتويات الصور ومقاطع الفيديو، تمامًا كما يفعل البشر. فهو يمكّن الآلات من التعرف على الكائنات وتحديد الأنماط وفهم ما تنظر إليه. 

تشير التقديرات إلى أن القيمة السوقية العالمية لرؤية الكمبيوتر ستنمو إلى 175.72 مليار دولار بحلول عام 2032. تشمل رؤية الكمبيوتر مهام متنوعة تمكن أنظمة Vision AI من تحليل وتفسير البيانات المرئية. يعد اكتشاف الكائنات أحد المهام الأكثر استخدامًا وأساسية في رؤية الكمبيوتر. 

يركز اكتشاف الكائنات على تحديد وتصنيف الكائنات في البيانات المرئية. على سبيل المثال، إذا عرضت على جهاز كمبيوتر صورة لبقرة، فيمكنه اكتشاف البقرة ورسم مربع إحاطة حولها. هذه القدرة مفيدة في التطبيقات الواقعية مثل مراقبة الحيوانات والسيارات ذاتية القيادة والمراقبة. 

إذًا، كيف يمكن إجراء اكتشاف الكائنات؟ إحدى الطرق هي من خلال نماذج رؤية الكمبيوتر. على سبيل المثال، Ultralytics YOLO11 هو نموذج رؤية كمبيوتر يدعم مهام رؤية الكمبيوتر مثل اكتشاف الكائنات. 

في هذا الدليل، سنستكشف اكتشاف الكائنات وكيفية عمله. سنناقش أيضًا بعض التطبيقات الواقعية لاكتشاف الكائنات و Ultralytics YOLO11.

__wf_reserved_inherit
الشكل 1. استخدام دعم YOLO11 لاكتشاف الكائنات لمراقبة الماشية.

ما هو اكتشاف الكائنات؟ 

اكتشاف الكائنات هو مهمة رؤية الكمبيوتر التي تحدد وتحدد مواقع الكائنات في الصور أو مقاطع الفيديو. يجيب على سؤالين رئيسيين: 'ما هي الكائنات الموجودة في الصورة؟' و 'أين تقع؟'

يمكنك التفكير في اكتشاف الكائنات على أنه عملية تتضمن خطوتين رئيسيتين. تسمح الخطوة الأولى، وهي تصنيف الكائنات، للنظام بالتعرف على الكائنات وتسميتها، مثل تحديد قطة أو سيارة أو شخص بناءً على الأنماط التي تم تعلمها. تحدد الخطوة الثانية، وهي تحديد الموقع، موضع الكائن عن طريق رسم مربع إحاطة حوله، مما يشير إلى مكانه في الصورة. معًا، تمكن هذه الخطوات الآلات من اكتشاف وفهم الكائنات في المشهد.

الجانب الذي يميز اكتشاف الكائنات هو قدرته على التعرف على الكائنات وتحديد موقعها بدقة. تركز مهام رؤية الكمبيوتر الأخرى على أهداف مختلفة.

على سبيل المثال، يقوم تصنيف الصور بتعيين تسمية لصورة كاملة. وفي الوقت نفسه، يوفر تجزئة الصور فهمًا على مستوى البكسل للعناصر المختلفة. من ناحية أخرى، يجمع اكتشاف الكائنات بين التعرف وتحديد الموقع. وهذا يجعله مفيدًا بشكل خاص لمهام مثل عد الكائنات المتعددة في الوقت الفعلي.

__wf_reserved_inherit
الشكل 2. مقارنة مهام رؤية الكمبيوتر.

التعرف على الكائنات مقابل اكتشاف الكائنات

أثناء استكشاف مصطلحات رؤية الكمبيوتر المختلفة، قد تشعر أن التعرف على الكائنات واكتشاف الكائنات قابلان للتبديل - لكنهما يخدمان أغراضًا مختلفة. تتمثل إحدى الطرق الرائعة لفهم الفرق في النظر إلى اكتشاف الوجه والتعرف على الوجه.

اكتشاف الوجوه هو نوع من أنواع اكتشاف الكائنات. يحدد وجود وجه في صورة ويحدد موقعه باستخدام مربع إحاطة. يجيب على السؤال: “أين الوجه في الصورة؟” تُستخدم هذه التقنية بشكل شائع في كاميرات الهواتف الذكية التي تركز تلقائيًا على الوجوه أو في كاميرات المراقبة التي تكتشف وجود شخص ما.

من ناحية أخرى، التعرف على الوجوه هو شكل من أشكال التعرف على الكائنات. لا يقتصر الأمر على اكتشاف وجه فحسب؛ بل يحدد هوية هذا الوجه من خلال تحليل السمات الفريدة ومقارنتها بقاعدة بيانات. يجيب على السؤال: “من هذا الشخص؟” هذه هي التقنية الكامنة وراء فتح هاتفك باستخدام Face ID أو أنظمة أمن المطارات التي تتحقق من الهويات.

ببساطة، يجد اكتشاف الكائنات الكائنات ويحدد مواقعها، بينما يصنف التعرف على الكائنات الكائنات ويحدد هويتها. 

__wf_reserved_inherit
الشكل 3. اكتشاف الكائنات مقابل التعرف على الكائنات. صورة للمؤلف.

تم تصميم العديد من نماذج اكتشاف الكائنات، مثل YOLO11، لدعم اكتشاف الوجوه ولكن ليس التعرف على الوجوه. يمكن لـ YOLO11 تحديد وجود وجه في صورة بكفاءة ورسم مربع إحاطة حوله، مما يجعله مفيدًا لتطبيقات مثل أنظمة المراقبة ومراقبة الحشود ووضع علامات تلقائية على الصور. ومع ذلك، لا يمكنه تحديد هوية هذا الوجه. يمكن دمج YOLO11 مع نماذج مدربة خصيصًا للتعرف على الوجوه، مثل Facenet أو DeepFace، لتمكين كل من الاكتشاف والتعرف في نظام واحد.

فهم كيفية عمل اكتشاف الكائنات

قبل أن نناقش كيفية عمل اكتشاف الكائنات، دعنا أولاً نلقي نظرة فاحصة على كيفية تحليل الكمبيوتر للصورة. بدلاً من رؤية الصورة كما نفعل، يقسمها الكمبيوتر إلى شبكة من المربعات الصغيرة تسمى وحدات البكسل. تحتوي كل وحدة بكسل على معلومات اللون والسطوع التي يمكن لأجهزة الكمبيوتر معالجتها لتفسير البيانات المرئية.

لفهم هذه البكسلات، تقوم الخوارزميات بتجميعها في مناطق ذات معنى بناءً على الشكل واللون ومدى قربها من بعضها البعض. يمكن لنماذج اكتشاف الكائنات، مثل YOLO11، التعرف على الأنماط أو الميزات في مجموعات البكسل هذه. 

على سبيل المثال، لا ترى السيارة ذاتية القيادة أحد المشاة بالطريقة التي نراها بها - فهي تكتشف الأشكال والأنماط التي تتطابق مع ميزات أحد المشاة. تعتمد هذه النماذج على تدريب مكثف باستخدام مجموعات بيانات الصور المصنفة، مما يسمح لها بتعلم الخصائص المميزة للكائنات مثل السيارات وإشارات المرور والأشخاص.

يحتوي نموذج اكتشاف الكائنات النموذجي على ثلاثة أجزاء رئيسية: العمود الفقري والعنق والرأس. يستخرج العمود الفقري ميزات مهمة من الصورة. يعالج العنق هذه الميزات ويحسنها، بينما الرأس مسؤول عن التنبؤ بمواقع الكائنات وتصنيفها.

تحسين عمليات الكشف وتقديم النتائج

بمجرد إجراء عمليات الكشف الأولية، يتم تطبيق تقنيات المعالجة اللاحقة لتحسين الدقة وتصفية التنبؤات الزائدة. على سبيل المثال، تتم إزالة مربعات الإحاطة المتداخلة، مما يضمن الاحتفاظ بعمليات الكشف الأكثر صلة فقط. أيضًا، يتم تعيين درجات الثقة (قيم رقمية تمثل مدى تأكد النموذج من أن كائنًا تم اكتشافه ينتمي إلى فئة معينة) لكل كائن تم اكتشافه للإشارة إلى يقين النموذج في تنبؤاته.

أخيرًا، يتم تقديم الإخراج مع مربعات إحاطة مرسومة حول الكائنات التي تم اكتشافها، جنبًا إلى جنب مع تسميات الفئات المتوقعة ودرجات الثقة. يمكن بعد ذلك استخدام هذه النتائج للتطبيقات الواقعية.

نماذج اكتشاف الكائنات الشائعة 

في الوقت الحاضر، هناك العديد من نماذج رؤية الكمبيوتر المتاحة، وبعض من أكثرها شيوعًا هي نماذج Ultralytics YOLO. وهي معروفة بسرعتها ودقتها وتعدد استخداماتها. على مر السنين، أصبحت هذه النماذج أسرع وأكثر دقة وقادرة على التعامل مع مجموعة واسعة من المهام. لقد سهّل إصدار Ultralytics YOLOv5 النشر باستخدام أطر عمل مثل PyTorch، مما سمح لعدد أكبر من الأشخاص باستخدام Vision AI المتقدمة دون الحاجة إلى خبرة فنية عميقة.

بالاعتماد على هذا الأساس، قدم Ultralytics YOLOv8 ميزات جديدة مثل تجزئة المثيل وتقدير الوضع وتصنيف الصور. الآن، YOLO11 يأخذ الأمور إلى أبعد من ذلك مع أداء أفضل عبر مهام متعددة. مع عدد أقل من المعلمات بنسبة 22٪ من YOLOv8m، يحقق YOLO11m متوسط دقة أعلى (mAP) على مجموعة بيانات COCO. بعبارات بسيطة، يمكن لـ YOLO11 التعرف على الكائنات بدقة أكبر مع استخدام موارد أقل، مما يجعله أسرع وأكثر موثوقية.

سواء كنت خبيرًا في الذكاء الاصطناعي أو بدأت للتو، فإن YOLO11 يقدم حلاً قويًا وسهل الاستخدام لتطبيقات رؤية الكمبيوتر.

تدريب نموذج مخصص لاكتشاف الكائنات

يتضمن تدريب نماذج Vision AI مساعدة أجهزة الكمبيوتر على التعرف على الصور ومقاطع الفيديو وفهمها. ومع ذلك، يمكن أن يكون التدريب عملية تستغرق وقتًا طويلاً. بدلاً من البدء من الصفر، يعمل التعلم بالنقل على تسريع الأمور باستخدام نماذج مدربة مسبقًا تتعرف بالفعل على الأنماط الشائعة.

على سبيل المثال، تم بالفعل تدريب YOLO11 على مجموعة بيانات COCO، التي تحتوي على مجموعة متنوعة من الكائنات اليومية. يمكن زيادة تدريب هذا النموذج المدرب مسبقًا بشكل مخصص لاكتشاف كائنات معينة قد لا تكون مضمنة في مجموعة البيانات الأصلية. 

لـ التدريب المخصص لـ YOLO11، تحتاج إلى مجموعة بيانات مصنفة تحتوي على صور للكائنات التي تريد اكتشافها. على سبيل المثال، إذا كنت ترغب في إنشاء نموذج لتحديد أنواع مختلفة من الفاكهة في متجر بقالة، فستقوم بإنشاء مجموعة بيانات تحتوي على صور مصنفة للتفاح والموز والبرتقال وما إلى ذلك. بمجرد إعداد مجموعة البيانات، يمكن تدريب YOLO11، وتعديل معلمات مثل حجم الدفعة ومعدل التعلم والحقب لتحسين الأداء.

باستخدام هذا النهج، يمكن للشركات تدريب YOLO11 على اكتشاف أي شيء، من الأجزاء المعيبة في التصنيع إلى أنواع الحياة البرية في مشاريع الحفظ، وتخصيص النموذج ليناسب احتياجاتها الدقيقة.

تطبيقات اكتشاف الكائنات

بعد ذلك، دعنا نلقي نظرة على بعض حالات الاستخدام الواقعية لاكتشاف الكائنات وكيف أنها تحول الصناعات المختلفة.

اكتشاف المخاطر للقيادة الذاتية

تستخدم السيارات ذاتية القيادة مهام الرؤية الحاسوبية مثل اكتشاف الأجسام للتنقل بأمان وتجنب العوائق. تساعد هذه التقنية في التعرف على المشاة والمركبات الأخرى والحفر ومخاطر الطريق، مما يجعل من الممكن فهم محيطها بشكل أفضل. يمكنهم اتخاذ قرارات سريعة والتحرك بأمان عبر حركة المرور من خلال التحليل المستمر لبيئتهم.

__wf_reserved_inherit
الشكل 4. مثال على استخدام اكتشاف الأجسام للكشف عن الحفر باستخدام YOLO11.

تحليل التصوير الطبي في مجال الرعاية الصحية

تقنيات التصوير الطبي مثل الأشعة السينية والتصوير بالرنين المغناطيسي والتصوير المقطعي المحوسب والموجات فوق الصوتية تخلق صورًا مفصلة للغاية لجسم الإنسان للمساعدة في تشخيص الأمراض وعلاجها. تنتج هذه الفحوصات كميات كبيرة من البيانات التي يجب على الأطباء، مثل أخصائيي الأشعة وعلماء الأمراض، تحليلها بعناية للكشف عن الأمراض. ومع ذلك، يمكن أن يستغرق فحص كل صورة بالتفصيل وقتًا طويلاً، وقد يفوت الخبراء البشريون أحيانًا التفاصيل بسبب التعب أو ضيق الوقت.

يمكن لنماذج اكتشاف الأجسام مثل YOLO11 المساعدة من خلال التحديد التلقائي للميزات الرئيسية في الفحوصات الطبية، مثل الأعضاء أو الأورام أو التشوهات، بدقة عالية. يمكن للنماذج المدربة خصيصًا تسليط الضوء على المناطق المثيرة للقلق باستخدام مربعات إحاطة، مما يساعد الأطباء على التركيز على المشكلات المحتملة بشكل أسرع. وهذا يقلل من عبء العمل ويحسن الكفاءة ويوفر رؤى سريعة.

__wf_reserved_inherit
الشكل 5. تحليل الصور الطبية باستخدام YOLO11.

زيادة الأمان من خلال اكتشاف الأشخاص والحالات الشاذة

تتبع الأجسام هي مهمة رؤية حاسوبية مدعومة من YOLO11، مما يتيح المراقبة في الوقت الفعلي وتعزيزات الأمان. يعتمد على اكتشاف الأجسام من خلال تحديد الأجسام وتتبع حركتها باستمرار عبر الإطارات. تستخدم هذه التقنية على نطاق واسع في أنظمة المراقبة لتحسين السلامة في البيئات المختلفة.

على سبيل المثال، في المدارس ومراكز الرعاية النهارية، يمكن أن يساعد تتبع الأجسام في مراقبة الأطفال ومنعهم من الابتعاد. في تطبيقات الأمان، يلعب دورًا رئيسيًا في اكتشاف المتسللين في المناطق المحظورة، ومراقبة الحشود بحثًا عن الاكتظاظ أو السلوك المشبوه، وإرسال تنبيهات في الوقت الفعلي عند اكتشاف نشاط غير مصرح به. من خلال تتبع الأجسام أثناء تحركها، تعمل أنظمة التتبع المدعومة من YOLO11 على تحسين الأمان وأتمتة المراقبة والسماح باستجابات أسرع للتهديدات المحتملة.

إيجابيات وسلبيات اكتشاف الأجسام

فيما يلي بعض الفوائد الرئيسية التي يمكن أن يجلبها اكتشاف الأجسام إلى مختلف الصناعات:

  • الأتمتة: يمكن أن يساعد اكتشاف الأجسام في تقليل الحاجة إلى الإشراف البشري في مهام مثل مراقبة لقطات كاميرات المراقبة.
  • يعمل مع نماذج الذكاء الاصطناعي الأخرى: يمكن دمجه مع أنظمة التعرف على الوجوه والتعرف على الإجراءات وأنظمة التتبع لتحسين الدقة والوظائف.
  • المعالجة في الوقت الفعلي: العديد من نماذج اكتشاف الأجسام، مثل YOLO11، سريعة وفعالة، مما يجعلها مثالية للتطبيقات في الوقت الفعلي التي تتطلب نتائج فورية. 

في حين أن هذه الفوائد تسلط الضوء على كيفية تأثير اكتشاف الأجسام على حالات الاستخدام المختلفة، فمن المهم أيضًا مراعاة التحديات التي ينطوي عليها تنفيذه. فيما يلي بعض التحديات الرئيسية:

  • خصوصية البيانات: قد يثير استخدام البيانات المرئية، خاصة في المناطق الحساسة مثل المراقبة أو الرعاية الصحية، مشكلات تتعلق بالخصوصية والمخاوف الأمنية.
  • الانسداد: يحدث الانسداد في اكتشاف الأجسام عندما يتم حجب الأجسام جزئيًا أو إخفاؤها عن الأنظار، مما يجعل من الصعب على النموذج اكتشافها وتصنيفها بدقة.
  • مكلف حسابيًا: غالبًا ما تتطلب النماذج عالية الأداء وحدات معالجة رسومات قوية (وحدات معالجة الرسوميات) للمعالجة، مما يجعل النشر في الوقت الفعلي مكلفًا.

النقاط الرئيسية

اكتشاف الأجسام هو أداة تغير قواعد اللعبة في الرؤية الحاسوبية تساعد الآلات على اكتشاف وتحديد مواقع الأجسام في الصور ومقاطع الفيديو. يتم استخدامه في قطاعات من السيارات ذاتية القيادة إلى الرعاية الصحية، مما يجعل المهام أسهل وأكثر أمانًا وكفاءة. مع النماذج الأحدث مثل YOLO11، يمكن للشركات بسهولة إنشاء نماذج مخصصة لاكتشاف الأجسام لإنشاء تطبيقات رؤية حاسوبية متخصصة. 

في حين أن هناك بعض التحديات، مثل المخاوف المتعلقة بالخصوصية وإخفاء الأجسام عن الأنظار، فإن اكتشاف الأجسام هو تقنية موثوقة. إن قدرتها على أتمتة المهام ومعالجة البيانات المرئية في الوقت الفعلي والتكامل مع أدوات Vision AI الأخرى تجعلها جزءًا أساسيًا من الابتكارات المتطورة.

لمعرفة المزيد، قم بزيارة مستودع GitHub الخاص بنا وتفاعل مع مجتمعنا. استكشف الابتكارات في قطاعات مثل الذكاء الاصطناعي في السيارات ذاتية القيادة و الرؤية الحاسوبية في الزراعة في صفحات الحلول الخاصة بنا. تحقق من خيارات ترخيص yolo الخاصة بنا واجعل مشاريع Vision AI الخاصة بك تنبض بالحياة. 🚀

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا
تم نسخ الرابط إلى الحافظة