تعرف على اكتشاف الكائنات وأهميته في الذكاء الاصطناعي وكيف تقوم نماذج مثل YOLO11 بتحويل صناعات مثل السيارات ذاتية القيادة والرعاية الصحية والأمن.

تعرف على اكتشاف الكائنات وأهميته في الذكاء الاصطناعي وكيف تقوم نماذج مثل YOLO11 بتحويل صناعات مثل السيارات ذاتية القيادة والرعاية الصحية والأمن.
تقوم العديد من الصناعات بدمج حلول الذكاء الاصطناعي (AI) بسرعة في عملياتها. من بين العديد من تقنيات الذكاء الاصطناعي المتاحة اليوم، تعد رؤية الكمبيوتر واحدة من أكثر التقنيات شيوعًا. رؤية الكمبيوتر هي فرع من فروع الذكاء الاصطناعي يساعد أجهزة الكمبيوتر على رؤية وفهم محتويات الصور ومقاطع الفيديو، تمامًا كما يفعل البشر. فهو يمكّن الآلات من التعرف على الكائنات وتحديد الأنماط وفهم ما تنظر إليه.
تشير التقديرات إلى أن القيمة السوقية العالمية لرؤية الكمبيوتر ستنمو إلى 175.72 مليار دولار بحلول عام 2032. تشمل رؤية الكمبيوتر مهام متنوعة تمكن أنظمة Vision AI من تحليل وتفسير البيانات المرئية. يعد اكتشاف الكائنات أحد المهام الأكثر استخدامًا وأساسية في رؤية الكمبيوتر.
يركز اكتشاف الكائنات على تحديد وتصنيف الكائنات في البيانات المرئية. على سبيل المثال، إذا عرضت على جهاز كمبيوتر صورة لبقرة، فيمكنه اكتشاف البقرة ورسم مربع إحاطة حولها. هذه القدرة مفيدة في التطبيقات الواقعية مثل مراقبة الحيوانات والسيارات ذاتية القيادة والمراقبة.
إذًا، كيف يمكن إجراء اكتشاف الكائنات؟ إحدى الطرق هي من خلال نماذج رؤية الكمبيوتر. على سبيل المثال، Ultralytics YOLO11 هو نموذج رؤية كمبيوتر يدعم مهام رؤية الكمبيوتر مثل اكتشاف الكائنات.
في هذا الدليل، سنستكشف اكتشاف الكائنات وكيفية عمله. سنناقش أيضًا بعض التطبيقات الواقعية لاكتشاف الكائنات و Ultralytics YOLO11.
اكتشاف الكائنات هو مهمة رؤية الكمبيوتر التي تحدد وتحدد مواقع الكائنات في الصور أو مقاطع الفيديو. يجيب على سؤالين رئيسيين: 'ما هي الكائنات الموجودة في الصورة؟' و 'أين تقع؟'
يمكنك التفكير في اكتشاف الكائنات على أنه عملية تتضمن خطوتين رئيسيتين. تسمح الخطوة الأولى، وهي تصنيف الكائنات، للنظام بالتعرف على الكائنات وتسميتها، مثل تحديد قطة أو سيارة أو شخص بناءً على الأنماط التي تم تعلمها. تحدد الخطوة الثانية، وهي تحديد الموقع، موضع الكائن عن طريق رسم مربع إحاطة حوله، مما يشير إلى مكانه في الصورة. معًا، تمكن هذه الخطوات الآلات من اكتشاف وفهم الكائنات في المشهد.
الجانب الذي يميز اكتشاف الكائنات هو قدرته على التعرف على الكائنات وتحديد موقعها بدقة. تركز مهام رؤية الكمبيوتر الأخرى على أهداف مختلفة.
على سبيل المثال، يقوم تصنيف الصور بتعيين تسمية لصورة كاملة. وفي الوقت نفسه، يوفر تجزئة الصور فهمًا على مستوى البكسل للعناصر المختلفة. من ناحية أخرى، يجمع اكتشاف الكائنات بين التعرف وتحديد الموقع. وهذا يجعله مفيدًا بشكل خاص لمهام مثل عد الكائنات المتعددة في الوقت الفعلي.
أثناء استكشاف مصطلحات رؤية الكمبيوتر المختلفة، قد تشعر أن التعرف على الكائنات واكتشاف الكائنات قابلان للتبديل - لكنهما يخدمان أغراضًا مختلفة. تتمثل إحدى الطرق الرائعة لفهم الفرق في النظر إلى اكتشاف الوجه والتعرف على الوجه.
اكتشاف الوجوه هو نوع من أنواع اكتشاف الكائنات. يحدد وجود وجه في صورة ويحدد موقعه باستخدام مربع إحاطة. يجيب على السؤال: “أين الوجه في الصورة؟” تُستخدم هذه التقنية بشكل شائع في كاميرات الهواتف الذكية التي تركز تلقائيًا على الوجوه أو في كاميرات المراقبة التي تكتشف وجود شخص ما.
من ناحية أخرى، التعرف على الوجوه هو شكل من أشكال التعرف على الكائنات. لا يقتصر الأمر على اكتشاف وجه فحسب؛ بل يحدد هوية هذا الوجه من خلال تحليل السمات الفريدة ومقارنتها بقاعدة بيانات. يجيب على السؤال: “من هذا الشخص؟” هذه هي التقنية الكامنة وراء فتح هاتفك باستخدام Face ID أو أنظمة أمن المطارات التي تتحقق من الهويات.
ببساطة، يجد اكتشاف الكائنات الكائنات ويحدد مواقعها، بينما يصنف التعرف على الكائنات الكائنات ويحدد هويتها.
تم تصميم العديد من نماذج اكتشاف الكائنات، مثل YOLO11، لدعم اكتشاف الوجوه ولكن ليس التعرف على الوجوه. يمكن لـ YOLO11 تحديد وجود وجه في صورة بكفاءة ورسم مربع إحاطة حوله، مما يجعله مفيدًا لتطبيقات مثل أنظمة المراقبة ومراقبة الحشود ووضع علامات تلقائية على الصور. ومع ذلك، لا يمكنه تحديد هوية هذا الوجه. يمكن دمج YOLO11 مع نماذج مدربة خصيصًا للتعرف على الوجوه، مثل Facenet أو DeepFace، لتمكين كل من الاكتشاف والتعرف في نظام واحد.
قبل أن نناقش كيفية عمل اكتشاف الكائنات، دعنا أولاً نلقي نظرة فاحصة على كيفية تحليل الكمبيوتر للصورة. بدلاً من رؤية الصورة كما نفعل، يقسمها الكمبيوتر إلى شبكة من المربعات الصغيرة تسمى وحدات البكسل. تحتوي كل وحدة بكسل على معلومات اللون والسطوع التي يمكن لأجهزة الكمبيوتر معالجتها لتفسير البيانات المرئية.
لفهم هذه البكسلات، تقوم الخوارزميات بتجميعها في مناطق ذات معنى بناءً على الشكل واللون ومدى قربها من بعضها البعض. يمكن لنماذج اكتشاف الكائنات، مثل YOLO11، التعرف على الأنماط أو الميزات في مجموعات البكسل هذه.
على سبيل المثال، لا ترى السيارة ذاتية القيادة أحد المشاة بالطريقة التي نراها بها - فهي تكتشف الأشكال والأنماط التي تتطابق مع ميزات أحد المشاة. تعتمد هذه النماذج على تدريب مكثف باستخدام مجموعات بيانات الصور المصنفة، مما يسمح لها بتعلم الخصائص المميزة للكائنات مثل السيارات وإشارات المرور والأشخاص.
يحتوي نموذج اكتشاف الكائنات النموذجي على ثلاثة أجزاء رئيسية: العمود الفقري والعنق والرأس. يستخرج العمود الفقري ميزات مهمة من الصورة. يعالج العنق هذه الميزات ويحسنها، بينما الرأس مسؤول عن التنبؤ بمواقع الكائنات وتصنيفها.
بمجرد إجراء عمليات الكشف الأولية، يتم تطبيق تقنيات المعالجة اللاحقة لتحسين الدقة وتصفية التنبؤات الزائدة. على سبيل المثال، تتم إزالة مربعات الإحاطة المتداخلة، مما يضمن الاحتفاظ بعمليات الكشف الأكثر صلة فقط. أيضًا، يتم تعيين درجات الثقة (قيم رقمية تمثل مدى تأكد النموذج من أن كائنًا تم اكتشافه ينتمي إلى فئة معينة) لكل كائن تم اكتشافه للإشارة إلى يقين النموذج في تنبؤاته.
أخيرًا، يتم تقديم الإخراج مع مربعات إحاطة مرسومة حول الكائنات التي تم اكتشافها، جنبًا إلى جنب مع تسميات الفئات المتوقعة ودرجات الثقة. يمكن بعد ذلك استخدام هذه النتائج للتطبيقات الواقعية.
في الوقت الحاضر، هناك العديد من نماذج رؤية الكمبيوتر المتاحة، وبعض من أكثرها شيوعًا هي نماذج Ultralytics YOLO. وهي معروفة بسرعتها ودقتها وتعدد استخداماتها. على مر السنين، أصبحت هذه النماذج أسرع وأكثر دقة وقادرة على التعامل مع مجموعة واسعة من المهام. لقد سهّل إصدار Ultralytics YOLOv5 النشر باستخدام أطر عمل مثل PyTorch، مما سمح لعدد أكبر من الأشخاص باستخدام Vision AI المتقدمة دون الحاجة إلى خبرة فنية عميقة.
بالاعتماد على هذا الأساس، قدم Ultralytics YOLOv8 ميزات جديدة مثل تجزئة المثيل وتقدير الوضع وتصنيف الصور. الآن، YOLO11 يأخذ الأمور إلى أبعد من ذلك مع أداء أفضل عبر مهام متعددة. مع عدد أقل من المعلمات بنسبة 22٪ من YOLOv8m، يحقق YOLO11m متوسط دقة أعلى (mAP) على مجموعة بيانات COCO. بعبارات بسيطة، يمكن لـ YOLO11 التعرف على الكائنات بدقة أكبر مع استخدام موارد أقل، مما يجعله أسرع وأكثر موثوقية.
سواء كنت خبيرًا في الذكاء الاصطناعي أو بدأت للتو، فإن YOLO11 يقدم حلاً قويًا وسهل الاستخدام لتطبيقات رؤية الكمبيوتر.
يتضمن تدريب نماذج Vision AI مساعدة أجهزة الكمبيوتر على التعرف على الصور ومقاطع الفيديو وفهمها. ومع ذلك، يمكن أن يكون التدريب عملية تستغرق وقتًا طويلاً. بدلاً من البدء من الصفر، يعمل التعلم بالنقل على تسريع الأمور باستخدام نماذج مدربة مسبقًا تتعرف بالفعل على الأنماط الشائعة.
على سبيل المثال، تم بالفعل تدريب YOLO11 على مجموعة بيانات COCO، التي تحتوي على مجموعة متنوعة من الكائنات اليومية. يمكن زيادة تدريب هذا النموذج المدرب مسبقًا بشكل مخصص لاكتشاف كائنات معينة قد لا تكون مضمنة في مجموعة البيانات الأصلية.
لـ التدريب المخصص لـ YOLO11، تحتاج إلى مجموعة بيانات مصنفة تحتوي على صور للكائنات التي تريد اكتشافها. على سبيل المثال، إذا كنت ترغب في إنشاء نموذج لتحديد أنواع مختلفة من الفاكهة في متجر بقالة، فستقوم بإنشاء مجموعة بيانات تحتوي على صور مصنفة للتفاح والموز والبرتقال وما إلى ذلك. بمجرد إعداد مجموعة البيانات، يمكن تدريب YOLO11، وتعديل معلمات مثل حجم الدفعة ومعدل التعلم والحقب لتحسين الأداء.
باستخدام هذا النهج، يمكن للشركات تدريب YOLO11 على اكتشاف أي شيء، من الأجزاء المعيبة في التصنيع إلى أنواع الحياة البرية في مشاريع الحفظ، وتخصيص النموذج ليناسب احتياجاتها الدقيقة.
بعد ذلك، دعنا نلقي نظرة على بعض حالات الاستخدام الواقعية لاكتشاف الكائنات وكيف أنها تحول الصناعات المختلفة.
تستخدم السيارات ذاتية القيادة مهام الرؤية الحاسوبية مثل اكتشاف الأجسام للتنقل بأمان وتجنب العوائق. تساعد هذه التقنية في التعرف على المشاة والمركبات الأخرى والحفر ومخاطر الطريق، مما يجعل من الممكن فهم محيطها بشكل أفضل. يمكنهم اتخاذ قرارات سريعة والتحرك بأمان عبر حركة المرور من خلال التحليل المستمر لبيئتهم.
تقنيات التصوير الطبي مثل الأشعة السينية والتصوير بالرنين المغناطيسي والتصوير المقطعي المحوسب والموجات فوق الصوتية تخلق صورًا مفصلة للغاية لجسم الإنسان للمساعدة في تشخيص الأمراض وعلاجها. تنتج هذه الفحوصات كميات كبيرة من البيانات التي يجب على الأطباء، مثل أخصائيي الأشعة وعلماء الأمراض، تحليلها بعناية للكشف عن الأمراض. ومع ذلك، يمكن أن يستغرق فحص كل صورة بالتفصيل وقتًا طويلاً، وقد يفوت الخبراء البشريون أحيانًا التفاصيل بسبب التعب أو ضيق الوقت.
يمكن لنماذج اكتشاف الأجسام مثل YOLO11 المساعدة من خلال التحديد التلقائي للميزات الرئيسية في الفحوصات الطبية، مثل الأعضاء أو الأورام أو التشوهات، بدقة عالية. يمكن للنماذج المدربة خصيصًا تسليط الضوء على المناطق المثيرة للقلق باستخدام مربعات إحاطة، مما يساعد الأطباء على التركيز على المشكلات المحتملة بشكل أسرع. وهذا يقلل من عبء العمل ويحسن الكفاءة ويوفر رؤى سريعة.
تتبع الأجسام هي مهمة رؤية حاسوبية مدعومة من YOLO11، مما يتيح المراقبة في الوقت الفعلي وتعزيزات الأمان. يعتمد على اكتشاف الأجسام من خلال تحديد الأجسام وتتبع حركتها باستمرار عبر الإطارات. تستخدم هذه التقنية على نطاق واسع في أنظمة المراقبة لتحسين السلامة في البيئات المختلفة.
على سبيل المثال، في المدارس ومراكز الرعاية النهارية، يمكن أن يساعد تتبع الأجسام في مراقبة الأطفال ومنعهم من الابتعاد. في تطبيقات الأمان، يلعب دورًا رئيسيًا في اكتشاف المتسللين في المناطق المحظورة، ومراقبة الحشود بحثًا عن الاكتظاظ أو السلوك المشبوه، وإرسال تنبيهات في الوقت الفعلي عند اكتشاف نشاط غير مصرح به. من خلال تتبع الأجسام أثناء تحركها، تعمل أنظمة التتبع المدعومة من YOLO11 على تحسين الأمان وأتمتة المراقبة والسماح باستجابات أسرع للتهديدات المحتملة.
فيما يلي بعض الفوائد الرئيسية التي يمكن أن يجلبها اكتشاف الأجسام إلى مختلف الصناعات:
في حين أن هذه الفوائد تسلط الضوء على كيفية تأثير اكتشاف الأجسام على حالات الاستخدام المختلفة، فمن المهم أيضًا مراعاة التحديات التي ينطوي عليها تنفيذه. فيما يلي بعض التحديات الرئيسية:
اكتشاف الأجسام هو أداة تغير قواعد اللعبة في الرؤية الحاسوبية تساعد الآلات على اكتشاف وتحديد مواقع الأجسام في الصور ومقاطع الفيديو. يتم استخدامه في قطاعات من السيارات ذاتية القيادة إلى الرعاية الصحية، مما يجعل المهام أسهل وأكثر أمانًا وكفاءة. مع النماذج الأحدث مثل YOLO11، يمكن للشركات بسهولة إنشاء نماذج مخصصة لاكتشاف الأجسام لإنشاء تطبيقات رؤية حاسوبية متخصصة.
في حين أن هناك بعض التحديات، مثل المخاوف المتعلقة بالخصوصية وإخفاء الأجسام عن الأنظار، فإن اكتشاف الأجسام هو تقنية موثوقة. إن قدرتها على أتمتة المهام ومعالجة البيانات المرئية في الوقت الفعلي والتكامل مع أدوات Vision AI الأخرى تجعلها جزءًا أساسيًا من الابتكارات المتطورة.
لمعرفة المزيد، قم بزيارة مستودع GitHub الخاص بنا وتفاعل مع مجتمعنا. استكشف الابتكارات في قطاعات مثل الذكاء الاصطناعي في السيارات ذاتية القيادة و الرؤية الحاسوبية في الزراعة في صفحات الحلول الخاصة بنا. تحقق من خيارات ترخيص yolo الخاصة بنا واجعل مشاريع Vision AI الخاصة بك تنبض بالحياة. 🚀