تعرّف على كيفية اكتشاف الأجسام وأهميته في الذكاء الاصطناعي، وكيف تعمل نماذج مثل YOLO11 على تحويل صناعات مثل السيارات ذاتية القيادة والرعاية الصحية والأمن.

تعرّف على كيفية اكتشاف الأجسام وأهميته في الذكاء الاصطناعي، وكيف تعمل نماذج مثل YOLO11 على تحويل صناعات مثل السيارات ذاتية القيادة والرعاية الصحية والأمن.

تقوم العديد من الصناعات بدمج حلول الذكاء الاصطناعي (AI) بسرعة في عملياتها. من بين العديد من تقنيات الذكاء الاصطناعي المتاحة اليوم، تعد رؤية الكمبيوتر واحدة من أكثر التقنيات شيوعًا. رؤية الكمبيوتر هي فرع من فروع الذكاء الاصطناعي يساعد أجهزة الكمبيوتر على رؤية وفهم محتويات الصور ومقاطع الفيديو، تمامًا كما يفعل البشر. فهو يمكّن الآلات من التعرف على الكائنات وتحديد الأنماط وفهم ما تنظر إليه.
تشير التقديرات إلى أن القيمة السوقية العالمية لرؤية الكمبيوتر ستنمو إلى 175.72 مليار دولار بحلول عام 2032. تشمل رؤية الكمبيوتر مهام متنوعة تمكن أنظمة Vision AI من تحليل وتفسير البيانات المرئية. يعد اكتشاف الكائنات أحد المهام الأكثر استخدامًا وأساسية في رؤية الكمبيوتر.
يركز اكتشاف الكائنات على تحديد موقع الكائنات وتصنيفها في البيانات المرئية. على سبيل المثال، إذا عرضت على الكمبيوتر صورة لبقرة، فيمكنه detect البقرة ورسم مربع محدد حولها. هذه القدرة مفيدة في تطبيقات العالم الحقيقي مثل مراقبة الحيوانات والسيارات ذاتية القيادة والمراقبة.
إذن، كيف يمكن إجراء اكتشاف الأجسام؟ إحدى الطرق هي من خلال نماذج الرؤية الحاسوبية. على سبيل المثال Ultralytics YOLO11 هو نموذج رؤية حاسوبية يدعم مهام الرؤية الحاسوبية مثل اكتشاف الأجسام.
في هذا الدليل، سنستكشف اكتشاف الكائنات وكيفية عمله. سنناقش أيضًا بعض التطبيقات الواقعية لاكتشاف الكائنات و Ultralytics YOLO11.

اكتشاف الكائنات هو مهمة رؤية الكمبيوتر التي تحدد وتحدد مواقع الكائنات في الصور أو مقاطع الفيديو. يجيب على سؤالين رئيسيين: 'ما هي الكائنات الموجودة في الصورة؟' و 'أين تقع؟'
يمكنك التفكير في اكتشاف الأجسام كعملية تتضمن خطوتين رئيسيتين. الأولى، وهي تصنيف الأجسام، تسمح للنظام بالتعرّف على الأجسام وتسميتها، مثل تحديد قطة أو سيارة أو شخص بناءً على الأنماط المكتسبة. أما الخطوة الثانية، وهي التوطين، فتحدد موقع الجسم من خلال رسم مربع محدد حوله، مع الإشارة إلى مكان ظهوره في الصورة. تمكّن هذه الخطوات معاً الآلات من detect الأجسام في المشهد وفهمها.
الجانب الذي يميز اكتشاف الكائنات هو قدرته على التعرف على الكائنات وتحديد موقعها بدقة. تركز مهام رؤية الكمبيوتر الأخرى على أهداف مختلفة.
على سبيل المثال، يقوم تصنيف الصور بتعيين تسمية لصورة كاملة. وفي الوقت نفسه، يوفر تجزئة الصور فهمًا على مستوى البكسل للعناصر المختلفة. من ناحية أخرى، يجمع اكتشاف الكائنات بين التعرف وتحديد الموقع. وهذا يجعله مفيدًا بشكل خاص لمهام مثل عد الكائنات المتعددة في الوقت الفعلي.

أثناء استكشاف مصطلحات رؤية الكمبيوتر المختلفة، قد تشعر أن التعرف على الكائنات واكتشاف الكائنات قابلان للتبديل - لكنهما يخدمان أغراضًا مختلفة. تتمثل إحدى الطرق الرائعة لفهم الفرق في النظر إلى اكتشاف الوجه والتعرف على الوجه.
اكتشاف الوجه هو نوع من أنواع اكتشاف الأجسام. فهو يحدد وجود وجه في الصورة ويحدد موقعه باستخدام مربع محدد. يجيب على السؤال "أين الوجه في الصورة؟ تُستخدم هذه التقنية بشكل شائع في كاميرات الهواتف الذكية التي تركز تلقائيًا على الوجوه أو في كاميرات المراقبة التي detect وجود شخص ما.
أما التعرف على الوجوه، من ناحية أخرى، فهو شكل من أشكال التعرف على الأشياء. فهو لا detect الوجه فقط؛ بل يحدد من هو صاحب الوجه من خلال تحليل السمات الفريدة ومقارنتها بقاعدة بيانات. إنه يجيب على السؤال "من هذا الشخص؟ هذه هي التقنية وراء فتح قفل هاتفك باستخدام Face ID أو أنظمة أمن المطارات التي تتحقق من الهويات.
ببساطة، يجد اكتشاف الكائنات الكائنات ويحدد مواقعها، بينما يصنف التعرف على الكائنات الكائنات ويحدد هويتها.

صُممت العديد من نماذج اكتشاف الأجسام، مثل YOLO11 لدعم اكتشاف الوجوه وليس التعرف على الوجوه. يمكن ل YOLO11 تحديد وجود وجه في الصورة بكفاءة ورسم مربع محدد حوله، مما يجعله مفيدًا لتطبيقات مثل أنظمة المراقبة ومراقبة الحشود ووضع علامات على الصور آليًا. ومع ذلك، لا يمكنه تحديد صاحب الوجه. يمكن دمج YOLO11 مع نماذج مدرّبة خصيصاً للتعرّف على الوجوه، مثل Facenet أو DeepFace، لتمكين كل من الكشف وتحديد الهوية في نظام واحد.
قبل أن نناقش كيفية عمل اكتشاف الكائنات، دعنا أولاً نلقي نظرة فاحصة على كيفية تحليل الكمبيوتر للصورة. بدلاً من رؤية الصورة كما نفعل، يقسمها الكمبيوتر إلى شبكة من المربعات الصغيرة تسمى وحدات البكسل. تحتوي كل وحدة بكسل على معلومات اللون والسطوع التي يمكن لأجهزة الكمبيوتر معالجتها لتفسير البيانات المرئية.
لفهم هذه البكسلات، تقوم الخوارزميات بتجميعها في مناطق ذات معنى بناءً على الشكل واللون ومدى قربها من بعضها البعض. يمكن لنماذج اكتشاف الأجسام، مثل YOLO11 التعرّف على الأنماط أو السمات في مجموعات البكسل هذه.
على سبيل المثال، لا ترى السيارة ذاتية القيادة أحد المشاة بالطريقة التي نراها بها - فهي تكتشف الأشكال والأنماط التي تتطابق مع ميزات أحد المشاة. تعتمد هذه النماذج على تدريب مكثف باستخدام مجموعات بيانات الصور المصنفة، مما يسمح لها بتعلم الخصائص المميزة للكائنات مثل السيارات وإشارات المرور والأشخاص.
يحتوي نموذج اكتشاف الكائنات النموذجي على ثلاثة أجزاء رئيسية: العمود الفقري والعنق والرأس. يستخرج العمود الفقري ميزات مهمة من الصورة. يعالج العنق هذه الميزات ويحسنها، بينما الرأس مسؤول عن التنبؤ بمواقع الكائنات وتصنيفها.
بمجرد إجراء عمليات الكشف الأولية، يتم تطبيق تقنيات المعالجة اللاحقة لتحسين الدقة وتصفية التنبؤات الزائدة. على سبيل المثال، تتم إزالة مربعات الإحاطة المتداخلة، مما يضمن الاحتفاظ بعمليات الكشف الأكثر صلة فقط. أيضًا، يتم تعيين درجات الثقة (قيم رقمية تمثل مدى تأكد النموذج من أن كائنًا تم اكتشافه ينتمي إلى فئة معينة) لكل كائن تم اكتشافه للإشارة إلى يقين النموذج في تنبؤاته.
أخيرًا، يتم تقديم الإخراج مع مربعات إحاطة مرسومة حول الكائنات التي تم اكتشافها، جنبًا إلى جنب مع تسميات الفئات المتوقعة ودرجات الثقة. يمكن بعد ذلك استخدام هذه النتائج للتطبيقات الواقعية.
في الوقت الحاضر، هناك العديد من نماذج الرؤية الحاسوبية المتاحة، ومن أشهرها نماذجUltralytics YOLO . وهي معروفة بسرعتها ودقتها وتعدد استخداماتها. على مر السنين، أصبحت هذه النماذج أسرع وأكثر دقة وقدرة على التعامل مع مجموعة واسعة من المهام. إن إصدار Ultralytics YOLOv5 جعل عملية النشر أسهل مع أطر عمل مثل PyTorch مما سمح لمزيد من الأشخاص باستخدام الذكاء الاصطناعي المتقدم للرؤية دون الحاجة إلى خبرة تقنية عميقة.
بناءً على هذا الأساس, Ultralytics YOLOv8 ميزات جديدة مثل تجزئة المثيل وتقدير الوضعية وتصنيف الصور. والآن، يرتقي YOLO11 بالأمور إلى ما هو أبعد من ذلك مع أداء أفضل عبر مهام متعددة. مع معلمات أقل بنسبة 22% أقل من YOLOv8m يحقق YOLO11m متوسط دقة أعلىmAP) على مجموعة بيانات COCO . بعبارات بسيطة، يمكن لـ YOLO11 التعرف على الكائنات بدقة أكبر مع استخدام موارد أقل، مما يجعله أسرع وأكثر موثوقية.
سواء كنت خبيراً في مجال الذكاء الاصطناعي أو بدأت للتو في العمل، فإن YOLO11 يقدم لك حلاً قوياً وسهل الاستخدام لتطبيقات الرؤية الحاسوبية.
يتضمن تدريب نماذج Vision AI مساعدة أجهزة الكمبيوتر على التعرف على الصور ومقاطع الفيديو وفهمها. ومع ذلك، يمكن أن يكون التدريب عملية تستغرق وقتًا طويلاً. بدلاً من البدء من الصفر، يعمل التعلم بالنقل على تسريع الأمور باستخدام نماذج مدربة مسبقًا تتعرف بالفعل على الأنماط الشائعة.
على سبيل المثال، تم تدريب YOLO11 بالفعل على مجموعة بياناتCOCO والتي تحتوي على مجموعة متنوعة من الأشياء اليومية. يمكن تدريب هذا النموذج المُدرَّب مسبقًا تدريبًا مخصصًا إضافيًا detect كائنات محددة قد لا تكون مدرجة في مجموعة البيانات الأصلية.
لتدريب YOLO11 بشكل مخصص، تحتاج إلى مجموعة بيانات مصنفة تحتوي على صور للأشياء التي تريد detect. على سبيل المثال، إذا كنت ترغب في إنشاء نموذج لتحديد أنواع مختلفة من الفاكهة في متجر بقالة، يمكنك إنشاء مجموعة بيانات تحتوي على صورٍ مُصنَّفة للتفاح والموز والبرتقال وغيرها. بمجرد إعداد مجموعة البيانات، يمكن تدريب YOLO11 وتعديل المعلمات مثل حجم الدُفعات ومعدل التعلّم والحقبة الزمنية لتحسين الأداء.
من خلال هذا النهج، يمكن للشركات تدريب YOLO11 على detect أي شيء، بدءاً من الأجزاء المعيبة في التصنيع إلى أنواع الحياة البرية في مشاريع الحفاظ على البيئة، وتكييف النموذج حسب احتياجاتها الدقيقة.
بعد ذلك، دعنا نلقي نظرة على بعض حالات الاستخدام الواقعية لاكتشاف الكائنات وكيف أنها تحول الصناعات المختلفة.
تستخدم السيارات ذاتية القيادة مهام الرؤية الحاسوبية مثل اكتشاف الأجسام للتنقل بأمان وتجنب العوائق. تساعد هذه التقنية في التعرف على المشاة والمركبات الأخرى والحفر ومخاطر الطريق، مما يجعل من الممكن فهم محيطها بشكل أفضل. يمكنهم اتخاذ قرارات سريعة والتحرك بأمان عبر حركة المرور من خلال التحليل المستمر لبيئتهم.

تخلق تقنيات التصوير الطبي مثل الأشعة السينية والتصوير بالرنين المغناطيسي والتصوير المقطعي المحوسب والتصوير بالموجات فوق الصوتية صوراً مفصلة للغاية لجسم الإنسان للمساعدة في تشخيص الأمراض وعلاجها. وتنتج هذه الفحوصات كميات كبيرة من البيانات التي يجب على الأطباء، مثل أخصائيي الأشعة وأخصائيي علم الأمراض، تحليلها بعناية detect الأمراض. ومع ذلك، فإن مراجعة كل صورة بالتفصيل قد تستغرق وقتاً طويلاً، وقد يفوت الخبراء البشريون أحياناً بعض التفاصيل بسبب الإرهاق أو ضيق الوقت.
يمكن أن تساعد نماذج اكتشاف الأجسام مثل YOLO11 من خلال تحديد السمات الرئيسية في الفحوصات الطبية تلقائياً، مثل الأعضاء أو الأورام أو التشوهات بدقة عالية. يمكن للنماذج المدرّبة حسب الطلب تسليط الضوء على المناطق المثيرة للقلق من خلال المربعات المحدودة، مما يساعد الأطباء على التركيز على المشاكل المحتملة بشكل أسرع. يؤدي ذلك إلى تقليل عبء العمل وتحسين الكفاءة وتوفير رؤى سريعة.

تتبع الأجسام هو إحدى مهام الرؤية الحاسوبية التي يدعمها YOLO11 مما يتيح المراقبة في الوقت الحقيقي وتحسينات الأمان. وهي تعتمد على اكتشاف الأجسام من خلال تحديد الأجسام وتتبع حركتها باستمرار عبر الإطارات. تُستخدم هذه التقنية على نطاق واسع في أنظمة المراقبة لتحسين السلامة في بيئات مختلفة.
على سبيل المثال، في المدارس ومراكز الرعاية النهارية، يمكن أن يساعد تتبع الأجسام في مراقبة الأطفال ومنعهم من التجول. في التطبيقات الأمنية، يلعب دورًا رئيسيًا في الكشف عن المتسللين في المناطق المحظورة، ومراقبة الحشود بحثًا عن الازدحام أو السلوك المشبوه، وإرسال تنبيهات في الوقت الفعلي عند اكتشاف نشاط غير مصرح به. من خلال track الأجسام أثناء تحركها، تعمل أنظمة التتبع YOLO11 على تعزيز الأمن وأتمتة المراقبة والسماح باستجابات أسرع للتهديدات المحتملة.
فيما يلي بعض الفوائد الرئيسية التي يمكن أن يجلبها اكتشاف الأجسام إلى مختلف الصناعات:
في حين أن هذه الفوائد تسلط الضوء على كيفية تأثير اكتشاف الأجسام على حالات الاستخدام المختلفة، فمن المهم أيضًا مراعاة التحديات التي ينطوي عليها تنفيذه. فيما يلي بعض التحديات الرئيسية:
يُعد اكتشاف الأجسام أداة لتغيير قواعد اللعبة في مجال الرؤية الحاسوبية تساعد الآلات على detect الأجسام في الصور ومقاطع الفيديو وتحديد مواقعها. يتم استخدامه في قطاعات من السيارات ذاتية القيادة إلى الرعاية الصحية، مما يجعل المهام أسهل وأكثر أمانًا وفعالية. مع النماذج الأحدث مثل YOLO11 يمكن للشركات بسهولة إنشاء نماذج مخصصة للكشف عن الكائنات لإنشاء تطبيقات رؤية حاسوبية متخصصة.
في حين أن هناك بعض التحديات، مثل المخاوف المتعلقة بالخصوصية وإخفاء الأجسام عن الأنظار، فإن اكتشاف الأجسام هو تقنية موثوقة. إن قدرتها على أتمتة المهام ومعالجة البيانات المرئية في الوقت الفعلي والتكامل مع أدوات Vision AI الأخرى تجعلها جزءًا أساسيًا من الابتكارات المتطورة.
لمعرفة المزيد، قم بزيارة مستودع GitHub الخاص بنا وتفاعل مع مجتمعنا. استكشف الابتكارات في قطاعات مثل الذكاء الاصطناعي في السيارات ذاتية القيادة والرؤية الحاسوبية في الزراعة على صفحات الحلول الخاصة بنا. اطلع على خيارات ترخيص yolo الخاصة بنا واجعل مشاريعك في مجال الذكاء الاصطناعي في الرؤية تنبض بالحياة. 🚀