كيفية استخدام Ultralytics YOLO11 للكشف عن الكائنات

أبيرامي فينا

3 دقائق للقراءة

29 نوفمبر 2024

استكشف كيف يمكن استخدام نموذج Ultralytics YOLO11 الجديد لاكتشاف الأجسام لتحقيق دقة أعلى في مختلف التطبيقات عبر مجموعة من الصناعات.

الرؤية الحاسوبية هو مجال من مجالات الذكاء الاصطناعي (AI) يساعد الآلات على تفسير المعلومات البصرية وفهمها لتمكين المهام الأساسية مثل اكتشاف الأجسام. على عكس تصنيف الصور، لا يحدد اكتشاف الأجسام الأشياء الموجودة في الصورة فحسب، بل يحدد أيضاً مواقعها بدقة. وهذا يجعله أداة مهمة لتطبيقات الذكاء الاصطناعي للرؤية مثل السيارات ذاتية القيادة وأنظمة الأمن في الوقت الحقيقي وأتمتة المستودعات.

بمرور الوقت، أصبحت تقنية اكتشاف الأجسام أكثر تقدماً وأسهل استخداماً. تم الإعلان عن خطوة كبيرة إلى الأمام في الحدث السنوي الهجين الذي تنظمه شركة Ultralytics، YOLO Vision 2024 (YV24)، مع إطلاق نموذج YOLO11 من Ultralytics. يعمل YOLO11 على تحسين الدقة والأداء مع دعم نفس المهام التي يدعمها نموذج YOLOv8، مما يسهل على مستخدمي النماذج السابقة الانتقال بسلاسة.

الشكل 1. مثال على استخدام نموذج Ultralytics YOLO11 لاكتشاف الأجسام.

سنشرح في هذه المقالة ماهية اكتشاف الأجسام، وكيف يختلف عن مهام الرؤية الحاسوبية الأخرى، وسنستكشف تطبيقاته في العالم الحقيقي. سنرشدك أيضًا إلى كيفية استخدام نموذج YOLO11 مع حزمة Ultralytics Python ومنصة Ultralytics HUB. لنبدأ!

ما هو اكتشاف الأجسام؟

اكتشاف الأج سام هو مهمة أساسية في الرؤية الحاسوبية التي تقوم بأكثر من مجرد تحديد الأجسام في الصورة. على عكس تصنيف الصور، الذي يحدد فقط ما إذا كان هناك كائن معين موجود أم لا، فإن اكتشاف الكائنات يتعرف على كائنات متعددة ويحدد مواقعها بدقة باستخدام المربعات المحدودة. 

على سبيل المثال، يمكنها تحديد الوجوه في صورة جماعية أو السيارات في شارع مزدحم أو المنتجات على رفوف المتاجر وتحديد موقعها. إن الجمع بين التعرف على الأشياء وتحديد مواقعها يجعلها مفيدة بشكل خاص لتطبيقات مثل المراقبة ومراقبة الحشود وإدارة المخزون الآلي.

الشكل 2. استخدام YOLO11 للكشف عن الوجوه.

ما يميز الكشف عن الكائنات عن المهام الأخرى مثل التجزئة الدلالية أو تجزئة المثيل هو تركيزها وكفاءتها. 

يصنف التجزئة الدلالية كل بكسل في الصورة ولكنه لا يفرق بين الكائنات الفردية من نفس النوع (على سبيل المثال، يتم تجميع كل الوجوه في الصورة على أنها "وجه"). يأخذ تجزئة المثيل إلى أبعد من ذلك من خلال فصل كل كائن وتحديد شكله بالضبط، حتى بالنسبة للأجسام من نفس الفئة. 

ومع ذلك، يوفر اكتشاف الأجسام نهجاً أكثر انسيابية من خلال تحديد الأجسام وتصنيفها أثناء تحديد مواقعها. وهذا يجعلها مثالية للمهام في الوقت الحقيقي مثل اكتشاف الوجوه في اللقطات الأمنية أو تحديد العوائق للمركبات ذاتية القيادة.

تطبيقات YOLO11 واكتشاف الأجسام

تجعل ميزات YOLO11 المتقدمة لاكتشاف الأجسام من YOLO11 مفيدة في العديد من المجالات. دعنا نلقي نظرة على بعض الأمثلة.

استخدام YOLO11 لتحليلات البيع بالتجزئة

يُعيد نموذج YOLO11 ونموذج اكتشاف الأجسام تعريف تحليلات البيع بالتجزئة من خلال جعل إدارة المخزون ومراقبة الأرفف أكثر كفاءة ودقة. تساعد قدرة النموذج على اكتشاف الأجسام بسرعة وموثوقية تجار التجزئة على تتبع مستويات المخزون وتنظيم الأرفف وتقليل الأخطاء في جرد المخزون.

على سبيل المثال، يمكن لـ YOLO11 اكتشاف عناصر محددة مثل النظارات الشمسية على رف المتجر. ولكن لماذا قد يرغب بائع التجزئة في مراقبة الرفوف؟ إن الحفاظ على الأرفف مخزنة ومنظمة أمر حيوي لضمان عثور العملاء على ما يحتاجون إليه، مما يؤثر بشكل مباشر على المبيعات. من خلال مراقبة الرفوف في الوقت الفعلي، يمكن لتجار التجزئة أن يكتشفوا بسرعة عندما تنخفض كمية العناصر أو تكون في غير مكانها أو تكون مزدحمة، مما يساعدهم في الحفاظ على عرض منظم وجذاب يحسن تجربة التسوق.

الشكل 3. مثال على استخدام YOLO11 للكشف عن المنتجات على الرفوف.

YOLO11 في تطبيقات المدن الذكية

تعتمد المدينة الصاخبة على التدفق المروري السلس والشوارع الآمنة لتعمل بكفاءة، ويمكن أن يساعد YOLO11 في جعل ذلك ممكناً. في الواقع، يمكن دمج العديد من تطبيقات المدن الذكية مع YOLO11. 

تتضمن إحدى الحالات المثيرة للاهتمام استخدام اكتشاف الأجسام لتحديد لوحات السيارات المتحركة. من خلال القيام بذلك، يمكن لـ YOLO11 دعم تحصيل أسرع للرسوم وإدارة حركة المرور بشكل أفضل وإنفاذ اللوائح بشكل أسرع. 

الشكل 4. استخدام اكتشاف الأجسام و YOLO11 للكشف عن لوحات السيارات.

يمكن للرؤى المستقاة من أنظمة Vision AI التي تراقب الطرق أن تنبه السلطات إلى المخالفات المرورية أو الازدحام قبل أن تتفاقم إلى مشاكل أكبر. كما يمكن لـ YOLO11 أيضاً اكتشاف المشاة وراكبي الدراجات، مما يجعل الشوارع أكثر أماناً وفعالية للجميع. 

في واقع الأمر، فإن قدرة YOLO11 على معالجة البيانات المرئية تجعله أداة قوية لتحسين البنية التحتية للمدينة. على سبيل المثال، يمكنه المساعدة في تحسين توقيت إشارات المرور من خلال تحليل حركة المركبات والمشاة. ويمكنه أيضاً تعزيز السلامة في مناطق المدارس من خلال الكشف عن الأطفال وتنبيه السائقين لإبطاء السرعة. باستخدام YOLO11، يمكن للمدن اتخاذ تدابير استباقية لمواجهة التحديات وخلق بيئة أكثر كفاءة للجميع.

الكشف عن الفيديو في الوقت الحقيقي باستخدام YOLO11: زيادة إمكانية الوصول

يشير الكشف عن الأجسام في الوقت الحقيقي إلى قدرة النظام على تحديد الأجسام وتصنيفها في بث فيديو مباشر عند ظهورها. صُمم YOLO11 لتحقيق أداء فائق في الوقت الحقيقي ويتفوق في دعم هذه القدرة. وتتجاوز تطبيقاته مجرد تبسيط العمليات - حيث يمكن أن يساعد أيضًا في إنشاء عالم أكثر شمولاً وسهولة في الوصول إليه.

على سبيل المثال، يمكن أن يساعد YOLO11 الأفراد ضعاف البصر من خلال تحديد الأشياء في الوقت الفعلي. واستناداً إلى عمليات الكشف، يمكن تقديم وصف صوتي، مما يساعد المستخدمين على التنقل في محيطهم باستقلالية أكبر.

فكر في شخص ضعيف البصر يتسوق لشراء البقالة. قد يكون انتقاء العناصر المناسبة أمرًا صعبًا، ولكن يمكن أن يساعدك YOLO11. أثناء وضع العناصر في عربة التسوق، يمكن استخدام نظام مدمج مع YOLO11 لتحديد كل عنصر - مثل الموز أو الأفوكادو أو علبة حليب - وتقديم وصف صوتي في الوقت الفعلي. يتيح لهم ذلك تأكيد اختياراتهم والتأكد من حصولهم على كل ما يحتاجون إليه. من خلال التعرف على العناصر اليومية، يمكن لـ YOLO11 أن يجعل التسوق أكثر بساطة.

الشكل 5. يمكن أن يساعد اكتشاف الأشياء في جعل العالم أكثر سهولة لضعاف البصر.

دليل خطوة بخطوة لاكتشاف الكائنات باستخدام YOLO11 

والآن بعد أن قمنا بتغطية أساسيات اكتشاف الكائنات وتطبيقاته المتنوعة، دعنا نتعمق في كيفية البدء في استخدام نموذج Ultralytics YOLO11 لمهام مثل اكتشاف الكائنات.

هناك طريقتان مباشرتان لاستخدام YOLO11: من خلال حزمة Ultralytics Python أو Ultralytics HUB. دعونا نستكشف كلتا الطريقتين، بدءاً بحزمة بايثون.

تشغيل الاستدلالات باستخدام YOLO11

الاستدلال هو عندما يقوم نموذج الذكاء الاصطناعي بتحليل البيانات الجديدة غير المرئية لوضع تنبؤات أو تصنيف المعلومات أو تقديم رؤى بناءً على ما تعلمه أثناء التدريب. فيما يتعلق باكتشاف الأجسام، يعني ذلك تحديد وتحديد موقع أجسام معينة داخل صورة أو مقطع فيديو، ورسم مربعات محددة حولها، وتسميتها بناءً على تدريب النموذج.

للاستدلال باستخدام نموذج الكشف عن كائنات YOLO11، ستحتاج أولاً إلى تثبيت حزمة Ultralytics Python عبر pip أو conda أو Docker. إذا واجهتك أي مشاكل في التثبيت، راجع دليل استكشاف الأخطاء وإصلاحها للحصول على نصائح وحيل لمساعدتك في حلها. بمجرد التثبيت، يمكنك استخدام الشيفرة التالية لتحميل نموذج اكتشاف كائنات YOLO11 وإجراء تنبؤات على صورة.

الشكل 6. تشغيل استدلال على صورة باستخدام YOLO11n.

تدريب نموذج YOLO11 المخصص

يدعم YOLO11 أيضًا التدريب المخصص ليناسب حالات الاستخدام الخاصة بك بشكل أفضل. من خلال ضبط النموذج بدقة، يمكنك تخصيصه لاكتشاف الأشياء ذات الصلة بمشروعك. على سبيل المثال، عند استخدام الرؤية الحاسوبية في مجال الرعاية الصحية، يمكن استخدام نموذج YOLO11 المُدرَّب خصيصًا للكشف عن تشوهات معينة في الصور الطبية، مثل الأورام في فحوصات التصوير بالرنين المغناطيسي أو الكسور في الأشعة السينية، مما يساعد الأطباء على إجراء تشخيصات أسرع وأكثر دقة.

يعرض مقتطف الشيفرة أدناه كيفية تحميل وتدريب نموذج YOLO11 لاكتشاف الكائنات. يمكنك البدء من ملف تهيئة YAML أو نموذج مُدرَّب مسبقًا، ونقل الأوزان، والتدريب على مجموعات بيانات مثل COCO للحصول على قدرات أكثر دقة في اكتشاف الأجسام.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.yaml")  # build a new model from YAML
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

بعد تدريب النموذج، يمكنك أيضًا تصدير النموذج المدرّب بتنسيقات مختلفة لنشره في بيئات مختلفة.

الكشف عن كائن YOLO11 على Ultralytics HUB

بالنسبة لأولئك الذين يبحثون عن بديل بدون رموز، يوفر Ultralytics HUB منصة Vision AI سهلة الاستخدام لتدريب نماذج YOLO ونشرها، بما في ذلك YOLO11.

لتشغيل خاصية اكتشاف الأجسام على الصور، ما عليك سوى إنشاء حساب، والانتقال إلى قسم "النماذج"، واختيار متغير نموذج اكتشاف الأجسام YOLO11. ارفع صورتك، وستعرض المنصة الكائنات المكتشفة في قسم المعاينة.

الشكل 7. تشغيل الاستدلالات على Ultralytics HUB.

من خلال الجمع بين مرونة حزمة Python وسهولة HUB، يجعل YOLO11 من السهل على المطورين والشركات على حد سواء الاستفادة من قوة تقنية اكتشاف الكائنات المتقدمة.

الوجبات الرئيسية

يضع YOLO11 معيارًا جديدًا في اكتشاف الأجسام، حيث يجمع بين الدقة العالية والتنوع لتلبية احتياجات مختلف الصناعات. من تعزيز تحليلات البيع بالتجزئة إلى إدارة البنية التحتية للمدن الذكية، تم تصميم YOLO11 لتحقيق أداء موثوق به في الوقت الفعلي عبر عدد لا يحصى من التطبيقات.

بفضل خيارات التدريب المخصص والواجهة سهلة الاستخدام من خلال Ultralytics HUB، لم يكن دمج YOLO11 في سير عملك أبسط من أي وقت مضى. سواء كنت مطورًا يستكشف الرؤية الحاسوبية أو شركة تتطلع إلى الابتكار باستخدام الذكاء الاصطناعي، فإن YOLO11 يوفر لك الأدوات التي تحتاجها لتحقيق النجاح.

لمعرفة المزيد، اطلع على مستودع GitHub الخاص بنا وتفاعل مع مجتمعنا. استكشف تطبيقات الذكاء الاصطناعي في السيارات ذاتية القيادة والرؤية الحاسوبية للزراعة على صفحات الحلول الخاصة بنا. 🚀

دعونا نبني المستقبل
للذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل التعلم الآلي

ابدأ مجاناً
تم نسخ الرابط إلى الحافظة