شيك أخضر
تم نسخ الرابط إلى الحافظة

ما هو YOLOE؟ الارتقاء بنماذج الرؤية الحاسوبية

تعرّف على كيفية تمكين YOLOE من العثور على الأجسام باستخدام موجه أو صورة بسيطة. يتيح لك رؤية حاسوبية أكثر ذكاءً وسرعة دون إعادة تدريب أو ضبط النماذج.

يُعد اكتشاف الأجسام مهمة أساسية في مجال الرؤية الحاسوبية، حيث يكون الهدف هو تحديد الأجسام في الصور أو مقاطع الفيديو وتحديد موقعها. وهو جزء أساسي من الرؤية الحاسوبية، وهو مجال من مجالات الذكاء الاصطناعي (AI) الذي يمكّن الآلات من فهم البيانات المرئية وتفسيرها. على سبيل المثال، يمكن أن يساعد اكتشاف الأجسام في تحديد سيارة في صورة أو تحديد موقع شخص في مقطع فيديو.

واحدة من أشهر سلاسل النماذج التي تدعم مهام الرؤية الحاسوبية مثل اكتشاف الأجسام هي سلسلة نماذج YOLO (أنت تنظر مرة واحدة فقط). صُممت نماذج YOLO من أجل السرعة والدقة، وقد تحسنت نماذج YOLO باستمرار بمرور الوقت. على سبيل المثال، أحد أحدث الإصدارات Ultralytics YOLO11أداءً جيدًا في مواقف العالم الحقيقي، حيث يقدم نتائج دقيقة حتى في البيئات الأكثر تعقيدًا.

ولتعزيز هذا التقدم، يهدف نموذج جديد يسمى YOLOE إلى توسيع قدرات نماذج YOLO . على عكس النماذج التقليدية التي تتطلب إعادة التدريب للتعرف على الأجسام الجديدة، يمكن لنموذج YOLOE أن يتبع نصاً بسيطاً أو صورة بسيطة لاكتشاف الأجسام التي لم يرها من قبل، مما يجعله أكثر قدرة على التكيف مع البيئات المتغيرة.

في هذه المقالة، سنلقي نظرة فاحصة على ما يجعل YOLOE فريدًا من نوعه، وكيف يمكن مقارنته بنماذج YOLO السابقة، وكيف يمكنك البدء في استخدامه اليوم. لنبدأ!

نظرة عامة على YOLOE

YOLOE هو نموذج للرؤية الحاسوبية يرتقي برصد الأجسام خطوة إلى الأمام. تم تقديمه في مارس 2025 من قبل باحثين في جامعة تسينغهوا. ما يميز YOLOE عن النماذج التقليدية هو استخدامه للكشف عن المفردات المفتوحة. 

بينما يتم تدريب معظم النماذج على التعرّف على قائمة ثابتة من الأشياء، يسمح لك YOLOOE بتحديد ما تبحث عنه باستخدام وصف قصير أو مثال صورة. على سبيل المثال، إذا كنت تبحث عن "حقيبة ظهر خضراء"، يمكنك إما كتابة هذا الوصف أو عرض صورة للنموذج، وسيحدد YOLOE موقعها داخل المشهد.

بالإضافة إلى ذلك، حتى بدون أي موجه، يمكن لـ YOLOE اكتشاف العديد من الأشياء اليومية من تلقاء نفسه. تُسمى هذه القدرة على التعرف على الأشياء التي لم يسبق له رؤيتها من قبل اكتشاف اللقطة الصفرية. وهي مفيدة بشكل خاص في البيئات الديناميكية التي قد تتغير فيها المهمة أو الأشياء ذات الأهمية بشكل غير متوقع.

الشكل 1. نظرة على قدرات YOLOE.

الميزات الرئيسية لـ YOLOE

يدعم YOLOE مجموعة واسعة من الميزات المصممة لتحسين أدائه في التطبيقات الواقعية. وبفضل قدرته على التعامل مع كل من المدخلات المنظمة وغير المنظمة، يفتح YOLOE إمكانيات جديدة لاكتشاف الكائنات وتجزئتها. 

فيما يلي بعض الميزات الرئيسية التي يقدمها النموذج:

  • الكشف القائم على الموجه: يمكن ل YOLOE البحث عن الكائنات بناءً على موجه نصي قصير أو مثال على صورة. هذا يعني أنك لست بحاجة إلى إعادة تدريب النموذج في كل مرة تتغير فيها مهمتك؛ فقط قم بوصف أو عرض ما تبحث عنه للنموذج.
  • تجزئة المثيل: بالإضافة إلى رسم المربعات المحدودة حول الكائنات، يمكن ل YOLOE تحديد شكلها الدقيق باستخدام تجزئة المثيل. يكون هذا مفيدًا بشكل خاص عندما تكون الكائنات متداخلة أو عندما تحتاج إلى معرفة الحدود الدقيقة للكائن.
  • التعرّف على الأجسام بدون تعليمات: يستطيع YOLOE التعرف على الأجسام حتى بدون تعليمات محددة. فهو يستخدم مجموعة من الأوصاف التي تم تعلمها مسبقاً للتعرف على الأجسام بسرعة، مما يجعل العملية أسرع وأكثر كفاءة.

مقارنة YOLOE مع نماذج YOLO الأخرى

والآن بعد أن أصبح لدينا فهم أفضل لماهية YOLOE، دعنا نلقي نظرة على بعض النماذج في عائلة YOLO التي تتشابه مع YOLO . 

مع تقدم رؤية الكمبيوتر، تطورت نماذج YOLO أيضاً. على سبيل المثال Ultralytics YOLOv8 دعمًا لمهام جديدة مثل التجزئة والتصنيف، بينما ركزت الإصدارات اللاحقة، مثل Ultralytics YOLO11 على تحسين الدقة والأداء لمجموعة واسعة من المهام.

بالإضافة إلى ذلك، تم إصدار YOLO في يناير 2024 وقدّم إمكانية استخدام المطالبات المكتوبة، مما يتيح للمستخدمين وصف الأشياء التي يريدون العثور عليها. على الرغم من أن YOLO كان خيارًا رائعًا لاكتشاف اللقطة الصفرية، إلا أنه كان يفتقر إلى ميزات مثل تجزئة المثيل ودعم المطالبات المرئية. 

يعتمد YOLOE على YOLO من خلال إضافة هذه الإمكانيات، وتحسين المرونة والأداء، وتقديم أداة أكثر تأثيرًا لتطبيقات الرؤية الحاسوبية الواقعية.

الشكل 2. يدعم كلٌ من YOLO و YOLOE اكتشاف الطلقة الصفرية.

استخدام YOLOE مع حزمة Ultralytics Python

سواءً كنت ترغب في اكتشاف كائنات معينة أو استكشاف كل شيء في الصورة، فإن بدء استخدام YOLOE بسيط. هذا النموذج مدعوم من حزمة Ultralytics Python مما يجعل من السهل دمجه في مشاريعك. بعد ذلك، دعنا نتعرف على كيفية استخدامه.

تثبيت حزمة Ultralytics

الخطوة الأولى هي تثبيت حزمةUltralytics Python باستخدام مدير حزم مثل "pip". يمكنك القيام بذلك عن طريق تشغيل الأمر "pip install ultralytics" في جهازك الطرفي أو موجه الأوامر.

بمجرد تثبيت الحزمة، سيكون لديك كل ما تحتاجه لتحميل النموذج، وإجراء التنبؤات، وتجربة أوضاع الكشف المختلفة. إذا واجهت أي مشاكل أثناء التثبيت، فإن وثائق Ultralytics الرسمية تقدم قسمًا مفيدًا لاستكشاف الأخطاء وإصلاحها

هناك عدة طرق مختلفة لاستخدام YOLOE لتشغيل التنبؤات. يعني تشغيل التنبؤات استخدام النموذج المُدرَّب لتحديد وتحديد موقع الكائنات داخل الصور أو مقاطع الفيديو. تتيح لك هذه الطرق المختلفة تخصيص كيفية تفاعلك مع النموذج بناءً على احتياجاتك الخاصة.

لنناقش كل طريقة من هذه الطرق، واحدة تلو الأخرى.

الكشف عن كائنات محددة باستخدام مطالبات نصية أو صور

يستطيع YOLOE اكتشاف الأجسام بناءً على وصف نصي قصير. على سبيل المثال، إذا كنت تبحث عن حصان متحرك، يمكنك استخدام مطالبة مثل "حصان يمشي".

للبدء، قم أولًا بتحميل نموذج YOLOE المُدرَّب مسبقًا وقم بتعيين المطالبة (وصف ما تريد أن يبحث عنه النموذج) كما هو موضح في مقتطف الكود أدناه.

from ultralytics import YOLOE

model = YOLOE("yoloe-11l-seg.pt")
prompt = ["horse walking"]
model.set_classes(prompt, model.get_text_pe(prompt))

بمجرد تعيين النموذج والموجه الخاص بك، يمكنك تشغيل النموذج على صورة أو فيديو. استبدل مسار الملف في الكود بمسار ملف الصورة أو الفيديو:

results = model.predict("path/to/your/image.jpg")
results[0].show()

سيعرض هذا الصورة مع الكائن المكتشف محددًا بوضوح بناءً على مطالبتك. يمكنك تغيير المطالبة للبحث عن كائنات مختلفة، مثل "حقيبة حمراء" أو "دراجة" أو "حمار وحشي"، اعتمادًا على ما تبحث عنه.

الشكل 3. مثال على استخدام YOLOE للكشف عن كائنات محددة باستخدام موجه نصي.

وبالمثل، يمكنك استخدام صورة لمطالبة YOLOE باستخدام حزمة Ultralytics Python . في وضع المطالبة المرئية، يستخدم النموذج الصورة للعثور على عناصر متشابهة المظهر في مشهد آخر. هذا مفيد بشكل خاص للأشياء التي يصعب وصفها أو تفتقر إلى تسميات واضحة. 

لاستكشاف الكود الخاص بذلك بمزيد من التفصيل، يمكنك الاطلاع على وثائقUltralytics .

الكشف العام عن الأجسام باستخدام YOLOE

في بعض الحالات، قد لا تعرف ما الذي تبحث عنه بالضبط، أو قد لا تبحث عن كائن معين. وهنا يأتي دور الوضع الخالي من المطالبات. 

باستخدام هذا الخيار، لا تحتاج إلى كتابة وصف أو تقديم مثال للصورة. يقوم YOLOE ببساطة بتحليل الصور من تلقاء نفسه ويكتشف كل ما يمكنه التعرف عليه، مثل الأشخاص أو الحيوانات أو الأثاث أو الأشياء اليومية.

إنها طريقة مفيدة لاستكشاف مشهد ما دون إعطاء النموذج أي تعليمات محددة. سواء أكنت تفحص غرفة مزدحمة أو تستعرض لقطات بها الكثير من النشاط، يمنحك الوضع الخالي من المطالبات نظرة سريعة على ما هو موجود في الصورة. 

يمكنك استخدام التعليمات البرمجية التالية لتشغيل YOLOE في الوضع الخالي من المطالبات. أولاً، يتم تحميل النموذج، ثم يعالج الصورة ويكتشف الكائنات الموجودة فيها تلقائيًا. أخيرًا، يتم عرض النتائج، ويتم تمييز الأجسام المكتشفة. 

تأكد من استبدال مسار الملف بالمسار الفعلي لصورتك.

from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg-pf.pt")
results = model.predict("path/to/image.jpg")
results[0].show()

الصورة الموضّحة أدناه هي مثال على ما يمكن لـ YOLOE اكتشافه في الوضع الخالي من المطالبات.

الشكل 4. استخدام YOLOE في الوضع الخالي من المطالبات.

التطبيقات الآنية لـ YOLOE

تجعل قدرة YOLOE على الاستجابة لكل من المطالبات النصية والصور أداة موثوقة للتطبيقات في الوقت الفعلي. تُعد مرونته مفيدة بشكل خاص في البيئات سريعة الوتيرة حيث يكون التوقيت والدقة ضروريين. 

دعنا نستكشف بعض الأمثلة الواقعية لكيفية استخدام YOLOE.

تحسين مناولة الأمتعة: الكشف عن الأمتعة في الوقت الحقيقي

في المطارات المزدحمة، قد يكون تحديد موقع أمتعة معينة أمراً صعباً، خاصةً عند التعامل مع الحقائب المفقودة. يمكن لـ YOLOE تبسيط هذه العملية من خلال المساعدة في مسح مقاطع الفيديو المباشرة وتحديد العناصر بسرعة بناءً على مطالبات بسيطة مثل "حقيبة حمراء". 

إذا كانت الحقيبة مفقودة أو في غير مكانها، يمكن للموظفين تغيير المطالبة بسهولة للبحث عن عنصر مختلف، مثل "حقيبة سوداء". يمكن لهذه القدرة على التكيف الفوري أن تساعد موظفي المطار على تحديد موقع الأمتعة الصحيحة بسرعة دون مراجعة ساعات طويلة من اللقطات أو إعادة تدريب النموذج، مما يجعل التعامل مع الأمتعة وحل مشكلات الأمتعة المفقودة أسرع وأكثر كفاءة.

مراقبة الأماكن العامة باستخدام YOLOE

غالبًا ما تتضمن لقطات المراقبة للأماكن العامة، مثل الأسواق والمقاهي المزدحمة، مزيجًا من الأشخاص والأشياء والأنشطة التي تتغير على مدار اليوم. يمكن ل YOLOE تحليل هذه اللقطات في الوقت الفعلي باستخدام الوضع الخالي من المطالبات، حيث يكتشف تلقائيًا عناصر مثل الحقائب أو الطاولات أو الدراجات دون الحاجة إلى تعليمات محددة.

الشكل 5. يستطيع YOLOE اكتشاف العديد من الأجسام في الأماكن العامة المزدحمة.

وهذا مفيد بشكل خاص لفرق الأمن لاكتشاف الأشياء غير المراقبة أو تتبع حركة الحشود. تسهّل قدرة YOLOE على اكتشاف العديد من الأشياء في وقت واحد إدارة الأماكن العامة أثناء الفعاليات أو الفترات المزدحمة، مما يساعد الفرق على البقاء على اطلاع واستجابة.

إيجابيات وسلبيات YOLOE

فيما يلي بعض الفوائد الرئيسية لاستخدام YOLOE في تطبيقات الرؤية الحاسوبية:

  • الأداء في الوقت الحقيقي: تم تحسين YOLOE للمعالجة السريعة والفعالة، مما يتيح الكشف في الوقت الفعلي، حتى في البيئات الديناميكية مثل بث الفيديو المباشر أو الأماكن العامة المزدحمة.
  • قابلية التوسع: YOLOE قابل للتطوير ويعمل بشكل جيد لمجموعة واسعة من التطبيقات، من الأمن والمراقبة إلى البيع بالتجزئة والرعاية الصحية والمركبات ذاتية القيادة.
  • سهل الاستخدام: نظرًا لأن YOLOE مدعوم من حزمة Ultralytics Python فمن السهل دمجه في مشاريع الرؤية الحاسوبية الحالية.

ومع ذلك، هناك بعض القيود التي يجب وضعها في الاعتبار عند استخدام YOLOE. فيما يلي بعض العوامل التي يجب أخذها في الاعتبار:

  • يتطلب بيانات تدريب كافية: على الرغم من أن برنامج YOLOE يدعم الكشف عن اللقطة الصفرية، إلا أن أداءه على الأجسام غير المرئية يعتمد على مدى تعميمه من بيانات التدريب الخاصة به. في بعض الحالات، قد يحتاج في بعض الحالات إلى بيانات إضافية أو إلى ضبط دقيق لأداء جيد في المهام المتخصصة للغاية.
  • حساس لجودة المدخلات: يمكن أن تتأثر دقة النموذج بالصور أو الفيديو منخفض الجودة. يمكن أن تقلل المدخلات الباهتة أو ضعيفة الإضاءة من قدرة النموذج على اكتشاف الأجسام بدقة، لذا فإن المدخلات عالية الجودة مهمة لتحقيق الأداء الأمثل.

الوجبات الرئيسية

يُضفي YOLOE مزيدًا من المرونة على الرؤية الحاسوبية من خلال السماح للمستخدمين بتوجيه الاكتشاف باستخدام النص أو مطالبات الصورة. وهو يعمل بشكل جيد في مواقف العالم الحقيقي حيث تتغير المشاهد بسرعة، ولا تكون إعادة التدريب خيارًا متاحًا.

من مناولة الأمتعة إلى مراقبة الأماكن العامة، تتكيف YOLOE مع المهام الجديدة بسهولة. مع زيادة إمكانية الوصول إلى الذكاء الاصطناعي، تساعد نماذج مثل YOLOE المزيد من الصناعات على استخدام تكنولوجيا الرؤية بطرق عملية وفعالة.

انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد عن ابتكارات الذكاء الاصطناعي. اكتشف أحدث التطورات في مجالات مثل الذكاء الاصطناعي في مجال البيع بالتجزئة والرؤية الحاسوبية في مجال الرعاية الصحية على صفحات الحلول الخاصة بنا. اطّلع على خيارات الترخيص لدينا وابدأ في استخدام الرؤية الحاسوبية اليوم!

شعار LinkedInشعار تويترشعار الفيسبوكرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي