يولو فيجن شنتشن
شنتشن
انضم الآن

ما هو YOLOE؟ المضي قدمًا بنماذج رؤية الكمبيوتر

أبيرامي فينا

5 دقائق قراءة

8 مايو 2025

تعرف على كيف يتيح لك YOLOE العثور على الكائنات باستخدام مطالبة بسيطة أو صورة. فهو يتيح رؤية حاسوب أذكى وأسرع دون إعادة تدريب النماذج أو ضبطها بدقة.

اكتشاف الأجسام هو مهمة رئيسية في رؤية الحاسوب، حيث الهدف هو تحديد وتحديد مواقع الأجسام في الصور أو مقاطع الفيديو. إنه جزء أساسي من رؤية الحاسوب، وهو مجال من مجالات الذكاء الاصطناعي (AI) الذي يمكّن الآلات من فهم وتفسير البيانات المرئية. على سبيل المثال، يمكن أن يساعد اكتشاف الأجسام في تحديد سيارة في صورة أو اكتشاف شخص في بث فيديو.

إحدى السلاسل الأكثر شهرة من النماذج التي تدعم مهام رؤية الكمبيوتر مثل الكشف عن الكائنات هي سلسلة نماذج YOLO (أنت تنظر مرة واحدة فقط). تم تصميم نماذج YOLO للسرعة والدقة، وقد تحسنت باستمرار بمرور الوقت. على سبيل المثال، أحد أحدث الإصدارات، Ultralytics YOLO11، يعمل بشكل جيد في المواقف الواقعية، مما يوفر نتائج دقيقة حتى في البيئات الأكثر تعقيدًا.

للمضي قدمًا بهذا التقدم، يهدف نموذج جديد يسمى YOLOE إلى توسيع قدرات نماذج YOLO. على عكس النماذج التقليدية التي تتطلب إعادة التدريب للتعرف على كائنات جديدة، يمكن لـ YOLOE اتباع مطالبات نصية أو صور بسيطة لاكتشاف الكائنات التي لم يرها من قبل، مما يجعلها أكثر قابلية للتكيف مع البيئات المتغيرة.

في هذه المقالة، سنلقي نظرة فاحصة على ما الذي يجعل YOLOE فريدًا، وكيف تتم مقارنته بنماذج YOLO السابقة، وكيف يمكنك البدء في استخدامه اليوم. هيا بنا نبدأ!

نظرة عامة على YOLOE

YOLOE هو نموذج رؤية حاسوبية يأخذ الكشف عن الكائنات خطوة إلى الأمام. تم تقديمه في مارس 2025 من قبل باحثين في جامعة تسينغهوا. ما يميز YOLOE عن النماذج التقليدية هو استخدامه للكشف عن المفردات المفتوحة. 

في حين يتم تدريب معظم النماذج على التعرف على قائمة ثابتة من الكائنات، يسمح لك YOLOE بتحديد ما تبحث عنه باستخدام وصف قصير أو صورة مثال. على سبيل المثال، إذا كنت تبحث عن “حقيبة ظهر خضراء”، فيمكنك إما كتابة هذا الوصف أو عرض صورة للنموذج، وسيقوم YOLOE بتحديد موقعها داخل المشهد.

بالإضافة إلى ذلك، حتى بدون أي مطالبة، يمكن لـ YOLOE اكتشاف العديد من الأشياء اليومية بمفرده. تسمى هذه القدرة على التعرف على الأشياء التي لم يرها من قبل اكتشاف الصفر (zero-shot detection). إنه مفيد بشكل خاص في البيئات الديناميكية حيث قد تتغير المهمة أو الأشياء موضع الاهتمام بشكل غير متوقع.

الشكل 1. نظرة على قدرات YOLOE.

الميزات الرئيسية لـ YOLOE

يدعم YOLOE مجموعة واسعة من الميزات المصممة لتحسين أدائه في التطبيقات الواقعية. وبفضل قدرته على التعامل مع كل من المدخلات المنظمة وغير المنظمة، يفتح YOLOE إمكانيات جديدة لاكتشاف الكائنات وتجزئتها. 

فيما يلي بعض الميزات الرئيسية التي يقدمها النموذج:

  • الاكتشاف المستند إلى المطالبات: يمكن لـ YOLOE البحث عن الكائنات بناءً على مطالبة نصية قصيرة أو صورة مثال. هذا يعني أنك لست بحاجة إلى إعادة تدريب النموذج في كل مرة تتغير فيها مهمتك؛ ما عليك سوى وصف أو إظهار النموذج لما تبحث عنه.
  • تجزئة المثيل: بالإضافة إلى رسم مربعات إحاطة حول الكائنات، يمكن لـ YOLOE تحديد شكلها الدقيق باستخدام تجزئة المثيل. هذا مفيد بشكل خاص عندما تتداخل الكائنات أو عندما تحتاج إلى معرفة الحدود الدقيقة للكائن.
  • التعرف على الكائنات بدون مطالبات: يمكن لـ YOLOE التعرف على الكائنات حتى بدون تعليمات محددة. يستخدم مجموعة من الأوصاف التي تم تعلمها مسبقًا لتحديد الكائنات بسرعة، مما يجعل العملية أسرع وأكثر كفاءة.

مقارنة YOLOE مع نماذج YOLO الأخرى

الآن بعد أن أصبح لدينا فهم أفضل لما هو YOLOE، دعنا نلقي نظرة على بعض النماذج في عائلة YOLO المماثلة. 

مع تقدم الرؤية الحاسوبية، تطورت أيضًا نماذج YOLO. على سبيل المثال، Ultralytics YOLOv8 جلبت دعمًا لمهام جديدة مثل التجزئة والتصنيف، بينما ركزت الإصدارات اللاحقة، مثل Ultralytics YOLO11، على تحسين الدقة والأداء لمجموعة واسعة من المهام.

أيضًا، تم إصدار YOLO-World في يناير 2024 وقدم القدرة على استخدام مطالبات مكتوبة، مما يتيح للمستخدمين وصف الكائنات التي يريدون العثور عليها. في حين أن YOLO-World كان خيارًا رائعًا للكشف بدون تدريب مسبق (zero-shot detection)، إلا أنه كان يفتقر إلى ميزات مثل تجزئة المثيلات (instance segmentation) ودعم المطالبات المرئية. 

يعتمد YOLOE على YOLO-World بإضافة هذه القدرات، وتحسين المرونة والأداء، وتقديم أداة أكثر تأثيرًا لتطبيقات الرؤية الحاسوبية الواقعية.

الشكل 2. يدعم كل من YOLO-World و YOLOE الكشف الصفري.

استخدام YOLOE مع حزمة Ultralytics Python

سواء كنت ترغب في اكتشاف كائنات معينة أو استكشاف كل شيء في صورة ما، فإن البدء بـ YOLOE أمر بسيط. هذه النموذج مدعوم بحزمة Ultralytics Python، مما يجعله سهل الاندماج في مشاريعك. بعد ذلك، دعنا ننتقل إلى كيفية استخدامه.

تثبيت حزمة Ultralytics

تتمثل الخطوة الأولى في تثبيت حزمة Ultralytics Python باستخدام مدير الحزم مثل ‘pip.’ يمكنك القيام بذلك عن طريق تشغيل الأمر “pip install ultralytics” في جهازك الطرفي أو موجه الأوامر.

بمجرد تثبيت الحزمة، سيكون لديك كل ما تحتاجه لتحميل النموذج وإجراء التنبؤات وتجربة أوضاع الكشف المختلفة. إذا واجهت أي مشكلات أثناء التثبيت، فستقدم وثائق Ultralytics الرسمية قسمًا مفيدًا لاستكشاف الأخطاء وإصلاحها

هناك عدة طرق مختلفة لاستخدام YOLOE لتشغيل التنبؤات. يعني تشغيل التنبؤات استخدام النموذج المدرب لتحديد وتحديد مواقع الكائنات داخل الصور أو مقاطع الفيديو. تتيح لك هذه الطرق المختلفة تخصيص كيفية التفاعل مع النموذج بناءً على احتياجاتك الخاصة.

دعنا نناقش كل طريقة من هذه الطرق، واحدة تلو الأخرى.

اكتشاف كائنات معينة باستخدام مطالبات نصية أو صور

يمكن لـ YOLOE اكتشاف الكائنات بناءً على وصف نصي قصير. على سبيل المثال، إذا كنت تبحث عن حصان يتحرك، فيمكنك استخدام مطالبة مثل "حصان يمشي".

للبدء، قم أولاً بتحميل نموذج YOLOE المدرب مسبقًا، وعيّن مطالبتك (وصف ما تريد أن يبحث عنه النموذج) كما هو موضح في مقتطف الشفرة أدناه.

from ultralytics import YOLOE

model = YOLOE("yoloe-11l-seg.pt")
prompt = ["horse walking"]
model.set_classes(prompt, model.get_text_pe(prompt))

بمجرد تعيين النموذج والمطالبة، يمكنك تشغيل النموذج على صورة أو مقطع فيديو. استبدل مسار الملف في التعليمات البرمجية بمسار ملف الصورة أو الفيديو الخاص بك:

results = model.predict("path/to/your/image.jpg")
results[0].show()

سيؤدي هذا إلى عرض الصورة مع الكائن الذي تم اكتشافه بوضوح بناءً على مطالبتك. يمكنك تغيير المطالبة للبحث عن كائنات مختلفة، مثل "حقيبة حمراء" أو "دراجة هوائية" أو "حمار وحشي"، اعتمادًا على ما تبحث عنه.

الشكل 3. مثال على استخدام YOLOE لاكتشاف كائنات محددة باستخدام مطالبة نصية.

وبالمثل، يمكنك استخدام صورة لمطالبة YOLOE بحزمة Ultralytics Python. في وضع المطالبة المرئية، يستخدم النموذج الصورة للعثور على عناصر ذات مظهر مشابه في مشهد آخر. هذا مفيد بشكل خاص للكائنات التي يصعب وصفها أو تفتقر إلى تسميات واضحة. 

لاستكشاف الكود الخاص بذلك بمزيد من التفصيل، يمكنك الاطلاع على وثائق Ultralytics.

اكتشاف عام للكائنات باستخدام YOLOE

في بعض الحالات، قد لا تعرف بالضبط ما الذي تبحث عنه، أو قد لا تبحث عن كائن معين. هذا هو المكان الذي يكون فيه الوضع الخالي من المطالبات مفيدًا. 

باستخدام هذا الخيار، لا تحتاج إلى كتابة وصف أو تقديم صورة مثال. يقوم YOLOE ببساطة بتحليل الصور بمفرده و يكتشف كل ما يمكنه التعرف عليه، مثل الأشخاص أو الحيوانات أو الأثاث أو الأشياء اليومية.

إنها طريقة مفيدة لاستكشاف مشهد دون إعطاء النموذج أي تعليمات محددة. سواء كنت تقوم بمسح غرفة مزدحمة أو مراجعة لقطات بها الكثير من النشاط، فإن الوضع الخالي من المطالبات يمنحك نظرة سريعة على ما هو موجود في الصورة. 

يمكنك استخدام الكود التالي لتشغيل YOLOE في وضع عدم المطالبة. أولاً، يتم تحميل النموذج، ثم يعالج الصورة ويكتشف الكائنات الموجودة فيها تلقائيًا. أخيرًا، يتم عرض النتائج، ويتم تمييز الكائنات المكتشفة. 

تأكد من استبدال مسار الملف بالمسار الفعلي لصورتك.

from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg-pf.pt")
results = model.predict("path/to/image.jpg")
results[0].show()

الصورة الموضحة أدناه هي مثال لما يمكن أن يكتشفه YOLOE في الوضع الخالي من المطالبات.

الشكل 4. استخدام YOLOE في الوضع الخالي من المطالبات.

تطبيقات YOLOE في الوقت الفعلي

إن قدرة YOLOE على الاستجابة للمطالبات النصية والصورية تجعله أداة موثوقة للتطبيقات في الوقت الفعلي. تعتبر مرونته مفيدة بشكل خاص في البيئات سريعة الخطى حيث يكون التوقيت والدقة ضروريين. 

دعنا نستكشف بعض الأمثلة الواقعية لكيفية استخدام YOLOE.

تحسين مناولة الأمتعة: الكشف عن الأمتعة في الوقت الفعلي

في المطارات المزدحمة، قد يكون تحديد موقع أمتعة معينة أمرًا صعبًا، خاصة عند التعامل مع الحقائب المفقودة. يمكن لـ YOLOE تبسيط هذه العملية من خلال المساعدة في فحص مقاطع الفيديو الحية وتحديد العناصر بسرعة بناءً على مطالبات بسيطة مثل "حقيبة حمراء". 

إذا كانت الحقيبة مفقودة أو في غير مكانها، يمكن للموظفين بسهولة تغيير الأمر للبحث عن عنصر مختلف، مثل "حقيبة سوداء". يمكن أن تساعد هذه القدرة على التكيف الفوري موظفي المطار في تحديد موقع الأمتعة المناسبة بسرعة دون مراجعة ساعات طويلة من اللقطات أو إعادة تدريب النموذج، مما يجعل مناولة الأمتعة وحل مشكلات الأمتعة المفقودة أسرع وأكثر كفاءة.

مراقبة الأماكن العامة باستخدام YOLOE

غالبًا ما تتضمن لقطات المراقبة للأماكن العامة، مثل الأسواق والمقاهي المزدحمة، مزيجًا من الأشخاص والأشياء والأنشطة التي تتغير على مدار اليوم. يمكن لـ YOLOE تحليل هذه اللقطات في الوقت الفعلي باستخدام وضع عدم الحاجة إلى مطالبات، واكتشاف العناصر تلقائيًا مثل الحقائب أو الطاولات أو الدراجات دون الحاجة إلى تعليمات محددة.

الشكل 5. يمكن لـ YOLOE اكتشاف كائنات متنوعة في مكان عام مزدحم.

هذا مفيد بشكل خاص لفرق الأمن لاكتشاف العناصر غير المراقبة أو تتبع حركة الحشود. إن قدرة YOLOE على اكتشاف كائنات متعددة في وقت واحد تجعل من السهل إدارة الأماكن العامة خلال الأحداث أو الفترات المزدحمة، مما يساعد الفرق على البقاء على اطلاع واستجابة.

إيجابيات وسلبيات YOLOE

فيما يلي بعض الفوائد الرئيسية لاستخدام YOLOE لتطبيقات رؤية الكمبيوتر:

  • أداء في الوقت الفعلي: تم تحسين YOLOE للمعالجة السريعة والفعالة، مما يتيح الكشف في الوقت الفعلي، حتى في البيئات الديناميكية مثل تدفقات الفيديو المباشرة أو الأماكن العامة المزدحمة.
  • قابلية التوسع: يتميز YOLOE بقابليته للتوسع ويعمل بشكل جيد لمجموعة واسعة من التطبيقات، من الأمن والمراقبة إلى البيع بالتجزئة والرعاية الصحية والمركبات ذاتية القيادة.
  • سهل الاستخدام: نظرًا لأن YOLOE مدعوم من حزمة Ultralytics Python، فمن السهل دمجه في مشاريع رؤية الكمبيوتر الحالية.

مع ذلك، هناك بعض القيود التي يجب وضعها في الاعتبار عند استخدام YOLOE. فيما يلي بعض العوامل التي يجب مراعاتها:

  • يتطلب بيانات تدريب كافية: على الرغم من أن YOLOE يدعم الاكتشاف بدون لقطات، إلا أن أداءه على الكائنات غير المرئية يعتمد على مدى تعميمه من بيانات التدريب الخاصة به. في بعض الحالات، قد يحتاج إلى بيانات إضافية أو ضبط دقيق لتحقيق أداء جيد في المهام المتخصصة للغاية.
  • حساسية لجودة الإدخال: يمكن أن تتأثر دقة النموذج بالصور أو مقاطع الفيديو منخفضة الجودة. يمكن أن يقلل الإدخال الضبابي أو ذو الإضاءة الضعيفة من قدرة النموذج على اكتشاف الأجسام بدقة، لذا فإن الإدخال عالي الجودة مهم لتحقيق الأداء الأمثل.

النقاط الرئيسية

يوفر YOLOE مزيدًا من المرونة للرؤية الحاسوبية من خلال السماح للمستخدمين بتوجيه الكشف باستخدام مطالبات نصية أو صور. إنه يعمل بشكل جيد في المواقف الواقعية حيث تتغير المشاهد بسرعة، وإعادة التدريب ليست خيارًا.

من معالجة الأمتعة إلى مراقبة الأماكن العامة، يتكيف YOLOE مع المهام الجديدة بسهولة. مع تزايد إمكانية الوصول إلى الذكاء الاصطناعي، تساعد نماذج مثل YOLOE المزيد من الصناعات على استخدام تكنولوجيا الرؤية بطرق عملية وفعالة.

انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد حول ابتكارات الذكاء الاصطناعي. اكتشف أحدث التطورات في مجالات مثل الذكاء الاصطناعي في البيع بالتجزئة و الرؤية الحاسوبية في الرعاية الصحية في صفحات الحلول الخاصة بنا. تحقق من خيارات الترخيص الخاصة بنا وابدأ في استخدام الرؤية الحاسوبية اليوم!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا
تم نسخ الرابط إلى الحافظة