Yolo فيجن شنتشن
شنتشن
انضم الآن

ما هو YOLOE؟ المضي قدمًا بنماذج رؤية الكمبيوتر

أبيرامي فينا

5 دقائق قراءة

8 مايو 2025

تعرف على كيف يتيح لك YOLOE العثور على الكائنات باستخدام مطالبة بسيطة أو صورة. فهو يتيح رؤية حاسوب أذكى وأسرع دون إعادة تدريب النماذج أو ضبطها بدقة.

اكتشاف الأجسام هو مهمة رئيسية في رؤية الحاسوب، حيث الهدف هو تحديد وتحديد مواقع الأجسام في الصور أو مقاطع الفيديو. إنه جزء أساسي من رؤية الحاسوب، وهو مجال من مجالات الذكاء الاصطناعي (AI) الذي يمكّن الآلات من فهم وتفسير البيانات المرئية. على سبيل المثال، يمكن أن يساعد اكتشاف الأجسام في تحديد سيارة في صورة أو اكتشاف شخص في بث فيديو.

واحدة من أشهر سلاسل النماذج التي تدعم مهام الرؤية الحاسوبية مثل اكتشاف الأجسام هي سلسلة نماذج YOLO (أنت تنظر مرة واحدة فقط). صُممت نماذج YOLO من أجل السرعة والدقة، وقد تحسنت نماذج YOLO باستمرار بمرور الوقت. على سبيل المثال، أحد أحدث الإصدارات Ultralytics YOLO11أداءً جيدًا في مواقف العالم الحقيقي، حيث يقدم نتائج دقيقة حتى في البيئات الأكثر تعقيدًا.

ولتعزيز هذا التقدم، يهدف نموذج جديد يسمى YOLOE إلى توسيع قدرات نماذج YOLO . على عكس النماذج التقليدية التي تتطلب إعادة التدريب للتعرف على الأجسام الجديدة، يمكن لنموذج YOLOE أن يتبع نصاً بسيطاً أو صورة بسيطة detect الأجسام التي لم يرها من قبل، مما يجعله أكثر قدرة على التكيف مع البيئات المتغيرة.

في هذه المقالة، سنلقي نظرة فاحصة على ما يجعل YOLOE فريدًا من نوعه، وكيف يمكن مقارنته بنماذج YOLO السابقة، وكيف يمكنك البدء في استخدامه اليوم. لنبدأ!

نظرة عامة على YOLOE

YOLOE هو نموذج رؤية حاسوبية يأخذ الكشف عن الكائنات خطوة إلى الأمام. تم تقديمه في مارس 2025 من قبل باحثين في جامعة تسينغهوا. ما يميز YOLOE عن النماذج التقليدية هو استخدامه للكشف عن المفردات المفتوحة. 

في حين يتم تدريب معظم النماذج على التعرف على قائمة ثابتة من الكائنات، يسمح لك YOLOE بتحديد ما تبحث عنه باستخدام وصف قصير أو صورة مثال. على سبيل المثال، إذا كنت تبحث عن “حقيبة ظهر خضراء”، فيمكنك إما كتابة هذا الوصف أو عرض صورة للنموذج، وسيقوم YOLOE بتحديد موقعها داخل المشهد.

بالإضافة إلى ذلك، حتى بدون أي موجه، يمكن لـ YOLOE detect العديد من الأشياء اليومية من تلقاء نفسه. تُسمى هذه القدرة على التعرف على الأشياء التي لم يسبق له رؤيتها من قبل اكتشاف اللقطة الصفرية. وهي مفيدة بشكل خاص في البيئات الديناميكية التي قد تتغير فيها المهمة أو الأشياء ذات الأهمية بشكل غير متوقع.

الشكل 1. نظرة على قدرات YOLOE.

الميزات الرئيسية لـ YOLOE

يدعم YOLOE مجموعة واسعة من الميزات المصممة لتحسين أدائه في التطبيقات الواقعية. وبفضل قدرته على التعامل مع كل من المدخلات المنظمة وغير المنظمة، يفتح YOLOE إمكانيات جديدة لاكتشاف الكائنات وتجزئتها. 

فيما يلي بعض الميزات الرئيسية التي يقدمها النموذج:

  • الاكتشاف المستند إلى المطالبات: يمكن لـ YOLOE البحث عن الكائنات بناءً على مطالبة نصية قصيرة أو صورة مثال. هذا يعني أنك لست بحاجة إلى إعادة تدريب النموذج في كل مرة تتغير فيها مهمتك؛ ما عليك سوى وصف أو إظهار النموذج لما تبحث عنه.
  • تجزئة المثيل: بالإضافة إلى رسم مربعات إحاطة حول الكائنات، يمكن لـ YOLOE تحديد شكلها الدقيق باستخدام تجزئة المثيل. هذا مفيد بشكل خاص عندما تتداخل الكائنات أو عندما تحتاج إلى معرفة الحدود الدقيقة للكائن.
  • التعرف على الكائنات بدون مطالبات: يمكن لـ YOLOE التعرف على الكائنات حتى بدون تعليمات محددة. يستخدم مجموعة من الأوصاف التي تم تعلمها مسبقًا لتحديد الكائنات بسرعة، مما يجعل العملية أسرع وأكثر كفاءة.

مقارنة YOLOE مع نماذج YOLO الأخرى

والآن بعد أن أصبح لدينا فهم أفضل لماهية YOLOE، دعنا نلقي نظرة على بعض النماذج في عائلة YOLO التي تتشابه مع YOLO . 

مع تقدم رؤية الكمبيوتر، تطورت نماذج YOLO أيضاً. على سبيل المثال Ultralytics YOLOv8 دعمًا لمهام جديدة مثل التجزئة والتصنيف، بينما ركزت الإصدارات اللاحقة، مثل Ultralytics YOLO11 على تحسين الدقة والأداء لمجموعة واسعة من المهام.

بالإضافة إلى ذلك، تم إصدار YOLO في يناير 2024 وقدّم إمكانية استخدام المطالبات المكتوبة، مما يتيح للمستخدمين وصف الأشياء التي يريدون العثور عليها. على الرغم من أن YOLO كان خيارًا رائعًا لاكتشاف اللقطة الصفرية، إلا أنه كان يفتقر إلى ميزات مثل تجزئة المثيل ودعم المطالبات المرئية. 

يعتمد YOLOE على YOLO من خلال إضافة هذه الإمكانيات، وتحسين المرونة والأداء، وتقديم أداة أكثر تأثيرًا لتطبيقات الرؤية الحاسوبية الواقعية.

الشكل 2. يدعم كلٌ من YOLO و YOLOE اكتشاف الطلقة الصفرية.

استخدام YOLOE مع حزمة Ultralytics Python

سواءً كنت ترغب في detect كائنات محددة أو استكشاف كل شيء في الصورة، فإن بدء استخدام YOLOE بسيط. هذا النموذج مدعوم بحزمة Ultralytics Python مما يجعل من السهل دمجه في مشاريعك. بعد ذلك، دعنا نتعرف على كيفية استخدامه.

تثبيت حزمة Ultralytics

الخطوة الأولى هي تثبيت حزمةUltralytics Python باستخدام مدير حزم مثل "pip". يمكنك القيام بذلك عن طريق تشغيل الأمر "pip install ultralytics" في جهازك الطرفي أو موجه الأوامر.

بمجرد تثبيت الحزمة، سيكون لديك كل ما تحتاجه لتحميل النموذج، وإجراء التنبؤات، وتجربة أوضاع الكشف المختلفة. إذا واجهت أي مشاكل أثناء التثبيت، فإن وثائق Ultralytics الرسمية تقدم قسمًا مفيدًا لاستكشاف الأخطاء وإصلاحها

هناك عدة طرق مختلفة لاستخدام YOLOE لتشغيل التنبؤات. يعني تشغيل التنبؤات استخدام النموذج المدرب لتحديد وتحديد مواقع الكائنات داخل الصور أو مقاطع الفيديو. تتيح لك هذه الطرق المختلفة تخصيص كيفية التفاعل مع النموذج بناءً على احتياجاتك الخاصة.

دعنا نناقش كل طريقة من هذه الطرق، واحدة تلو الأخرى.

اكتشاف كائنات معينة باستخدام مطالبات نصية أو صور

يستطيع YOLOE detect الأجسام بناءً على وصف نصي قصير. على سبيل المثال، إذا كنت تبحث عن حصان متحرك، يمكنك استخدام مطالبة مثل "حصان يمشي".

للبدء، قم أولاً بتحميل نموذج YOLOE المدرب مسبقًا، وعيّن مطالبتك (وصف ما تريد أن يبحث عنه النموذج) كما هو موضح في مقتطف الشفرة أدناه.

from ultralytics import YOLOE

model = YOLOE("yoloe-11l-seg.pt")
prompt = ["horse walking"]
model.set_classes(prompt, model.get_text_pe(prompt))

بمجرد تعيين النموذج والمطالبة، يمكنك تشغيل النموذج على صورة أو مقطع فيديو. استبدل مسار الملف في التعليمات البرمجية بمسار ملف الصورة أو الفيديو الخاص بك:

results = model.predict("path/to/your/image.jpg")
results[0].show()

سيؤدي هذا إلى عرض الصورة مع الكائن الذي تم اكتشافه بوضوح بناءً على مطالبتك. يمكنك تغيير المطالبة للبحث عن كائنات مختلفة، مثل "حقيبة حمراء" أو "دراجة هوائية" أو "حمار وحشي"، اعتمادًا على ما تبحث عنه.

الشكل 3. مثال على استخدام YOLOE detect كائنات محددة باستخدام موجه نصي.

وبالمثل، يمكنك استخدام صورة لمطالبة YOLOE باستخدام حزمة Ultralytics Python . في وضع المطالبة المرئية، يستخدم النموذج الصورة للعثور على عناصر متشابهة المظهر في مشهد آخر. هذا مفيد بشكل خاص للأشياء التي يصعب وصفها أو تفتقر إلى تسميات واضحة. 

لاستكشاف الكود الخاص بذلك بمزيد من التفصيل، يمكنك الاطلاع على وثائقUltralytics .

اكتشاف عام للكائنات باستخدام YOLOE

في بعض الحالات، قد لا تعرف بالضبط ما الذي تبحث عنه، أو قد لا تبحث عن كائن معين. هذا هو المكان الذي يكون فيه الوضع الخالي من المطالبات مفيدًا. 

باستخدام هذا الخيار، لا تحتاج إلى كتابة وصف أو تقديم صورة مثال. يقوم YOLOE ببساطة بتحليل الصور بمفرده و يكتشف كل ما يمكنه التعرف عليه، مثل الأشخاص أو الحيوانات أو الأثاث أو الأشياء اليومية.

إنها طريقة مفيدة لاستكشاف مشهد دون إعطاء النموذج أي تعليمات محددة. سواء كنت تقوم بمسح غرفة مزدحمة أو مراجعة لقطات بها الكثير من النشاط، فإن الوضع الخالي من المطالبات يمنحك نظرة سريعة على ما هو موجود في الصورة. 

يمكنك استخدام الكود التالي لتشغيل YOLOE في وضع عدم المطالبة. أولاً، يتم تحميل النموذج، ثم يعالج الصورة ويكتشف الكائنات الموجودة فيها تلقائيًا. أخيرًا، يتم عرض النتائج، ويتم تمييز الكائنات المكتشفة. 

تأكد من استبدال مسار الملف بالمسار الفعلي لصورتك.

from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg-pf.pt")
results = model.predict("path/to/image.jpg")
results[0].show()

الصورة الموضّحة أدناه هي مثال على ما يمكن لـ YOLOE detect في الوضع الخالي من المطالبات.

الشكل 4. استخدام YOLOE في الوضع الخالي من المطالبات.

تطبيقات YOLOE في الوقت الفعلي

إن قدرة YOLOE على الاستجابة للمطالبات النصية والصورية تجعله أداة موثوقة للتطبيقات في الوقت الفعلي. تعتبر مرونته مفيدة بشكل خاص في البيئات سريعة الخطى حيث يكون التوقيت والدقة ضروريين. 

دعنا نستكشف بعض الأمثلة الواقعية لكيفية استخدام YOLOE.

تحسين مناولة الأمتعة: الكشف عن الأمتعة في الوقت الفعلي

في المطارات المزدحمة، قد يكون تحديد موقع أمتعة معينة أمرًا صعبًا، خاصة عند التعامل مع الحقائب المفقودة. يمكن لـ YOLOE تبسيط هذه العملية من خلال المساعدة في فحص مقاطع الفيديو الحية وتحديد العناصر بسرعة بناءً على مطالبات بسيطة مثل "حقيبة حمراء". 

إذا كانت الحقيبة مفقودة أو في غير مكانها، يمكن للموظفين بسهولة تغيير الأمر للبحث عن عنصر مختلف، مثل "حقيبة سوداء". يمكن أن تساعد هذه القدرة على التكيف الفوري موظفي المطار في تحديد موقع الأمتعة المناسبة بسرعة دون مراجعة ساعات طويلة من اللقطات أو إعادة تدريب النموذج، مما يجعل مناولة الأمتعة وحل مشكلات الأمتعة المفقودة أسرع وأكثر كفاءة.

مراقبة الأماكن العامة باستخدام YOLOE

غالبًا ما تتضمن لقطات المراقبة للأماكن العامة، مثل الأسواق والمقاهي المزدحمة، مزيجًا من الأشخاص والأشياء والأنشطة التي تتغير على مدار اليوم. يمكن لـ YOLOE تحليل هذه اللقطات في الوقت الفعلي باستخدام وضع عدم الحاجة إلى مطالبات، واكتشاف العناصر تلقائيًا مثل الحقائب أو الطاولات أو الدراجات دون الحاجة إلى تعليمات محددة.

الشكل 5. يستطيع YOLOE detect العديد من الأجسام في الأماكن العامة المزدحمة.

وهذا مفيد بشكل خاص لفرق الأمن لاكتشاف الأشياء غير المراقبة أو track حركة الحشود. تسهّل قدرة YOLOE على detect العديد من الأشياء في وقت واحد إدارة الأماكن العامة أثناء الفعاليات أو الفترات المزدحمة، مما يساعد الفرق على البقاء على اطلاع واستجابة.

إيجابيات وسلبيات YOLOE

فيما يلي بعض الفوائد الرئيسية لاستخدام YOLOE لتطبيقات رؤية الكمبيوتر:

  • أداء في الوقت الفعلي: تم تحسين YOLOE للمعالجة السريعة والفعالة، مما يتيح الكشف في الوقت الفعلي، حتى في البيئات الديناميكية مثل تدفقات الفيديو المباشرة أو الأماكن العامة المزدحمة.
  • قابلية التوسع: يتميز YOLOE بقابليته للتوسع ويعمل بشكل جيد لمجموعة واسعة من التطبيقات، من الأمن والمراقبة إلى البيع بالتجزئة والرعاية الصحية والمركبات ذاتية القيادة.
  • سهل الاستخدام: نظرًا لأن YOLOE مدعوم من حزمة Ultralytics Python فمن السهل دمجه في مشاريع الرؤية الحاسوبية الحالية.

مع ذلك، هناك بعض القيود التي يجب وضعها في الاعتبار عند استخدام YOLOE. فيما يلي بعض العوامل التي يجب مراعاتها:

  • يتطلب بيانات تدريب كافية: على الرغم من أن YOLOE يدعم الاكتشاف بدون لقطات، إلا أن أداءه على الكائنات غير المرئية يعتمد على مدى تعميمه من بيانات التدريب الخاصة به. في بعض الحالات، قد يحتاج إلى بيانات إضافية أو ضبط دقيق لتحقيق أداء جيد في المهام المتخصصة للغاية.
  • حساس لجودة المدخلات: يمكن أن تتأثر دقة النموذج بالصور أو الفيديو منخفض الجودة. يمكن أن تقلل المدخلات الباهتة أو ضعيفة الإضاءة من قدرة النموذج على detect الأجسام بدقة، لذا فإن المدخلات عالية الجودة مهمة لتحقيق الأداء الأمثل.

النقاط الرئيسية

يوفر YOLOE مزيدًا من المرونة للرؤية الحاسوبية من خلال السماح للمستخدمين بتوجيه الكشف باستخدام مطالبات نصية أو صور. إنه يعمل بشكل جيد في المواقف الواقعية حيث تتغير المشاهد بسرعة، وإعادة التدريب ليست خيارًا.

من معالجة الأمتعة إلى مراقبة الأماكن العامة، يتكيف YOLOE مع المهام الجديدة بسهولة. مع تزايد إمكانية الوصول إلى الذكاء الاصطناعي، تساعد نماذج مثل YOLOE المزيد من الصناعات على استخدام تكنولوجيا الرؤية بطرق عملية وفعالة.

انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد حول ابتكارات الذكاء الاصطناعي. اكتشف أحدث التطورات في مجالات مثل الذكاء الاصطناعي في البيع بالتجزئة و الرؤية الحاسوبية في الرعاية الصحية في صفحات الحلول الخاصة بنا. تحقق من خيارات الترخيص الخاصة بنا وابدأ في استخدام الرؤية الحاسوبية اليوم!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا