تعرف على كيف يتيح لك YOLOE العثور على الكائنات باستخدام مطالبة بسيطة أو صورة. فهو يتيح رؤية حاسوب أذكى وأسرع دون إعادة تدريب النماذج أو ضبطها بدقة.
تعرف على كيف يتيح لك YOLOE العثور على الكائنات باستخدام مطالبة بسيطة أو صورة. فهو يتيح رؤية حاسوب أذكى وأسرع دون إعادة تدريب النماذج أو ضبطها بدقة.
اكتشاف الأجسام هو مهمة رئيسية في رؤية الحاسوب، حيث الهدف هو تحديد وتحديد مواقع الأجسام في الصور أو مقاطع الفيديو. إنه جزء أساسي من رؤية الحاسوب، وهو مجال من مجالات الذكاء الاصطناعي (AI) الذي يمكّن الآلات من فهم وتفسير البيانات المرئية. على سبيل المثال، يمكن أن يساعد اكتشاف الأجسام في تحديد سيارة في صورة أو اكتشاف شخص في بث فيديو.
واحدة من أشهر سلاسل النماذج التي تدعم مهام الرؤية الحاسوبية مثل اكتشاف الأجسام هي سلسلة نماذج YOLO (أنت تنظر مرة واحدة فقط). صُممت نماذج YOLO من أجل السرعة والدقة، وقد تحسنت نماذج YOLO باستمرار بمرور الوقت. على سبيل المثال، أحد أحدث الإصدارات Ultralytics YOLO11أداءً جيدًا في مواقف العالم الحقيقي، حيث يقدم نتائج دقيقة حتى في البيئات الأكثر تعقيدًا.
ولتعزيز هذا التقدم، يهدف نموذج جديد يسمى YOLOE إلى توسيع قدرات نماذج YOLO . على عكس النماذج التقليدية التي تتطلب إعادة التدريب للتعرف على الأجسام الجديدة، يمكن لنموذج YOLOE أن يتبع نصاً بسيطاً أو صورة بسيطة detect الأجسام التي لم يرها من قبل، مما يجعله أكثر قدرة على التكيف مع البيئات المتغيرة.
في هذه المقالة، سنلقي نظرة فاحصة على ما يجعل YOLOE فريدًا من نوعه، وكيف يمكن مقارنته بنماذج YOLO السابقة، وكيف يمكنك البدء في استخدامه اليوم. لنبدأ!
YOLOE هو نموذج رؤية حاسوبية يأخذ الكشف عن الكائنات خطوة إلى الأمام. تم تقديمه في مارس 2025 من قبل باحثين في جامعة تسينغهوا. ما يميز YOLOE عن النماذج التقليدية هو استخدامه للكشف عن المفردات المفتوحة.
في حين يتم تدريب معظم النماذج على التعرف على قائمة ثابتة من الكائنات، يسمح لك YOLOE بتحديد ما تبحث عنه باستخدام وصف قصير أو صورة مثال. على سبيل المثال، إذا كنت تبحث عن “حقيبة ظهر خضراء”، فيمكنك إما كتابة هذا الوصف أو عرض صورة للنموذج، وسيقوم YOLOE بتحديد موقعها داخل المشهد.
بالإضافة إلى ذلك، حتى بدون أي موجه، يمكن لـ YOLOE detect العديد من الأشياء اليومية من تلقاء نفسه. تُسمى هذه القدرة على التعرف على الأشياء التي لم يسبق له رؤيتها من قبل اكتشاف اللقطة الصفرية. وهي مفيدة بشكل خاص في البيئات الديناميكية التي قد تتغير فيها المهمة أو الأشياء ذات الأهمية بشكل غير متوقع.

يدعم YOLOE مجموعة واسعة من الميزات المصممة لتحسين أدائه في التطبيقات الواقعية. وبفضل قدرته على التعامل مع كل من المدخلات المنظمة وغير المنظمة، يفتح YOLOE إمكانيات جديدة لاكتشاف الكائنات وتجزئتها.
فيما يلي بعض الميزات الرئيسية التي يقدمها النموذج:
والآن بعد أن أصبح لدينا فهم أفضل لماهية YOLOE، دعنا نلقي نظرة على بعض النماذج في عائلة YOLO التي تتشابه مع YOLO .
مع تقدم رؤية الكمبيوتر، تطورت نماذج YOLO أيضاً. على سبيل المثال Ultralytics YOLOv8 دعمًا لمهام جديدة مثل التجزئة والتصنيف، بينما ركزت الإصدارات اللاحقة، مثل Ultralytics YOLO11 على تحسين الدقة والأداء لمجموعة واسعة من المهام.
بالإضافة إلى ذلك، تم إصدار YOLO في يناير 2024 وقدّم إمكانية استخدام المطالبات المكتوبة، مما يتيح للمستخدمين وصف الأشياء التي يريدون العثور عليها. على الرغم من أن YOLO كان خيارًا رائعًا لاكتشاف اللقطة الصفرية، إلا أنه كان يفتقر إلى ميزات مثل تجزئة المثيل ودعم المطالبات المرئية.
يعتمد YOLOE على YOLO من خلال إضافة هذه الإمكانيات، وتحسين المرونة والأداء، وتقديم أداة أكثر تأثيرًا لتطبيقات الرؤية الحاسوبية الواقعية.

سواءً كنت ترغب في detect كائنات محددة أو استكشاف كل شيء في الصورة، فإن بدء استخدام YOLOE بسيط. هذا النموذج مدعوم بحزمة Ultralytics Python مما يجعل من السهل دمجه في مشاريعك. بعد ذلك، دعنا نتعرف على كيفية استخدامه.
الخطوة الأولى هي تثبيت حزمةUltralytics Python باستخدام مدير حزم مثل "pip". يمكنك القيام بذلك عن طريق تشغيل الأمر "pip install ultralytics" في جهازك الطرفي أو موجه الأوامر.
بمجرد تثبيت الحزمة، سيكون لديك كل ما تحتاجه لتحميل النموذج، وإجراء التنبؤات، وتجربة أوضاع الكشف المختلفة. إذا واجهت أي مشاكل أثناء التثبيت، فإن وثائق Ultralytics الرسمية تقدم قسمًا مفيدًا لاستكشاف الأخطاء وإصلاحها.
هناك عدة طرق مختلفة لاستخدام YOLOE لتشغيل التنبؤات. يعني تشغيل التنبؤات استخدام النموذج المدرب لتحديد وتحديد مواقع الكائنات داخل الصور أو مقاطع الفيديو. تتيح لك هذه الطرق المختلفة تخصيص كيفية التفاعل مع النموذج بناءً على احتياجاتك الخاصة.
دعنا نناقش كل طريقة من هذه الطرق، واحدة تلو الأخرى.
يستطيع YOLOE detect الأجسام بناءً على وصف نصي قصير. على سبيل المثال، إذا كنت تبحث عن حصان متحرك، يمكنك استخدام مطالبة مثل "حصان يمشي".
للبدء، قم أولاً بتحميل نموذج YOLOE المدرب مسبقًا، وعيّن مطالبتك (وصف ما تريد أن يبحث عنه النموذج) كما هو موضح في مقتطف الشفرة أدناه.
from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg.pt")
prompt = ["horse walking"]
model.set_classes(prompt, model.get_text_pe(prompt))بمجرد تعيين النموذج والمطالبة، يمكنك تشغيل النموذج على صورة أو مقطع فيديو. استبدل مسار الملف في التعليمات البرمجية بمسار ملف الصورة أو الفيديو الخاص بك:
results = model.predict("path/to/your/image.jpg")
results[0].show()سيؤدي هذا إلى عرض الصورة مع الكائن الذي تم اكتشافه بوضوح بناءً على مطالبتك. يمكنك تغيير المطالبة للبحث عن كائنات مختلفة، مثل "حقيبة حمراء" أو "دراجة هوائية" أو "حمار وحشي"، اعتمادًا على ما تبحث عنه.

وبالمثل، يمكنك استخدام صورة لمطالبة YOLOE باستخدام حزمة Ultralytics Python . في وضع المطالبة المرئية، يستخدم النموذج الصورة للعثور على عناصر متشابهة المظهر في مشهد آخر. هذا مفيد بشكل خاص للأشياء التي يصعب وصفها أو تفتقر إلى تسميات واضحة.
لاستكشاف الكود الخاص بذلك بمزيد من التفصيل، يمكنك الاطلاع على وثائقUltralytics .
في بعض الحالات، قد لا تعرف بالضبط ما الذي تبحث عنه، أو قد لا تبحث عن كائن معين. هذا هو المكان الذي يكون فيه الوضع الخالي من المطالبات مفيدًا.
باستخدام هذا الخيار، لا تحتاج إلى كتابة وصف أو تقديم صورة مثال. يقوم YOLOE ببساطة بتحليل الصور بمفرده و يكتشف كل ما يمكنه التعرف عليه، مثل الأشخاص أو الحيوانات أو الأثاث أو الأشياء اليومية.
إنها طريقة مفيدة لاستكشاف مشهد دون إعطاء النموذج أي تعليمات محددة. سواء كنت تقوم بمسح غرفة مزدحمة أو مراجعة لقطات بها الكثير من النشاط، فإن الوضع الخالي من المطالبات يمنحك نظرة سريعة على ما هو موجود في الصورة.
يمكنك استخدام الكود التالي لتشغيل YOLOE في وضع عدم المطالبة. أولاً، يتم تحميل النموذج، ثم يعالج الصورة ويكتشف الكائنات الموجودة فيها تلقائيًا. أخيرًا، يتم عرض النتائج، ويتم تمييز الكائنات المكتشفة.
تأكد من استبدال مسار الملف بالمسار الفعلي لصورتك.
from ultralytics import YOLOE
model = YOLOE("yoloe-11l-seg-pf.pt")
results = model.predict("path/to/image.jpg")
results[0].show()الصورة الموضّحة أدناه هي مثال على ما يمكن لـ YOLOE detect في الوضع الخالي من المطالبات.

إن قدرة YOLOE على الاستجابة للمطالبات النصية والصورية تجعله أداة موثوقة للتطبيقات في الوقت الفعلي. تعتبر مرونته مفيدة بشكل خاص في البيئات سريعة الخطى حيث يكون التوقيت والدقة ضروريين.
دعنا نستكشف بعض الأمثلة الواقعية لكيفية استخدام YOLOE.
في المطارات المزدحمة، قد يكون تحديد موقع أمتعة معينة أمرًا صعبًا، خاصة عند التعامل مع الحقائب المفقودة. يمكن لـ YOLOE تبسيط هذه العملية من خلال المساعدة في فحص مقاطع الفيديو الحية وتحديد العناصر بسرعة بناءً على مطالبات بسيطة مثل "حقيبة حمراء".
إذا كانت الحقيبة مفقودة أو في غير مكانها، يمكن للموظفين بسهولة تغيير الأمر للبحث عن عنصر مختلف، مثل "حقيبة سوداء". يمكن أن تساعد هذه القدرة على التكيف الفوري موظفي المطار في تحديد موقع الأمتعة المناسبة بسرعة دون مراجعة ساعات طويلة من اللقطات أو إعادة تدريب النموذج، مما يجعل مناولة الأمتعة وحل مشكلات الأمتعة المفقودة أسرع وأكثر كفاءة.
غالبًا ما تتضمن لقطات المراقبة للأماكن العامة، مثل الأسواق والمقاهي المزدحمة، مزيجًا من الأشخاص والأشياء والأنشطة التي تتغير على مدار اليوم. يمكن لـ YOLOE تحليل هذه اللقطات في الوقت الفعلي باستخدام وضع عدم الحاجة إلى مطالبات، واكتشاف العناصر تلقائيًا مثل الحقائب أو الطاولات أو الدراجات دون الحاجة إلى تعليمات محددة.

وهذا مفيد بشكل خاص لفرق الأمن لاكتشاف الأشياء غير المراقبة أو track حركة الحشود. تسهّل قدرة YOLOE على detect العديد من الأشياء في وقت واحد إدارة الأماكن العامة أثناء الفعاليات أو الفترات المزدحمة، مما يساعد الفرق على البقاء على اطلاع واستجابة.
فيما يلي بعض الفوائد الرئيسية لاستخدام YOLOE لتطبيقات رؤية الكمبيوتر:
مع ذلك، هناك بعض القيود التي يجب وضعها في الاعتبار عند استخدام YOLOE. فيما يلي بعض العوامل التي يجب مراعاتها:
يوفر YOLOE مزيدًا من المرونة للرؤية الحاسوبية من خلال السماح للمستخدمين بتوجيه الكشف باستخدام مطالبات نصية أو صور. إنه يعمل بشكل جيد في المواقف الواقعية حيث تتغير المشاهد بسرعة، وإعادة التدريب ليست خيارًا.
من معالجة الأمتعة إلى مراقبة الأماكن العامة، يتكيف YOLOE مع المهام الجديدة بسهولة. مع تزايد إمكانية الوصول إلى الذكاء الاصطناعي، تساعد نماذج مثل YOLOE المزيد من الصناعات على استخدام تكنولوجيا الرؤية بطرق عملية وفعالة.
انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد حول ابتكارات الذكاء الاصطناعي. اكتشف أحدث التطورات في مجالات مثل الذكاء الاصطناعي في البيع بالتجزئة و الرؤية الحاسوبية في الرعاية الصحية في صفحات الحلول الخاصة بنا. تحقق من خيارات الترخيص الخاصة بنا وابدأ في استخدام الرؤية الحاسوبية اليوم!