Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

الرؤية الحاسوبية (CV)

استكشف أساسيات الرؤية الحاسوبية (CV). تعرف على كيفية تمكين Ultralytics Ultralytics من اكتشاف الكائنات وتقسيمها وغير ذلك الكثير.

الرؤية الحاسوبية (CV) هي مجال متطور من مجالات الذكاء الاصطناعي (AI) الذي يمكّن أجهزة الكمبيوتر والأنظمة من استخلاص معلومات مفيدة من الصور الرقمية ومقاطع الفيديو والمدخلات المرئية الأخرى. في حين أن الرؤية البشرية تتمتع بقدرة فطرية على إدراك وفهم المحيط على الفور، يجب تدريب أجهزة الكمبيوتر على التعرف على الأنماط وتفسير وحدات البكسل. من خلال الاستفادة من خوارزميات التعلم الآلي (ML) وخاصة خوارزميات التعلم العميق (DL) ، يمكن لأنظمة الرؤية الحاسوبية أخذ البيانات المرئية ومعالجتها وتقديم توصيات أو اتخاذ إجراءات بناءً على تلك المعلومات.

كيف تعمل رؤية الكمبيوتر؟

في جوهره، يرى الكمبيوتر الصورة على أنها مجموعة من القيم الرقمية التي تمثل وحدات البكسل. تعتمد تقنية التعرف البصري الحديثة بشكل كبير على الشبكات العصبية التلافيفية (CNNs)، والتي صممت لتقليد نمط اتصال الخلايا العصبية في الدماغ البشري. تتعلم هذه الشبكات تحديد تسلسل هرمي للسمات — من الحواف والأنسجة البسيطة إلى الأشكال والأشياء المعقدة — من خلال عملية تسمى استخراج السمات.

لكي تعمل هذه النماذج بفعالية، فإنها تتطلب كميات هائلة من بيانات التدريب. على سبيل المثال، للتعرف على سيارة، يحتاج النموذج إلى معالجة آلاف الصور المصنفة للسيارات في ظروف مختلفة. تعمل أدوات مثل Ultralytics على تبسيط سير العمل هذا، مما يتيح للمستخدمين تعليق مجموعات البيانات وتدريب النماذج في السحابة ونشرها بكفاءة.

المهام الأساسية في الرؤية الحاسوبية

الرؤية الحاسوبية ليست وظيفة واحدة بل مجموعة من المهام المتميزة، كل منها يحل مشكلة محددة:

  • تصنيف الصور: تخصص هذه المهمة تصنيفًا لفئة كاملة من الصور، وتجيب على السؤال "ماذا يوجد في هذه الصورة؟" (على سبيل المثال، التمييز بين القطة والكلب).
  • كشف الأجسام: في خطوة أبعد من ذلك، يحدد الكشف الأجسام المتميزة داخل الصورة ويرسم مربعًا حولها. وهذا أمر بالغ الأهمية لعد العناصر أو تحديد ميزات معينة.
  • تجزئة المثيلات: توفر هذه الميزة قناعًا دقيقًا على مستوى البكسل لكل كائن تم اكتشافه، مما يفصل بين المثيلات الفردية من نفس الفئة. وهي ضرورية للتطبيقات التي تتطلب دقة عالية، مثل تحليل الصور الطبية.
  • تقدير الوضع: يتضمن ذلك اكتشاف نقاط محددة على كائن ما، مثل مفاصل جسم الإنسان، track والوضعية.

تطبيقات واقعية

تشمل فائدة الرؤية الحاسوبية جميع الصناعات تقريبًا، حيث تعمل على أتمتة المهام التي كانت تتطلب في السابق تدخل العين البشرية .

  • التصنيع ومراقبة الجودة: في البيئات الصناعية، غالبًا ما يشار إلى CV باسم الرؤية الآلية. وهي تُستخدم لأتمتة فحص الجودة، واكتشاف العيوب الدقيقة في المنتجات على خط التجميع بشكل أسرع وأكثر دقة من المفتشين البشريين. على سبيل المثال، تسمح الذكاء الاصطناعي في التصنيع بمراقبة المعدات في الوقت الفعلي لمنع الأعطال.
  • النقل المستقل: تعتمد السيارات ذاتية القيادة كليًا على CV للتنقل بأمان. من خلال معالجة المدخلات من الكاميرات وأجهزة استشعار LiDAR، تقوم هذه المركبات بالكشف عن الأجسام ثلاثية الأبعاد لتحديد المشاة والمركبات الأخرى وإشارات المرور في الوقت الفعلي. هذا عنصر حاسم لتحقيق مستويات عالية من أتمتة المركبات.
  • الرعاية الصحية والتشخيص: يستخدم أخصائيو الأشعة CV للمساعدة في تحديد الحالات الشاذة في الأشعة السينية والتصوير بالرنين المغناطيسي والأشعة المقطعية. تساعد الذكاء الاصطناعي في الرعاية الصحية في الكشف المبكر عن الأمراض، مثل تحديد الأورام، من خلال إبراز المناطق المهمة التي قد لا تظهر للعين المجردة .

الرؤية الحاسوبية مقابل معالجة الصور

من المهم التمييز بين السيرة الذاتية و معالجة الصور، على الرغم من أنهما غالبًا ما يعملان معًا.

  • تتضمن معالجة الصور معالجة الصورة لتحسينها أو استخراج المعلومات منها (على سبيل المثال، ضبط السطوع والتباين أو تطبيق مرشحات مثل تلك الموجودة في برنامج Adobe Photoshop). وعادة ما تكون النتيجة صورة أخرى.
  • تأخذ الرؤية الحاسوبية صورة كمدخل وتخرج معلومات أو تفسيرًا (على سبيل المثال، "يوجد ثلاثة أشخاص في هذه الغرفة"). تستخدم الرؤية الحاسوبية تقنيات معالجة الصور لإعداد الصور للتحليل بواسطة الشبكات العصبية.

تنفيذ الرؤية الحاسوبية باستخدام Python

المكتبات الحديثة جعلت تنفيذ نماذج CV القوية في متناول الجميع. يوضح المثال أدناه كيفية تحميل أحدث يولو26 نموذج detect في صورة باستخدام ultralytics الحزمة.

from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Run inference on a standard example image
# The model identifies objects and their locations
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting image with bounding boxes
results[0].show()

يستخدم هذا البرنامج النصي البسيط نموذجًا مدربًا مسبقًا لأداء مهام استدلال معقدة ، مما يدل على سهولة الوصول إلى أدوات الذكاء الاصطناعي الحديثة. بالنسبة للمطورين الذين يتطلعون إلى تجاوز الصور الثابتة، يدعم CV أيضًا أنظمة فهم الفيديو والتتبع في الوقت الفعلي المستخدمة في تحليلات الأمن والرياضة. من خلال التكامل مع مكتبات مثل OpenCV، يمكن للمطورين إنشاء تطبيقات شاملة تلتقط وتعالج وتحلل العالم المرئي.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن