Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

الرؤية الحاسوبية (CV)

أطلق العنان لإمكانات الذكاء الاصطناعي مع رؤية الكمبيوتر! استكشف دورها في الكشف عن الكائنات والرعاية الصحية والسيارات ذاتية القيادة وما بعدها. تعلم المزيد الآن!

الرؤية الحاسوبية (CV) هو مجال تحويلي من مجالات الذكاء الاصطناعي (AI) الذي يمكّن أجهزة الكمبيوتر من إدراك العالم المرئي وتفسيره وفهمه. من خلال معالجة الصور الرقمية ومقاطع الفيديو و والمدخلات المرئية الأخرى، يمكن للآلات استخراج معلومات ذات مغزى واتخاذ إجراءات أو تقديم توصيات بناءً على ذلك التحليل. في حين تعتمد الرؤية البشرية على العين والدماغ لتحديد السياق المحيط على الفور، فإن الرؤية الحاسوبية تستخدم برامج متقدمة و وخوارزميات التعلم الآلي (ML) المتقدمة لتكرار هذه القدرة، مما يسمح للأنظمة بأتمتة المهام التي كانت تتطلب رؤية بشرية في السابق.

كيف تعمل رؤية الكمبيوتر؟

تعتمد الرؤية الحاسوبية في جوهرها على تقنيات التعرف على الأنماط لفهم البيانات المرئية البيانات البصرية. تضمنت المحاولات المبكرة ترميز القواعد يدويًا لتعريف الأشياء، لكن السيرة الذاتية الحديثة تعتمد على التعلّم العميق (DL) وكميات هائلة من البيانات التدريبية التدريب. البنية الأكثر شيوعًا المستخدمة اليوم هي الشبكة العصبية التلافيفية (CNN)، والتي تعالج الصور بكسل بكسل. تحدد هذه الشبكات ميزات منخفضة المستوى مثل الحواف والقوام في الطبقات الأولية وتجمعها للتعرف على المفاهيم المعقدة - مثل الوجوه أو المركبات - في طبقات أعمق. تتطلب هذه العملية تتطلب مجموعات بيانات موسومة ضخمة لتعليم النموذج كيفية التمييز بين الفئات المختلفة بفعالية.

المهام الأساسية في الرؤية الحاسوبية

الرؤية الحاسوبية ليست عملاً واحداً بل مجموعة من المهام المحددة التي تحل مشاكل مختلفة:

  • اكتشاف الأجسام: تتضمن هذه المهمة تحديد الكائنات وتحديد موقعها داخل صورة أو دفق فيديو. ترسم مربعات محددة حول العناصر المكتشفة وتعيين لها تسمية فئة، مثل "شخص" أو "دراجة".
  • تصنيف الصور: يقوم النظام يقوم النظام بتحليل صورة كاملة وتعيين تسمية واحدة لها بناءً على محتواها السائد. على سبيل المثال تصنيف صورة على أنها "منظر طبيعي" أو "صورة شخصية".
  • تجزئة المثيل: التعمق أكثر من من الاكتشاف، وهذا يحدد المخطط الدقيق لكل كائن بدقة بكسل كاملة، ويفصل المثيلات الفردية من من نفس الفئة عن الخلفية.
  • تقدير الوضعية: تكتشف هذه التقنية نقاط رئيسية محددة على الشكل، مثل مفاصل جسم الإنسان، track الحركة والوضعية في الوقت الفعلي.

الرؤية الحاسوبية مقابل معالجة الصور

من الشائع الخلط بين الرؤية الحاسوبية و معالجة الصور الرقمية، لكنهما يخدمان أغراضاً مختلفة. تركز معالجة الصور على معالجة الصورة المدخلة لتحسين جودتها أو استخراج المعلومات دون "فهمها" بالضرورة. تتضمن الأمثلة الشائعة تعديل السطوع أو تطبيق المرشحات أو تقليل الضوضاء. على النقيض من ذلك, تركز السيرة الذاتية على فهم الصورة، حيث يكون الهدف هو محاكاة الإدراك البشري لتفسير ما تمثله الصورة.

تطبيقات واقعية

تمتد فائدة الرؤية الحاسوبية لتشمل كل الصناعات تقريباً، مما يعزز الكفاءة والسلامة:

تنفيذ الرؤية الحاسوبية باستخدام YOLO11

يمكن للمطورين تنفيذ مهام الرؤية الحاسوبية القوية باستخدام ultralytics حزمة Python . يوضح المثال أدناه يوضح كيفية تحميل طراز YOLO11-أحدث إصدار الإصدار المستقر الموصى به لجميع حالات الاستخدام القياسية detect الكائنات في الصورة.

from ultralytics import YOLO

# Load the pretrained YOLO11 model (nano version for speed)
model = YOLO("yolo11n.pt")

# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results to see bounding boxes and labels
results[0].show()

الأدوات والمكتبات الرئيسية

نظام السيرة الذاتية مدعوم بمكتبات قوية مفتوحة المصدر. OpenCV هي مكتبة تأسيسية توفر الآلاف من الخوارزميات من أجل للرؤية الحاسوبية في الوقت الحقيقي. لبناء وتدريب نماذج التعلُّم العميق، أطر عمل مثل PyTorch و TensorFlow هي معايير الصناعة. تعتمد Ultralytics على هذه الأسس لتوفير أحدث النماذج التي يسهل نشرها. بالنظر إلى المستقبل، توفر توفر منصةUltralytics بيئة شاملة لإدارة دورة حياة Vision AI بأكملها، بدءًا من إدارة البيانات وحتى النشر.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن