أطلق العنان لإمكانات الذكاء الاصطناعي مع رؤية الكمبيوتر! استكشف دورها في الكشف عن الكائنات والرعاية الصحية والسيارات ذاتية القيادة وما بعدها. تعلم المزيد الآن!
الرؤية الحاسوبية (CV) هو مجال تحويلي من مجالات الذكاء الاصطناعي (AI) الذي يمكّن أجهزة الكمبيوتر من إدراك العالم المرئي وتفسيره وفهمه. من خلال معالجة الصور الرقمية ومقاطع الفيديو و والمدخلات المرئية الأخرى، يمكن للآلات استخراج معلومات ذات مغزى واتخاذ إجراءات أو تقديم توصيات بناءً على ذلك التحليل. في حين تعتمد الرؤية البشرية على العين والدماغ لتحديد السياق المحيط على الفور، فإن الرؤية الحاسوبية تستخدم برامج متقدمة و وخوارزميات التعلم الآلي (ML) المتقدمة لتكرار هذه القدرة، مما يسمح للأنظمة بأتمتة المهام التي كانت تتطلب رؤية بشرية في السابق.
تعتمد الرؤية الحاسوبية في جوهرها على تقنيات التعرف على الأنماط لفهم البيانات المرئية البيانات البصرية. تضمنت المحاولات المبكرة ترميز القواعد يدويًا لتعريف الأشياء، لكن السيرة الذاتية الحديثة تعتمد على التعلّم العميق (DL) وكميات هائلة من البيانات التدريبية التدريب. البنية الأكثر شيوعًا المستخدمة اليوم هي الشبكة العصبية التلافيفية (CNN)، والتي تعالج الصور بكسل بكسل. تحدد هذه الشبكات ميزات منخفضة المستوى مثل الحواف والقوام في الطبقات الأولية وتجمعها للتعرف على المفاهيم المعقدة - مثل الوجوه أو المركبات - في طبقات أعمق. تتطلب هذه العملية تتطلب مجموعات بيانات موسومة ضخمة لتعليم النموذج كيفية التمييز بين الفئات المختلفة بفعالية.
الرؤية الحاسوبية ليست عملاً واحداً بل مجموعة من المهام المحددة التي تحل مشاكل مختلفة:
من الشائع الخلط بين الرؤية الحاسوبية و معالجة الصور الرقمية، لكنهما يخدمان أغراضاً مختلفة. تركز معالجة الصور على معالجة الصورة المدخلة لتحسين جودتها أو استخراج المعلومات دون "فهمها" بالضرورة. تتضمن الأمثلة الشائعة تعديل السطوع أو تطبيق المرشحات أو تقليل الضوضاء. على النقيض من ذلك, تركز السيرة الذاتية على فهم الصورة، حيث يكون الهدف هو محاكاة الإدراك البشري لتفسير ما تمثله الصورة.
تمتد فائدة الرؤية الحاسوبية لتشمل كل الصناعات تقريباً، مما يعزز الكفاءة والسلامة:
يمكن للمطورين تنفيذ مهام الرؤية الحاسوبية القوية باستخدام ultralytics حزمة Python . يوضح المثال
أدناه يوضح كيفية تحميل طراز YOLO11-أحدث إصدار
الإصدار المستقر الموصى به لجميع حالات الاستخدام القياسية detect الكائنات في الصورة.
from ultralytics import YOLO
# Load the pretrained YOLO11 model (nano version for speed)
model = YOLO("yolo11n.pt")
# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results to see bounding boxes and labels
results[0].show()
نظام السيرة الذاتية مدعوم بمكتبات قوية مفتوحة المصدر. OpenCV هي مكتبة تأسيسية توفر الآلاف من الخوارزميات من أجل للرؤية الحاسوبية في الوقت الحقيقي. لبناء وتدريب نماذج التعلُّم العميق، أطر عمل مثل PyTorch و TensorFlow هي معايير الصناعة. تعتمد Ultralytics على هذه الأسس لتوفير أحدث النماذج التي يسهل نشرها. بالنظر إلى المستقبل، توفر توفر منصةUltralytics بيئة شاملة لإدارة دورة حياة Vision AI بأكملها، بدءًا من إدارة البيانات وحتى النشر.