Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تقدير العمق

تعرف على كيفية إضافة المنظور ثلاثي الأبعاد إلى الرؤية الحاسوبية من خلال تقدير العمق. استكشف تقنيات مثل العمق الأحادي العين والرؤية المجسمة باستخدام نماذج Ultralytics .

تقدير العمق هو عملية حاسمة في الرؤية الحاسوبية تحدد مسافة الأجسام من الكاميرا، مما يضيف بفعالية بعدًا ثالثًا إلى الصور ثنائية الأبعاد. من خلال حساب المسافة بين كل بكسل في الصورة، تنشئ هذه التقنية خريطة عمق، وهي تمثيل حيث تتوافق كثافة البكسل مع المسافة. تحاكي هذه القدرة الرؤية البشرية الثنائية العينين، مما يسمح للآلات بإدراك العلاقات المكانية والهندسة. وهي تقنية أساسية لتمكين الأنظمة المستقلة من التنقل بأمان، وفهم بيئتها، والتفاعل مع الأجسام المادية.

الآليات والتقنيات الأساسية

هناك عدة طرق لتحقيق تقدير العمق، تتراوح من الحلول القائمة على الأجهزة إلى النهج القائمة على البرمجيات فقط باستخدام الذكاء الاصطناعي.

  • أنظمة الرؤية المجسمة: على غرار العين البشرية، تستخدم الرؤية المجسمة كاميرتين موضوعتين جنبًا إلى جنب. تحلل الخوارزميات الاختلافات الطفيفة، أو التباين، بين الصورتين اليسرى واليمنى لتحديد المسافة. يعتمد هذا بشكل كبير على مطابقة الميزات الدقيقةلتحديد النقاط نفسها في كلا الإطارين.
  • تقدير العمق الأحادي العين: تقدر هذه الطريقة المتقدمة العمق من صورة واحدة. نظرًا لأن الصورة الثنائية الأبعاد الواحدة تفتقر إلى بيانات العمق المتأصلة، يتم تدريب نماذج التعلم العميق على مجموعات بيانات ضخمة للتعرف على الإشارات البصرية مثل المنظور وحجم الكائن والانسداد. تتفوق البنى الحديثة، مثل الشبكات العصبية التلافيفية (CNNs)، في هذه المهمة، مما يجعل من الممكن استخلاص بنية ثلاثية الأبعاد من الكاميرات القياسية.
  • LiDAR ووقت الطيران (ToF): المستشعرات النشطة مثل LiDAR (الكشف عن الضوء وتحديد المدى) و كاميرات وقت الطيران تصدر نبضات ضوئية وتقيس الوقت الذي تستغرقه للعودة. تولد هذه الطرق سحب نقطية عالية الدقة وغالبًا ما تستخدم لجمع بيانات الحقيقة الأرضية لتدريب نماذج التعلم الآلي.

تطبيقات واقعية

تعد القدرة على قياس المسافة أمرًا تحويليًا في العديد من الصناعات، حيث تدعم التطبيقات التي تتطلب الوعي المكاني .

  • القيادة الذاتية: تعتمد السيارات ذاتية القيادة على تقدير العمق detect وقياس المسافة إلى المركبات الأخرى والتنقل بأمان في شبكات الطرق المعقدة. وهو جزء لا يتجزأ من اكتشاف الأجسام ثلاثية الأبعاد لتحديد المشاة وراكبي الدراجات.
  • الروبوتات والأتمتة: تستخدم الروبوتات الإدراك العميق في مهام مثل تخطيط المسار والتلاعب بالأشياء. على سبيل المثال، يحتاج روبوت المستودع إلى معرفة المسافة بالضبط بينه وبين الرف لالتقاط طرد دون الاصطدام به.
  • الواقع المعزز (AR): لوضع كائنات افتراضية بشكل مقنع في مشهد من العالم الحقيقي، يجب أن تفهم أجهزة الواقع المعزز الهندسة ثلاثية الأبعاد للبيئة. يضمن تقدير العمق أن الشخصيات الافتراضية يمكن أن تختبئ خلف الأثاث الحقيقي، وهو مفهوم يُعرف باسم معالجة الانسداد.

مثال على الكود: تقدير العمق الأحادي العين

على الرغم من وجود نماذج عمق متخصصة، يمكنك غالبًا استنتاج العلاقات المكانية باستخدام مربعات تحديد الكائنات كبديل للمسافة في السيناريوهات البسيطة (غالبًا ما تعني المربعات الأكبر حجمًا كائنات أقرب). فيما يلي كيفية تحميل نموذج باستخدام ultralytics حزمة detect وهي الخطوة الأولى في العديد من خطوط الإنتاج التي تراعي العمق.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Process results
for result in results:
    # Get bounding boxes (xyxy format)
    boxes = result.boxes.xyxy

    # Iterate through detections
    for box in boxes:
        print(f"Detected object at: {box}")

العلاقة بمفاهيم الرؤية الحاسوبية الأخرى

من المهم التمييز بين تقدير العمق والمصطلحات ذات الصلة. في حين أن اكتشاف الكائنات يحدد ماهية الكائن ومكانه في الفضاء ثنائي الأبعاد (باستخدام مربع حدودي)، فإن تقدير العمق يحدد مدى بعده (المحور Z). وبالمثل، تصنف التجزئة الدلالية البكسلات إلى فئات (مثل الطريق والسماء والسيارة)، بينما يحدد تقدير العمق قيمة المسافة لتلك البكسلات نفسها.

التطورات في مجال الذكاء الاصطناعي المكاني

التقدم الأخير في مجال الذكاء الاصطناعي التوليدي يسد الفجوة بين الرؤية ثنائية الأبعاد وثلاثية الأبعاد. تقنيات مثل Neural Radiance Fields (NeRF) تستخدم صورًا ثنائية الأبعاد متعددة لإعادة بناء مشاهد ثلاثية الأبعاد معقدة، معتمدة بشكل كبير على مبادئ العمق الأساسية. علاوة على ذلك، مع تحسن تقنيات تحسين النماذج ، أصبح من الممكن إجراء تقدير دقيق للغاية للعمق على أجهزة الذكاء الاصطناعي المتطورة. وهذا يتيح الحوسبة المكانية في الوقت الفعلي على أجهزة صغيرة مثل الطائرات بدون طيار أو النظارات الذكية، بفضل منصات مثل Ultralytics لتدريب النماذج ونشرها بكفاءة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن