تعرف على كيفية إضافة المنظور ثلاثي الأبعاد إلى الرؤية الحاسوبية من خلال تقدير العمق. استكشف تقنيات مثل العمق الأحادي العين والرؤية المجسمة باستخدام نماذج Ultralytics .
تقدير العمق هو عملية حاسمة في الرؤية الحاسوبية تحدد مسافة الأجسام من الكاميرا، مما يضيف بفعالية بعدًا ثالثًا إلى الصور ثنائية الأبعاد. من خلال حساب المسافة بين كل بكسل في الصورة، تنشئ هذه التقنية خريطة عمق، وهي تمثيل حيث تتوافق كثافة البكسل مع المسافة. تحاكي هذه القدرة الرؤية البشرية الثنائية العينين، مما يسمح للآلات بإدراك العلاقات المكانية والهندسة. وهي تقنية أساسية لتمكين الأنظمة المستقلة من التنقل بأمان، وفهم بيئتها، والتفاعل مع الأجسام المادية.
هناك عدة طرق لتحقيق تقدير العمق، تتراوح من الحلول القائمة على الأجهزة إلى النهج القائمة على البرمجيات فقط باستخدام الذكاء الاصطناعي.
تعد القدرة على قياس المسافة أمرًا تحويليًا في العديد من الصناعات، حيث تدعم التطبيقات التي تتطلب الوعي المكاني .
على الرغم من وجود نماذج عمق متخصصة، يمكنك غالبًا استنتاج العلاقات المكانية باستخدام مربعات تحديد الكائنات
كبديل للمسافة في السيناريوهات البسيطة (غالبًا ما تعني المربعات الأكبر حجمًا كائنات أقرب). فيما يلي كيفية تحميل نموذج
باستخدام ultralytics حزمة detect وهي الخطوة الأولى في العديد من خطوط الإنتاج التي تراعي العمق.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("path/to/image.jpg")
# Process results
for result in results:
# Get bounding boxes (xyxy format)
boxes = result.boxes.xyxy
# Iterate through detections
for box in boxes:
print(f"Detected object at: {box}")
من المهم التمييز بين تقدير العمق والمصطلحات ذات الصلة. في حين أن اكتشاف الكائنات يحدد ماهية الكائن ومكانه في الفضاء ثنائي الأبعاد (باستخدام مربع حدودي)، فإن تقدير العمق يحدد مدى بعده (المحور Z). وبالمثل، تصنف التجزئة الدلالية البكسلات إلى فئات (مثل الطريق والسماء والسيارة)، بينما يحدد تقدير العمق قيمة المسافة لتلك البكسلات نفسها.
التقدم الأخير في مجال الذكاء الاصطناعي التوليدي يسد الفجوة بين الرؤية ثنائية الأبعاد وثلاثية الأبعاد. تقنيات مثل Neural Radiance Fields (NeRF) تستخدم صورًا ثنائية الأبعاد متعددة لإعادة بناء مشاهد ثلاثية الأبعاد معقدة، معتمدة بشكل كبير على مبادئ العمق الأساسية. علاوة على ذلك، مع تحسن تقنيات تحسين النماذج ، أصبح من الممكن إجراء تقدير دقيق للغاية للعمق على أجهزة الذكاء الاصطناعي المتطورة. وهذا يتيح الحوسبة المكانية في الوقت الفعلي على أجهزة صغيرة مثل الطائرات بدون طيار أو النظارات الذكية، بفضل منصات مثل Ultralytics لتدريب النماذج ونشرها بكفاءة.