استكشف كيف يعزز الكشف عن المربعات المحيطة الموجهة (OBB) الكشف عن الأجسام من خلال التحديد الدقيق للأجسام المدورة في الصور عبر تطبيقات العالم الحقيقي.

استكشف كيف يعزز الكشف عن المربعات المحيطة الموجهة (OBB) الكشف عن الأجسام من خلال التحديد الدقيق للأجسام المدورة في الصور عبر تطبيقات العالم الحقيقي.
إن التعرف على الأجسام، بغض النظر عن كيفية ترتيبها أو الاتجاه الذي تواجهه، يأتي بشكل طبيعي بالنسبة لنا كبشر. سواء كانت سيارات عند تقاطع طرق أو قوارب في ميناء، يمكننا بسهولة معرفة ماهيتها والاتجاه الذي تشير إليه. ومع ذلك، بالنسبة لأنظمة الذكاء الاصطناعي (AI)، فالأمر ليس بهذه البساطة.
على سبيل المثال، رؤية الحاسوب، وهي فرع من فروع الذكاء الاصطناعي يركز على فهم الصور ومقاطع الفيديو، تُمكّن مهام مثل الكشف عن الأجسام، مما يساعد الآلات على تحديد وتحديد مواقع الأجسام داخل المشهد. يعتمد الكشف التقليدي عن الأجسام على مربعات محيطة محاذاة للمحاور لرسم مربعات حول الأجسام. هذه المربعات لها جوانب مستقيمة وزوايا قائمة ثابتة. يعمل هذا النهج بشكل جيد عندما تكون الأجسام منتصبة وليست قريبة جدًا من بعضها البعض.
ولكن عندما تكون الأجسام مائلة أو مدورة أو قريبة من بعضها البعض، غالبًا ما يكافح الكشف التقليدي عن الأجسام لالتقاطها بدقة. للتعامل مع هذه المواقف الأكثر تعقيدًا، تم تقديم تقنيات مثل الكشف عن المربعات المحيطة الموجهة (OBB). على عكس المربعات المحيطة القياسية، يمكن أن تدور OBBs لتتناسب مع زاوية وشكل الجسم، مما يسمح بملاءمة أكثر إحكامًا ودقة.
تُمكّن نماذج رؤية الحاسوب مثل Ultralytics YOLO11، التي تدعم الكشف عن OBB، مجموعة من التطبيقات في الوقت الفعلي، خاصة في السيناريوهات التي يكون فيها اتجاه الجسم مهمًا، مثل المراقبة الجوية. بالإضافة إلى ذلك، يُستخدم الكشف عن OBB أيضًا في الرعاية الصحية والزراعة وتحليل المستندات.
في هذه المقالة، سوف نستكشف ماهية الكشف عن OBB، وكيف يعمل، وأين يتم تطبيقه في سيناريوهات العالم الحقيقي. هيا بنا نبدأ!
المربع المحيط الموجه هو نوع من المربعات المستطيلة المستخدمة في رؤية الحاسوب لتمثيل الأجسام التي تم الكشف عنها في صورة. في حين أن المربعات المحيطة القياسية محاذاة مع المحاور الأفقية والرأسية للصورة، يمكن أن تدور OBBs لتتناسب مع الزاوية الفعلية للجسم.
تجلب هذه القدرة على الدوران العديد من المزايا. يمكن أن تتماشى OBBs بشكل أوثق مع اتجاه الجسم، مما يسمح للمربع بالتناسب بإحكام حول شكل الجسم واتجاهه. ونتيجة لذلك، يصبح الكشف أكثر دقة وتحديدًا.
تُعد OBBs مفيدة بشكل خاص عندما لا تكون الأجسام منتصبة تمامًا، مثل سيارة تنعطف على طريق منحني في لقطات جوية، أو كتاب مائل على مكتب، أو ورم مستدار في فحص طبي. من خلال مطابقة زاوية الجسم بدقة أكبر، تعمل OBBs على تحسين أداء الكشف وتقليل تداخل الخلفية، وهي رائعة بشكل خاص للتطبيقات التي يكون فيها اتجاه الجسم مهمًا مثل موضعه.
قد يبدو الكشف عن OBB والكشف التقليدي عن الأجسام متشابهين في البداية، لكنهما يستخدمان بطرق مختلفة وفي مواقف مختلفة. دعنا نلقي نظرة فاحصة على كيفية مقارنتهما بمثال.
يمكن تدريب نماذج رؤية الحاسوب، مثل YOLO11، للكشف عن الأجسام وتصنيفها في تطبيقات مختلفة في العالم الحقيقي، مثل الفحص الصناعي. ضع في اعتبارك خط تجميع في مصنع حيث تتحرك أجزاء مختلفة من الماكينة على طول حزام ناقل. قد يتم وضع بعض الأجزاء بدقة، ولكن قد يتم تدوير أجزاء أخرى قليلاً أو إمالتها أو تداخلها بسبب الاهتزاز أو السرعة.
يستخدم الكشف التقليدي عن الأجسام مربعات مستقيمة مستطيلة تتماشى مع الحواف الأفقية والرأسية للصورة. لذلك، عندما يتم تدوير جزء ما، قد لا يتناسب المربع بشكل صحيح - فقد يترك جزءًا من الجسم أو يتضمن جزءًا كبيرًا جدًا من الخلفية. هذا يمكن أن يجعل عمليات الكشف أقل دقة ويصعب على النظام تحديد الجزء بثقة.
الآن، لنفترض أنك تستخدم الكشف عن OBB بدلاً من ذلك. في هذه الحالة، يمكن للنموذج رسم مربع يدور لمطابقة الزاوية الدقيقة لكل جزء. سيتم إحاطة الترس المائل أو المكون الزاوي بإحكام بمربع يتناسب مع شكله واتجاهه. وهذا يعني دقة أفضل وأخطاء أقل ونتائج أكثر موثوقية، خاصة فيما يتعلق بحالات الاستخدام مثل التحكم الآلي في الجودة أو الفرز الروبوتي.
الآن بعد أن أصبح لدينا فهم أفضل لما هو الكشف عن OBB، دعنا نلقي نظرة على بعض نماذج Vision AI الأكثر استخدامًا التي تدعمه.
تم تطوير العديد من نماذج الرؤية الحاسوبية المتقدمة خصيصًا لاكتشاف الأجسام المدورة أو المائلة. من بينها، تشتهر نماذج Ultralytics YOLO بشكل خاص بقدراتها الموثوقة والفعالة في اكتشاف الصناديق المحيطة الموجهة (OBB).
تم تصميم الإصدارات السابقة مثل Ultralytics YOLOv5 لاكتشاف الأجسام القياسي. بينما قدمت التكرارات اللاحقة، مثل Ultralytics YOLOv8 و YOLO11 الأحدث، دعمًا أصليًا لاكتشاف OBB. يوفر YOLO11، على وجه الخصوص، دقة متطورة دون المساومة على السرعة، مما يجعله خيارًا مؤثرًا للتطبيقات في الوقت الفعلي.
تم تدريب نماذج YOLO11 OBB المدربة مسبقًا، مثل YOLO11n-obb، على مجموعات بيانات مثل DOTAv1، والتي تتكون من صور جوية مشروحة بمجموعة من فئات الأجسام مثل الطائرات والسفن وملاعب التنس التي تظهر بزوايا واتجاهات مختلفة.
أيضًا، تتوفر هذه النماذج بخمسة أحجام مختلفة، من النانو (n-obb) إلى الكبير جدًا (x-obb)، لتلبية احتياجات الأداء المختلفة. يتيح هذا التنوع إمكانية تطبيقها في مختلف الصناعات - من مراقبة البنية التحتية الحضرية وفحص الآلات إلى قراءة النصوص المائلة في المستندات الممسوحة ضوئيًا.
في العديد من المواقف الواقعية، قد تختلف الأجسام التي تحتاج إلى اكتشافها تمامًا عن تلك الموجودة في مجموعات بيانات التدريب القياسية. على سبيل المثال، قد تكون الأجسام مثل الأدوات الموجودة على خط الإنتاج أو عبوات المنتجات أو المكونات الموجودة على لوحة الدوائر الكهربائية مدورة أو موضوعة بشكل غير منتظم أو ذات أشكال مختلفة.
لاكتشاف هذه الأجسام المخصصة بدقة، خاصةً عندما يكون الاتجاه مهمًا، من المهم تدريب نماذج مثل YOLO11 باستخدام الصور والتسميات الخاصة بك. تُعرف هذه العملية باسم التدريب المخصص.
إليك نظرة فاحصة على العملية خطوة بخطوة لتدريب YOLO11 لاكتشاف OBB:
تعتبر الأجسام غير المركزية أو المائلة شائعة جدًا في سيناريوهات الحياة الواقعية. دعنا نمر ببعض الأمثلة حيث يحدث اكتشاف OBB فرقًا حقيقيًا من خلال اكتشاف هذه الأجسام بدقة.
يمكن أن يأخذ اكتشاف OBB تحليل الصور الطبية خطوة أخرى إلى الأمام من خلال تحسين الدقة. غالبًا ما تتضمن الصور الطبية هياكل تشريحية مثل الأورام أو الأعضاء أو العظام. غالبًا ما تظهر هذه الهياكل بأشكال غير منتظمة واتجاهات متنوعة. نظرًا لأن OBBs يمكن أن تدور لتتناسب مع زاوية الجسم، فإنها توفر تحديد موقع وقياس أكثر دقة، وهو أمر بالغ الأهمية للتشخيص والتخطيط للعلاج.
هذا النهج فعال بشكل خاص عندما يتعلق الأمر بتحليل صور الأشعة السينية لكسور العظام، حيث يكون موضع العظام ومحاذاتها من العوامل الرئيسية. على سبيل المثال، تم استخدام اكتشاف OBB لتحليل صور الأشعة السينية لمرفق الأطفال. من خلال التكيف مع اتجاه العظام، ساعد ذلك في تحسين دقة الاكتشاف.
تعتبر المراقبة الجوية أداة أساسية في قطاعات مثل السلامة العامة والمراقبة البيئية والتخطيط المدني. يمكن أن تساعد الصور التي تلتقطها الطائرات بدون طيار أو الأقمار الصناعية في تحديد الأجسام مثل السفن والمركبات والمباني. ومع ذلك، في هذه الصور، غالبًا ما تظهر الأجسام صغيرة وبزوايا غير عادية، مما يجعل اكتشافها بدقة أكثر صعوبة.
يحل اكتشاف OBB هذه المشكلة عن طريق إمالة مربعات الإحاطة لتتناسب مع زاوية كل جسم. يؤدي هذا إلى قياسات أكثر دقة لحجم الجسم واتجاهه، مما يدعم اتخاذ قرارات أفضل في مجالات مثل التخطيط الحضري والدفاع والاستجابة للكوارث والمراقبة البيئية.
أحد الأمثلة المثيرة للاهتمام على اكتشاف OBB هو تتبع السفن في المراقبة البحرية. غالبًا ما تلتقط صور الأقمار الصناعية السفن بزوايا وأحجام مختلفة بسبب الطقس أو الإضاءة أو الحركة. يمكن أن تتكيف OBBs مع هذه التغييرات، مما يحسن الاكتشاف، خاصة بالنسبة للسفن الصغيرة أو المخفية جزئيًا.
يُعد فرز المحاصيل بعد الحصاد خطوة حاسمة لضمان الجودة قبل تعبئتها وإرسالها إلى السوق. في حين أن العديد من الأنظمة تعمل بشكل جيد مع الفواكه المستديرة مثل التفاح والبرتقال، إلا أن المحاصيل الطويلة والضيقة، مثل الجزر أو براعم زيزانيا، يمكن أن يكون التعامل معها أكثر صعوبة. تختلف أشكالها، وغالبًا ما ينتهي بها الأمر بزوايا مختلفة، مما يجعل اكتشافها وفرزها بدقة أمرًا صعبًا.
لمعالجة هذه المشكلة، طور الباحثون نظامًا يستخدم اكتشاف الصندوق المحيط الموجه (OBB) لتحديد وتقييم هذه المحاصيل بدقة أكبر. يمكن للنظام اكتشاف محاصيل متعددة في صورة واحدة، حتى لو كانت مائلة أو متداخلة، وتقييم جودتها وموقعها في الوقت الفعلي.
فيما يلي بعض فوائد استخدام اكتشاف الصندوق المحيط الموجه (OBB):
على الرغم من المساعدة في تحسين دقة الاكتشاف في المشاهد المعقدة، إلا أن اكتشاف الصندوق المحيط الموجه (OBB) يأتي مع بعض القيود التي يجب أخذها في الاعتبار:
يسهل اكتشاف الصندوق المحيط الموجه (OBB) على حلول الرؤية الحاسوبية التعرف على الكائنات غير المستقيمة أو المحاذية تمامًا. من خلال التقاط كل من موضع الكائنات واتجاهها، يعزز اكتشاف الصندوق المحيط الموجه (OBB) الدقة عبر حالات الاستخدام الواقعية مثل مسح الصور الطبية أو مراقبة الأراضي الزراعية أو تحليل صور الأقمار الصناعية.
مع نماذج مثل YOLO11 التي تجعل اكتشاف الصندوق المحيط الموجه (OBB) أكثر سهولة، فإنه يصبح خيارًا عمليًا للعديد من الصناعات. سواء كنت تتعامل مع كائنات مائلة أو متداخلة أو ذات أشكال غريبة، فإن اكتشاف الصندوق المحيط الموجه (OBB) يضيف طبقة إضافية من الدقة غالبًا ما تفوتها الطرق القياسية.
هل أنت مهتم بالذكاء الاصطناعي؟ استكشف مستودع GitHub الخاص بنا، وتواصل مع مجتمعنا، وتحقق من خيارات الترخيص الخاصة بنا لبدء مشروع الرؤية الحاسوبية الخاص بك. تعرف على المزيد حول الابتكارات مثل الذكاء الاصطناعي في مجال البيع بالتجزئة و الرؤية الحاسوبية في صناعة الخدمات اللوجستية في صفحات الحلول الخاصة بنا.