تبسيط عملية إضافة التعليقات التوضيحية للصور باستخدام Ultralytics
تعرف على كل ما تحتاج إلى معرفته حول تعليق الصور باستخدام Ultralytics وأدواتها المدمجة لتصنيف مجموعات البيانات وإدارة التعليقات وإعداد البيانات للنماذج.

تعرف على كل ما تحتاج إلى معرفته حول تعليق الصور باستخدام Ultralytics وأدواتها المدمجة لتصنيف مجموعات البيانات وإدارة التعليقات وإعداد البيانات للنماذج.

أطلقت Ultralytics Ultralytics ، وهي بيئة مصممة لدعم دورة حياة تطوير الرؤية الحاسوبية بالكامل. تعمل هذه المنصة على تجميع الأدوات المستخدمة لإدارة المراحل المختلفة لسير عمل الذكاء الاصطناعي في مجال الرؤية، بما في ذلك إعداد مجموعات البيانات، ووضع العلامات على الصور ومقاطع الفيديو، وتدريب النماذج، ونشرها.
على الرغم من تزايد استخدام حلول الرؤية الحاسوبية في قطاعات مثل القيادة الذاتية والرعاية الصحية، لا يزال تطوير هذه الحلول يُعتبر عملية مجزأة. ويعود أحد الأسباب الرئيسية لذلك إلى أن نماذج الرؤية الحاسوبية تعتمد بشكل كبير على جودة البيانات التي يتم تدريبها عليها. فقبل أن يبدأ التدريب، يجب إنشاء مجموعات البيانات وتنظيمها ومراجعتها وتصنيفها حتى يتمكن النموذج من تعلم ما يجب عليه detect التعرف عليه.
عند التعامل مع البيانات المرئية، تُعرف هذه العملية باسم «توضيح البيانات» أو «توضيح الصور». وأثناء عملية توضيح الصور، يتم تمييز أجزاء محددة من الصورة وتعيين تسميات لها لتوجيه النموذج أثناء التدريب.
على سبيل المثال، إذا كان الهدف هو detect في الصور، فقد يقوم المُصنّفون برسم مربعات محددة حول كل كلب لإظهار مكان ظهوره. وفي المهام الأكثر تفصيلاً، قد يقومون برسم ملامح شكل الكلب باستخدام أقنعة التجزئة أو تحديد النقاط الرئيسية لتسجيل وضعيته. وتؤثر هذه الأمثلة المُصنّفة بشكل مباشر على مدى جودة أداء النموذج بمجرد نشره.
قد تشكل إدارة عمليات تدفق عمل تعليق الصور على نطاق واسع تحديًا. فمجموعات البيانات الضخمة غالبًا ما تتطلب معايير تصنيف متسقة، وتعاونًا بين العديد من القائمين على التعليق، وأدوات تسهل مراجعة التعليقات وصقلها.
تجمع Ultralytics بين هذه الميزات ومحرر تعليقات مدمج. وهي تدعم أنواعًا متعددة من مهام التعليق، وتوفر للفرق طريقة أبسط لتصنيف البيانات وإعداد مجموعات بيانات الرؤية الحاسوبية ضمن مسار عمل واحد.

في هذا المقال، سنتعرف على الكيفية التي يساعد بها محرر التعليقات التوضيحية Ultralytics الفرق على إضافة التعليقات التوضيحية إلى مجموعات البيانات بكفاءة وتبسيط عملية إعداد البيانات. هيا بنا نبدأ!
قبل أن نستكشف أدوات تعليق الصور المتوفرة على Ultralytics ، دعونا نرجع قليلاً إلى الوراء لفهم ماهية تعليق البيانات وأهميتها في بناء أنظمة الرؤية الحاسوبية.
تتعلم نماذج الرؤية الحاسوبية من خلال تحليل مجموعات ضخمة من الصور أو مقاطع الفيديو، والتي تُعرف باسم «مجموعات البيانات». ومع ذلك، لا توفر الصور الأولية وحدها معلومات كافية للنموذج لفهم ما يجب عليه detect التعرف عليه. ولجعل البيانات مفيدة للتدريب، يجب تصنيف الصور من خلال عملية «تصنيف البيانات» حتى يتمكن النموذج من تعلم الكائنات أو الأشكال أو الأنماط التي يجب عليه البحث عنها.
أثناء عملية تعليق الصور، يتم تمييز عناصر محددة داخل الصورة وتخصيص تسميات لها تصف ما يجب أن يتعلمه النموذج. وتقوم هذه الأمثلة المُصنَّفة بتوجيه نماذج وخوارزميات التعلم العميق أثناء التدريب، وتساعدها على التعرف على الأنماط المماثلة عند معالجة الصور الجديدة.
تتطلب مهام الرؤية الحاسوبية المختلفة أنواعًا مختلفة من تعليقات الصور، وذلك حسب التطبيق وحالة الاستخدام. على سبيل المثال، قد يقوم المُعلِّقون برسم مربعات محددة حول الكائنات من أجل الكشف عنها، أو تحديد مناطق في الصورة من أجل التجزئة الدلالية، أو تحديد النقاط الرئيسية لتقدير الوضع، أو تعيين تسميات للصورة بأكملها من أجل التصنيف.
غالبًا ما يتطلب إعداد البيانات لمشاريع الرؤية الحاسوبية التعامل مع تنسيقات ملفات متنوعة وتنظيم مجموعات البيانات. كما يشمل ذلك التأكد من أن كل شيء جاهز لعملية التوضيح وتدريب خوارزميات التعلم الآلي. وفي العديد من سير العمل، تتوزع هذه العملية على أدوات متعددة، حيث يتم تحميل البيانات وتنقيحها ونقلها بين الأنظمة قبل أن تصبح جاهزة للاستخدام.
تسهل Ultralytics هذه العملية من خلال تولي مهام إعداد البيانات وتدريب النماذج ونشرها ضمن بيئة واحدة. يمكن للفرق تحميل الصور أو مقاطع الفيديو أو أرشيفات مجموعات البيانات، والاستفادة من نهج قابل للتخصيص بالكامل لإعداد بياناتهم باستخدام التعليقات التوضيحية اليدوية أو الآلية التي تعتمد على الذكاء الاصطناعي. تدعم Ultralytics كلاً من البيانات الأولية والتنسيقات القياسية مثل YOLO COCO مما يسهل بدء مشاريع جديدة. كما توفر الوصول إلى مجموعات البيانات الموجودة على المنصة، بما في ذلك مجموعات البيانات المُعلّقة التي يمكن للفرق استخدامها لبدء مشاريع أو تجارب جديدة بسرعة.

بمجرد توفر البيانات، يمكن إدارتها مباشرةً على المنصة. يمكن للمطورين مراجعة الصور، ومراقبة تقدم عملية وضع العلامات، واستخدام أدوات العرض المرئي المدمجة لفهم توزيع مجموعة البيانات وتحديد الثغرات المحتملة.
تدعم المنصة أيضًا إدارة إصدارات مجموعات البيانات، مما يساعد الفرق على التقاط لقطات من بياناتهم مع تطورها. وهذا يسهل track ومقارنة التجارب والحفاظ على الاتساق أثناء التدريب.
وبعد إعداد البيانات، يمكن للفرق الانتقال إلى مرحلة تعليق الصور، حيث يتم تصنيفها لمساعدة النماذج على تعلم العناصر التي يجب detect.
بمجرد تحميل البيانات، تكون الخطوة التالية هي عملية التوضيح. وهي المرحلة التي يتم فيها تصنيف بيانات الصور، مما يضع الأساس لتدريب نماذج الرؤية الحاسوبية لاحقًا. تتضمن Ultralytics خدمات مدمجة لتوضيح الصور من خلال محرر توضيح يتيح للفرق تصنيف مجموعات البيانات وإدارتها مباشرةً ضمن نفس البيئة.
يتم فتح محرر التعليقات التوضيحية في مساحة عمل بسيطة حيث يمكن للمستخدمين مراجعة الصور وإضافة التسميات وتحديث التعليقات التوضيحية حسب الحاجة. يتم تنظيم كل شيء في مكان واحد، مما يسهل الحفاظ على اتساق مجموعات البيانات وجاهزيتها للتدريب.
يمكن للفرق تحميل مجموعات البيانات والبدء في تصنيف الصور مباشرةً من خلال المتصفح، مع تحديد فئات التعليقات التوضيحية وإدارتها لضمان اتساق التصنيفات عبر مجموعة البيانات. ومع إنشاء التعليقات التوضيحية، يمكن للمستخدمين مراجعتها بصريًّا في المحرر، مما يسهل التحقق من دقتها قبل الانتقال إلى مرحلة تدريب النموذج.
تتضمن Ultralytics أيضًا العديد من الميزات التي تدعم سير العمل الفعال في تصنيف مجموعات البيانات، مما يسهل عملية التوضيح باستخدام خوارزميات متطورة.
فيما يلي بعض الميزات الرئيسية المتوفرة في Ultralytics :
من خلال الجمع بين الأدوات اليدوية والذكاء الاصطناعي والأتمتة، تساعد Ultralytics المستخدمين على تعليق الصور بشكل أكثر كفاءة. كما تتيح إعداد بيانات تدريب عالية الجودة لنماذج الرؤية الحاسوبية القابلة للتطوير.
ستتطلب حالات الاستخدام المختلفة، مثل ضمان جودة المنتجات، أنواعًا مختلفة من التعليقات التوضيحية، اعتمادًا على العناصر المطلوب اكتشافها داخل الصور أو مقاطع الفيديو. وكما أشرنا سابقًا، تدعم Ultralytics خمس مهام لاكتشاف الكائنات، لكل منها نوعها الخاص من التعليقات التوضيحية.
دعونا نلقي نظرة عن كثب على مهام التوضيح المدعومة على المنصة وكيفية استخدامها لتصنيف مجموعات البيانات.
يُعرف اكتشاف الكائنات ويحدد مواقع الكائنات داخل الصورة. ويقوم المُصنّفون بتمييز كل كائن مهم باستخدام مربعات محددة، للإشارة إلى أماكن ظهور العناصر في الصورة.
في محرر التعليقات التوضيحية، يتم ذلك باستخدام أداة «المربع المحيط». يمكن للمستخدمين الدخول إلى «وضع التحرير»، والنقر والسحب لرسم مستطيل حول كائن ما، وتعيين تسمية فئة من القائمة المنسدلة.
يمكن تعديل مربعات الحدود بعد إنشائها. يمكن للمُعلِّمين تغيير حجمها عن طريق سحب مقابض الزوايا أو الحواف، أو نقلها عن طريق سحب مركز المربع، أو حذفها باستخدام اختصارات لوحة المفاتيح. تساعد هذه التعليقات التوضيحية نماذج الرؤية على تعلم كيفية detect في مختلف المشاهد والظروف.

توفر تقنية تجزئة الكيانات تعليقات توضيحية أكثر تفصيلاً من خلال تحديد الشكل الدقيق للكائنات داخل الصورة. فبدلاً من رسم مربع بسيط، يقوم المُعلّقون بتحديد حدود الكائن باستخدام التعليقات التوضيحية متعددة الأضلاع لإنشاء أقنعة دقيقة لمهام تجزئة الصور.
يتضمن محرر التعليقات التوضيحية أداة "المضلع" المخصصة لهذه المهمة. يقوم المُعلِّقون بوضع عدة نقاط حول حواف الكائن لتحديد شكله. وبمجرد وضع النقاط، يمكن إغلاق المضلع لإنشاء قناع تقسيم.
يمكن تعديل الرؤوس بعد إنشاء المضلع. ويمكن تحريك النقاط الفردية لتحسين حدود الكائنات، كما يمكن إزالة الرؤوس عند الحاجة. تساعد هذه التعليقات التوضيحية على مستوى البكسل النماذج على تعلم الهياكل البصرية التفصيلية والتمييز بين الكائنات التي تبدو قريبة من بعضها البعض.
تسجل تعليقات تقدير الوضع مواقع مفاصل الجسم والعلاقات بينها. وهذا يساعد النماذج على فهم بنية وحركة الأشخاص أو الحيوانات في الصورة.
باستخدام أداة النقاط المرجعية، يقوم المُصنّفون بوضع نقاط مرجعية تمثل مفاصل الجسم مثل الكتفين والمرفقين والمعصمين والوركين والركبتين والكاحلين. تدعم المنصة عدة قوالب هيكلية مدمجة، بما في ذلك تنسيق COCO لوضعيات COCO المكون من 17 نقطة، بالإضافة إلى قوالب لليدين والوجوه والكلاب وزوايا الصناديق.
تتيح القوالب وضع تخطيط هيكلي كامل بنقرة واحدة، وبعد ذلك يمكن تعديل النقاط الرئيسية الفردية لتتوافق مع الوضعية الموجودة في الصورة. كما يمكن أن تتضمن كل نقطة رئيسية علامة إظهار للإشارة إلى ما إذا كانت مرئية أم محجوبة.

تتجاوز الصناديق المحيطة الموجهة الصناديق المحيطة التقليدية بخطوة إلى الأمام من خلال دعم ميزة الدوران. ويُعد هذا النوع من التعليقات التوضيحية مفيدًا عندما تظهر الكائنات بزوايا معينة بدلاً من أن تكون متوازية مع إطار الصورة.
في محرر التعليقات التوضيحية، يمكن للمعلقين استخدام أداة «المربع المحيط الموجه» لرسم مستطيلات مائلة حول الكائنات. وبعد رسم المربع الأولي، يمكن استخدام مقبض الدوران لتعديل الزاوية، بينما تسمح مقابض الزوايا بتغيير حجم المربع.
غالبًا ما تُستخدم التعليقات التوضيحية المقلوبة في الصور الجوية ومجموعات بيانات الفحص الصناعي، وفي حالات أخرى تظهر فيها الأجسام بشكل مائل أو من زوايا رؤية مختلفة.

يُصنف تصنيف الصور الصورة بأكملها بدلاً من تحديد العناصر الفردية الموجودة فيها.
بالنسبة لمجموعات بيانات التصنيف، يوفر محرر التعليقات التوضيحية لوحة لاختيار الفئات. يمكن للمُعلِّمين تخصيص تسميات للصور عن طريق اختيار فئة من الشريط الجانبي أو باستخدام اختصارات لوحة المفاتيح لتسريع عملية التسمية.
تساعد هذه العلامات المرفقة بالصور النماذج على تعلم الأنماط البصرية عالية المستوى التي تمثل الفئات المختلفة.
غالبًا ما يتطلب تصنيف الصور لأغراض مثل التجزئة عملاً دقيقًا ومفصلاً، لا سيما عندما يتعين تحديد معالم الكائنات بدقة. تتضمن Ultralytics أدوات للتعليق التوضيحي مدعومة بالذكاء الاصطناعي تعمل على تسريع العملية مع الحفاظ على دقة التعليقات التوضيحية وسهولة مراجعتها.
على سبيل المثال، يمكن للمُعلِّمين التفاعل مع الصورة من خلال النقر على أجزاء من الكائن الذي يرغبون في تضمينه في التعليق التوضيحي. كما يمكنهم تحديد المناطق التي يجب استبعادها لتحسين النتيجة. وبناءً على هذه المدخلات، يقوم النموذج بإنشاء قناع تقسيم في الوقت الفعلي، والذي يمكن بعد ذلك مراجعته وتعديله قبل حفظه.
يسهل هذا النهج معالجة الصور المعقدة دون الحاجة إلى تتبع كل التفاصيل يدويًّا. وفي الوقت نفسه، يظل المُعلِّقون مسيطرين على النتيجة النهائية، مما يضمن اتساق التعليقات التوضيحية عبر مجموعة البيانات.

تعمل هذه الميزات بواسطة نماذج Segment Anything Models (SAM). وتشكل هذه النماذج جزءًا من منظومة أوسع نطاقًا من أدوات الرؤية الحاسوبية مفتوحة المصدر، المصممة لتوليد عمليات تقسيم عالية الجودة من مدخلات محدودة. تدعم المنصة عدة SAM ، بما في ذلك SAM .1 SAM . وهذا يمنح الفرق المرونة في الاختيار بين الأداء الأسرع والنتائج الأكثر تفصيلاً وفقًا لاحتياجاتها.
يمكن استخدام هذه الأدوات المدعومة بالذكاء الاصطناعي في مهام متنوعة مثل اكتشاف الكائنات، وتقسيم الحالات، واكتشاف المربعات المحيطة الموجهة. وهذا يعني أن الفرق يمكنها معالجة مجموعات البيانات الضخمة بكفاءة أكبر مع الحفاظ على الجودة المطلوبة لتدريب النماذج بشكل موثوق.
مع تقدم عملية وضع العلامات، من الشائع العودة لتعديل العلامات أو تصحيح أي أخطاء أو مراجعة الصور بمزيد من الدقة. يتضمن محرر Ultralytics أدوات مدمجة تجعل التعامل مع هذه المهام اليومية أسهل وأقل استهلاكًا للوقت.
تشمل بعض ميزات سير العمل المتوفرة في المحرر ما يلي:
تلعب فئات التعليقات التوضيحية الواضحة والمتسقة دورًا مهمًا في إنشاء مجموعات بيانات موثوقة في مجال الرؤية الحاسوبية. ومع توسع نطاق المشاريع، قد تصبح إدارة عملية تصنيف البيانات عبر مجموعات البيانات الضخمة أمرًا صعبًا، لا سيما عند مشاركة عدد كبير من القائمين على وضع التعليقات التوضيحية. ويساعد الحفاظ على تنظيم الفئات بشكل جيد على ضمان اتساق التعليقات التوضيحية وتعلم النماذج من البيانات المنظمة.
تعمل Ultralytics على تبسيط هذه العملية من خلال دمج إدارة الفئات مباشرةً في محرر التوضيح. فبدلاً من التعامل مع العلامات بشكل منفصل، يمكن للفرق إنشاء الفئات وتحديثها ومراجعتها أثناء العمل على الصور، مما يسهل الحفاظ على الاتساق طوال مسار عمل التوضيح.
داخل المحرر، تتوفر جميع الفئات في شريط جانبي بجانب لوحة التعليقات التوضيحية. وهذا يسهل اختيار التسمية الصحيحة أثناء إضافة التعليقات التوضيحية، ويتيح track استخدام الفئات عبر مجموعة البيانات. ويمكن للمستخدمين البحث عن الفئات الموجودة أو إنشاء فئات جديدة حسب الحاجة، دون مقاطعة سير عملهم.
يمكن أيضًا تحديث تفاصيل الفئات في أي وقت. يمكن تعديل الأسماء مباشرةً، كما يمكن تعيين ألوان لتسهيل تمييز الفئات المختلفة عبر التعليقات التوضيحية. يعرض المحرر أيضًا عدد التعليقات التوضيحية المرتبطة بكل فئة، ويتيح للمستخدمين مراجعتها، مما يساعد الفرق على التحقق من الاتساق والدقة.
تُدار جميع الفئات من خلال جدول مركزي يمكن من خلاله فرزها والبحث فيها وتحديثها. وتُطبق أي تغييرات يتم إجراؤها هنا تلقائيًا على مجموعة البيانات بأكملها، مما يساعد الفرق على الحفاظ على الاتساق مع توسع نطاق مشاريع التوضيح.

مع انتقال أنظمة الرؤية الحاسوبية من مرحلة التطوير إلى الاستخدام الفعلي، تلعب جودة البيانات المُعلمة دورًا أساسيًا في أداء النماذج. وتساعد مجموعات البيانات المُعلمة جيدًا النماذج على إصدار تنبؤات أكثر دقة واتساقًا، لا سيما في البيئات الديناميكية أو التي يصعب التنبؤ بها.
في الواقع، يمكن حتى لأدنى التناقضات في عملية الترميز أن تؤثر على سلوك النموذج. وقد لا تظهر الاختلافات في طريقة تصنيف الكائنات أو التعامل مع الحالات الاستثنائية بوضوح أثناء التدريب، لكنها قد تؤدي إلى تنبؤات أقل موثوقية بمجرد بدء تشغيل الأنظمة.
علاوة على ذلك، قد تصبح هذه التناقضات أكثر وضوحًا في التطبيقات العملية. فعلى سبيل المثال، في مجال الروبوتات وأنظمة الرعاية الصحية، تعتمد النماذج على المدخلات البصرية detect وتوجيه الإجراءات في الوقت الفعلي. وقد تؤثر الاختلافات في التصنيف على دقة تفسير هذه الأنظمة لمحيطها.
من خلال الحفاظ على ممارسات توضيحية متسقة واستخدام منصات مثل Ultralytics مجموعات البيانات وتحسينها بمرور الوقت، يمكن للفرق بناء نماذج تعمل بشكل أكثر موثوقية خارج نطاق بيئات الاختبار الخاضعة للرقابة.
يعد التعليق على البيانات بجودة عالية أمرًا ضروريًا لتدريب نماذج الرؤية الحاسوبية الدقيقة ودعم مشاريع التعليق على الصور الناجحة. تعمل Ultralytics على تبسيط هذه العملية من خلال محرر تعليقات قوي يدعم مهام الرؤية المتعددة. ومن خلال الجمع بين أدوات التعليق اليدوي والتصنيف المدعوم بالذكاء الاصطناعي باستخدام SAM يزات سير العمل SAM يمكن للفرق إعداد مجموعات البيانات بكفاءة أكبر والانتقال بسرعة أكبر من مرحلة إعداد البيانات إلى مرحلة تطوير النماذج.
انضم إلى مجتمعنا واستكشف مستودع GitHub لمعرفة المزيد عن نماذج الرؤية الحاسوبية. اقرأ عن تطبيقات مثل الذكاء الاصطناعي في قطاع السيارات والرؤية الحاسوبية في مجال الروبوتات على صفحات الحلول الخاصة بنا. اطلع على خيارات الترخيص المتاحة لدينا وابدأ في بناء نموذج الذكاء الاصطناعي الخاص بك للرؤية.
ابدأ رحلتك مع مستقبل تعلم الآلة