كيف تستخدم Ultralytics الذكاء الاصطناعي لأتمتة عملية وضع العلامات
اكتشف كيف تستخدم Ultralytics الذكاء الاصطناعي لأتمتة عملية وضع العلامات، وإدارة مجموعات البيانات الضخمة، وتحسين الاتساق، وتسريع تطوير تقنيات الرؤية الحاسوبية.
اكتشف كيف تستخدم Ultralytics الذكاء الاصطناعي لأتمتة عملية وضع العلامات، وإدارة مجموعات البيانات الضخمة، وتحسين الاتساق، وتسريع تطوير تقنيات الرؤية الحاسوبية.
أصبحت حلول الرؤية الحاسوبية التي تحلل الصور ومقاطع الفيديو جزءًا أساسيًا من سير العمل في العديد من القطاعات، بدءًا من التصنيع وصولاً إلى التصوير الطبي. ففي مجال التصنيع، على سبيل المثال، يعتمد الكشف عن عيوب الأسطح في المنتجات التي تتحرك على حزام ناقل على نماذج الرؤية الحاسوبية القادرة على اكتشاف الأنماط الدقيقة.
لكي تعمل هذه النماذج بشكل جيد، يجب تدريبها على بيانات مصنفة يتم فيها تحديد كل عيب بوضوح. وهذا يمكّن هذه النماذج من تعلم ما يجب البحث عنه والتعرف على الأنماط المماثلة.
تُسمى عملية إنشاء هذه العلامات «توضيح البيانات». وعلى وجه الخصوص، يتضمن توضيح الصور والفيديو رسم مربعات محددة، أو تحديد الأشكال، أو وضع علامات على مناطق معينة داخل الصور وإطارات الفيديو.
ورغم أن هذه العملية يمكن إدارتها في حالة مجموعات البيانات الصغيرة، إلا أنها سرعان ما تصبح أكثر صعوبة مع تزايد حجم البيانات. فوضع العلامات على آلاف الصور يتطلب جهدًا يدويًا متواصلًا، مما يجعل عملية التوضيح عقبة رئيسية. وغالبًا ما تكون الأدوات التقليدية بطيئة ومجزأة ويصعب توسيع نطاقها.
تساعد Ultralytics وهي منصة الذكاء الاصطناعي الشاملة للرؤية، في التغلب على هذه التحديات من خلال عملية الترميز المدعومة بالذكاء الاصطناعي. فمن خلال استخدام الذكاء الاصطناعي لإنشاء علامات أولية تلقائيًا يمكن مراجعتها وصقلها بسرعة، تقلل المنصة من الجهد اليدوي وتعزز الكفاءة.
في هذا المقال، سنتعرف على كيفية عمل التوضيح المدعوم بالذكاء الاصطناعي ضمن Ultralytics وكيف يعمل على تحسين عملية التصنيف. هيا بنا نبدأ!
قبل أن نتعمق في كيفية عمل التوضيح المدعوم بالذكاء الاصطناعي على Ultralytics ، دعونا أولاً نلقي نظرة فاحصة على عملية توضيح البيانات.
يُعرف تعليق البيانات، أو ما يُعرف أيضًا بتصنيف البيانات، بأنه عملية تخصيص تصنيفات منظمة للبيانات الأولية بحيث يمكن استخدامها لتدريب نماذج التعلم الآلي. وفي مجال الرؤية الحاسوبية، تحدد هذه التصنيفات الكائنات أو المناطق أو السمات المهمة داخل الصور أو مقاطع الفيديو.
أثناء التدريب، يتعلم النموذج أو الخوارزمية ربط البيانات المدخلة بهذه التصنيفات، مما يجعل جودة التصنيف عاملاً أساسياً في أداء النموذج. فمجموعات البيانات المصنفة بدقة واتساق تتيح للنموذج تعلم الأنماط الصحيحة، في حين أن التصنيفات الرديئة أو غير المتسقة قد تؤدي إلى تنبؤات غير موثوقة.
على سبيل المثال، في حالة استخدام تتعلق بالكشف عن العيوب، يمكن إضافة تعليقات توضيحية إلى صورة منتج موجود على حزام ناقل عن طريق تحديد أماكن ظهور العيوب وتصنيف نوعها. وهذا يساعد النموذج على تعلم شكل العيوب حتى يتمكن من التعرف عليها في الصور الجديدة.
بعد ذلك، دعونا نلقي نظرة على بعض الطرق الشائعة لتعليق الصور في مجال الرؤية الحاسوبية. تُستخدم هذه الطرق لتصنيف البيانات المرئية من أجل مهام مثل اكتشاف الكائنات، وتقسيم الحالات، وتصنيف الصور. وتؤدي كل طريقة من طرق التعليق وظيفة مختلفة، مثل تحديد مواقع الكائنات، أو تحديد الأشكال، أو التعرف على الهياكل الرئيسية.
المربعات المحيطة هي مستطيلات بسيطة تُرسم حول الكائنات الموجودة في الصورة لإظهار مواقعها. وهي تُعد إحدى الطرق الأكثر شيوعًا لتصنيف البيانات في مجال الرؤية الحاسوبية.
من خلال التدريب على الصور التي تحتوي على هذه المربعات، تتعلم نماذج الكشف عن الأجسام التعرف على الأجسام المختلفة وفهم مواقعها داخل الصورة. وهذا يتيح لها detect أجسام في آن واحد وتحديد مكان ظهور كل منها.
على سبيل المثال، لنفترض أننا نحلل مباراة بيسبول باستخدام تقنية الرؤية الحاسوبية. يمكن رسم مربعات حول اللاعبين والمضرب والكرة في كل إطار، مما يتيح للنموذج detect هذه الكائنات detect طوال المباراة.

تتجاوز المضلعات، التي تُعرف أيضًا باسم «أقنعة التجزئة»، حدود الصناديق المحيطة من خلال تصنيف الكائنات على مستوى البكسل. فبدلاً من رسم مستطيل تقريبي، تلتقط هذه المضلعات الشكل والحواف الدقيقة لكل كائن في الصورة. وهذا يجعلها مفيدة في المهام التي تتطلب فهمًا أكثر تفصيلاً.
على سبيل المثال، في مجال القيادة الذاتية، تُستخدم أقنعة التجزئة في مهام مثل التجزئة الدلالية، حيث يتم تصنيف كل بكسل ضمن فئة معينة مثل الطريق أو السماء، والتجزئة الملموسة، حيث يتم تحديد الكائنات الفردية مثل المركبات أو المشاة بشكل منفصل.
كما تُستخدم هذه التقنيات في مهام مثل إزالة الخلفية، حيث يتعين عزل كائن ما، مثل شخص ما، عن بقية الصورة.
تُستخدم النقاط الرئيسية لتمييز نقاط محددة على جسم ما، مثل مفاصل الجسم البشري أو أجزاء من جسم حيوان. ومن خلال تحديد هذه النقاط، يمكن للنماذج فهم بنية الجسم وكيفية ترتيب أجزائه بالنسبة لبعضها البعض.
في مجال الرؤية الحاسوبية، يُعرف هذا باسم «تقدير الوضع»، حيث يتمثل الهدف في تحديد مواقع هذه النقاط الرئيسية وفهم العلاقة بينها. ويتيح تتبع هذه النقاط بمرور الوقت تحليل الحركة والتغيرات في الوضع.

ومن الأمثلة الشائعة على ذلك تحديد مفاصل الجسم في مقطع فيديو لتحليل حركة الإنسان. ومن خلال التركيز على هذه النقاط الرئيسية، يمكن للنماذج رصد وضعية الشخص وكيفية تغيرها بمرور الوقت.
ليست كل العناصر الموجودة في الصورة متوازنة تمامًا. ففي العديد من الحالات الواقعية، تظهر العناصر مائلة أو مقلوبة أو يُنظر إليها من زوايا مختلفة.
غالبًا ما تواجه الصناديق المحيطة القياسية صعوبات في هذه الحالات، حيث قد تتضمن خلفيات غير ضرورية أو تفشل في مطابقة الكائن بدقة. تعالج الصناديق المحيطة الموجهة هذه المشكلة باستخدام مستطيلات مائلة تتوافق مع اتجاه الكائن. وينتج عن ذلك تعليقات توضيحية أكثر دقة وشمولية.
يُستخدم هذا النهج في الكشف عن الصناديق المحيطة الموجهة (OBB)، حيث تحدد النماذج موقع الكائن واتجاهه على حد سواء. ومن الأمثلة على ذلك الصور الجوية، حيث تظهر كائنات مثل المباني أو السفن أو المركبات غالبًا من زوايا مختلفة. وتسهل الصناديق المائلة التقاط شكلها واتجاهها الحقيقيين داخل المشهد.
تتبع علامات التصنيف نهجًا مختلفًا عن طرق التوضيح الأخرى، حيث تُخصص علامة واحدة للصورة بأكملها، بدلاً من تحديد كائنات أو مناطق معينة. وتُستخدم هذه العلامات عندما يكون الهدف هو تحديد العناصر الموجودة في الصورة، دون التركيز على مكان ظهورها.
على سبيل المثال، يمكن تصنيف صورة على أنها «قطة» أو «كلب» بناءً على محتواها العام. وهذا يجعل تصنيف الصور مفيدًا في المهام التي يكفي فيها فهم الصورة على مستوى عام.
تعتمد العديد من أدوات التصنيف التقليدية على خطوات متعددة وسير عمل غير مترابط. وغالبًا ما تضطر فرق تطوير الذكاء الاصطناعي إلى التنقل بين منصات التوضيح من أجل التصنيف والتخزين والتحقق، مما يؤدي إلى إبطاء مشاريع الذكاء الاصطناعي.
تدعم معظم الأدوات مجموعة محدودة فقط من أنواع التعليقات التوضيحية وأنواع البيانات، لذا ينتهي الأمر بالفرق إلى استخدام أدوات مختلفة للمربعات المحيطة والتجزئة والنقاط الرئيسية. وقد يكون من الصعب إدارة هذا النظام المجزأ، خاصة بالنسبة للفرق التي لا تزال مبتدئة في مجال الرؤية الحاسوبية.
ويشكل العمل اليدوي تحديًا رئيسيًا آخر. ففي حين أن تعليق صورة واحدة قد لا يستغرق سوى بضع دقائق، فإن التعامل مع مجموعات البيانات الضخمة سرعان ما يصبح عملية تستغرق وقتًا طويلاً، لا سيما عندما تتطلب الصور المتشابهة مهام متكررة.
مع تزايد حجم مجموعات البيانات، يتعين على الفرق أيضًا إدارة الملفات، track إصدارات track ، والحفاظ على الاتساق بين التعليقات التوضيحية. وهذا يزيد من عبء العمل، حيث يُنفق المزيد من الوقت في إدارة البيانات ويُخصص وقت أقل لتحسين أداء النموذج.
ويتمثل النهج الأكثر كفاءة في استخدام الترميز المدعوم بالذكاء الاصطناعي ضمن Ultralytics التي تستخدم الذكاء الاصطناعي لإنشاء العلامات وصقلها، مما يقلل من الجهد اليدوي مع تحسين السرعة والاتساق، كل ذلك ضمن بيئة واحدة تجمع بين إدارة مجموعات البيانات والترميز وتدريب النماذج ونشرها ومراقبتها.
تعمل Ultralytics على تبسيط عملية وضع العلامات من خلال ربطها مباشرةً ببقية مراحل سير عمل الرؤية الحاسوبية. وبدلاً من الاعتماد على أدوات منفصلة، يمكن للفرق العمل على البيانات والعلامات والنماذج في بيئة واحدة.
وهي تدعم مجموعة من مهام الرؤية الحاسوبية، بما في ذلك اكتشاف الكائنات، وتصنيف الصور، وتقسيم الحالات، وتقدير الوضع، واكتشاف المربعات المحيطة الموجهة.
في إطار هذا النظام، يمكن إجراء عملية الترميز بعدة طرق. يمكن للفرق ترميز البيانات يدويًّا لتحقيق التحكم الكامل، أو استخدام الترميز الذكي SAM للترميز التفاعلي القائم على النقاط، أو تطبيق الترميز الذكي YOLO لإنشاء ترميزات تلقائيًّا يمكن مراجعتها وصقلها. وتسهل هذه المرونة التعامل مع مجموعات البيانات المختلفة ومتطلبات الترميز المتنوعة.

نظرًا لأن عملية وضع العلامات المدعومة بالذكاء الاصطناعي واليدوية مدمجة مع إدارة مجموعات البيانات وتدريب النماذج، يمكن للفرق الانتقال بسلاسة من وضع العلامات على البيانات إلى تنظيم مجموعات البيانات وتدريب النماذج. وهذا يحافظ على تنظيم سير العمل ويزيل الحاجة إلى التبديل بين الأدوات أو إعادة تنسيق العلامات.
تدعم المنصة أيضًاYOLO Ultralytics مثل Ultralytics YOLO11 و Ultralytics مما يتيح استخدام البيانات المُعلَّمة مباشرةً للتدريب والاختبار. وهذا يسهل تحديد الثغرات في مجموعات البيانات، وتحسين التعليقات التوضيحية، وإعادة تدريب النماذج من خلال التكرار المستمر.
تم تصميم ميزة التعليقات التوضيحية الذكية SAM على Ultralytics بهدف تسريع عملية إضافة التعليقات التوضيحية لمهام الكشف عن الكائنات، وتقسيم الحالات، ومهام الصناديق المحيطة الموجهة (OBB).
توفر المنصة عدة إصدارات SAM ، بما في ذلك SAM .1 Tiny SAM .1 Small SAM .1 Base SAM .1 Large SAM ، مما يتيح للمستخدمين الاختيار بين السرعة والدقة.

تتميز النماذج الأصغر حجماً، مثل Tiny وSmall، بسرعتها وتناسبها التام لعمليات التوضيح السريعة، بينما توفر النماذج الأكبر حجماً، مثل Large SAM دقة أعلى للمشاهد الأكثر تعقيداً. ويؤدي التبديل بين النماذج إلى تحديث سلوك عملية التوضيح على الفور.
داخل محرر التوضيح، بمجرد اختيار SAM يمكن للمُصنّفين البشريين الدخول إلى الوضع الذكي لبدء عملية التصنيف. وبدلاً من رسم الأشكال يدويًّا، يتم توجيه النموذج باستخدام مدخلات بسيطة تعتمد على النقاط.
يؤدي النقر بزر الفأرة الأيسر إلى إضافة نقطة موجبة لإدراج منطقة ما، بينما يؤدي النقر بزر الفأرة الأيمن إلى إضافة نقطة سالبة لاستبعاد المناطق غير المرغوب فيها. وبناءً على هذه المدخلات، يقوم النموذج بإنشاء قناع دقيق في الوقت الفعلي.
لتسريع سير العمل، يمكن تمكين وضع "التطبيق التلقائي". وعند تفعيل هذا الوضع، تؤدي كل نقرة تلقائيًا إلى إنشاء تعليق توضيحي وحفظه دون الحاجة إلى تأكيد يدوي. أما بالنسبة للكائنات الأكثر تعقيدًا، فيمكن للمُعلقين إما الضغط باستمرار على مفتاح "Shift" لوضع نقاط متعددة قبل تطبيق القناع، أو تعطيل وضع "التطبيق التلقائي" لإضافة النقاط بحرية ثم الضغط على مفتاح "Enter" لتطبيق القناع.
وعلى غرار التسمية التوضيحية الذكية SAM تستخدم التسمية التوضيحية YOLO على Ultralytics الذكاء الاصطناعي لتسريع عملية التسمية. فبدلاً من توجيه النموذج بالنقرات، تستخدم توقعات النموذج لإنشاء التسميات التوضيحية تلقائيًا.
يدعم هذا النهج مهام مثل اكتشاف الكائنات، وتقسيم المثيلات، ووضع العلامات على الصناديق المحيطة الموجهة (OBB). وهو يعمل بشكل خاص معYOLO Ultralytics بما في ذلك النماذج المُدرَّبة مسبقًا التي توفرها Ultralytics YOLO المُدرَّبة خصيصًا.
داخل محرر التعليقات التوضيحية، يمكن للمُعلِّمين الدخول إلى الوضع الذكي، واختيار YOLO من أداة اختيار النماذج، ثم النقر على «تنبؤ». ولا تعرض أداة اختيار النماذج سوى YOLO التي تتوافق مع مهمة مجموعة البيانات الحالية، مما يضمن توافق التعليقات التوضيحية التي يتم إنشاؤها.
يقوم النموذج بتحليل الصورة وإنشاء تعليقات توضيحية بناءً على تنبؤاته، ثم تُضاف هذه التعليقات مباشرةً إلى الصورة. وإذا تداخلت التنبؤات مع التعليقات التوضيحية الموجودة بالفعل لنفس الفئة، يتم تخطي عمليات الكشف عن التكرار تلقائيًّا عندما يتجاوز التداخل عتبة محددة، مما يساعد في الحفاظ على علامات نظيفة ومتسقة.

بمجرد إنشاء التوقعات، يمكن للمراجعين البشريين مراجعتها أو تعديلها أو حذفها حسب الحاجة. وهذا يسهل عملية تصنيف مجموعات البيانات الضخمة بسرعة، من خلال البدء بالتعليقات التوضيحية التي أنشأها النموذج ثم تحسينها، بدلاً من تصنيف كل شيء يدويًّا.
بمرور الوقت، يمكن إعادة استخدام YOLO المحسّنة لتوليد تنبؤات أفضل، مما يدعم سير عمل تكراري للتصنيف التلقائي.
بعد ذلك، دعونا نستعرض بعض الأمثلة التي توضح كيف تتيح Ultralytics إمكانية تعليق البيانات في حالات الاستخدام الواقعية.
تعتمد المركبات ذاتية القيادة المزودة بنماذج الرؤية الحاسوبية على بيانات بصرية موثقة بدقة لفهم محيطها في الوقت الفعلي. ويمكن للنماذج التي تم تدريبها على هذه البيانات detect segment والمشاة وإشارات المرور وحدود الطرق.
تتطلب مهام التجزئة حدودًا دقيقة على مستوى البكسل، مما يجعل عملية وضع العلامات أمرًا بالغ الأهمية ومستهلكًا للوقت في الوقت نفسه. وقد يتحول وضع العلامات يدويًا على كميات كبيرة من بيانات أجهزة الاستشعار إلى عقبة كبيرة بسرعة، لا سيما في مشاهد القيادة المعقدة.
تعمل Ultralytics على تبسيط هذه العملية من خلال عملية الترميز المدعومة بالذكاء الاصطناعي باستخدام YOLO SAM YOLO . يتيح الترميز الذكي SAM إجراء عملية تقسيم سريعة تعتمد على النقرات باستخدام أقنعة دقيقة، بينما يمكن استخدام YOLO لإنشاء الترميزات تلقائيًا عبر الصور.
تساعد هذه الأساليب مجتمعةً على تسهيل التعامل مع المشاهد المعقدة التي تحتوي على كائنات متداخلة.
نظرًا لأن عملية وضع العلامات ترتبط ارتباطًا مباشرًا بتدريب النماذج، يمكن استخدام قواعد البيانات المحدثة واسعة النطاق على الفور لإعادة تدريب النماذج وتقييمها. وهذا يتيح للفرق تحسين الأداء باستمرار والتكيف مع ظروف القيادة الجديدة بشكل أكثر كفاءة.
في مجال التصنيع، يعتمد الحفاظ على جودة ثابتة على الكشف الدقيق عن العيوب أثناء الإنتاج. وغالبًا ما تُستخدم نماذج الرؤية الحاسوبية لتحديد المشكلات في الوقت الفعلي، لكن أداءها يعتمد على مدى دقة انعكاس بيانات التدريب لظروف الإنتاج الفعلية.
قد تؤدي التغيرات في بيئات التصنيع، مثل الاختلافات في المواد الخام أو إعدادات الآلات أو الإضاءة، إلى ظهور أنواع جديدة ونادرة من العيوب لم تكن موجودة في بيانات التدريب الأصلية. وهذا يؤدي إلى وجود فجوة بين ما تعلمه النموذج وما يظهر على خط الإنتاج.
للحفاظ على التوافق، يجب تحديث مجموعات البيانات بانتظام باستخدام تعليقات توضيحية داخلية عالية الجودة. تيسر Ultralytics عملية تحديث التعليقات التوضيحية وتوسيع نطاق مجموعات البيانات مع ظهور أنماط عيوب جديدة. ويمكن بعد ذلك استخدام مجموعات البيانات المحدثة هذه لإعادة تدريب النماذج، مما يساعد الفرق على التكيف بسرعة أكبر مع ظروف الإنتاج المتغيرة.
تُعد مواقع البناء بيئات ديناميكية، حيث تتواجد فيها فرق عمل متعددة ومعدات متحركة وتصميمات تتغير باستمرار. ويعتمد الحفاظ على السلامة في هذه الظروف على وجود بيانات مرئية واضحة ومُشروحة بشكل جيد.
يمكن أن تسهم التعليقات التوضيحية الدقيقة في تحسين جودة البيانات ومساعدة أنظمة الذكاء الاصطناعي على تحديد هوية العمال والمعدات ومعدات السلامة والمخاطر المحتملة في ظل مجموعة متنوعة من ظروف المواقع، بما في ذلك الأماكن المزدحمة والخلفيات المتغيرة والإضاءة المتباينة.
تدعم Ultralytics ذلك من خلال تسهيل تحديث التعليقات التوضيحية وصقلها مع تغير ظروف الموقع. ويمكن التقاط صور جديدة وإضافتها إلى مجموعة البيانات فور ظهورها، مما يضمن توافقها مع السيناريوهات الواقعية.
يعد الترميز عالي الجودة أمرًا ضروريًا لبناء نماذج موثوقة في مجالي الرؤية الحاسوبية والذكاء الاصطناعي، لكن سير العمل التقليدي غالبًا ما يؤدي إلى إبطاء عمل الفرق. تعمل Ultralytics على تبسيط هذه العملية من خلال أدوات الترميز الآلية وسير عمل قابل للتوسع. ونتيجة لذلك، يمكن للفرق الانتقال بسرعة أكبر من البيانات إلى النموذج مع الحفاظ على الدقة والاتساق.
تفضل بزيارة مجتمعنا المتنامي ومستودع GitHub الخاص بنا لمعرفة المزيد عن الرؤية الحاسوبية. إذا كنت ترغب في تطوير حلول للرؤية الحاسوبية، فاطلع على خيارات الترخيص المتاحة لدينا. استكشف صفحات الحلول الخاصة بنا لمعرفة المزيد عن فوائد الرؤية الحاسوبية في مجال التصنيع والذكاء الاصطناعي في مجال الرعاية الصحية.
ابدأ رحلتك مع مستقبل تعلم الآلة