Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

توصيف البيانات

ما هو ترميز البيانات؟ تعلم كيف أن تسمية البيانات باستخدام مربعات الإحاطة أو المضلعات أمر ضروري لتدريب نماذج الذكاء الاصطناعي ورؤية الكمبيوتر الدقيقة.

الشرح التوضيحي للبيانات هو عملية وضع العلامات أو وضع علامات على البيانات الخام أو تدوينها لتوفير سياق يمكن لنموذج يمكن لنموذج التعلم الآلي (ML) فهمه. هذه الخطوة أساسية في التعلّم تحت الإشراف، حيث تعتمد الخوارزميات على الأمثلة المصنفة لتعلم الأنماط وإجراء التنبؤات. تعمل البيانات المشروحة بمثابة الحقيقة الأرضية، والتي تمثل الإجابة "الصحيحة" التي يسعى النموذج إلى تكرارها أثناء التدريب. بدون تعليق توضيحي دقيق، حتى البنى المتطورة مثل Ultralytics YOLO11 لا يمكن أن تعمل بفعالية، حيث أن يرتبط أداء النموذج بشكل جوهري بجودة بيانات بيانات التدريب الخاصة به.

دور الشرح التوضيحي في رؤية الكمبيوتر

في مجال الرؤية الحاسوبية (CV)، تتضمن البيانات يتضمن وضع علامات على ميزات محددة داخل الصور أو إطارات الفيديو. تتطلب المهام المختلفة أساليب مختلفة، حيث يوفر كل منها مستوى فريدًا من التفاصيل للنظام.

  • الكشف عن الكائنات: الشروح ترسم مربعات محددة ثنائية الأبعاد حول الأجسام ذات الأهمية, مثل السيارات أو المشاة. هذا يعلم النموذج ماهية الجسم ومكان وجوده.
  • تجزئة المثيل: تتطلب هذه التقنية تتبع المضلعات الدقيقة حول الأجسام. على عكس المربعات المحددة، فإن التجزئة تحدد بدقة الشكل والمحيط الدقيق للكيان، وهو أمر بالغ الأهمية لتطبيقات مثل الإمساك الآلي.
  • تقدير الوضعية: يقوم الشارحون بتمييز "نقاط رئيسية" محددة على الهدف، مثل مفاصل جسم الإنسان (المرفقين والركبتين والكتفين). يسمح ذلك النماذج track الحركة والوضعية.
  • الصناديق المحدودة الموجهة (OBB): تُستخدم ل الأجسام التي لا تتماشى مع محور الصورة، مثل السفن في صور الأقمار الصناعية أو الطرود على الحزام الناقل. يمكن تدوير هذه المربعات لتناسب اتجاه الكائن.
  • تصنيف الصور: أبسط أشكال أبسط أشكال التعليقات التوضيحية، حيث يتم تعيين تسمية واحدة (مثل "مشمس" أو "ممطر") إلى صورة كاملة.

عادةً ما يتم حفظ التعليقات التوضيحية بتنسيقات منظمة مثل JSON, أو XML أو ملفات نصية بسيطة (مثل تنسيق YOLO )، والتي يتم تحليلها بعد ذلك بواسطة برنامج التدريب.

تطبيقات واقعية

يعمل الشرح التوضيحي للبيانات على تشغيل عدد لا يحصى من التقنيات الحديثة من خلال سد الفجوة بين أجهزة الاستشعار الخام و صنع القرار الذكي.

  1. المركبات ذاتية القيادة: تعتمد السيارات ذاتية القيادة على مجموعات بيانات ضخمة حيث يتم وضع تعليقات توضيحية لكل علامة حارة وإشارة مرور وعائق. البيانات من الكاميرات وأجهزة استشعار LiDAR لتدريب نظام الإدراك في السيارة نظام التصور الخاص بالمركبة على التنقل بأمان. هذا المستوى من التفاصيل أمر بالغ الأهمية لتطوير الذكاء الاصطناعي في حلول السيارات.
  2. التشخيص الطبي: في الذكاء الاصطناعي في الرعاية الصحية، يقوم أخصائيو الأشعة بشرح فحوصات التصوير بالرنين المغناطيسي أو الأشعة السينية لتسليط الضوء على الأورام والكسور. تسمح هذه الصور الطبية المشروحة للنماذج بمساعدة الأطباء من خلال تحديد الشذوذات المحتملة بحساسية عالية.
  3. البيع بالتجزئة الذكي: تستخدم أنظمة السداد الآلية للتعرف على المنتجات. من خلال وضع العلامات الآلاف من سلع البقالة، يمكن للأنظمة تسهيل تجربة تسوق سلسة. شاهد المزيد عن الذكاء الاصطناعي في البيع بالتجزئة.

مقارنة مع المفاهيم ذات الصلة

من المفيد التمييز بين الشرح التوضيحي للبيانات والمصطلحات الأخرى المستخدمة غالبًا في سير عمل إعداد البيانات.

  • التعليق التوضيحي مقابل توسيم البيانات: غالبًا ما يستخدم هذان المصطلحان بالتبادل. ومع ذلك، غالبًا ما يرتبط مصطلح "وضع العلامات" بمهام التصنيف البسيطة التصنيف البسيطة (تعيين فئة)، في حين أن "التعليق التوضيحي" غالبًا ما ينطوي على بيانات وصفية أكثر تعقيدًا مثل رسم الأشكال الهندسية (المضلعات أو المربعات) أو وضع علامات على الطوابع الزمنية في الفيديو.
  • التعليق التوضيحي مقابل زيادة البيانات: ينشئ التعليق التوضيحي التسميات الأولية لمجموعة البيانات. زيادة البيانات هي عملية منفصلة تقوم بشكل مصطنع توسع مجموعة البيانات هذه بشكل مصطنع عن طريق تعديل الصور المشروحة الحالية (على سبيل المثال، التقليب أو التدوير أو تغيير السطوع) لتحسين متانة النموذج.
  • التعليق التوضيحي مقابل التعلم النشط: التعلُّم النشط هو استراتيجية يحدد فيها النموذج نقاط البيانات الأكثر ارتباكًا ويطلب شرحًا تعليقًا توضيحيًا بشريًا لتلك الأمثلة المحددة فقط، مما يؤدي إلى تحسين ميزانية التعليق التوضيحي.

الأدوات وسير العمل

غالباً ما يتطلب إنشاء تعليقات توضيحية عالية الجودة أدوات متخصصة. خيارات مفتوحة المصدر مثل CVAT (أداة الرؤية الحاسوبية للتعليقات التوضيحية) و استوديو التسمية توفر واجهات لرسم المربعات والمضلعات. بالنسبة للعمليات على نطاق واسع، قد تنتقل الفرق إلى بيئات متكاملة مثل منصة Ultralytics القادمة، والتي تبسط دورة الحياة من مصادر البيانات إلى نشر النماذج.

بمجرد وضع التعليقات التوضيحية للبيانات، يمكن استخدامها لتدريب نموذج. يوضح المثال التالي كيفية تدريب YOLO11 باستخدام مجموعة بيانات محددة في ملف YAML، والتي تشير إلى الصور والتسميات المشروحة.

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")

# Train on the COCO8 dataset, which contains pre-annotated images
# The 'data' argument references a YAML file defining dataset paths and classes
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن