Data Labeling
تعلم أساسيات تصنيف البيانات (data labeling) لتعلم الآلة. اكتشف أنواعًا رئيسية مثل الكشف عن الكائنات وكيفية تسريع سير العمل باستخدام Ultralytics YOLO26.
توسيم البيانات هو العملية الأساسية لتحديد البيانات الخام—مثل الصور، وإطارات الفيديو، والنصوص، أو الصوت—وإضافة وسوم أو بيانات وصفية مفيدة لتوفير السياق. في مجال تعلم الآلة (ML)، لا يمكن للخوارزميات فهم العالم المادي بشكل متأصل؛ فهي تتطلب "معلماً" لتوجيهها. يأتي هذا التوجيه في شكل مجموعات بيانات موسومة تُستخدم أثناء التعلم الخاضع للإشراف. تعمل هذه الوسوم كـ حقيقة أرضية، والتي تمثل الإجابات الصحيحة التي يسعى النموذج للتنبؤ بها. سواء كنت تدرب مصنفاً بسيطاً أو معمارية معقدة مثل Ultralytics YOLO26، فإن دقة هذه الوسوم واتساقها وجودتها هي المحددات الأساسية لنجاح النموذج.
Link to this sectionتوسيم البيانات مقابل تعليق البيانات#
على الرغم من استخدام المصطلحين غالباً بالتبادل في المحادثات العادية، إلا أن هناك تمييزاً دقيقاً يستحق الذكر. يشير "توسيم البيانات" (Data labeling) بشكل عام إلى العملية الواسعة لتعيين فئة أو وسم لقطعة من البيانات (على سبيل المثال، وسم بريد إلكتروني بـ "رسالة غير مرغوب فيها"). في المقابل، يكون تعليق البيانات غالباً أكثر تخصيصاً لـ رؤية الحاسوب (CV)، ويتضمن التحديد الدقيق للكائنات باستخدام صناديق الإحاطة، أو المضلعات، أو النقاط الرئيسية. ومع ذلك، ضمن معظم مسارات عمل عمليات تعلم الآلة (MLOps)، يصف كلا المصطلحين إنشاء بيانات تدريب عالية الجودة.
Link to this sectionالأنواع الرئيسية في رؤية الحاسوب#
تتغير طريقة التوسيم بناءً على المهمة التي يجب أن يؤديها النموذج. تشمل الأنواع الشائعة ما يلي:
- تصنيف الصور: تعيين وسم واحد لصورة بأكملها، مثل تحديد حالة الطقس بأنها "غائمة" أو "مشمسة".
- اكتشاف الكائنات: رسم صناديق إحاطة ثنائية الأبعاد حول كائنات متميزة لتعليم النموذج ماهية الكائن ومكان وجوده.
- تقسيم المثيلات: إنشاء أقنعة مثالية للبكسل أو مضلعات حول الكائنات، وهو أمر ضروري لتحديد الأشكال والحدود الدقيقة.
- تقدير الوضعية: تحديد نقاط رئيسية معينة على جسم ما، مثل المفاصل الهيكلية، لتحليل الحركة أو وضعية الجسم.
Link to this sectionتطبيقات العالم الحقيقي#
تمتد فائدة توسيم البيانات عبر كل صناعة تقريباً توظف الذكاء الاصطناعي.
-
المركبات ذاتية القيادة: تعتمد السيارات ذاتية القيادة على مجموعات بيانات ضخمة حيث يتم توسيم كل مركبة، ومشاة، وعلامة مرور، وخط مسار بدقة متناهية. تسمح هذه البيانات الموسومة لنظام الإدراك بالتنقل في البيئات المعقدة بأمان. تستثمر شركات المركبات ذاتية القيادة بكثافة في التوسيم على مستوى البكسل لضمان الامتثال لمعايير السلامة.
-
الزراعة الدقيقة: في الزراعة الحديثة، يُستخدم الذكاء الاصطناعي في الزراعة للكشف عن أمراض المحاصيل أو مراقبة مراحل النمو. يستخدم المزارعون نماذج مدربة على صور موسومة لأوراق "سليمة" مقابل أوراق "مصابة" لأتمتة المعالجة، مما يقلل من استخدام المواد الكيميائية ويزيد من الإنتاجية.
Link to this sectionمسار عمل التوسيم#
غالباً ما يكون إنشاء مجموعة بيانات موسومة هو الجزء الأكثر استهلاكاً للوقت في مشروع الذكاء الاصطناعي. تتضمن العملية عادةً نهج "الإنسان في الحلقة" (HITL)، حيث يقوم معلقون بشريون بالتحقق من الوسوم لضمان دقة عالية. تستفيد مسارات العمل الحديثة من أدوات مثل منصة Ultralytics، التي تبسط إدارة مجموعات البيانات وتسمح للفرق بالتعاون في التعليقات التوضيحية. يمكن أيضاً استخدام تقنيات متقدمة مثل التعلم النشط، حيث يقوم النموذج بتوسيم البيانات مسبقاً، ويقوم البشر فقط بتصحيح التنبؤات منخفضة الثقة، مما يسرع العملية بشكل كبير.
يوضح المثال التالي كيفية استخدام نموذج YOLO26 مدرب مسبقاً لتوليد الوسوم تلقائياً (التوسيم التلقائي) لصورة جديدة، والتي يمكن بعد ذلك تصحيحها بواسطة البشر:
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")
# Save the detection results to a text file in standard YOLO format
# This file can now be used as a starting point for data labeling
results[0].save_txt("bus_labels.txt")





