استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

DBSCAN (التجميع المكاني القائم على الكثافة للتطبيقات مع الضوضاء)

اكتشف DBSCAN: خوارزمية تجميع قوية لتحديد الأنماط، والتعامل مع الضوضاء، وتحليل مجموعات البيانات المعقدة في التعلم الآلي.

DBSCAN (التجميع المكاني القائم على الكثافة للتطبيقات مع الضوضاء) هي خوارزمية تعلم غير خاضعة للإشراف شائعة تستخدم لتجميع نقاط البيانات المتقاربة، مع تحديد النقاط الموجودة بمفردها في مناطق منخفضة الكثافة كقيم متطرفة. على عكس طرق التجميع الأخرى، لا يتطلب DBSCAN تحديد عدد المجموعات مسبقًا. إن قدرته على إيجاد مجموعات ذات أشكال اعتباطية ومتانته ضد الضوضاء تجعله أداة قوية لتنقيب البيانات و تحليل البيانات. تم تقديم الخوارزمية لأول مرة في ورقة بحثية عام 1996 بواسطة مارتن إستر وهانز بيتر كريجل ويورج ساندر وشياويي شو، والتي أصبحت عملاً تأسيسيًا في هذا المجال.

كيف يعمل DBSCAN

يحدد DBSCAN المجموعات بناءً على كثافة نقاط البيانات في مساحة معينة. وهو يعمل على معيارين أساسيين:

  • إبسيلون (ε أو eps): تحدد هذه المعلمة نصف قطر الجوار حول نقطة بيانات. تعتبر جميع النقاط داخل هذه المسافة جيرانًا.
  • الحد الأدنى من النقاط (MinPts): هذا هو الحد الأدنى لعدد نقاط البيانات (بما في ذلك النقطة نفسها) المطلوبة لتشكيل منطقة أو مجموعة كثيفة.

بناءً على هذه المعلمات، يصنف DBSCAN كل نقطة بيانات إلى أحد الأنواع الثلاثة:

  1. النقاط الأساسية: تعتبر النقطة نقطة أساسية إذا كان لديها على الأقل MinPts في نطاقها eps مجاور. هذه النقاط هي الجزء الداخلي من المجموعة.
  2. النقاط الحدودية: تكون النقطة نقطة حدودية إذا كانت تقع ضمن eps مجاور لنقطة أساسية ولكن ليس لديها عدد كافٍ من الجيران لتكون نقطة أساسية بحد ذاتها. تشكل هذه النقاط حافة المجموعة.
  3. نقاط الضوضاء (القيم المتطرفة): تعتبر النقطة ضوضاء إذا لم تكن نقطة أساسية ولا نقطة حدودية. هذه هي القيم المتطرفة التي لا تنتمي إلى أي مجموعة.

تبدأ الخوارزمية بنقطة اعتباطية وتسترجع جوارها. وإذا كانت نقطة أساسية، يتم إنشاء مجموعة جديدة. ثم تقوم الخوارزمية بتوسيع المجموعة بشكل متكرر عن طريق إضافة جميع الجيران الذين يمكن الوصول إليهم مباشرة إليها، وهي عملية تستمر حتى يتعذر إضافة المزيد من النقاط إلى أي مجموعة. يمكنك رؤية تطبيق مرئي في وثائق scikit-learn.

تطبيقات الذكاء الاصطناعي/تعلم الآلة الواقعية

إن قدرة DBSCAN على تحديد الضوضاء واكتشاف المجموعات غير الخطية تجعله ذا قيمة عالية في مختلف المجالات:

  • التحليل الجغرافي المكاني: يستخدم مخططو المدن والجغرافيون خوارزمية DBSCAN لتحليل البيانات المكانية. على سبيل المثال، من خلال تجميع إحداثيات GPS لحوادث المرور، يمكنهم تحديد النقاط الساخنة للحوادث. وبالمثل، يمكن استخدامه للعثور على تجمعات لحالات الأمراض المبلغ عنها، مما يساعد علماء الأوبئة على تتبع تفشي الأمراض. تستخدم منظمات مثل هيئة المعلومات الجغرافية المكانية في اليابان طرقًا مماثلة قائمة على الكثافة لرسم الخرائط.
  • اكتشاف الحالات الشاذة في مجال التمويل: في القطاع المالي، يمكن استخدام خوارزمية DBSCAN للكشف عن المعاملات الاحتيالية. من خلال تجميع أنماط الإنفاق المعتادة للعميل، يمكن الإبلاغ عن أي معاملة تقع خارج هذه التجمعات (أي يتم تصنيفها كضوضاء) لمزيد من التحقيق. هذا النهج هو عنصر أساسي في أنظمة الكشف عن الاحتيال الحديثة.

DBSCAN و Ultralytics

يركز نظام Ultralytics البيئي بشكل أساسي على نماذج التعلم الخاضع للإشراف، مثل Ultralytics YOLO لمهام تشمل اكتشاف الكائنات، و تصنيف الصور، و تجزئة المثيلات. في حين أن DBSCAN هي طريقة غير خاضعة للإشراف، إلا أن مبادئها ذات صلة في السياق الأوسع لـ رؤية الحاسوب (CV).

على سبيل المثال، بعد إجراء اكتشاف الكائنات باستخدام نموذج مثل YOLO11 على مقطع فيديو لشارع مزدحم، يمكن تطبيق DBSCAN على الإحداثيات المركزية للمربعات المحيطة المكتشفة. يمكن أن تجمع هذه الخطوة اللاحقة لمعالجة البيانات بين عمليات الكشف عن المشاة الفردية في حشود متميزة، مما يوفر مستوى أعلى من فهم المشهد. يعد فهم توزيع البيانات أمرًا بالغ الأهمية أيضًا عند إعداد مجموعات البيانات للتدريب. يمكن أن يكشف تحليل البيانات الاستكشافي باستخدام DBSCAN عن أنماط أو حالات شاذة في مجموعة البيانات، والتي يمكن إدارتها وتصورها باستخدام منصات مثل Ultralytics HUB.

التمييز عن المصطلحات ذات الصلة

  • تجميع K-Means: الفرق الأهم هو أن K-Means يتطلب من المستخدم تحديد عدد المجموعات (clusters).k) مسبقًا، بينما تحدد DBSCAN عدد المجموعات تلقائيًا. تعاني K-Means أيضًا من المجموعات غير الكروية وهي حساسة للقيم المتطرفة، لأنها تجبر كل نقطة على الدخول في مجموعة. تتفوق DBSCAN في العثور على مجموعات ذات أشكال عشوائية وتعزل القيم المتطرفة بشكل فعال كضوضاء.
  • التجميع الهرمي: تنشئ هذه الطريقة شجرة من المجموعات، تُعرف باسم مخطط التفرع. في حين أنه مفيد لتصور هياكل المجموعة المتداخلة، إلا أنه قد يكون أكثر تكلفة من الناحية الحسابية على مجموعات البيانات الكبيرة مقارنة بـ DBSCAN. غالبًا ما يعتمد الاختيار بينهما على حجم مجموعة البيانات والإخراج المطلوب، كما هو موضح في أدلة اختيار خوارزمية التجميع المناسبة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة