اكتشف كيف يستخدم التعلم غير الخاضع للإشراف التجميع وتقليل الأبعاد واكتشاف الحالات الشاذة للكشف عن الأنماط الخفية في البيانات.
التعلّم غير الخاضع للإشراف هو فرع ديناميكي من فروع التعلم الآلي (ML) حيث تقوم الخوارزميات بتحليل وتجميع مجموعات البيانات غير الموسومة. على عكس الأساليب الخاضعة للإشراف التي تتطلب "مفاتيح إجابة" أو مدخلات ومخرجات مصنفة تُترك خوارزميات التعلّم غير الخاضع للإشراف لاكتشاف الأنماط الخفية والبنى الأساسية والارتباطات ضمن البيانات من تلقاء نفسها. هذه القدرة تجعلها أداة أساسية في مجال الذكاء الاصطناعي الأوسع نطاقًا, لا سيما لتحليل البيانات الاستكشافية حيث لا تكون خصائص البيانات مفهومة تمامًا.
يشتمل التعلّم غير الخاضع للإشراف على العديد من المنهجيات المصممة لاستخراج الرؤى من البيانات الأولية. هذه التقنيات غالباً ما يتم تصنيفها حسب أهدافها المحددة:
تسمح القدرة على معالجة كميات كبيرة من البيانات غير المصنفة بالتعلم غير الخاضع للإشراف لدفع عجلة الابتكار في مختلف الصناعات المختلفة:
يتطلب فهم موقع التعلّم غير الخاضع للإشراف في مجال التعلّم الآلي تمييزه عن غيره من الأساليب الأخرى:
في حين أن الأطر مثل Ultralytics مشهورة بمهام الرؤية الخاضعة للإشراف,
المفهوم الأساسي لتجميع البيانات هو مفهوم عالمي. فيما يلي مثال بسيط باستخدام
scikit-learn مكتبة لإجراء تجميع K-Means، وتجميع نقاط البيانات بناءً على ميزاتها بدون
أي تسميات.
import numpy as np
from sklearn.cluster import KMeans
# Create a simple dataset with two distinct groups of data points
# Group 1 is near (1, 2), Group 2 is near (10, 4)
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])
# Initialize K-Means to find 2 clusters
kmeans = KMeans(n_clusters=2, random_state=0, n_init="auto")
# Fit the model to the data (No labels are provided here)
kmeans.fit(X)
# The model automatically assigns a label (0 or 1) to each point based on proximity
print(f"Predicted Clusters: {kmeans.labels_}")
# Output might look like: [1 1 1 0 0 0] showing the separation
يعد التعلم غير الخاضع للإشراف أمرًا بالغ الأهمية للنهوض ب التعلم العميق (DL). التقنيات الحديثة مثل التعلم الخاضع للإشراف الذاتي-حيث يقوم النظام بتوليد تسمياته الخاصة من البيانات- تحدث ثورة في مجالات مثل معالجة اللغات الطبيعية (NLP) والرؤية الحاسوبية. مع ازدياد حجم البيانات العالمية أضعافًا مضاعفة، تصبح القدرة على التعلم من المعلومات غير المسماة أمرًا حيويًا بشكل متزايد من أجل لسير عمل علم البيانات القابل للتطوير.
للتعمق أكثر في التفاصيل التقنية، يمكن الاطلاع على موارد مثل دليل IBM للتعلم غير الخاضع للإشراف و Scikit-learn ووثائق التجميع من Scikit-learn مزيدًا من القراءة الممتازة.