استكشف الشبكات العصبية البيانية (GNN) لمعالجة البيانات غير الأوقليدية. تعرف على كيفية تعزيز الشبكات العصبية البيانية (GNN) للمنطق العلائقي جنبًا إلى جنب مع Ultralytics من أجل الذكاء الاصطناعي المتقدم في مجال الرؤية.
شبكة العصبية البيانية (GNN) هي فئة متخصصة من بنى التعلم العميق المصممة لمعالجة البيانات الممثلة في شكل رسوم بيانية. في حين أن النماذج التقليدية مثل الشبكات العصبية التلافيفية (CNNs) مُحسّنة للهياكل الشبكية مثل الصور، وتتميز الشبكات العصبية المتكررة (RNNs) بالبيانات المتسلسلة مثل النصوص أو تحليل السلاسل الزمنية، فإن شبكات GNN تتميز بقدرتها الفريدة على معالجة البيانات غير الأوقليدية. وهذا يعني أنها تعمل على مجموعات بيانات محددة بواسطة العقد (الكيانات) والحواف (العلاقات)، مما يسمح لها بالتعلم من الترابطات المعقدة التي تميز الشبكات في العالم الحقيقي. من خلال التقاط كل من سمات نقاط البيانات الفردية والروابط الهيكلية بينها، تفتح شبكات GNN رؤى قوية في المجالات التي تكون فيها العلاقات بنفس أهمية الكيانات نفسها.
الآلية الأساسية وراء شبكة GNN هي عملية تسمى غالبًا "تمرير الرسائل" أو تجميع الجوار . في هذا الإطار، تقوم كل عقدة في الرسم البياني بتحديث تمثيلها الخاص من خلال جمع المعلومات من جيرانها المباشرين. أثناء تدريب النموذج، تتعلم الشبكة إنتاج تضميناتفعالة — تمثيلات متجهة كثيفة — تقوم بترميز ميزات العقدة جنبًا إلى جنب مع طوبولوجيا جوارها المحلي.
من خلال طبقات متعددة من المعالجة، يمكن للعقدة في النهاية دمج معلومات من أماكن أبعد في الرسم البياني، مما يؤدي إلى توسيع "مجال استقبالها" بشكل فعال. وهذا يسمح للنموذج بفهم سياق العقدة داخل الهيكل الأكبر. تسهل الأطر الحديثة مثل PyTorch و Deep Graph Library (DGL) تنفيذ مخططات تمرير الرسائل المعقدة هذه ، مما يتيح للمطورين إنشاء تطبيقات متطورة قائمة على الرسوم البيانية دون البدء من الصفر.
لتقدير الدور المتميز لشبكات GNN، من المفيد تمييزها عن أنواع الشبكات العصبية (NN) الشائعة الأخرى الموجودة في مجال الذكاء الاصطناعي : * شبكات العصبون العضلي ( GNN ): شبكات عصبية ذات طبقات متعددة تتكون من طبقة من العصبونات العضلية (GNNs) وطبقة من العصبونات العضلية (GNNs) وطبقة من العصبونات العضلية (GNNs
إن القدرة على نمذجة العلاقات التعسفية تجعل شبكات GNNs لا غنى عنها في مختلف الصناعات ذات التأثير الكبير:
يتم دمج الشبكات العصبية البيانية بشكل متزايد في خطوط الأنابيب متعددة الوسائط. على سبيل المثال، قد يستخدم نظام شامل تقسيم الصور لتحديد الأجسام المتميزة في مشهد ما، ثم يستخدم شبكة عصبية بيانية للتفكير في العلاقات المكانية بين تلك الأجسام — والتي يشار إليها غالبًا باسم "الرسم البياني للمشهد". وهذا يسد الفجوة بين الإدراك البصري والتفكير المنطقي .
يوضح Python التالي Python كيفية ربط Vision AI بهياكل الرسوم البيانية. ويستخدم
Ultralytics YOLO26 نموذج detect
تعمل كعقد، ويقوم بإعداد بنية رسم بياني أساسي باستخدام torch.
import torch
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Run inference on an image to find entities (nodes)
results = model("https://ultralytics.com/images/bus.jpg")
# Extract box centers to serve as node features
# Format: [center_x, center_y] derived from xywh
boxes = results[0].boxes.xywh[:, :2].cpu()
x = torch.tensor(boxes.numpy(), dtype=torch.float)
# Create a hypothetical edge index connecting the first two objects
# In a real GNN, edges might be defined by distance or interaction
edge_index = torch.tensor([[0, 1], [1, 0]], dtype=torch.long)
print(f"Graph constructed: {x.size(0)} nodes (objects) and {edge_index.size(1)} edges.")
يمكن للمطورين الذين يسعون إلى إدارة مجموعات البيانات المطلوبة لهذه الأنابيب المعقدة استخدام Ultralytics التي تبسط عمليات التعليق والتدريب لمكونات الرؤية في النظام. من خلال الجمع بين نماذج الرؤية القوية والتفكير العلائقي لـ GNNs، يمكن للمهندسين بناء أنظمة مستقلة مدركة للسياق تفهم العالم من حولها بشكل أفضل.