GPT (Generative Pre-trained Transformer)
استكشف أساسيات GPT (المحولات التوليدية المدربة مسبقًا). تعلم كيفية عمل هذه النماذج وكيفية دمجها مع Ultralytics YOLO26 للرؤية الحاسوبية.
يشير GPT (المحولات التوليدية المدربة مسبقًا) إلى عائلة من نماذج الشبكات العصبية المصممة لإنشاء نصوص تشبه النصوص البشرية وحل المهام المعقدة من خلال التنبؤ بالعنصر التالي في سلسلة ما. تم بناء هذه النماذج على بنية Transformer، وتحديدًا باستخدام كتل فك التشفير التي تسمح لها بمعالجة البيانات بالتوازي بدلاً من التسلسل. يشير جانب "المدربة مسبقًا" إلى أن النموذج يخضع لمرحلة أولية من التعلم غير الخاضع للإشراف على مجموعات بيانات ضخمة—تشمل الكتب والمقالات ومواقع الويب—لتعلم الهيكل الإحصائي للغة. أما "التوليدية" فتعني القدرة الأساسية للنموذج: إنشاء محتوى جديد بدلاً من مجرد تصنيف المدخلات الموجودة.
Link to this sectionالبنية الأساسية والوظائف#
في قلب نموذج GPT يكمن آلية الانتباه، وهي تقنية رياضية تسمح للشبكة بوزن أهمية الكلمات المختلفة في الجملة بالنسبة لبعضها البعض. تُمكّن هذه الآلية النموذج من فهم السياق والفروق الدقيقة والاعتمادات طويلة المدى، مثل معرفة أن ضميرًا في نهاية فقرة يشير إلى اسم ذُكر في البداية.
بعد التدريب المسبق الأولي، تخضع هذه النماذج عادةً لـ الضبط الدقيق لتخصيصها لمهام معينة أو لمواءمتها مع القيم البشرية. غالبًا ما تُستخدم تقنيات مثل التعلم التعزيزي من التغذية الراجعة البشرية (RLHF) لضمان أن ينتج النموذج استجابات آمنة ومفيدة ودقيقة. هذه العملية المكونة من خطوتين—التدريب المسبق العام متبوعًا بضبط دقيق محدد—هي ما يجعل نماذج GPT نماذج أساسية متعددة الاستخدامات.
Link to this sectionتطبيقات العالم الحقيقي#
لقد انتقلت نماذج GPT من الأبحاث النظرية إلى أدوات عملية يومية عبر مختلف الصناعات.
- مساعدو البرمجة الأذكياء: يستخدم المطورون أدوات مدعومة بتقنية GPT لكتابة البرمجيات وتصحيح أخطائها وتوثيقها. تقوم هذه وكلاء الذكاء الاصطناعي بتحليل سياق مستودع الكود لاقتراح وظائف كاملة أو تحديد الأخطاء، مما يسرع دورة حياة التطوير بشكل كبير.
- أتمتة خدمة العملاء: تستفيد روبوتات المحادثة الحديثة من GPT للتعامل مع استفسارات العملاء المعقدة. على عكس الأنظمة القديمة القائمة على القواعد، يمكن لهذه المساعدين الافتراضيين فهم القصد والحفاظ على سجل المحادثة وإنشاء ردود مخصصة في الوقت الفعلي.
Link to this sectionدمج GPT مع الرؤية الحاسوبية#
بينما يتفوق GPT في معالجة اللغات الطبيعية (NLP)، فإنه غالبًا ما يتم دمجه مع الرؤية الحاسوبية (CV) لإنشاء أنظمة متعددة الوسائط. يتضمن سير العمل الشائع استخدام كاشف عالي السرعة مثل Ultralytics YOLO26 لتحديد الكائنات في صورة، ثم تغذية تلك المخرجات المنظمة إلى نموذج GPT لإنشاء سرد وصفي.
يوضح المثال التالي كيفية استخراج أسماء الكائنات باستخدام YOLO26 لإنشاء سلسلة سياق لمطالبة GPT:
from ultralytics import YOLO
# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")
# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Extract detected class names to construct a text description
class_names = [model.names[int(cls)] for cls in results[0].boxes.cls]
# This string serves as the context for a GPT prompt
print(f"Detected objects for GPT context: {', '.join(class_names)}")Link to this sectionالمفاهيم ذات الصلة والتمييز#
من المفيد تمييز GPT عن البنى الشائعة الأخرى لفهم دوره المحدد.
- GPT مقابل BERT: يستخدم كلاهما بنية Transformer، لكنهما يختلفان في الاتجاهية. BERT (تمثيلات المشفر ثنائية الاتجاه من المحولات) هو نموذج مشفر فقط ينظر إلى السياق من اليسار واليمين في وقت واحد، مما يجعله مثاليًا لمهام مثل التصنيف وتحليل المشاعر. GPT هو نموذج فك تشفير فقط يتنبأ بالرمز التالي بناءً على الرموز السابقة، مما يجعله محسنًا لـ توليد النصوص.
- GPT مقابل LLM: مصطلح نموذج اللغة الكبير (LLM) هو فئة واسعة للنماذج الضخمة المدربة على كميات هائلة من النصوص. GPT هي بنية محددة وعلامة تجارية لـ LLM، تم تطويرها بشكل بارز بواسطة OpenAI.
Link to this sectionالتحديات والتوقعات المستقبلية#
على الرغم من قدراتها المبهرة، تواجه نماذج GPT تحديات مثل الهلوسة، حيث تولد معلومات خاطئة بثقة. يعمل الباحثون بنشاط على تحسين أخلاقيات الذكاء الاصطناعي وبروتوكولات السلامة. علاوة على ذلك، فإن دمج GPT مع أدوات مثل Ultralytics Platform يسمح بخطوط أنابيب أكثر قوة حيث تعمل نماذج الرؤية واللغة معًا لحل مشاكل معقدة في العالم الحقيقي.






