Constitutional AI
استكشف كيف يواءم الذكاء الاصطناعي الدستوري (Constitutional AI) النماذج مع القيم البشرية باستخدام مبادئ أخلاقية. تعلم كيفية تنفيذ فحوصات السلامة في رؤية الكمبيوتر مع Ultralytics YOLO26.
الذكاء الاصطناعي الدستوري هو منهجية لتدريب أنظمة الذكاء الاصطناعي لتتوافق مع القيم البشرية من خلال تزويدها بمجموعة من المبادئ عالية المستوى—أو "دستور"—بدلاً من الاعتماد فقط على التغذية الراجعة البشرية المكثفة على المخرجات الفردية. يعلم هذا النهج نموذج الذكاء الاصطناعي بشكل أساسي نقد ومراجعة سلوكه بناءً على مجموعة محددة مسبقًا من القواعد، مثل "كن مفيدًا"، و"كن غير ضار"، و"تجنب التمييز". من خلال تضمين هذه المبادئ التوجيهية الأخلاقية مباشرة في عملية التدريب، يمكن للمطورين إنشاء أنظمة أكثر أمانًا وشفافية وأسهل في التوسع مقارنة بتلك التي تعتمد على التعلم التعزيزي من التغذية الراجعة البشرية (RLHF) اليدوي.
Link to this sectionآلية الذكاء الاصطناعي الدستوري#
يكمن الابتكار الجوهري للذكاء الاصطناعي الدستوري في عملية تدريبه المكونة من مرحلتين، والتي تعمل على أتمتة مواءمة النماذج. على عكس التعلم الخاضع للإشراف التقليدي، حيث يجب على البشر تصنيف كل استجابة صحيحة، يستخدم الذكاء الاصطناعي الدستوري النموذج نفسه لتوليد بيانات التدريب.
-
مرحلة التعلم الخاضع للإشراف: يولد النموذج استجابات للمطالبات، ثم ينتقد مخرجاته الخاصة بناءً على المبادئ الدستورية. ويقوم بمراجعة الاستجابة لتتوافق بشكل أفضل مع القواعد. تُستخدم مجموعة البيانات المنقحة هذه بعد ذلك لضبط النموذج، مما يعلمه اتباع المبادئ التوجيهية بشكل جوهري.
-
مرحلة التعلم التعزيزي: تحل هذه المرحلة، التي غالبًا ما تُسمى التعلم التعزيزي من التغذية الراجعة للذكاء الاصطناعي (RLAIF)، محل المُصنف البشري. يولد الذكاء الاصطناعي أزواجًا من الاستجابات ويختار تلك التي تلتزم بالدستور بشكل أفضل. تُدرب بيانات التفضيلات هذه نموذج مكافأة، والذي بدوره يعزز السلوكيات المطلوبة عبر تقنيات التعلم التعزيزي القياسية.
Link to this sectionالعلاقة برؤية الحاسوب#
بينما نشأ الذكاء الاصطناعي الدستوري في سياق نماذج اللغة الكبيرة (LLM) التي طورتها مؤسسات مثل Anthropic، أصبحت مبادئه ذات صلة متزايدة بمهام تعلم الآلة الأوسع، بما في ذلك رؤية الحاسوب (CV).
- توليد الصور الأخلاقي: يمكن تدريب أدوات الذكاء الاصطناعي التوليدي لإنشاء الصور "دستوريًا" لرفض المطالبات التي قد تؤدي إلى إنشاء صور عنيفة أو كراهية أو محمية بحقوق الطبع والنشر. هذا يضمن أن أوزان النموذج نفسها تشفر قيود السلامة، مما يمنع إنشاء محتوى مرئي ضار.
- أنظمة الرؤية ذات الأهمية للسلامة: في المركبات ذاتية القيادة، يمكن للنهج "الدستوري" تحديد قواعد هرمية لاتخاذ القرار. على سبيل المثال، يمكن لقاعدة تنص على "سلامة الإنسان تتجاوز كفاءة المرور" أن توجه النموذج عند تحليل مشاهد الطرق المعقدة، مما يضمن تفسير نتائج اكتشاف الكائنات مع إعطاء الأولوية للسلامة.
Link to this sectionتنفيذ فحص السياسات في ذكاء الرؤية الاصطناعي#
في حين أن التدريب الكامل للذكاء الاصطناعي الدستوري يتضمن حلقات تغذية راجعة معقدة، يمكن للمطورين تطبيق مفهوم "الفحوصات الدستورية" أثناء الاستدلال لتصفية المخرجات بناءً على سياسات السلامة. يوضح المثال التالي استخدام YOLO26 لاكتشاف الكائنات وتطبيق قاعدة سلامة لتصفية الاكتشافات منخفضة الثقة، مما يحاكي دستور الموثوقية.
from ultralytics import YOLO
# Load the YOLO26 model (latest stable Ultralytics release)
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Apply a "constitutional" safety check: Only accept high-confidence detections
for result in results:
# Filter boxes with confidence > 0.5 to ensure reliability
safe_boxes = [box for box in result.boxes if box.conf > 0.5]
print(f"Safety Check Passed: {len(safe_boxes)} reliable objects detected.")
# Further processing would only use 'safe_boxes'Link to this sectionالذكاء الاصطناعي الدستوري مقابل التعلم التعزيزي من التغذية الراجعة البشرية (RLHF) التقليدي#
من المهم التمييز بين الذكاء الاصطناعي الدستوري والتعلم التعزيزي من التغذية الراجعة البشرية (RLHF) القياسي.
- القابلية للتوسع: يتطلب RLHF كميات هائلة من العمل البشري لتقييم مخرجات النموذج، وهو أمر مكلف وبطيء. يقوم الذكاء الاصطناعي الدستوري بأتمتة ذلك باستخدام وكلاء الذكاء الاصطناعي، مما يجعله قابلًا للتوسع بدرجة كبيرة.
- الشفافية: في RLHF، يتعلم النموذج من "إشارة مكافأة" مبهمة (درجة)، مما يجعل من الصعب معرفة لماذا تم تفضيل سلوك معين. في الذكاء الاصطناعي الدستوري، تجعل مطالبة سلسلة الأفكار المستخدمة أثناء مرحلة النقد الاستدلال صريحًا ويمكن تتبعه إلى مبادئ مكتوبة محددة.
- الاتساق: يمكن أن يكون المقيمون البشر غير متسقين أو متحيزين. يوفر الدستور المكتوب أساسًا ثابتًا لـ أخلاقيات الذكاء الاصطناعي، مما يقلل من الذاتية في عملية المواءمة.
Link to this sectionمستقبل المواءمة#
مع تطور النماذج نحو الذكاء الاصطناعي العام (AGI)، تتزايد أهمية استراتيجيات المواءمة القوية مثل الذكاء الاصطناعي الدستوري. تعد هذه الأساليب ضرورية للامتثال للمعايير الناشئة من هيئات مثل معهد سلامة الذكاء الاصطناعي التابع للمعهد الوطني للمعايير والتقنية (NIST).
تقدم منصة Ultralytics أدوات لإدارة حوكمة البيانات ومراقبة النماذج، مما يسهل إنشاء أنظمة ذكاء اصطناعي مسؤولة. من خلال دمج هذه الاعتبارات الأخلاقية في دورة حياة تطوير الذكاء الاصطناعي—بدءًا من جمع البيانات وصولًا إلى نشر النموذج—يمكن للمؤسسات تخفيف المخاطر وضمان مساهمة تقنياتها بشكل إيجابي في المجتمع.






