وكيل الذكاء الاصطناعي
تعرّف على ماهية وكيل الذكاء الاصطناعي وكيف تدعم هذه الأنظمة المستقلة الأتمتة الحديثة. اكتشف حلقة الإدراك والتفكير والفعل ودورها في الرؤية الحاسوبية والروبوتات.
الوكيل الذكي (AI agent) هو كيان مستقل يدرك بيئته من خلال أجهزة الاستشعار، ويعالج هذه المعلومات لاتخاذ قرارات ذكية، ويتصرف بناءً على تلك البيئة باستخدام المشغلات لتحقيق أهداف محددة. على عكس البرنامج البسيط الذي يتبع مجموعة محددة مسبقًا من التعليمات، يمكن للوكيل الذكي أن يتعلم من التجربة، ويتكيف مع الظروف المتغيرة، ويعمل بشكل مستقل دون تدخل بشري مباشر. هذه القدرة على الإدراك والتفكير والتصرف تجعل الوكلاء حجر الزاوية في الذكاء الاصطناعي (AI) الحديث، مما يدفع تطوير أنظمة الأتمتة المتطورة. الهدف هو إنشاء أنظمة يمكنها التعامل مع المهام المعقدة والديناميكية، من التنقل في شوارع المدينة إلى إدارة العمليات الصناعية.
كيف تعمل وكلاء الذكاء الاصطناعي
يمكن فهم تشغيل وكيل الذكاء الاصطناعي على أفضل وجه على أنه دورة مستمرة تتضمن ثلاثة مكونات أساسية:
- الإدراك (الاستشعار): تجمع العناصر معلومات حول حالتها الحالية والبيئة المحيطة بها باستخدام أجهزة الاستشعار. في سياق رؤية الكمبيوتر، تكون هذه المستشعرات عادةً عبارة عن كاميرات تلتقط بيانات مرئية. هذه البيانات الأولية هي المدخلات التي يستخدمها العنصر لفهم سياقه.
 - اتخاذ القرار (المعالجة): جوهر وكيل الذكاء الاصطناعي هو "دماغه"، الذي يعالج البيانات الإدراكية لاتخاذ القرارات. غالبًا ما يكون هذا المكون نموذج تعلم آلي (ML) متطور، مثل شبكة عصبية. بالنسبة للسلوكيات المعقدة، قد تستخدم الوكلاء تقنيات مثل التعلم بالتعزيز، حيث يتعلمون أفضل الإجراءات من خلال التجربة والخطأ لزيادة المكافأة إلى أقصى حد. يقوم الوكيل بتقييم الاحتمالات المختلفة ويختار الإجراء الذي من المرجح أن يحقق هدفه.
 - الفعل (التفعيل): بمجرد اتخاذ القرار، يقوم الوكيل بتنفيذه من خلال المشغلات. المشغل هو آلية تؤثر على البيئة. بالنسبة للروبوت المادي، يمكن أن يكون هذا تحريك ذراع آلية أو توجيه مركبة. بالنسبة للوكيل الرقمي، يمكن أن يكون تنفيذ صفقة في سوق الأوراق المالية أو تصفية البريد الإلكتروني.
 
تسمح حلقة الإدراك-التفكير-الفعل هذه، والمعروفة باسم بنية الوكيل، للوكيل بالعمل بشكل مستقل والتفاعل مع الأحداث في الوقت الفعلي. أصبحت أطر بناء الوكلاء أكثر شيوعًا، مع اكتساب مشاريع مثل LangChain و AutoGPT شعبية لتطوير الوكلاء المدعومين بنماذج اللغات الكبيرة (LLM).
وكلاء الذكاء الاصطناعي في رؤية الحاسوب
الرؤية الحاسوبية هي تقنية تمكين حاسمة لوكلاء الذكاء الاصطناعي الذين يعملون في العالم المادي. تعمل نماذج الرؤية مثل Ultralytics YOLO11 كأساس إدراكي، مما يمنح الوكيل القدرة على "رؤية" محيطه وتفسيره. عند دمجها في نظام الوكيل، يحول نموذج الرؤية الحاسوبية البيانات المرئية الأولية إلى معلومات منظمة، مثل تحديد وتحديد مواقع الكائنات (اكتشاف الكائنات)، وتتبع حركتها (تتبع الكائنات)، أو فهم أوضاع الإنسان (تقدير الوضع).
هذا المزيج من الذكاء الاصطناعي الفاعل ورؤية الكمبيوتر أمر محوري لمستقبل الأتمتة. لا يكتشف الوكيل كائنًا فحسب؛ بل يستخدم هذا الاكتشاف كمحفز لاتخاذ قرار. على سبيل المثال، بعد أن يكتشف نموذج YOLO عيبًا في خط الإنتاج، يقرر الوكيل تنشيط ذراع آلية لإزالة العنصر. هذا يتجاوز الاكتشاف البسيط لإنشاء سير عمل مؤتمت بالكامل.
تطبيقات وأمثلة في أرض الواقع
تتجلى قوة وكلاء الذكاء الاصطناعي بشكل واضح في تطبيقاتهم الواقعية، حيث يترجمون الإدراك واتخاذ القرارات إلى أفعال ملموسة.
- المركبات ذاتية القيادة: السيارات ذاتية القيادة هي مثال رئيسي على وكلاء الذكاء الاصطناعي المعقدين. إنها تستخدم مجموعة من المستشعرات، بما في ذلك الكاميرات والليدار (LiDAR)، لبناء رؤية بزاوية 360 درجة لبيئتها. تنفذ نماذج الرؤية الحاسوبية (CV) الاستدلال في الوقت الفعلي لاكتشاف المشاة والمركبات الأخرى وإشارات المرور. ثم يعالج محرك اتخاذ القرار الخاص بالوكيل هذه المعلومات للتحكم في التوجيه والتسارع والكبح، والتنقل في البيئات الحضرية المعقدة بأمان. تُعد شركات مثل Waymo رائدة في نشر مثل هذه الأنظمة المتقدمة القائمة على الوكلاء.
 - التصنيع الذكي: في التصنيع المدفوع بالذكاء الاصطناعي، تقوم وكلاء الذكاء الاصطناعي بأتمتة مراقبة الجودة. يمكن لوكيل متصل بكاميرا تقوم بتشغيل نموذج مثل YOLO11 مراقبة حزام ناقل. يستخدم تقسيم المثيل لتحديد كل منتج، والتحقق من وجود عيوب، وإذا تم اكتشاف عيب، فإنه يشير إلى ذراع آلية (المشغل) لإزالة العنصر المعيب. يؤدي هذا إلى إنشاء نظام فعال ومستقل لضمان الجودة يعمل باستمرار، وهو مكون رئيسي في الصناعة 4.0.
 
التمييز بين وكلاء الذكاء الاصطناعي والمفاهيم ذات الصلة
من المفيد تمييز وكلاء الذكاء الاصطناعي عن المصطلحات الأخرى ذات الصلة في مجال الذكاء الاصطناعي.
- العميل المدعوم بالذكاء الاصطناعي مقابل نموذج الذكاء الاصطناعي: نموذج الذكاء الاصطناعي هو أحد مكونات العميل، وليس العميل نفسه. النموذج، مثل كاشف كائنات YOLO، هو أداة تؤدي مهمة معينة (مثل العثور على كائنات في صورة). العميل المدعوم بالذكاء الاصطناعي هو النظام الشامل الذي يستخدم مخرجات النموذج لاتخاذ قرار ثم التصرف. يوفر النموذج "ماذا"، بينما يقرر العميل "ماذا يفعل حيال ذلك".
 - العميل المدعوم بالذكاء الاصطناعي مقابل برنامج الدردشة الآلي/نموذج اللغة الكبير (LLM): في حين أن برنامج الدردشة الآلي أو نموذج اللغة الكبير (LLM) يمكن أن يُظهر سلوكًا ذكيًا، إلا أنه يقتصر عادةً على البيئات الرقمية القائمة على النصوص. العميل المدعوم بالذكاء الاصطناعي هو مفهوم أوسع يمكنه التفاعل مع العالم المادي من خلال أجهزة الاستشعار والمشغلات. ومع ذلك، يمكن أن يكون نموذج اللغة الكبير (LLM) بمثابة محرك قوي لاتخاذ القرارات داخل العميل، وهو مفهوم تستكشفه منصات مثل Hugging Face.
 - العميل المدعوم بالذكاء الاصطناعي مقابل علم الروبوتات: يشير علم الروبوتات إلى تصميم وبناء الروبوت المادي - الجسم. العميل المدعوم بالذكاء الاصطناعي هو الذكاء الذي يتحكم في هذا الجسم - العقل. ذراع الروبوت الصناعي هو مجرد جهاز، ويصبح عميلاً ذكيًا عندما يتم تشغيله بواسطة نظام ذكاء اصطناعي يمكّنه من إدراك بيئته واتخاذ قرارات مستقلة.