تعرف على YOLO26: جيل جديد من ذكاء الرؤية الاصطناعي.
Ultralytics
الذكاء الاصطناعي المرئي

الربط بين معالجة اللغات الطبيعية والرؤية الحاسوبية

تعرف على كيفية عمل معالجة اللغات الطبيعية (NLP) والرؤية الحاسوبية (CV) معاً لتحويل الصناعات بأنظمة ذكاء اصطناعي أكثر ذكاءً وتعدداً للوسائط.

أبأبيرامي فينا
4 min read
الربط بين معالجة اللغات الطبيعية والرؤية الحاسوبية

معالجة اللغات الطبيعية (NLP) والرؤية الحاسوبية (CV) هما فرعان متميزان من الذكاء الاصطناعي (AI) اكتسبا الكثير من الشعبية في السنوات الأخيرة. وبفضل التقدم في الذكاء الاصطناعي، أصبح هذان الفرعان الآن أكثر ترابطاً من أي وقت مضى.

مثال رائع على ذلك هو شرح الصور التلقائي. يمكن استخدام الرؤية الحاسوبية لتحليل وفهم محتويات الصورة، بينما يمكن استخدام معالجة اللغات الطبيعية لتوليد وصف مكتوب لها. يُستخدم شرح الصور التلقائي بشكل شائع على منصات التواصل الاجتماعي لتحسين إمكانية الوصول وفي أنظمة إدارة المحتوى للمساعدة في تنظيم الصور ووسمها بكفاءة.

لقد أدت الابتكارات في معالجة اللغات الطبيعية والرؤية بالذكاء الاصطناعي إلى العديد من حالات الاستخدام هذه في مجموعة من الصناعات. في هذه المقالة، سنلقي نظرة فاحصة على معالجة اللغات الطبيعية والرؤية الحاسوبية وسنناقش كيفية عمل كل منهما. وسنستكشف أيضاً تطبيقات مثيرة تستخدم كلتا التقنيتين جنباً إلى جنب. لنبدأ!

Link to this sectionفهم معالجة اللغات الطبيعية ورؤية الذكاء الاصطناعي#

تركز معالجة اللغات الطبيعية على التفاعل بين أجهزة الكمبيوتر واللغة البشرية. فهي تمكّن الآلات من فهم وتفسير وتوليد النصوص أو الكلام بطريقة ذات معنى. ويمكن استخدامها لتنفيذ مهام مثل الترجمة، أو تحليل المشاعر، أو التلخيص.

في الوقت نفسه، تساعد الرؤية الحاسوبية الآلات في تحليل الصور ومقاطع الفيديو والعمل معها. ويمكن استخدامها لمهام مثل اكتشاف الكائنات في صورة، أو التعرف على الوجوه، أو تتبع الكائنات، أو تصنيف الصور. تُمكّن تقنية الرؤية بالذكاء الاصطناعي الآلات من فهم العالم المرئي والتفاعل معه بشكل أفضل.

مثال على تصنيف الصور

شكل 1. مثال على تصنيف الصور.

عند دمجها مع الرؤية الحاسوبية، يمكن لمعالجة اللغات الطبيعية أن تضيف معنى إلى البيانات المرئية من خلال الجمع بين النصوص والصور، مما يسمح بفهم أعمق. وكما يقول المثل، "الصورة تساوي ألف كلمة"، وعندما تقترن بالنص، تصبح أكثر قوة، مما يوفر رؤى أغنى.

Link to this sectionأمثلة على عمل معالجة اللغات الطبيعية والرؤية الحاسوبية معاً#

من المحتمل أنك رأيت معالجة اللغات الطبيعية والرؤية الحاسوبية تعملان معاً في أدوات يومية دون أن تلاحظ ذلك حتى، مثل عندما يقوم هاتفك بترجمة نص من صورة.

في الواقع، يستخدم Google Translate كلاً من معالجة اللغات الطبيعية والرؤية الحاسوبية لترجمة النص من الصور. عندما تلتقط صورة للوحة طريق بلغة أخرى، تقوم الرؤية الحاسوبية بتحديد النص واستخراجه، بينما تقوم معالجة اللغات الطبيعية بترجمته إلى لغتك المفضلة.

تعمل معالجة اللغات الطبيعية والرؤية الحاسوبية معاً لجعل العملية سلسة وفعالة، مما يتيح للمستخدمين فهم المعلومات والتفاعل معها عبر اللغات في الوقت الفعلي. يكسر هذا التكامل السلس للتقنيات حواجز التواصل.

ميزة Google Translate لترجمة النص من صورة

شكل 2. ميزة الترجمة من Google.

فيما يلي بعض التطبيقات الأخرى التي تعمل فيها معالجة اللغات الطبيعية والرؤية الحاسوبية معاً:

  • السيارات ذاتية القيادة: يمكن استخدام الرؤية الحاسوبية لاكتشاف لافتات الطرق، والمسارات، والعوائق، بينما يمكن لمعالجة اللغات الطبيعية معالجة الأوامر الصوتية أو النصوص الموجودة على لافتات الطرق.
  • قارئات المستندات: يمكن للرؤية بالذكاء الاصطناعي التعرف على النصوص من المستندات الممسوحة ضوئياً أو الكتابة اليدوية، ويمكن لمعالجة اللغات الطبيعية تفسير المعلومات وتلخيصها.
  • البحث المرئي في تطبيقات التسوق: يمكن للرؤية الحاسوبية تحديد المنتجات في الصور، بينما تعالج معالجة اللغات الطبيعية مصطلحات البحث لتحسين التوصيات.
  • الأدوات التعليمية: يمكن للرؤية الحاسوبية التعرف على الملاحظات المكتوبة بخط اليد أو المدخلات المرئية، ويمكن لمعالجة اللغات الطبيعية تقديم تفسيرات أو ملاحظات بناءً على المحتوى.

Link to this sectionالمفاهيم الرئيسية التي تربط بين الرؤية الحاسوبية ومعالجة اللغات الطبيعية#

الآن بعد أن رأينا كيف يتم استخدام الرؤية الحاسوبية ومعالجة اللغات الطبيعية، دعونا نستكشف كيف تجتمعان معاً لتمكين الذكاء الاصطناعي عبر الوسائط.

يجمع الذكاء الاصطناعي عبر الوسائط بين الفهم المرئي من الرؤية الحاسوبية وفهم اللغة من معالجة اللغات الطبيعية لمعالجة المعلومات وربطها عبر النصوص والصور. على سبيل المثال، في الرعاية الصحية، يمكن للذكاء الاصطناعي عبر الوسائط المساعدة في تحليل الأشعة السينية وإنشاء ملخص مكتوب وواضح للمشكلات المحتملة، مما يساعد الأطباء على اتخاذ قرارات أسرع وأكثر دقة.

Link to this sectionفهم اللغة الطبيعية (NLU)#

فهم اللغة الطبيعية هو مجموعة فرعية خاصة من معالجة اللغات الطبيعية تركز على تفسير واستخراج المعنى من النص من خلال تحليل القصد، والسياق، والدلالات، والنبرة، والبنية. وبينما تعالج معالجة اللغات الطبيعية النص الخام، فإن فهم اللغة الطبيعية يمكّن الآلات من فهم اللغة البشرية بشكل أكثر فعالية. على سبيل المثال، التحليل النحوي هو تقنية من تقنيات فهم اللغة الطبيعية التي تحول النص المكتوب إلى تنسيق منظم يمكن للآلات فهمه.

رسم توضيحي للعلاقة بين معالجة اللغات الطبيعية NLP وفهم اللغات الطبيعية NLU

شكل 3. العلاقة بين معالجة اللغات الطبيعية وفهم اللغة الطبيعية.

يعمل فهم اللغة الطبيعية مع الرؤية الحاسوبية عندما تحتوي البيانات المرئية على نصوص تحتاج إلى فهم. تقوم الرؤية الحاسوبية، باستخدام تقنيات مثل التعرف الضوئي على الحروف (OCR)، باستخراج النص من الصور أو المستندات أو مقاطع الفيديو. وقد يشمل ذلك مهام مثل مسح إيصال ضوئياً، أو قراءة نص على لافتة، أو رقمنة ملاحظات مكتوبة بخط اليد.

بعد ذلك، يعالج فهم اللغة الطبيعية النص المستخرج لفهم معناه وسياقه وقصده. هذا المزيج يجعل من الممكن للأنظمة القيام بأكثر من مجرد التعرف على النص. فهي تستطيع تصنيف النفقات من الإيصالات أو تحليل النبرة والمشاعر. معاً، تحول الرؤية الحاسوبية وفهم اللغة الطبيعية النص المرئي إلى معلومات ذات معنى وقابلة للتنفيذ.

Link to this sectionهندسة الأوامر (Prompt Engineering)#

هندسة الأوامر هي عملية تصميم أوامر إدخال واضحة ودقيقة ومفصلة لتوجيه أنظمة الذكاء الاصطناعي التوليدي، مثل النماذج اللغوية الكبيرة (LLMs) ونماذج الرؤية واللغة (VLMs)، لإنتاج المخرجات المطلوبة. تعمل هذه الأوامر كتعليمات تساعد نموذج الذكاء الاصطناعي على فهم قصد المستخدم.

تتطلب هندسة الأوامر الفعالة فهم قدرات النموذج وصياغة مدخلات تزيد من قدرته على توليد استجابات دقيقة أو إبداعية أو ثاقبة. هذا مهم بشكل خاص عندما يتعلق الأمر بـ نماذج الذكاء الاصطناعي التي تعمل مع كل من النصوص والصور.

خذ نموذج DALL·E الخاص بـ OpenAI كمثال. إذا طلبت منه إنشاء "صورة واقعية لرائد فضاء يركب حصاناً"، فيمكنه توليد ذلك بالضبط بناءً على وصفك. هذه المهارة مفيدة للغاية في مجالات مثل التصميم الجرافيكي، حيث يمكن للمحترفين تحويل الأفكار النصية بسرعة إلى نماذج مرئية، مما يوفر الوقت ويعزز الإنتاجية.

صورة تم إنشاؤها باستخدام DALL-E من OpenAI

شكل 4. صورة تم إنشاؤها باستخدام DALL-E من OpenAI.

قد تتساءل كيف يرتبط هذا بالرؤية الحاسوبية - أليس هذا مجرد ذكاء اصطناعي توليدي؟ في الواقع، كلاهما مترابط بشكل وثيق. يبني الذكاء الاصطناعي التوليدي على أسس الرؤية الحاسوبية لإنشاء مخرجات مرئية جديدة تماماً.

نماذج الذكاء الاصطناعي التوليدي التي تنشئ صوراً من الأوامر النصية يتم تدريبها على مجموعات بيانات كبيرة من الصور المقترنة بأوصاف نصية. هذا يسمح لها بتعلم العلاقات بين اللغة والمفاهيم المرئية مثل الكائنات، والأنسجة، والعلاقات المكانية.

لا تفسر هذه النماذج البيانات المرئية بنفس الطريقة التي تعمل بها أنظمة الرؤية الحاسوبية التقليدية، مثل التعرف على الكائنات في صور العالم الحقيقي. بدلاً من ذلك، فهي تستخدم فهمها المكتسب لهذه المفاهيم لتوليد صور مرئية جديدة بناءً على الأوامر. من خلال الجمع بين هذه المعرفة والأوامر المصاغة جيداً، يمكن للذكاء الاصطناعي التوليدي إنتاج صور واقعية ومفصلة تتوافق مع مدخلات المستخدم.

Link to this sectionالإجابة على الأسئلة (QA)#

صُممت أنظمة الإجابة على الأسئلة لفهم أسئلة اللغة الطبيعية وتقديم إجابات دقيقة وذات صلة. وهي تستخدم تقنيات مثل استرجاع المعلومات، والفهم الدلالي، والتعلم العميق لتفسير الاستفسارات والرد عليها.

يمكن للنماذج المتقدمة مثل GPT-4o من OpenAI التعامل مع الإجابة على الأسئلة المرئية (VQA)، مما يعني أنها تستطيع تحليل الصور والإجابة على أسئلة حولها. ومع ذلك، لا يقوم GPT-4o بتنفيذ مهام الرؤية الحاسوبية بشكل مباشر. بدلاً من ذلك، يستخدم مُشفراً متخصصاً للصور لمعالجة الصور، واستخراج الميزات، ودمجها مع فهمه اللغوي لتقديم الإجابات.

قدرة ChatGPT على الإجابة على الأسئلة المرئية

شكل 5. قدرة ChatGPT على الإجابة على الأسئلة المرئية. الصورة بواسطة المؤلف.

يمكن للأنظمة الأخرى أن تذهب خطوة أبعد من خلال دمج قدرات الرؤية الحاسوبية بشكل كامل. يمكن لهذه الأنظمة تحليل الصور أو مقاطع الفيديو مباشرة لتحديد الكائنات أو المشاهد أو النصوص. عند دمجها مع معالجة اللغات الطبيعية، يمكنها التعامل مع أسئلة أكثر تعقيداً حول المحتوى المرئي. على سبيل المثال، يمكنها الإجابة على "ما هي الكائنات الموجودة في هذه الصورة؟" أو "من الذي يظهر في هذا المقطع؟" عن طريق اكتشاف العناصر المرئية وتفسيرها.

Link to this sectionالتعلم بصفر لقطة (ZSL)#

التعلم بصفر لقطة (ZSL) هو أسلوب للتعلم الآلي يسمح لنماذج الذكاء الاصطناعي بالتعامل مع مهام جديدة وغير مرئية دون أن يتم تدريبها عليها تحديداً. يقوم بذلك باستخدام معلومات إضافية، مثل الأوصاف أو العلاقات الدلالية، لربط ما يعرفه النموذج بالفعل (الفئات المرئية) بفئات جديدة وغير مرئية.

في معالجة اللغات الطبيعية، يساعد ZSL النماذج على فهم المواضيع التي لم يتم تدريبها عليها والعمل معها من خلال الاعتماد على العلاقات بين الكلمات والمفاهيم. وبالمثل، في الرؤية الحاسوبية، يسمح ZSL للنماذج بالتعرف على الكائنات أو المشاهد التي لم تصادفها من قبل عن طريق ربط الميزات المرئية، مثل الأجنحة أو الريش، بمفاهيم معروفة، مثل الطيور.

يربط ZSL بين معالجة اللغات الطبيعية والرؤية الحاسوبية من خلال الجمع بين فهم اللغة والتعرف المرئي، مما يجعله مفيداً بشكل خاص للمهام التي تتضمن كليهما. على سبيل المثال، في الإجابة على الأسئلة المرئية، يمكن للنموذج تحليل صورة مع فهم سؤال ذي صلة لتقديم إجابة دقيقة. كما أنه مفيد لمهام مثل شرح الصور.

Link to this sectionأبرز النقاط#

أدى الجمع بين معالجة اللغات الطبيعية والرؤية الحاسوبية إلى ظهور أنظمة ذكاء اصطناعي يمكنها فهم كل من النصوص والصور. يُستخدم هذا المزيج في العديد من الصناعات، بدءاً من مساعدة السيارات ذاتية القيادة على قراءة لافتات الطرق وصولاً إلى تحسين التشخيصات الطبية وجعل وسائل التواصل الاجتماعي أكثر أماناً. مع تحسن هذه التقنيات، ستستمر في جعل الحياة أسهل وفتح فرص جديدة في مجموعة واسعة من المجالات. لمعرفة المزيد، تفضل بزيارة مستودع GitHub الخاص بنا، وتفاعل مع مجتمعنا. استكشف تطبيقات الذكاء الاصطناعي في السيارات ذاتية القيادة والزراعة على صفحات الحلول الخاصة بنا. 🚀

Explore solutions

Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد

لنبنِ مستقبل الذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل تعلم الآلة