تعرف على YOLO26: جيل جديد من ذكاء الرؤية الاصطناعي.
Ultralytics
العودة إلى قاموس مصطلحات Ultralytics

Grounding

استكشف أساسيات التأريض (grounding) في الذكاء الاصطناعي. تعلم كيفية ربط اللغة الطبيعية بالبيانات المرئية باستخدام Ultralytics YOLO26 وYOLO-World للاكتشاف مفتوح المفردات.

يشير التأصيل (Grounding) إلى قدرة نظام الذكاء الاصطناعي على ربط المفاهيم المجردة—المستمدة عادةً من اللغة الطبيعية—بتمثيلات محددة وملموسة في العالم المادي، مثل البيانات المرئية أو المدخلات الحسية. في سياق الرؤية الحاسوبية، يعني هذا أن النموذج لا يعالج النص فحسب؛ بل يمكنه تحليل عبارة مثل "شخص يمشي مع كلب" وتحديد مواقع تلك الكيانات بدقة داخل صورة أو مقطع فيديو. تسد هذه العملية الفجوة بين التفكير الرمزي والإدراك على مستوى البكسل، معالجةً معضلة تأصيل الرموز الأساسية في العلوم المعرفية. من خلال ربط الرموز اللغوية بالسمات المرئية، يعمل التأصيل كحجر زاوية لـ الذكاء الاصطناعي متعدد الوسائط الحديث، مما يُمكّن الآلات من التفاعل بشكل أكثر حدسية مع البيئات البشرية الديناميكية.

Link to this sectionآليات التأصيل#

على المستوى التقني، يتضمن التأصيل مواءمة البيانات من وسائط مختلفة في مساحة متجهية مشتركة عالية الأبعاد. تقوم البنى المتقدمة، التي غالبًا ما تُبنى على إطار عمل Transformer المستخدم في معالجة اللغات الطبيعية (NLP)، بإنشاء تمثيلات رقمية تُعرف باسم embeddings لكل من الأوصاف النصية والمدخلات المرئية. أثناء التدريب، يتعلم النموذج تقليل المسافة بين تضمين مطالبة نصية (مثل "حقيبة ظهر زرقاء") وتضمين المنطقة المرئية المقابلة لها.

يسمح هذا المواءمة بـ الاكتشاف مفتوح المفردات (Open-Vocabulary Detection). على عكس التعلم الخاضع للإشراف التقليدي حيث يقتصر النموذج على مجموعة ثابتة من الفئات، يتيح التأصيل التعلم بدون أمثلة (zero-shot learning). يمكن للنموذج المؤصل تحديد الكائنات التي لم يرها صراحةً أثناء التدريب، شريطة أن يفهم اللغة التي تصفها. يتم دعم هذه المرونة من خلال أطر تعلم عميق مثل PyTorch، التي تسهل عمليات المصفوفات المعقدة المطلوبة لهذه المواءمات متعددة الوسائط.

Link to this sectionتطبيقات العالم الحقيقي#

تعمل تقنية التأصيل على إعادة تشكيل الصناعات من خلال السماح للأنظمة بتفسير نية المستخدم والتنقل في البيئات غير المهيكلة بفعالية.

  • الذكاء الاصطناعي في الروبوتات: يعد التأصيل ضروريًا للوكلاء المستقلين الذين ينفذون تعليمات لفظية. إذا طُلب من روبوت مستودع "التقاط الحزمة الموجودة على الرف العلوي"، فيجب عليه تأصيل مفهومي "حزمة" و "رف علوي" بإحداثيات ثلاثية الأبعاد محددة في مجال رؤيته. تمثل هذه القدرة تركيزًا رئيسيًا لـ أبحاث الروبوتات في MIT CSAIL، مما يُمكّن الروبوتات من العمل بأمان إلى جانب البشر.
  • البحث الدلالي واسترجاع الوسائط: يدعم التأصيل محركات بحث متقدمة تتجاوز مطابقة الكلمات الرئيسية. يمكن للمستخدمين الاستعلام عن أرشيفات الفيديو بأوصاف معقدة مثل "راكب دراجة ينعطف يسارًا عند الغروب"، ويستخدم النظام التأصيل لاسترجاع طوابع زمنية محددة. هذا يعزز بشكل كبير فهم الفيديو لأغراض الأمن وإدارة الوسائط.
  • التكنولوجيا المساعدة: بالنسبة للمستخدمين ضعاف البصر، يُمكّن التأصيل التطبيقات من وصف المحيط في الوقت الفعلي أو الإجابة على أسئلة حول البيئة، بالاعتماد على تعرف قوي على الصور مرتبط بتوليد الكلام.

Link to this sectionالتأصيل مع Ultralytics YOLO-World#

يدعم نظام Ultralytics البيئي التأصيل من خلال بنى متخصصة مثل YOLO-World. بينما تتطلب النماذج القياسية التدريب على مجموعات بيانات محددة، يسمح YOLO-World للمستخدمين بتحديد فئات اكتشاف مخصصة فورًا باستخدام مطالبات نصية. هذا "يؤصل" بشكل فعال مدخلات اللغة الطبيعية على الصورة دون الحاجة إلى إعادة تدريب.

يوضح المثال التالي كيفية استخدام حزمة ultralytics لاكتشاف الكائنات بناءً على أوصاف نصية مخصصة:

from ultralytics import YOLO

# Load a pre-trained YOLO-World model for open-vocabulary detection
model = YOLO("yolov8s-world.pt")

# Define custom text prompts (classes) to ground in the image
# The model maps these descriptions to visual features
model.set_classes(["person wearing hat", "blue backpack"])

# Run prediction on an image source to localize the described objects
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Link to this sectionتمييز التأصيل عن المفاهيم ذات الصلة#

لتقدير فائدة التأصيل بشكل كامل، من المفيد تمييزه عن مهام الرؤية الحاسوبية المشابهة:

  • مقابل اكتشاف الكائنات: تحدد نماذج الاكتشاف التقليدية، مثل YOLO26 المتطور، الكائنات من مجموعة مغلقة ومحددة مسبقًا من الفئات (مثل الفئات الـ 80 في COCO). التأصيل مفتوح النهاية، حيث يحدد الكائنات بناءً على نص حر.
  • مقابل تسمية الصور: تولد التسمية جملة وصفية لصورة كاملة (صورة $\to$ نص). يعمل التأصيل عادةً في الاتجاه المعاكس أو بشكل ثنائي الاتجاه، حيث يحدد عناصر مرئية محددة بناءً على مدخلات نصية (نص $\to$ منطقة صورة).
  • مقابل الإجابة على الأسئلة المرئية (VQA): يتضمن VQA الإجابة على سؤال محدد حول صورة (مثل "ما لون السيارة؟"). يركز التأصيل بشكل خاص على خطوة التوطين—رسم صندوق إحاطة حول الكائن المذكور.

Link to this sectionالتحديات والتوقعات المستقبلية#

على الرغم من التطورات، يظل التأصيل مكثفًا من الناحية الحسابية. تتطلب مواءمة نماذج لغوية ضخمة مع مشفرات الرؤية موارد GPU كبيرة وإدارة فعالة للذاكرة، وهو تحدٍ غالبًا ما يتم معالجته بواسطة مبتكري الأجهزة مثل NVIDIA. بالإضافة إلى ذلك، يمكن أن تواجه النماذج صعوبة في الغموض اللغوي، مما يتطلب نوافذ سياق كبيرة لتحديد ما إذا كانت كلمة "bat" تشير إلى أداة رياضية أو حيوان.

تتجه التطورات المستقبلية نحو نماذج أساسية موحدة متعددة الوسائط بطبيعتها. تتطور أدوات مثل منصة Ultralytics لمساعدة المطورين على إدارة مجموعات البيانات المعقدة المطلوبة لهذه المهام، مما يوفر سير عمل مبسط لـ تعليق البيانات ونشر النماذج. مع نضوج هذه التقنيات، يمكننا توقع تكامل سلس للتأصيل في أجهزة الحافة، مما يُمكّن تطبيقات ذكاء اصطناعي أكثر ذكاءً واستجابة.

Explore solutions

Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.

اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.

اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.

اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.

اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.

اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.

اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.

اعرف المزيد

لنبنِ مستقبل الذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل تعلم الآلة