Yolo فيجن شنتشن
شنتشن
انضم الآن

نظرة على حل البحث الدلالي للصور من Ultralytics

تعرّف على كيفية استخدام حل البحث الدلالي عن الصور من Ultralytics لمطابقة الصور مع الاستعلامات بسرعة، مما يجعل سير العمل الإبداعي والبحثي أكثر كفاءة.

يمكن أن يصبح تصفح معرض يضم مئات الصور أمرًا مربكًا للغاية، خاصةً عندما تحاول العثور على شيء محدد جدًا. على سبيل المثال، قد يجد شخص يبحث عن خريطة لروما القديمة خرائط مدن عشوائية أو صورًا فوتوغرافية للسفر بدلاً من ذلك.

تحدث هذه السيناريوهات لأن معظم أنظمة البحث عن الصور تعتمد على أسماء الملفات أو العلامات. في حين أن هذا قد ينجح في الاستعلامات العامة، إلا أنه غالبًا ما يقصر عندما تكون الدقة والتفاصيل والسياق مطلوبة. 

في الواقع، يجد العديد من الأشخاص في مجالات مثل التصميم والتسويق والبحث صعوبة في العثور على الصور المناسبة، نظرًا لأن عمليات البحث بالكلمات الرئيسية نادرًا ما تلتقط الفكرة المحددة التي يبحثون عنها. يمكن أن يتسبب هذا في تأخيرات ويعطل الإنتاجية.

ومع ذلك، فبفضل التطورات الأخيرة في الذكاء الاصطناعي (AI)، يتم استبدال القيود التقليدية لأدوات البحث عن الصور بأنظمة أكثر ذكاءً وبديهية. على سبيل المثال، الرؤية الحاسوبية، وهي فرع من فروع الذكاء الاصطناعي يركز على تفسير وفهم البيانات المرئية، تتيح عمليات بحث أسرع وأكثر دقة عن الصور من خلال تحليل المحتوى الفعلي للصور.

على وجه الخصوص، يتجاوز البحث الدلالي عن الصور مطابقة الكلمات الرئيسية من خلال فهم المعنى الكامن وراء البحث. فهو يتيح لك استخدام اللغة الطبيعية لوصف ما تبحث عنه والعثور على الصور التي تطابق الفكرة، وليس فقط العلامات. على سبيل المثال، قد يؤدي البحث عن "حيوانات في حديقة حيوانات" إلى إرجاع صور حيوانات عشوائية في نظام تقليدي، بينما يفهم البحث الدلالي السياق ويعثر على صور لحيوانات في أماكن حدائق الحيوانات.

الشكل 1. مثال على استخدام البحث الدلالي عن الصور لاسترجاع صور الحيوانات في حديقة الحيوان.

سنستكشف في هذه المقالة كيفية عمل البحث الدلالي عن الصور ومناقشة بعض حالات الاستخدام الواقعية. كما سنلقي نظرة على حل البحث الدلالي عن الصور الذي تقدمه شركةUltralytics والذي يسهّل تطبيق هذا المفهوم في المشاريع اليومية. لنبدأ!

لمحة عامة عن حل البحث الدلالي عن الصور الذي تقدمه شركة Ultralytics

تقدم حزمةUltralytics Python مجموعة من الحلول الجاهزة للاستخدام لتطبيقات الرؤية الحاسوبية الشائعة، بما في ذلك إدارة قوائم الانتظار، وحساب الكائنات القائمة على المنطقة، وحساب المسافة، والبحث الدلالي عن الصور. تم تصميم هذه الحلول لتكون سهلة الاستخدام، حتى بالنسبة لأولئك الذين ليس لديهم خبرة في الذكاء الاصطناعي أو رؤية الكمبيوتر.

من بينها، يتيح حل البحث الدلالي عن الصور للمستخدمين العثور على الصور ذات الصلة باستخدام أوصاف اللغة الطبيعية بدلاً من الاعتماد على أسماء الملفات أو العلامات اليدوية. إنه يفهم المعنى الكامن وراء استعلام البحث ويعيد الصور التي تتطابق مع الفكرة، مما يجعله مفيدًا بشكل خاص عندما تكون الدقة والسياق مهمين.

آلية عمل حل البحث الدلالي عن الصور

يتم تشغيل حل Ultralytics للبحث الدلالي عن الصور بواسطة نموذجين متقدمين من نماذج الذكاء الاصطناعي: نموذج CLIP من OpenAI (لغة التباين - التدريب المسبق على الصور) ونموذج FAISS (البحث عن التشابه بالذكاء الاصطناعي على فيسبوك) من Meta. يقوم CLIP بتحويل كل من النصوص والصور إلى تمثيلات رقمية تُسمى التضمينات، والتي تلتقط معانيها وسياقها. يقوم FAISS بالبحث بكفاءة من خلال الملايين من هذه التضمينات للعثور على أكثرها صلة باستعلامك. 

أيضًا، واجهة ويب مبسطة مبنية باستخدام Flask تجعل الحل سهل الاستخدام. يمكن للمستخدمين إدخال استعلامات باللغة الطبيعية واسترجاع الصور المطابقة دون أي ترميز يدوي أو إعداد للبيانات.

إحدى المزايا الرئيسية لهذا الحل هي قدرته على التشغيل بدون تدريب مسبق. هذا يعني أنه يمكنه تفسير الاستعلامات حول الكائنات أو المشاهد التي لم يتم تدريبه عليها تحديدًا والاستجابة لها. من خلال الاستفادة من فهمه الواسع للغة والمرئيات، يمكنه إرجاع نتائج ذات صلة حتى للمحتوى غير المألوف أو غير الموسوم.

على سبيل المثال، إذا كنت تستخدم الحل للبحث عن "بيئة مكتبية"، فقد يعرض لك صورًا لمكاتب أو غرف اجتماعات أو مساحات عمل، حتى لو لم تكن هذه الكلمات مرتبطة بالملفات. وهذا ما يجعل البحث الدلالي عن الصور في برنامج Ultralyticsأداة عملية ومرنة للمشاريع الإبداعية والبحث والعمل مع مكتبات الصور الكبيرة.

الشكل 2. الاستعلام عن صور لبيئة مكتبية باستخدام حل البحث الدلالي عن الصور من Ultralytics.

تطبيقات عملية لحلول البحث الدلالي عن الصور

والآن بعد أن أصبح لدينا فهم أفضل لحل البحث الدلالي عن الصور الذي تقدمه شركة Ultralyticsدعنا نتعرف على بعض التطبيقات الواقعية ونرى كيف يمكن لمختلف الصناعات دمجها في عمليات سير العمل المرئية الخاصة بها.

استخدام أدوات البحث عن الصور المدعومة بالذكاء الاصطناعي لإدارة مجموعات البيانات

تُعد إدارة مجموعات بيانات الصور الضخمة إحدى أكثر المهام استهلاكًا للوقت في بناء حلول رؤية الحاسوب. في معظم الحالات، لا يحتاج المطورون إلى مجموعة البيانات بأكملها. بدلاً من ذلك، قد يبحثون عن أنواع معينة من الصور لتدريب النماذج أو إنشاء مجموعات تحقق نظيفة. ولكن العثور على تلك الصور المحددة من بين آلاف الصور قد يكون أمرًا صعبًا.

لنفترض أنك تعمل على مشروع يتضمن صورًا لركوب الخيل. قد تحتاج فقط إلى صور يرتدي فيها الفارس خوذة، أو يركب مع الآخرين، أو يتم التقاطها في منتصف الحركة من الجانب. بدون تسميات مناسبة، قد يستغرق العثور على هذه الصور يدويًا الكثير من الوقت والجهد.

يمكن لحل البحث الدلالي عن الصور، المدعوم من Ultralytics حل هذه المشكلة من خلال تمكين المطورين من استخدام استعلامات اللغة الطبيعية للعثور بسرعة على ما يحتاجون إليه، حتى في مجموعات البيانات الفوضوية أو غير المسماة. وهذا يقلل من الوقت المستغرق في الفرز ويسمح للفرق بالتركيز على بناء نماذج أفضل بكفاءة أكبر.

الشكل 3. يمكنك البحث عن صور معينة في مجموعات بيانات كبيرة بسهولة.

البحث عن الصور بدون نماذج تدريبية مسبقة لمنتجات التجارة الإلكترونية 

قد يكون البحث عن منتجات معينة عبر الإنترنت أمرًا محبطًا. غالبًا ما يصف المتسوقون ما يبحثون عنه بكلماتهم الخاصة، ولكن قد تستخدم قوائم المنتجات مصطلحات أو تسميات مختلفة. هذا التباين يجعل العثور على العناصر المناسبة أكثر صعوبة، خاصة في الكتالوجات الكبيرة.

ضع في اعتبارك موقفًا يبحث فيه شخص ما عن شراء أثاث ويبحث عن “طقم أريكة وكرسي وطاولة.” قد يتم إدراج المنتج الذي يبحثون عنه تحت تصنيف مختلف، مثل “طقم صالة ثلاث قطع.” نظرًا لأن المصطلحات لا تتطابق تمامًا، فقد لا يظهر العنصر في نتائج البحث، على الرغم من أنه بالضبط ما يحتاجه العميل.

الشكل 4. يساعد حل البحث الدلالي عن الصور الذي تقدمه شركة Ultralytics في مطابقة نوايا المستخدم مع صور المنتجات ذات الصلة.

فهرسة الصور المتقدمة للوسائط والنشر

وبالمثل، في مجالات مثل الصحافة والتدوين والتسويق الرقمي، تعتبر العناصر المرئية ضرورية لسرد القصص. يمكن للصورة المناسبة أن تدعم الرسالة وتحدد النبرة وتحافظ على تفاعل القراء. ومع ذلك، غالبًا ما يعني العثور على تلك الصورة المثالية البحث في العديد من الملفات.

من الأمثلة الجيدة على ذلك مدون يكتب عن اتجاهات الديكور المنزلي. قد يرغب في صورة لغرفة معيشة مشرقة وبسيطة مع إضاءة طبيعية. ومع ذلك، إذا كانت الصور المتاحة موسومة فقط بمصطلحات عامة مثل "غرفة" أو "تصميم داخلي"، فقد يكون العثور على التطابق الصحيح أمرًا محبطًا. 

باستخدام البحث الدلالي عن الصور، يمكنهم ببساطة كتابة عبارة وصفية مثل “غرفة معيشة بسيطة ومشرقة ذات نوافذ كبيرة” واسترجاع الصور التي تطابق الفكرة على الفور. ليست هناك حاجة للاعتماد على العلامات الدقيقة أو أسماء الملفات.

الشكل 5. يمكن لفرق المحتوى استخدام حل البحث الدلالي عن الصور من Ultralytics لتحسين اختيار الصور.

بحث دلالي عن الصور لإلهام الفن والتصميم

عادةً، يتضمن العمل الإبداعي مثل تصميم لوحة مزاج أو جمع الإلهام لمشروع جديد البحث في مجموعات صور كبيرة للعثور على صور مرئية تتطابق مع نمط أو فكرة معينة. أحد الأمثلة المثيرة للاهتمام هو المصممون الذين يعملون على مجموعة لـ فيلم. قد يحتاجون إلى التقاط حالة مزاجية أو فترة زمنية أو جو معين. يمكن أن يتراوح هذا من مدينة مستقبلية إلى غرفة معيشة مريحة مصممة وكأنها من الثمانينيات.

يعمل البحث الدلالي عن الصور في برنامج Ultralyticsعلى تسهيل ذلك من خلال ربط اللغة بالمعنى المرئي. وهذا يجعل من الممكن للفرق استكشاف الأفكار بسرعة والحفاظ على التركيز، دون إبطاء البحث اليدوي.

الشكل 6. يدعم حل البحث الدلالي عن الصور من Ultralytics الاستكشاف المرئي الأسرع للمشاريع الإبداعية.

إيجابيات وسلبيات البحث عن الصور المدعوم بالذكاء الاصطناعي

فيما يلي بعض المزايا الرئيسية لاستخدام البحث عن الصور المدعوم بالذكاء الاصطناعي لتحسين سير العمل المرئي وكفاءة البحث:

  • دعم اللغة الطبيعية: يمكن للأشخاص العثور على الصور من خلال وصفها بكلماتهم الخاصة، دون استخدام تسميات محددة مسبقًا.
  • دعم تنسيقات الصور الشائعة: تعمل هذه الأنظمة عادةً مع التنسيقات القياسية مثل JPG و PNG، لذلك ليست هناك حاجة لتحويل الملفات أو إعادة تنسيقها.
  • يتكامل مع أدوات أخرى: غالبًا ما يمكن تضمين البحث عن الصور المدعوم بالذكاء الاصطناعي في خطوط أنابيب أو لوحات معلومات أو برامج إبداعية أكبر.

في حين أن حلول البحث عن الصور المدعومة بالذكاء الاصطناعي تقدم العديد من الفوائد، إلا أن هناك أيضًا بعض القيود التي يجب وضعها في الاعتبار. فيما يلي بعض العوامل التي يجب مراعاتها:

  • دقة محدودة مع الاستعلامات المتخصصة: إذا كان الاستعلام محددًا جدًا أو غير معتاد، فقد يعيد النظام نتائج أقل صلة بسبب الثغرات في بيانات تدريب النموذج.
  • التحيز في بيانات التدريب: يمكن لنماذج الذكاء الاصطناعي أن تعكس التحيزات الموجودة في مجموعات البيانات التي تم تدريبها عليها، مما قد يؤدي إلى نتائج مشوهة أو غير كاملة.
  • يعتمد الأداء على جودة الصورة: يمكن أن تقلل الصور منخفضة الدقة أو غير الواضحة من فعالية إنشاء التضمين ودقة البحث.

النقاط الرئيسية

يحول البحث الدلالي عن الصور التركيز من مطابقة الكلمات الرئيسية إلى فهم المعنى، مما يساعد المستخدمين في العثور على الصور بناءً على السياق بدلاً من مجرد العلامات أو أسماء الملفات. وهذا يجعل تجربة البحث أسرع وأكثر دقة وأكثر توافقًا مع ما يبحث عنه المستخدمون بالفعل. 

بالنسبة للفرق الإبداعية والقطاعات التي تعتمد على المحتوى، يعني ذلك قضاء وقت أقل في فرز الملفات غير ذات الصلة ووقت أطول في تطوير الأفكار. يمكن للمؤسسات التي تدير كميات كبيرة من البيانات المرئية استخدام حلول مثل البحث الدلالي عن الصور من Ultralyticsلتبسيط اكتشاف المحتوى وتقليل الفرز اليدوي واتخاذ قرارات أكثر ذكاءً وسرعة بناءً على السياق المرئي.

كن جزءًا من مجتمعنا واستكشف مستودع GitHub الخاص بنا للحصول على مزيد من الأفكار حول الذكاء الاصطناعي. ألق نظرة على صفحات الحلول الخاصة بنا لمعرفة المزيد حول الابتكارات مثل الذكاء الاصطناعي في مجال الخدمات اللوجستية و رؤية الحاسوب في الرعاية الصحية. تحقق من خيارات الترخيص الخاصة بنا وابدأ اليوم!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا