تعرف على YOLO26: جيل جديد من ذكاء الرؤية الاصطناعي.
Ultralytics
العودة إلى قاموس مصطلحات Ultralytics

Speech Recognition

استكشف كيف يقوم التعرف على الكلام (ASR) بتحويل اللغة المنطوقة إلى نص. تعرف على الشبكات العصبية، وتطبيقات الذكاء الاصطناعي في العالم الحقيقي، و Ultralytics YOLO26 متعدد الوسائط.

يُعد التعرف على الكلام، والذي يُشار إليه تقنياً غالباً باسم التعرف التلقائي على الكلام (ASR)، القدرة المحددة التي تُمكّن الحاسوب من تحديد اللغة المنطوقة ومعالجتها وتحويلها إلى نص مكتوب. تعمل هذه التقنية كجسر حيوي في التفاعل بين الإنسان والحاسوب، مما يسمح لأنظمة الذكاء الاصطناعي (AI) بقبول الأوامر الصوتية كمدخلات بدلاً من الاعتماد فقط على لوحات المفاتيح أو شاشات اللمس. من خلال تحليل الأشكال الموجية للصوت ومطابقتها مع مجموعات بيانات لغوية ضخمة، يمكن لهذه الأنظمة تفسير لهجات متنوعة، وسرعات تحدث متفاوتة، ومفردات معقدة. تُعتبر هذه العملية عنصراً أساسياً في سير عمل معالجة اللغات الطبيعية (NLP) الحديث، حيث تحول الصوت غير المهيكل إلى بيانات مهيكلة قابلة للقراءة آلياً.

Link to this sectionكيف يعمل التعرف على الكلام#

تطورت البنية التحتية للتعرف على الكلام من مطابقة القوالب البسيطة إلى خطوط أنابيب متطورة مدعومة بـ التعلم العميق (DL). تتبع العملية عادةً تسلسلاً من الخطوات الحاسمة؛ أولاً، يتم التقاط الصوت التماثلي الخام ورقمنته. ثم يقوم النظام بـ استخراج الميزات لتصفية ضوضاء الخلفية وعزل الخصائص الصوتية، وغالباً ما يتم تمثيل الصوت بصرياً كـ مخطط طيفي لرسم كثافة التردد بمرور الوقت.

بمجرد عزل ميزات الصوت، يبدأ دور النموذج الصوتي. هذا النموذج، الذي غالباً ما يُبنى باستخدام شبكة عصبية (NN) مثل الشبكة العصبية المتكررة (RNN) أو Transformer الحديث، يقوم بتعيين الإشارات الصوتية إلى فونيمات—وهي الوحدات الأساسية للصوت. أخيراً، يقوم نموذج اللغة بتحليل تسلسل الفونيمات للتنبؤ بالكلمات والجمل الأكثر احتمالاً. هذه الخطوة حاسمة للتمييز بين المتجانسات اللفظية (مثل "to" و"two" و"too") بناءً على السياق. يستخدم المطورون أطر عمل مثل PyTorch لتدريب هذه النماذج المكثفة للبيانات.

Link to this sectionتطبيقات العالم الحقيقي#

أصبح التعرف على الكلام متاحاً في كل مكان، مما يعزز الكفاءة وسهولة الوصول عبر العديد من القطاعات.

  • التوثيق في الرعاية الصحية: في المجال الطبي، يسمح الذكاء الاصطناعي في الرعاية الصحية للأطباء باستخدام أدوات متخصصة من مزودين مثل Nuance Communications لإملاء الملاحظات السريرية مباشرة في السجلات الصحية الإلكترونية (EHR). هذا يقلل بشكل كبير من الإرهاق الإداري ويحسن دقة البيانات.
  • واجهات السيارات: تدمج المركبات الحديثة التحكم الصوتي للسماح للسائقين بإدارة أنظمة الملاحة والترفيه دون استخدام اليدين. يعطي الذكاء الاصطناعي في السيارات الأولوية للسلامة من خلال تقليل التشتت البصري عبر هذه الواجهات الصوتية الموثوقة.
  • المساعدون الافتراضيون: تستخدم الوكلاء الاستهلاكيون مثل Apple's Siri تقنية ASR لتحليل الأوامر للمهام التي تتراوح من ضبط المؤقتات إلى التحكم في أجهزة المنزل الذكي، حيث تعمل كطبقة إدخال أولية لـ المساعد الافتراضي.

Link to this sectionالتمييز بين المصطلحات ذات الصلة#

على الرغم من استخدامهما بشكل عرضي ليعنيا الشيء نفسه، من المهم التمييز بين التعرف على الكلام والمفاهيم ذات الصلة في قاموس الذكاء الاصطناعي.

  • تحويل الكلام إلى نص (STT): تشير STT تحديداً إلى وظيفة الإخراج (تحويل الصوت إلى نص)، في حين يشمل التعرف على الكلام المنهجية التكنولوجية الأوسع لتحديد الصوت.
  • فهم اللغة الطبيعية (NLU): تقوم ASR بتحويل الصوت إلى نص، لكنها لا "تفهم" الرسالة بطبيعتها. NLU هي العملية اللاحقة التي تفسر القصد والمشاعر والمعنى وراء الكلمات المنسوخة.
  • تحويل النص إلى كلام (TTS): هذه هي العملية العكسية، حيث يقوم النظام بتوليد كلام اصطناعي شبيه بالبشر من نص مكتوب.

Link to this sectionالتكامل مع الرؤية الحاسوبية#

الحدود التالية للأنظمة الذكية هي التعلم متعدد الوسائط (Multi-modal Learning)، الذي يجمع بين البيانات السمعية والبصرية. على سبيل المثال، قد يستخدم روبوت الخدمة YOLO26 لـ اكتشاف الكائنات في الوقت الفعلي لتحديد موقع مستخدم معين في غرفة، بينما يستخدم في الوقت نفسه التعرف على الكلام لفهم أمر مثل "أحضر لي زجاجة الماء". هذا التقارب يخلق وكلاء ذكاء اصطناعي شاملين قادرين على الرؤية والسمع. تسهل منصة Ultralytics إدارة مجموعات البيانات المعقدة هذه وتدريب نماذج قوية لمثل هذه التطبيقات متعددة الوسائط.

يوضح مثال Python التالي كيفية استخدام مكتبة SpeechRecognition، وهي أداة تضمين شائعة، لنسخ ملف صوتي.

import speech_recognition as sr

# Initialize the recognizer class
recognizer = sr.Recognizer()

# Load an audio file (supports WAV, AIFF, FLAC)
# Ideally, this audio file contains clear, spoken English
with sr.AudioFile("user_command.wav") as source:
    audio_data = recognizer.record(source)  # Read the entire audio file

try:
    # Transcribe the audio using Google's public speech recognition API
    text = recognizer.recognize_google(audio_data)
    print(f"Transcribed Text: {text}")
except sr.UnknownValueError:
    print("System could not understand the audio")

يتم تقييم أداء النظام عادةً باستخدام مقياس معدل خطأ الكلمة (WER)، حيث تشير الدرجة الأقل إلى دقة أعلى. لمزيد من الرؤى حول كيفية عمل هذه التقنيات جنباً إلى جنب مع نماذج الرؤية، استكشف دليلنا حول ربط معالجة اللغات الطبيعية بالرؤية الحاسوبية.

Explore solutions

Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.
اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.
اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.
اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.
اعرف المزيد

لنبنِ مستقبل الذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل تعلم الآلة