تعرف على YOLO26: جيل جديد من ذكاء الرؤية الاصطناعي.
Ultralytics
العودة إلى قاموس مصطلحات Ultralytics

Speech-to-Text

استكشف كيف يحول الكلام إلى نص (STT) الصوت إلى بيانات. تعرف على ASR، وتكامل معالجة اللغات الطبيعية (NLP)، والذكاء الاصطناعي متعدد الوسائط باستخدام Ultralytics YOLO26 ومنصة Ultralytics.

يُعد تحويل الكلام إلى نص (STT)، والذي يشار إليه غالباً بالتعرف التلقائي على الكلام (ASR)، عملية حاسوبية تحول اللغة المنطوقة إلى نص مكتوب. وتعمل هذه التقنية كجسر حيوي بين التواصل البشري والأنظمة الرقمية، مما يُمكّن الآلات من معالجة وتحليل وتخزين المعلومات الشفهية كبيانات مهيكلة. وفي جوهرها، تعتمد تقنية STT على خوارزميات التعلم العميق (DL) المتقدمة لتحليل موجات الصوت، وتحديد الأنماط الصوتية، وإعادة بنائها في جمل متماسكة، لتعمل فعلياً كطبقة إدخال لخطوط أنابيب معالجة اللغات الطبيعية (NLP) الأوسع.

Link to this sectionآليات العمل وراء النسخ#

تتضمن عملية التحويل من الصوت إلى نص عدة مراحل معقدة. في البداية، يلتقط النظام الصوت ويقوم بإجراء تنظيف البيانات لإزالة الضوضاء الخلفية. يخضع الصوت المُصفى بعد ذلك لعملية استخراج الميزات، حيث يتم تحويل موجات الصوت الخام إلى مخططات طيفية أو معاملات سيبسترال لتردد ميل (MFCCs)، والتي تمثل الخصائص الصوتية للكلام.

تستخدم أنظمة STT الحديثة بنيات مثل الشبكات العصبية المتكررة (RNN) أو نموذج Transformer عالي الكفاءة لتعيين هذه الميزات الصوتية إلى فونيمات (الوحدات الأساسية للصوت) وفي النهاية إلى كلمات. وقد أظهرت ابتكارات مثل OpenAI Whisper كيف يمكن للتدريب على مجموعات بيانات ضخمة ومتنوعة أن يخفض بشكل كبير من معدل خطأ الكلمات (WER)، وهو مقياس رئيسي لتقييم دقة النسخ.

Link to this sectionتطبيقات العالم الحقيقي#

أصبحت تقنية تحويل الكلام إلى نص منتشرة في كل مكان، مما يعزز الكفاءة عبر مختلف الصناعات من خلال تمكين التشغيل بدون استخدام اليدين وإدخال البيانات السريع.

  • التوثيق السريري: في القطاع الطبي، يستخدم الأطباء أدوات متخصصة مثل Nuance Dragon Medical لإملاء ملاحظات المرضى مباشرة في السجلات الصحية الإلكترونية (EHRs). ويقلل هذا التكامل لـ الذكاء الاصطناعي في الرعاية الصحية بشكل كبير من الأعباء الإدارية، مما يسمح للأطباء بالتركيز أكثر على رعاية المرضى.
  • واجهات السيارات: تستخدم المركبات الحديثة تقنية STT لتمكين السائقين من التحكم في أنظمة الملاحة والترفيه عبر الأوامر الصوتية. وتعطي الحلول التي تدعم الذكاء الاصطناعي في السيارات الأولوية للسلامة من خلال تقليل التشتت البصري، مما يسمح للسائقين بإبقاء أعينهم على الطريق أثناء التفاعل مع الأنظمة الرقمية لمركباتهم.
  • تحليلات خدمة العملاء: تستخدم المؤسسات خدمات مثل Google Cloud Speech-to-Text لنسخ آلاف مكالمات دعم العملاء يومياً. ثم يتم تحليل هذه النصوص المستخرجة لمعرفة المشاعر وتحسين جودة الخدمة.

Link to this sectionالتمييز بين المفاهيم ذات الصلة#

لفهم مشهد الذكاء الاصطناعي بالكامل، من المفيد التمييز بين تحويل الكلام إلى نص ومصطلحات معالجة اللغة الأخرى:

  • تحويل النص إلى كلام (TTS): هذه هي العملية العكسية. بينما تأخذ تقنية STT مدخلات صوتية وتنتج نصاً، تقوم تقنية TTS بتركيب كلام بشري اصطناعي من مدخل نصي.
  • فهم اللغة الطبيعية (NLU): تعد STT أداة نسخ بحتة؛ فهي تلتقط ما قيل ولكن ليس بالضرورة ما يعنيه. أما NLU فهي العملية اللاحقة التي تحلل النص المنسوخ لتحديد نية المستخدم والمعنى الدلالي.
  • التعرف على الكلام: على الرغم من استخدامهما كمرادفين غالباً، إلا أن التعرف على الكلام هو مصطلح شامل أوسع يمكن أن يتضمن أيضاً تحديد هوية المتحدث (تحديد من يتحدث)، بينما تركز تقنية STT تحديداً على المحتوى اللغوي.

Link to this sectionالتكامل متعدد الوسائط مع رؤية الذكاء الاصطناعي#

يكمن مستقبل الوكلاء الأذكياء في التعلم متعدد الوسائط، حيث تقوم الأنظمة بمعالجة البيانات المرئية والسمعية في وقت واحد. على سبيل المثال، قد يستخدم روبوت الخدمة YOLO26—أحدث طراز متطور من Ultralytics—لـ اكتشاف الكائنات في الوقت الفعلي لتحديد موقع المستخدم، بينما يستخدم في الوقت نفسه تقنية STT للاستماع إلى أمر مثل "أحضر لي تلك الزجاجة."

يسمح هذا التقارب بإنشاء وكلاء ذكاء اصطناعي شاملين قادرين على الرؤية والسمع. وتسهل منصة Ultralytics إدارة هذه التدفقات العملية المعقدة، من خلال دعم التعليق التوضيحي، والتدريب، ونشر النماذج التي يمكن أن تكون بمثابة العمود الفقري المرئي للتطبيقات متعددة الوسائط.

Link to this sectionمثال على التنفيذ باستخدام Python#

يوضح المثال التالي تنفيذاً أساسياً باستخدام مكتبة SpeechRecognition، وهي أداة Python شائعة تتصل بمحركات ASR مختلفة (مثل CMU Sphinx) لنسخ الملفات الصوتية.

import speech_recognition as sr

# Initialize the recognizer class
recognizer = sr.Recognizer()

# Load an audio file (supports WAV, FLAC, etc.)
# In a real workflow, this audio might be triggered by a YOLO26 detection event
with sr.AudioFile("user_command.wav") as source:
    audio_data = recognizer.record(source)  # Read the entire audio file

try:
    # Transcribe audio using the Google Web Speech API
    text = recognizer.recognize_google(audio_data)
    print(f"Transcribed Text: {text}")
except sr.UnknownValueError:
    print("System could not understand the audio.")

Explore solutions

Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.

اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.

اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.

اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.

اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.

اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.

اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.

اعرف المزيد

لنبنِ مستقبل الذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل تعلم الآلة