نموذج ماركوف المخفي (HMM) هو نموذج إحصائي يُستخدم لوصف الأنظمة التي تنتقل بين الحالات مع مرور الوقت. في نماذج HMMs، لا يمكن ملاحظة تسلسل الحالات التي يمر بها النظام بشكل مباشر (فهي "مخفية")، ولكن يمكن الاستدلال عليها من تسلسل المخرجات أو الانبعاثات التي يمكن ملاحظتها الناتجة عن كل حالة. تعتبر نماذج HMMs قوية بشكل خاص لنمذجة البيانات المتسلسلة وتحليل السلاسل الزمنية عبر مجالات مختلفة ضمن الذكاء الاصطناعي (AI) والتعلم الآلي (ML). وهي تنتمي إلى فئة من النماذج تُعرف باسم النماذج البيانية الاحتمالية، وتوفر إطارًا للتعامل مع عدم اليقين في الأنظمة الديناميكية.
المفاهيم الأساسية
يتم تعريف ال HMMs من خلال عمليتين عشوائيتين (عشوائيتين) رئيسيتين:
- الحالات الخفية: سلسلة أساسية غير قابلة للرصد من حالات ماركوف. ينتقل النظام بين هذه الحالات الخفية وفقًا لاحتمالات محددة. والافتراض الأساسي هو خاصية ماركوف: يعتمد احتمال الانتقال إلى الحالة التالية على الحالة الحالية فقط، وليس على تسلسل الحالات التي سبقتها.
- الانبعاثات القابلة للرصد: تولد كل حالة خفية مخرجات أو انبعاثات يمكن ملاحظتها بناءً على توزيع احتمالي معين. هذه الانبعاثات هي البيانات التي نلاحظها بالفعل.
يتميز النموذج بـ
- الحالات: مجموعة محدودة من الحالات المخفية.
- الملاحظات: مجموعة محدودة من الانبعاثات أو الملاحظات الممكنة.
- احتمالات الانتقال: احتمالات الانتقال من حالة خفية إلى أخرى.
- احتمالات الانبعاث: احتمالات رصد انبعاث معين إذا كان النظام في حالة خفية محددة.
- توزيع الحالة الأولية: احتمالات بدء النظام في كل حالة مخفية.
كيف تعمل نماذج ماركوف المخفية
عادةً ما يتضمن العمل مع HMMs عادةً معالجة ثلاث مشاكل أساسية، وغالبًا ما يتم التعامل معها باستخدام خوارزميات محددة مفصلة في البرامج التعليمية مثل رابينر:
- مشكلة التقييم: إذا كان لدينا HMM وتسلسل من الملاحظات، ما هو احتمال أن تكون الملاحظات قد تم إنشاؤها بواسطة النموذج؟ (تُحل باستخدام الخوارزمية الأمامية).
- مشكلة فك التشفير: بمعلومية HMM وتسلسل الملاحظات، ما هو التسلسل الأكثر احتمالاً للحالات المخفية التي أنتجت هذه الملاحظات؟ (تُحل باستخدام خوارزمية فيتربي).
- مشكلة التعلّم: بالنظر إلى تسلسل من الملاحظات (أو تسلسلات متعددة)، كيف يمكننا ضبط معلمات HMM (احتمالات الانتقال والانبعاثات) لتفسير البيانات المرصودة على أفضل وجه؟ (غالبًا ما يتم حلها باستخدام خوارزمية Baum-Welch، وهي مثال على خوارزمية التوقع-التعظيم). هذا أمر بالغ الأهمية لتدريب النموذج.
التطبيقات الواقعية
تم تطبيق HMMs بنجاح في العديد من المجالات:
- التعرّف على الكلام: هذا تطبيق كلاسيكي. يمكن أن تمثل الحالات المخفية الفونيمات (الوحدات الأساسية للصوت)، في حين أن الملاحظات هي السمات الصوتية المستخرجة من إشارة الكلام. يقوم HMM بفك تشفير التسلسل الأكثر احتمالاً من الفونيمات بالنظر إلى الصوت، مما يشكل الأساس للتعرف على الكلمات. وقد اعتمدت أدوات مثل CMU Sphinx تاريخياً بشكل كبير على HMMs.
- المعلوماتية الحيوية: تستخدم HMMs على نطاق واسع لتحليل التسلسل. على سبيل المثال، في العثور على الجينات، قد تمثل الحالات المخفية مناطق الترميز أو المناطق غير المشفرة أو تراكيب جينية محددة (مثل كودونات البدء، والإكسونات، والإنترونات). الملاحظات هي أزواج قواعد الحمض النووي (A، C، G، T). يساعد النموذج في تحديد مواقع الجينات داخل تسلسل الحمض النووي الطويل. تستخدم برمجيات مثل HMMER نماذج HMMs الشخصية لتحليل تسلسل البروتين، ومقارنة التسلسلات بقواعد البيانات مثل قاعدة بيانات NCBI Gene.
- معالجة اللغة الطبيعية (NLP): تُستخدم في مهام مثل وضع علامات على أجزاء الكلام، حيث تكون الحالات المخفية هي العلامات النحوية (الاسم، والفعل، والصفة) والملاحظات هي الكلمات الموجودة في الجملة. تطبق أيضًا في التعرف على الكيانات المسماة (NER).
- الرؤية الحاسوبية: تطبق في التعرف على الإيماءات، والتعرف على النشاط من الفيديو، وأحيانًا تاريخيًا في تتبع الأجسام، على الرغم من أنه غالبًا ما تحل محلها أساليب مثل مرشحات كالمان أو مناهج التعلم العميق.
- التمويل: نمذجة أنظمة السوق (على سبيل المثال، الأسواق الصاعدة مقابل الأسواق الهابطة) كحالات خفية تستند إلى مؤشرات مالية يمكن ملاحظتها.
- تحليل الصور الطبية: تحليل تسلسل الصور أو الإشارات الطبية مع مرور الوقت.
المقارنة مع المفاهيم ذات الصلة
من المهم التمييز بين HMMs ونماذج التسلسل الأخرى:
في حين أن أساليب التعلم العميق الأحدث غالبًا ما تحقق أحدث النتائج، تظل HMMs ذات قيمة لقابليتها للتفسير (الحالات والاحتمالات الواضحة) وفعاليتها، خاصةً عندما تكون بيانات التدريب محدودة أو عندما تكون معرفة المجال يمكن دمجها في بنية النموذج. إن فهم المفاهيم التأسيسية مثل HMMs يوفر سياقًا قيّمًا في المشهد الأوسع للتعلم الآلي، حتى عند استخدام منصات مثل Ultralytics HUB التي تسهل في المقام الأول تطوير ونشر نماذج DL مثل YOLOv8 أو YOLO11.