Glossar

Hidden Markov Model (HMM)

Entdecken Sie Hidden Markov Models (HMMs), ihre Prinzipien, Anwendungen in der Spracherkennung, Bioinformatik & KI und wie sie verborgene Zustände ableiten.

Ein Hidden Markov Model (HMM) ist eine Art statistisches KI-Modell, das zur Analyse sequenzieller Daten verwendet wird, bei denen davon ausgegangen wird, dass das zugrunde liegende System ein Markov-Prozess mit unbeobachteten (versteckten) Zuständen ist. Die Kernidee besteht darin, Schlussfolgerungen über eine Sequenz versteckter Zustände auf der Grundlage einer Sequenz beobachtbarer Ausgaben zu ziehen. HMMs basieren auf der Markov-Eigenschaft, die besagt, dass die Wahrscheinlichkeit eines zukünftigen Zustands nur vom aktuellen Zustand abhängt, nicht von der gesamten Historie der Zustände. Dies macht HMMs zu einem leistungsstarken Werkzeug für Aufgaben in Bereichen wie Natural Language Processing (NLP) und Bioinformatik.

Wie Hidden-Markov-Modelle funktionieren

Ein HMM besteht aus mehreren Schlüsselkomponenten, die zusammenarbeiten, um sequentielle Daten zu modellieren:

Verborgene Zustände (Hidden States): Dies sind die nicht beobachtbaren Zustände des Systems, die das Modell zu erschließen versucht. Bei der Wettervorhersage könnten die verborgenen Zustände beispielsweise "Sonnig", "Bewölkt" oder "Regnerisch" sein.
Beobachtbare Ausgaben (Emissionen): Dies sind die sichtbaren Datenpunkte, die jeder verborgene Zustand erzeugen kann. Am Beispiel des Wetters könnten Beobachtungen "Hohe Temperatur", "Niedrige Temperatur" oder "Hohe Luftfeuchtigkeit" sein.
Übergangswahrscheinlichkeiten: Diese Wahrscheinlichkeiten bestimmen die Wahrscheinlichkeit, von einem verborgenen Zustand in einen anderen zu wechseln. Zum Beispiel gibt es eine bestimmte Wahrscheinlichkeit, dass auf einen "sonnigen" Tag ein "bewölkter" Tag folgt.
Emissionswahrscheinlichkeiten: Diese Wahrscheinlichkeiten stellen die Wahrscheinlichkeit dar, eine bestimmte Ausgabe zu beobachten, wenn sich das System in einem bestimmten verborgenen Zustand befindet. Zum Beispiel ist die Wahrscheinlichkeit, "Hohe Luftfeuchtigkeit" zu beobachten, wahrscheinlich höher, wenn der verborgene Zustand "Regnerisch" ist.

Um Vorhersagen zu treffen, verwenden HMMs etablierte Algorithmen. Der Viterbi-Algorithmus wird häufig verwendet, um die wahrscheinlichste Sequenz verborgener Zustände angesichts einer Sequenz von Beobachtungen zu finden. Um das Modell zu trainieren und seine Wahrscheinlichkeitsverteilungen aus Trainingsdaten zu lernen, wird häufig der Baum-Welch-Algorithmus verwendet.

Anwendungsfälle in der Praxis

HMMs werden seit Jahrzehnten erfolgreich in verschiedenen Bereichen eingesetzt. Hier sind ein paar prominente Beispiele:

Spracherkennung: In klassischen Spracherkennungssystemen waren HMMs von entscheidender Bedeutung. Die verborgenen Zustände entsprechen Phonemen (den Grundeinheiten des Klangs in einer Sprache), und die beobachtbaren Ausgaben sind akustische Merkmale, die aus aufgezeichneter Sprache extrahiert werden. Die Aufgabe des HMM besteht darin, die wahrscheinlichste Sequenz von Phonemen aus dem Audiosignal zu bestimmen, die dann zur Identifizierung der gesprochenen Wörter verwendet wird.
Bioinformatik: HMMs sind ein Eckpfeiler der Computational Biology, insbesondere für die Gensuche. In diesem Zusammenhang könnten verborgene Zustände Teile eines Gens darstellen, wie z. B. "Exon" (kodierender Bereich) oder "Intron" (nicht-kodierender Bereich), während die Beobachtungen die Sequenz der DNA-Basen (A, C, G, T) sind. Durch die Analyse einer langen DNA-Sequenz kann ein HMM die wahrscheinlichsten Positionen von Genen identifizieren. Das National Center for Biotechnology Information (NCBI) beschreibt diese Methoden im Detail.

Vergleich mit verwandten Konzepten

Es ist wichtig, HMMs von anderen Sequenzmodellen zu unterscheiden:

Markov-Entscheidungsprozesse (MDPs): Während beide Zustände und Übergänge beinhalten, gehen MDPs davon aus, dass Zustände vollständig beobachtbar sind, und konzentrieren sich auf die Entscheidungsfindung (das Finden optimaler Aktionen) im Rahmen des Reinforcement Learning (RL). HMMs konzentrieren sich auf das Ableiten versteckter Zustände aus Beobachtungen. Ressourcen wie die Einführungsmaterialien von DeepMind behandeln RL und MDPs.
Rekurrente Neuronale Netze (RNNs) und Long Short-Term Memory (LSTMs): Dies sind Deep-Learning (DL)-Modelle, die ebenfalls für sequentielle Daten entwickelt wurden. Im Gegensatz zu den expliziten probabilistischen Zuständen von HMMs verfügen RNNs/LSTMs über einen internen Hidden State Vektor, der sich implizit weiterentwickelt, während sie Sequenzen verarbeiten. Sie können komplexere und längerfristige Abhängigkeiten erfassen und erreichen oft eine höhere Genauigkeit bei Aufgaben wie maschineller Übersetzung und fortgeschrittener Spracherkennung. Ein guter Überblick bietet das Verständnis von LSTMs. Moderne Vision-Modelle wie Ultralytics YOLO verwenden DL-Architekturen, die oft mit Frameworks wie PyTorch oder TensorFlow für Aufgaben wie Objekterkennung und Instanzsegmentierung erstellt werden.

Obwohl neuere Deep-Learning-Methoden oft modernste Ergebnisse erzielen, bleiben HMMs aufgrund ihrer Interpretierbarkeit (explizite Zustände und Wahrscheinlichkeiten) und Effektivität wertvoll, insbesondere wenn nur begrenzte Trainingsdaten vorhanden sind oder Domänenwissen in die Modellstruktur einbezogen werden kann. Das Verständnis grundlegender Konzepte wie HMMs bietet einen wertvollen Kontext in der breiteren ML-Landschaft, selbst bei der Verwendung von Plattformen wie Ultralytics HUB, die in erster Linie die Entwicklung und das Deployment von DL-Modellen wie YOLOv8 oder YOLO11 erleichtern.

Hidden Markov Model (HMM)

Trainieren Sie Ultralytics YOLO-Modelle, um Arbeitsabläufe in allen Branchen zu rationalisieren

Flexible Enterprise-Lizenzlösung zur Förderung Ihrer Innovationen

Trainieren Sie KI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Wie Hidden-Markov-Modelle funktionieren

Anwendungsfälle in der Praxis

Vergleich mit verwandten Konzepten

Mehr in dieser Kategorie lesen

Von Bits zu Qubits: Wie die Quantenoptimierung die KI umgestaltet

Eine Kurzanleitung für Anfänger, wie man ein KI-Modell trainiert

Aus Dubai mit Einblicken: Die wichtigsten Erkenntnisse aus dem GDG MENA-T Summit 2025

Treten Sie der Ultralytics-Community bei