Yolo 비전 선전
선전
지금 참여하기
용어집

Hidden Markov Model (HMM)

Hidden Markov Models(HMM)와 그 원리, 음성 인식, 생물 정보학 및 AI에서의 응용, 숨겨진 상태를 추론하는 방법을 알아보세요.

숨겨진 마르코프 모델(HMM)은 확률적 시스템을 설명하는 데 사용되는 통계적 AI 모델입니다. 내부 상태를 직접 관찰할 수 없지만(숨겨진) 일련의 관찰 가능한 이벤트를 통해 추론할 수 있는 일련의 관찰 가능한 이벤트를 통해 추론할 수 있습니다. HMM은 특히 다음과 같은 경우에 효과적입니다. 시계열 분석 및 순차적 데이터 마르코프 가정에 의존하여 미래 상태의 확률은 현재 상태에만 의존하고 그 이전의 이벤트에는 이벤트에 따라 달라집니다. 이 프레임워크 덕분에 HMM은 다음과 같은 분야에서 기본 도구로 자리 잡았습니다. 자연어 처리(NLP), 생물 정보학 및 음성 처리와 같은 분야의 기본 도구가 되었습니다.

Hidden Markov 모델 작동 방식

HMM은 프로세스를 시간이 지남에 따라 숨겨진 상태 사이를 전환하는 시스템으로 모델링하여 각 단계에서 관찰 가능한 출력을 각 단계에서 관찰 가능한 출력을 방출합니다. 이 모델은 세 가지 기본 확률 집합으로 정의됩니다:

  • 전환 확률: 숨겨진 상태에서 다른 상태로 이동할 확률(예: "맑음" 날씨 상태에서 "맑은" 날씨 상태에서 "비오는" 날씨 상태로).
  • 방출 확률: 현재 숨겨진 상태가 주어졌을 때 특정 출력이 관찰될 가능성입니다. 상태(예: 상태가 '비'일 때 '우산'이 표시되는 경우)가 주어졌을 때 특정 출력을 관찰할 확률입니다.
  • 초기 확률: 시작 확률: 시작 상태의 확률 분포입니다.

두 가지 핵심 알고리즘이 HMM 사용의 핵심입니다. 하나는 비터비 알고리즘은 디코딩에 사용되며, 주어진 관측 시퀀스를 생성한 숨겨진 상태의 가장 가능성이 높은 숨겨진 상태의 시퀀스를 결정하는 데 사용됩니다. 모델 학습을 위해 매개변수를 학습하기 위해 바움-웰치 알고리즘, 일종의 기대 최대화(EM) 방법의 일종인 바움-웰치 알고리즘이 일반적으로 사용됩니다.

현대적이지만 딥러닝(DL) 프레임워크와 같은 PyTorch 오늘날 시퀀스 작업을 처리하는 경우 HMM은 확률적 모델링에 대한 중요한 통찰력을 제공합니다. 다음 Python 예제에서는 hmmlearn 라이브러리를 사용하여 간단한 상태 예측을 시연합니다:

# pip install hmmlearn
import numpy as np
from hmmlearn import hmm

# Define an HMM with 2 hidden states (e.g., Sunny, Rainy) and 2 observables
model = hmm.CategoricalHMM(n_components=2, random_state=42)
model.startprob_ = np.array([0.6, 0.4])  # Initial state probabilities
model.transmat_ = np.array([[0.7, 0.3], [0.4, 0.6]])  # Transition matrix
model.emissionprob_ = np.array([[0.9, 0.1], [0.2, 0.8]])  # Emission matrix

# Predict the most likely hidden states for a sequence of observations
logprob, predicted_states = model.decode(np.array([[0, 1, 0]]).T)
print(f"Predicted sequence of hidden states: {predicted_states}")

실제 애플리케이션

HMM은 초기 AI 시스템 개발에 중요한 역할을 해왔으며, 해석 가능성과 확률적 추론이 필요한 곳에서 계속 사용되고 있습니다.

  1. 음성 인식: 딥 뉴럴 네트워크가 등장하기 전에는 음성 언어를 텍스트로 변환하는 표준으로 HMM이 사용되었습니다. 이 맥락에서 숨겨진 상태는 음소(소리의 고유한 단위)를 나타내며, 관찰 가능한 출력은 오디오에서 파생된 음향 신호 또는 오디오에서 파생된 특징입니다. 모델은 오디오를 가장 잘 설명하는 음소 시퀀스를 추론합니다. 입력. 더 자세히 알아보려면 IEEE 신호 처리 학회 에서 이러한 역사적 방법에 대한 광범위한 리소스를 제공합니다.
  2. 생물정보학 및 유전체학: HMM은 DNA와 같은 생물학적 염기서열을 분석하는 데 널리 사용됩니다. A 고전적인 응용 분야는 유전자 탐색으로, 숨겨진 상태는 게놈의 기능 영역( 엑손, 인트론 또는 유전자 간 영역)에 해당하며 관찰 대상은 뉴클레오티드 서열(A, C, G, T)입니다. 다음과 같은 도구 GENSCAN은 HMM을 활용하여 다음을 예측합니다. DNA 염기서열 내의 유전자 구조를 정확도.

관련 개념과의 비교

HMM은 종종 다른 시퀀스 모델링 기법과 비교되지만, 구조와 기능이 크게 다릅니다. 기능이 크게 다르긴 하지만요:

  • 마르코프 의사 결정 프로세스(MDP): 둘 다 마르코프 속성에 의존하지만, MDP는 다음에서 사용됩니다. 상태를 완전히 관찰할 수 있는 강화 학습 를 완전히 관찰할 수 있으며, 보상을 극대화하기 위한 의사 결정(행동)을 내리는 것이 목표인 강화 학습에 사용됩니다. 반대로 HMM은 다음을 처리합니다. 수동 추론을 처리합니다.
  • 순환 신경망(RNN)LSTM: RNN과 장단기 메모리 네트워크는 데이터에서 복잡한 비선형 종속성을 포착하는 딥러닝 모델입니다. 를 포착하는 딥러닝 모델입니다. 마르코프 가정의 고정된 히스토리에 의해 제한되는 HMM과 달리, LSTM은 장거리의 맥락을 학습할 수 있습니다. 딥마인드의 연구에서는 종종 이러한 신경 접근 방식이 번역과 같은 복잡한 작업에서 HMM을 어떻게 대체했는지를 강조합니다.

다음과 같은 최신 컴퓨터 비전 모델 Ultralytics YOLO11, 와 같은 최신 컴퓨터 비전 모델은 다음과 같은 작업에 HMM이 아닌 고급 컨볼루션 신경망(CNN)과 트랜스포머를 활용합니다. 객체 감지인스턴스 세분화와 같은 작업에 사용합니다. 그러나 HMM은 여전히 통계적 기초를 이해하는 데 유용한 개념입니다. 머신 러닝(ML).

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기