숨겨진 마르코프 모델(HMM)은 시간이 지남에 따라 상태 간에 전환하는 시스템을 설명하는 데 사용되는 통계 모델입니다. HMM에서 시스템이 통과하는 상태의 순서는 직접 관찰할 수 없지만("숨겨진"), 각 상태에서 생성되는 일련의 관찰 가능한 출력 또는 배출을 통해 유추할 수 있습니다. HMM은 특히 인공지능(AI) 및 머신러닝(ML) 내의 다양한 영역에서 순차적 데이터 및 시계열 분석을 모델링하는 데 매우 강력합니다. 확률적 그래픽 모델로 알려진 모델 클래스에 속하며, 동적 시스템의 불확실성을 처리하는 프레임워크를 제공합니다.
핵심 개념
HMM은 두 가지 주요 확률적(무작위) 프로세스로 정의됩니다:
- 숨겨진 상태: 관찰할 수 없는 기본 상태의 마르코프 체인입니다. 시스템은 특정 확률에 따라 이러한 숨겨진 상태 사이를 전환합니다. 핵심 가정은 마르코프 속성입니다. 다음 상태로 전환할 확률은 이전 상태의 순서가 아니라 현재 상태에만 의존한다는 것입니다.
- 관측 가능한 배출: 각 숨겨진 상태는 특정 확률 분포에 따라 관측 가능한 출력 또는 배출을 생성합니다. 이러한 배출은 실제로 관찰되는 데이터입니다.
이 모델의 특징은 다음과 같습니다:
- 상태: 상태: 숨겨진 상태의 유한한 집합입니다.
- 관측: 관측: 가능한 배출 또는 관측의 유한한 집합입니다.
- 전환 확률: 숨겨진 상태에서 다른 상태로 이동할 확률입니다.
- 방출 확률: 시스템이 특정 숨겨진 상태에 있을 때 특정 방출을 관찰할 확률입니다.
- 초기 상태 분포: 시스템이 각 숨겨진 상태에서 시작될 확률입니다.
숨겨진 마르코프 모델의 작동 원리
HMM으로 작업하려면 일반적으로 세 가지 근본적인 문제를 해결해야 하는데, 이러한 문제는 Rabiner의 튜토리얼에 자세히 설명된 특정 알고리즘을 사용하여 해결하는 경우가 많습니다:
- 평가 문제: HMM과 일련의 관측이 주어졌을 때, 해당 관측이 모델에 의해 생성되었을 확률은 얼마인가? (포워드 알고리즘을 사용하여 해결).
- 해독 문제: HMM과 일련의 관측값이 주어졌을 때, 이러한 관측값을 생성한 숨겨진 상태의 가장 가능성이 높은 시퀀스는 무엇인가요? (비터비 알고리즘을 사용하여 해결).
- 학습 문제: 일련의 관측(또는 여러 개의 관측)이 주어졌을 때, 관측된 데이터를 가장 잘 설명하도록 HMM 파라미터(전이 및 방출 확률)를 어떻게 조정할 수 있을까요? (기대-최대화 알고리즘의 한 예인 바움-웰치 알고리즘을 사용하여 종종 해결합니다). 이는 모델 훈련에 매우 중요합니다.
실제 애플리케이션
HMM은 다양한 분야에서 성공적으로 적용되었습니다:
- 음성 인식: 이것은 고전적인 애플리케이션입니다. 숨겨진 상태는 음소(소리의 기본 단위)를 나타낼 수 있으며, 관찰은 음성 신호에서 추출한 음향적 특징입니다. HMM은 오디오가 주어졌을 때 가장 가능성이 높은 음소 시퀀스를 해독하여 단어 인식의 기초를 형성합니다. CMU 스핑크스와 같은 도구는 역사적으로 HMM에 크게 의존해 왔습니다.
- 생물정보학: HMM은 염기서열 분석에 널리 사용됩니다. 예를 들어 유전자 검색에서 숨겨진 상태는 코딩 영역, 비코딩 영역 또는 특정 유전자 구조(예: 시작 코돈, 엑손, 인트론)를 나타낼 수 있습니다. 관찰 대상은 DNA 염기쌍(A, C, G, T)입니다. 이 모델은 긴 DNA 서열 내에서 유전자 위치를 식별하는 데 도움이 됩니다. HMMER와 같은 소프트웨어는 단백질 서열 분석에 프로필 HMM을 사용하여 NCBI 유전자 데이터베이스와 같은 데이터베이스와 서열을 비교합니다.
- 자연어 처리(NLP): 품사 태깅과 같은 작업에 사용되며, 숨겨진 상태는 문법 태그(명사, 동사, 형용사)이고 관찰 대상은 문장의 단어입니다. 명명된 엔티티 인식(NER)에도 적용됩니다.
- 컴퓨터 비전(CV): 제스처 인식, 비디오에서 활동 인식, 때로는 물체 추적에 적용되었지만 칼만 필터나 딥러닝 접근 방식과 같은 방법으로 대체되는 경우가 많습니다.
- 금융: 관찰 가능한 재무 지표를 기반으로 시장 체제(예: 강세장 대 약세장)를 숨겨진 상태로 모델링합니다.
- 의료 이미지 분석: 시간 경과에 따른 의료 이미지 또는 신호의 시퀀스를 분석합니다.
관련 개념과의 비교
HMM을 다른 시퀀스 모델과 구별하는 것이 중요합니다:
최신 딥 러닝 방법도 종종 최첨단 결과를 달성하지만, 특히 학습 데이터가 제한적이거나 도메인 지식을 모델 구조에 통합할 수 있을 때 HMM은 해석 가능성(명시적 상태 및 확률)과 효과 면에서 여전히 가치가 있습니다. HMM과 같은 기본 개념을 이해하면 다음과 같은 DL 모델의 개발 및 배포를 주로 촉진하는 Ultralytics HUB와 같은 플랫폼을 사용하는 경우에도 더 광범위한 ML 환경에서 유용한 컨텍스트를 얻을 수 있습니다. YOLOv8 또는 YOLO11.