용어집

숨겨진 마르코프 모델(HMM)

숨겨진 마르코프 모델(HMM)과 그 원리, 음성 인식, 생물 정보학 및 AI에서의 적용, 숨겨진 상태를 추론하는 방법에 대해 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

숨겨진 마르코프 모델(HMM)은 시간이 지남에 따라 상태 간에 전환하는 시스템을 설명하는 데 사용되는 통계 모델입니다. HMM에서 시스템이 통과하는 상태의 순서는 직접 관찰할 수 없지만("숨겨진"), 각 상태에서 생성되는 일련의 관찰 가능한 출력 또는 배출을 통해 유추할 수 있습니다. HMM은 특히 인공지능(AI)머신러닝(ML) 내의 다양한 영역에서 순차적 데이터 및 시계열 분석을 모델링하는 데 매우 강력합니다. 확률적 그래픽 모델로 알려진 모델 클래스에 속하며, 동적 시스템의 불확실성을 처리하는 프레임워크를 제공합니다.

핵심 개념

HMM은 두 가지 주요 확률적(무작위) 프로세스로 정의됩니다:

  1. 숨겨진 상태: 관찰할 수 없는 기본 상태의 마르코프 체인입니다. 시스템은 특정 확률에 따라 이러한 숨겨진 상태 사이를 전환합니다. 핵심 가정은 마르코프 속성입니다. 다음 상태로 전환할 확률은 이전 상태의 순서가 아니라 현재 상태에만 의존한다는 것입니다.
  2. 관측 가능한 배출: 각 숨겨진 상태는 특정 확률 분포에 따라 관측 가능한 출력 또는 배출을 생성합니다. 이러한 배출은 실제로 관찰되는 데이터입니다.

이 모델의 특징은 다음과 같습니다:

  • 상태: 상태: 숨겨진 상태의 유한한 집합입니다.
  • 관측: 관측: 가능한 배출 또는 관측의 유한한 집합입니다.
  • 전환 확률: 숨겨진 상태에서 다른 상태로 이동할 확률입니다.
  • 방출 확률: 시스템이 특정 숨겨진 상태에 있을 때 특정 방출을 관찰할 확률입니다.
  • 초기 상태 분포: 시스템이 각 숨겨진 상태에서 시작될 확률입니다.

숨겨진 마르코프 모델의 작동 원리

HMM으로 작업하려면 일반적으로 세 가지 근본적인 문제를 해결해야 하는데, 이러한 문제는 Rabiner의 튜토리얼에 자세히 설명된 특정 알고리즘을 사용하여 해결하는 경우가 많습니다:

  1. 평가 문제: HMM과 일련의 관측이 주어졌을 때, 해당 관측이 모델에 의해 생성되었을 확률은 얼마인가? (포워드 알고리즘을 사용하여 해결).
  2. 해독 문제: HMM과 일련의 관측값이 주어졌을 때, 이러한 관측값을 생성한 숨겨진 상태의 가장 가능성이 높은 시퀀스는 무엇인가요? (비터비 알고리즘을 사용하여 해결).
  3. 학습 문제: 일련의 관측(또는 여러 개의 관측)이 주어졌을 때, 관측된 데이터를 가장 잘 설명하도록 HMM 파라미터(전이 및 방출 확률)를 어떻게 조정할 수 있을까요? (기대-최대화 알고리즘의 한 예인 바움-웰치 알고리즘을 사용하여 종종 해결합니다). 이는 모델 훈련에 매우 중요합니다.

실제 애플리케이션

HMM은 다양한 분야에서 성공적으로 적용되었습니다:

  • 음성 인식: 이것은 고전적인 애플리케이션입니다. 숨겨진 상태는 음소(소리의 기본 단위)를 나타낼 수 있으며, 관찰은 음성 신호에서 추출한 음향적 특징입니다. HMM은 오디오가 주어졌을 때 가장 가능성이 높은 음소 시퀀스를 해독하여 단어 인식의 기초를 형성합니다. CMU 스핑크스와 같은 도구는 역사적으로 HMM에 크게 의존해 왔습니다.
  • 생물정보학: HMM은 염기서열 분석에 널리 사용됩니다. 예를 들어 유전자 검색에서 숨겨진 상태는 코딩 영역, 비코딩 영역 또는 특정 유전자 구조(예: 시작 코돈, 엑손, 인트론)를 나타낼 수 있습니다. 관찰 대상은 DNA 염기쌍(A, C, G, T)입니다. 이 모델은 긴 DNA 서열 내에서 유전자 위치를 식별하는 데 도움이 됩니다. HMMER와 같은 소프트웨어는 단백질 서열 분석에 프로필 HMM을 사용하여 NCBI 유전자 데이터베이스와 같은 데이터베이스와 서열을 비교합니다.
  • 자연어 처리(NLP): 품사 태깅과 같은 작업에 사용되며, 숨겨진 상태는 문법 태그(명사, 동사, 형용사)이고 관찰 대상은 문장의 단어입니다. 명명된 엔티티 인식(NER)에도 적용됩니다.
  • 컴퓨터 비전(CV): 제스처 인식, 비디오에서 활동 인식, 때로는 물체 추적에 적용되었지만 칼만 필터나 딥러닝 접근 방식과 같은 방법으로 대체되는 경우가 많습니다.
  • 금융: 관찰 가능한 재무 지표를 기반으로 시장 체제(예: 강세장 대 약세장)를 숨겨진 상태로 모델링합니다.
  • 의료 이미지 분석: 시간 경과에 따른 의료 이미지 또는 신호의 시퀀스를 분석합니다.

관련 개념과의 비교

HMM을 다른 시퀀스 모델과 구별하는 것이 중요합니다:

  • 마르코프 의사 결정 프로세스(MDP): 둘 다 상태와 전환을 포함하지만, MDP는 상태를 완전히 관찰할 수 있다고 가정하고 강화 학습(RL)의 프레임워크 내에서 의사 결정(최적의 행동 찾기)에 중점을 둡니다. HMM은 관찰에서 숨겨진 상태를 추론하는 데 중점을 둡니다. DeepMind의 입문 자료와 같은 리소스에서 RL과 MDP를 다룹니다.
  • 순환 신경망(RNN)장단기 메모리(LSTM): 이 역시 순차적 데이터를 위해 설계된 딥러닝(DL) 모델입니다. HMM의 명시적 확률 상태와 달리, RNN/LSTM은 시퀀스를 처리하면서 암시적으로 진화하는 내부 숨겨진 상태 벡터를 유지합니다. 따라서 더 복잡하고 긴 범위의 종속성을 포착할 수 있어 기계 번역이나 고급 음성 인식과 같은 작업에서 더 높은 정확도를 달성하는 경우가 많습니다. LSTM을 이해하면 좋은 개요를 얻을 수 있습니다. 다음과 같은 최신 비전 모델 Ultralytics YOLO 와 같은 최신 비전 모델은 DL 아키텍처를 사용하며, 종종 다음과 같은 프레임워크로 구축됩니다. PyTorch 또는 TensorFlow와 같은 프레임워크를 사용하여 객체 감지인스턴스 세분화와 같은 작업을 수행합니다.

최신 딥 러닝 방법도 종종 최첨단 결과를 달성하지만, 특히 학습 데이터가 제한적이거나 도메인 지식을 모델 구조에 통합할 수 있을 때 HMM은 해석 가능성(명시적 상태 및 확률)과 효과 면에서 여전히 가치가 있습니다. HMM과 같은 기본 개념을 이해하면 다음과 같은 DL 모델의 개발 및 배포를 주로 촉진하는 Ultralytics HUB와 같은 플랫폼을 사용하는 경우에도 더 광범위한 ML 환경에서 유용한 컨텍스트를 얻을 수 있습니다. YOLOv8 또는 YOLO11.

모두 보기