YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

의사 결정 트리

분류, 회귀, 의료 및 금융과 같은 실제 애플리케이션을 위한 머신 러닝에서 의사 결정 트리의 힘을 알아보세요.

의사 결정 트리는 트리와 유사한 구조를 사용하여 예측하는 널리 사용되고 직관적인 머신 러닝(ML) 모델입니다. 데이터 세트를 더 작고 작은 하위 세트로 분할하는 동시에 관련 의사 결정 트리를 개발하여 작동합니다. 최종 결과는 의사 결정 노드와 리프 노드가 있는 트리입니다. 의사 결정 노드는 특징 또는 속성을 나타내고, 분기는 의사 결정 규칙을 나타내며, 각 리프 노드는 결과 또는 클래스 레이블을 나타냅니다. 구조가 순서도와 유사하기 때문에 이해하고 해석하기 가장 간단한 모델 중 하나이며 예측 모델링의 초석입니다.

의사 결정 트리 작동 방식

의사 결정 트리 구축 프로세스에는 다양한 속성 값을 기반으로 학습 데이터를 재귀적으로 분할하는 과정이 포함됩니다. 알고리즘은 각 단계에서 데이터를 분할하는 데 가장 적합한 속성을 선택하여 결과 하위 그룹을 가능한 한 "순수하게" 만드는 것을 목표로 합니다. 즉, 각 그룹은 주로 동일한 결과를 가진 데이터 포인트로 구성됩니다. 이 분할 프로세스는 종종 노드의 무질서 또는 무작위성 수준을 측정하는 Gini 불순도 또는 정보 이득과 같은 기준에 의해 안내됩니다.

트리는 모든 데이터를 포함하는 단일 루트 노드에서 시작됩니다. 그런 다음 데이터에 대한 질문(예: "고객의 나이가 30세 이상입니까?")을 나타내는 의사 결정 노드로 분할됩니다. 이러한 분할은 노드가 순수하거나 최대 트리 깊이와 같은 중지 조건이 충족될 때까지 계속됩니다. 분할되지 않은 최종 노드를 리프 노드라고 하며, 이 노드는 해당 노드에 도달하는 모든 데이터 포인트에 대한 최종 예측을 제공합니다. 예를 들어 리프 노드는 트랜잭션을 "사기성" 또는 "사기성이 아님"으로 분류할 수 있습니다. 이러한 해석 가능성은 설명 가능한 AI(XAI)에 대한 논의에서 자주 강조되는 주요 이점입니다.

실제 애플리케이션

의사 결정 트리는 다재다능하며 다양한 산업 분야에서 분류 및 회귀 작업 모두에 사용됩니다.

  1. 진단을 위한 의료 분야의 AI(AI in Healthcare for Diagnosis): 의사 결정 트리를 사용하여 예비 진단 모델을 만들 수 있습니다. 이 모델은 증상(열, 기침), 연령 및 실험실 결과와 같은 환자 데이터를 입력(특징)으로 사용합니다. 그런 다음 트리는 일련의 의사 결정 규칙에 따라 특정 질병의 가능성을 예측합니다. 예를 들어 분할은 환자에게 열이 있는지 여부를 기준으로 할 수 있으며, 그 다음에는 기침 심각도에 대한 또 다른 분할이 이어져 궁극적으로 가능한 진단을 제시하는 리프 노드로 이어집니다. 이는 의료 전문가가 따라야 할 명확한 규칙 기반 경로를 제공합니다. 이 분야에 대한 자세한 내용은 국립 생체 의학 영상 및 생체 공학 연구소(NIBIB)에서 확인할 수 있습니다.
  2. 신용 위험 평가를 위한 금융 서비스: 은행 및 금융 기관은 의사 결정 트리를 사용하여 대출 자격을 결정합니다. 이 모델은 신용 점수, 소득, 대출 금액 및 고용 이력과 같은 신청자 데이터를 분석합니다. 트리는 먼저 신용 점수를 기준으로 분할될 수 있습니다. 점수가 높으면 한 경로를 따르고, 낮으면 다른 경로를 따릅니다. 소득 및 대출 기간에 대한 후속 분할은 신청자를 저위험 또는 고위험으로 분류하여 대출 승인 결정에 영향을 미칩니다. 이 응용 프로그램은 금융 분야의 AI의 핵심 부분입니다.

다른 모델과의 관계

의사 결정 트리는 더 복잡한 앙상블 방법의 기초를 형성하며, 이는 종종 더 높은 정확도를 산출합니다.

  • 랜덤 포레스트(Random Forests): 이 인기 있는 모델은 데이터와 특징의 서로 다른 랜덤 하위 집합에 대해 여러 개의 결정 트리를 구축합니다. 그런 다음 예측을 집계하여(분류를 위한 투표 또는 회귀를 위한 평균) 성능을 향상시키고 과적합에 대해 모델을 더욱 강력하게 만듭니다.
  • Gradient Boosted Trees: XGBoostLightGBM과 같은 모델은 의사 결정 트리를 순차적으로 구축하는 고급 앙상블 기법으로, 각 새로운 트리는 이전 트리의 오류를 수정합니다.
  • K-Means Clustering: 의사 결정 트리를 클러스터링 알고리즘과 구별하는 것이 중요합니다. K-Means는 레이블이 지정되지 않은 데이터를 그룹화하기 위한 비지도 학습 방법인 반면, 의사 결정 트리는 레이블이 지정된 데이터를 기반으로 예측하기 위해 지도 학습에 사용됩니다.
  • CNN(Convolutional Neural Networks): 표 형식 데이터가 있는 문제에 강력하지만 의사 결정 트리는 이미지와 같은 고차원 데이터에는 덜 효과적입니다. 컴퓨터 비전에서는 CNNViT(Vision Transformers)와 같은 모델이 대신 사용됩니다. Ultralytics YOLO11과 같은 최첨단 아키텍처는 객체 탐지, 이미지 분류인스턴스 분할과 같은 복잡한 작업을 위해 이러한 딥 러닝 구조를 활용합니다.

의사 결정 트리와 같은 기본 모델을 이해하면 더 넓은 인공 지능(AI) 환경에서 유용한 맥락을 제공합니다. Scikit-learn과 같은 도구는 의사 결정 트리에 대한 널리 사용되는 구현을 제공하는 반면, Ultralytics HUB와 같은 플랫폼은 더욱 복잡한 사용 사례를 위한 고급 비전 모델의 개발 및 배포를 간소화합니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.