用語集

デシジョンツリー

分類、回帰、そして医療や金融などの実世界での応用のための機械学習における決定木のパワーを発見してください。

決定木(Decision Tree)とは、ツリーのような構造を使って予測を行う、一般的で直感的な機械学習(ML)モデルである。データセットをより小さなサブセットに分解すると同時に、関連する決定木を開発することで動作する。最終的な結果は、デシジョンノードとリーフノードを持つツリーである。決定ノードは特徴または属性を表し、枝は決定ルールを表し、各葉ノードは結果またはクラス・ラベルを表す。その構造はフローチャートに似ているため、理解し解釈するのが最も簡単なモデルの1つであり、予測モデリングの基礎となっている。

デシジョンツリーの仕組み

決定木の構築プロセスでは、異なる属性の値に基づいて訓練データを再帰的に分割する。アルゴリズムは、各ステップでデータを分割するのに最適な属性を選択し、結果として得られるサブグループを可能な限り「純粋」にすることを目指します。この分割プロセスは、ノード内の無秩序やランダム性のレベルを測定するジニ不純度や情報利得のような基準によって導かれることが多い。

ツリーは、すべてのデータを含む1つのルート・ノードから始まる。次に、データに関する質問(たとえば、「顧客の年齢は30歳以上か」)を表す決定ノードに分割されます。これらの分割は、ノードが純粋になるか、ツリーの最大深さなどの停止条件が満たされるまで続きます。最終的な分割されていないノードはリーフ・ノードと呼ばれ、それらに到達するデータ・ポイントの最終予測を提供します。例えば、リーフノードはトランザクションを "不正 "または "不正でない "と分類するかもしれない。この解釈可能性は、説明可能なAI(XAI)をめぐる議論でしばしば強調される重要な利点である。

実世界での応用

決定木は汎用性が高く、さまざまな産業で分類と回帰の両方のタスクに使用されている。

  1. 診断のためのヘルスケアにおけるAI決定木は、予備的な診断モデルの作成に使用できる。このモデルは、症状(発熱、咳)、年齢、検査結果などの患者データを入力(特徴)として受け取る。そしてツリーは一連の決定規則に従って、特定の病気の可能性を予測する。例えば、発熱の有無で分岐し、咳の程度で分岐し、最終的に診断の可能性を示唆するリーフノードに至る。これにより、医療従事者がたどるべき明確なルールベースの経路が提供される。この分野におけるさらなる洞察は、National Institute of Biomedical Imaging and Bioengineering (NIBIB)で見ることができる。
  2. 信用リスク評価のための金融サービス銀行や金融機関は、融資の適格性を判断するためにディシジョン・ツリーを使用する。このモデルは、クレジットスコア、収入、融資額、職歴などの申込者データを分析する。ツリーはまずクレジット・スコアに基づいて分割される。クレジット・スコアが高ければ1つの経路をたどり、低ければ別の経路をたどる。続いて、収入と融資期間に基づいて分割すると、申込者が低リスクか高リスクかに分類され、融資承認の判断に影響する。このアプリケーションは、金融におけるAIの中核部分である。

他のモデルとの関係

決定木は、より複雑なアンサンブル手法の基礎を形成し、多くの場合、より高い精度をもたらす。

決定木のような基礎的なモデルを理解することは、人工知能(AI)のより広い展望において貴重な文脈を提供する。Scikit-learnのようなツールは、決定木の一般的な実装を提供し、Ultralytics HUBのようなプラットフォームは、より複雑なユースケースのための高度なビジョンモデルの開発とデプロイメントを合理化します。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク