Yolo 深圳
深セン
今すぐ参加
用語集

決定木

分類、回帰、そしてヘルスケアや金融などの現実世界のアプリケーションにおける、機械学習における決定木の力を発見しましょう。

決定木は、広く使用されている直感的な教師付き学習アルゴリズムです。 教師あり学習アルゴリズムである。 ツリーのような構造で意思決定とその結果をモデル化する。これは 機械学習(ML)の基本的なツールであり 機械学習(ML)の基本的なツールである。このモデルは、データセットを特定の特徴値に基づいてより小さなサブセットに分割することで動作する。 フローチャートを作成し、各内部ノードが属性のテストを表し、各ブランチがそのテストの結果を表し、各ブランチがそのテストの結果を表す。 はそのテストの結果を表し、各葉ノードは最終的なクラスラベルまたは連続値を表す。その透明性から その透明性から、決定木は次のような分野で高く評価されている。 説明可能なAI(XAI)において高く評価されており、データサイエンティストは予測の背後にあるロジックを正確に追跡することができる。 予測の背後にあるロジックを正確に追跡することができる。

コアのメカニズムと構造

デシジョンツリーの構築には、再帰的パーティショニングと呼ばれるプロセスが含まれる。アルゴリズムは ルート・ノードにある学習データ全体から始まり、データを分割するために最も重要な特徴を選択する。 結果として得られる部分集合の純度を最大化することを目的として、データを分割するために最も重要な特徴を選択する。以下のような指標 ジニ不純度または情報利得(エントロピーに基づく エントロピーに基づく)のような指標が数学的に計算される。 計算され、各ステップで最適な分割を決定する。

このプロセスは、最大深度に達するか、ノードに最小数のサンプルが含まれるなどの停止基準が満たされるまで続けられる。 最小サンプル数に達する。強力な反面、単一決定木はオーバーフィッティングを起こしやすい。 オーバーフィッティングを起こしやすい。 が学習される。そのため モデルの枝刈りのような技術は、不要な枝を削除し、モデルが未知のデータに汎化する能力を向上させるために、しばしば適用される。 モデルの枝刈りのようなテクニックは、不要な枝を削除し、モデルの未知のテストデータへの汎化能力を向上させるために適用されることが多い。 汎化する能力を向上させる。

実際のアプリケーション

デシジョン・ツリーは、ルールに基づいた意思決定と明確な監査証跡を必要とする業界ではどこにでもある。

  • 財務リスクの評価金融部門では 金融機関では、デシジョンツリーを用いて信用度を評価する。収入、職歴、既存の債務などの特徴を分析することで このモデルは、融資を承認するか否かのロジック・パスを作成する。この 予測モデリングの応用は、銀行が引受プロセスを自動化しながら とともに、引受プロセスを自動化します。
  • 医療診断: 医療におけるAIは決定木を活用し 臨床判断をサポートする。モデルは患者の症状、バイタルサイン、過去のデータを入力として、診断の可能性を示唆する。 診断の可能性を提案する。例えば、診断ツリーは、救急隊員が胸痛の特徴に基づいて患者を迅速にトリアージするのに役立つ。 胸痛の特徴に基づいて、患者を迅速にトリアージすることができる。 医療情報学研究

関連アルゴリズムとの比較

を構成要素として利用する、より複雑なアンサンブル手法と区別することが重要である。 アンサンブル手法と区別することが重要である:

  • 決定木とランダムフォレストの比較:1本の木は単純だが不安定になりやすい。A ランダムフォレストは、データと特徴のランダムな部分集合で訓練された複数の決定木の データと特徴のランダムなサブセットで訓練された複数の決定木の「森」を作成し、その結果を平均化することで、精度を向上させ、分散を削減します。 その結果を平均化することで、精度を高め、分散を減らす。
  • 決定木 vs. 勾配ブースティング:次のようなアルゴリズム XGBoostのようなアルゴリズムはツリーを順次構築する。それぞれの新しいツリーは その結果、単体の決定木と比較して、構造化データ競技において優れたパフォーマンスを発揮することが多い。 の優れたパフォーマンスをもたらす。
  • 決定木とディープラーニングの比較決定木は表形式のデータを得意とするが、画像のような非構造化データは苦手である。 画像のような非構造化データは苦手だ。物体検出 ようなディープラーニング・モデルが適している。 YOLO11のようなディープラーニングモデルが好まれる。 畳み込みニューラルネットワーク(CNN) を用いて、生のピクセルから自動的に特徴を抽出するからである。

実施例

現代のコンピュータビジョン(CV)はディープラーニングに依存しているが 決定木は、ビジョンモデルによって生成されたメタデータや表形式の出力を分析するための定番である。以下の例では 以下の例では Scikit-learnライブラリを使用して基本的な分類器を学習します。

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier

# Load dataset and split into training and validation sets
data = load_iris()
X_train, X_val, y_train, y_val = train_test_split(data.data, data.target, random_state=42)

# Initialize and train the Decision Tree
clf = DecisionTreeClassifier(max_depth=3, random_state=42)
clf.fit(X_train, y_train)

# Evaluate accuracy on unseen data
accuracy = clf.score(X_val, y_val)
print(f"Validation Accuracy: {accuracy:.2f}")

AIエコシステムにおける関連性

決定木を理解することは、人工知能(AI)のより高度な概念を理解するための強固な基礎となる。 人工知能(AI)を理解するための強固な基礎となる。決定木は 手動のルールベースのシステムから自動化されたデータ駆動型ロジックへの移行を意味する。複雑なパイプラインでは YOLO11モデルがビデオストリーム内のオブジェクトをdetect する。 下流のデシジョンツリーは、検出の頻度とタイプを分析し、特定のビジネスアラートをトリガーする、 ディープラーニング(DL)と従来の機械学習が 従来型の機械学習が、モデル導入時にしばしば連携して機能することを実証している。 モデル展開の際に、ディープラーニング(DL)と従来の機械学習がしばしば連動することを示している。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加