Glossar

Entscheidungsbaum

Entdecken Sie die Leistungsfähigkeit von Entscheidungsbäumen beim maschinellen Lernen für Klassifizierung, Regression und reale Anwendungen wie Gesundheitswesen und Finanzen.

Ein Entscheidungsbaum ist ein beliebtes und intuitives Modell des maschinellen Lernens (ML), das eine baumartige Struktur verwendet, um Vorhersagen zu treffen. Dabei wird ein Datensatz in immer kleinere Teilmengen zerlegt und gleichzeitig ein zugehöriger Entscheidungsbaum entwickelt. Das Endergebnis ist ein Baum mit Entscheidungsknoten und Blattknoten. Ein Entscheidungsknoten steht für ein Merkmal oder Attribut, ein Zweig für eine Entscheidungsregel und jeder Blattknoten für ein Ergebnis oder eine Klassenbezeichnung. Da seine Struktur einem Flussdiagramm ähnelt, ist es eines der am einfachsten zu verstehenden und zu interpretierenden Modelle, was es zu einem Eckpfeiler der prädiktiven Modellierung macht.

Wie Entscheidungsbäume funktionieren

Bei der Erstellung eines Entscheidungsbaums werden die Trainingsdaten auf der Grundlage der Werte verschiedener Attribute rekursiv aufgeteilt. Der Algorithmus wählt bei jedem Schritt das beste Attribut für die Aufteilung der Daten aus und versucht, die resultierenden Untergruppen so "rein" wie möglich zu machen, d. h. jede Gruppe besteht hauptsächlich aus Datenpunkten mit demselben Ergebnis. Dieser Aufteilungsprozess wird häufig von Kriterien wie der Gini-Unreinheit oder dem Informationsgewinn geleitet, die den Grad der Unordnung oder Zufälligkeit in den Knotenpunkten messen.

Der Baum beginnt mit einem einzigen Wurzelknoten, der alle Daten enthält. Dann teilt er sich in Entscheidungsknoten auf, die Fragen zu den Daten darstellen (z. B. "Ist das Alter des Kunden über 30?"). Diese Aufspaltungen werden fortgesetzt, bis die Knoten rein sind oder eine Abbruchbedingung erfüllt ist, wie z. B. eine maximale Baumtiefe. Die letzten, nicht aufgeteilten Knoten werden als Blattknoten bezeichnet und liefern die endgültige Vorhersage für jeden Datenpunkt, der sie erreicht. So kann ein Blattknoten beispielsweise eine Transaktion als "betrügerisch" oder "nicht betrügerisch" einstufen. Diese Interpretierbarkeit ist ein entscheidender Vorteil, der oft in Diskussionen über erklärbare KI (XAI) hervorgehoben wird.

Anwendungen in der realen Welt

Entscheidungsbäume sind vielseitig und werden sowohl für Klassifizierungs- als auch für Regressionsaufgaben in verschiedenen Branchen eingesetzt.

  1. KI im Gesundheitswesen für die Diagnose: Ein Entscheidungsbaum kann zur Erstellung eines vorläufigen Diagnosemodells verwendet werden. Das Modell würde Patientendaten wie Symptome (Fieber, Husten), Alter und Laborergebnisse als Eingaben (Merkmale) verwenden. Der Baum würde dann eine Reihe von Entscheidungsregeln befolgen, um die Wahrscheinlichkeit einer bestimmten Krankheit vorherzusagen. Beispielsweise könnte eine Unterteilung darauf beruhen, ob ein Patient Fieber hat, gefolgt von einer weiteren Unterteilung nach der Schwere des Hustens, was schließlich zu einem Blattknoten führt, der eine wahrscheinliche Diagnose vorschlägt. Auf diese Weise entsteht ein klarer, regelbasierter Pfad, dem medizinisches Fachpersonal folgen kann. Weitere Einblicke in diesen Bereich bietet das National Institute of Biomedical Imaging and Bioengineering (NIBIB).
  2. Finanzdienstleistungen zur Kreditrisikobewertung: Banken und Finanzinstitute verwenden Entscheidungsbäume, um die Kreditwürdigkeit zu bestimmen. Das Modell analysiert die Daten des Antragstellers wie Kreditwürdigkeit, Einkommen, Kreditbetrag und Beschäftigungsgeschichte. Der Baum kann sich zunächst nach der Kreditwürdigkeit aufteilen. Ist die Punktzahl hoch, folgt er einem Pfad, ist sie niedrig, einem anderen. Nachfolgende Aufteilungen nach Einkommen und Kreditlaufzeit helfen, den Antragsteller als risikoarm oder risikoreich einzustufen, was die Entscheidung über die Kreditvergabe beeinflusst. Diese Anwendung ist ein Kernstück der KI im Finanzbereich.

Beziehung zu anderen Modellen

Entscheidungsbäume bilden die Grundlage für komplexere Ensemble-Methoden, die oft eine höhere Genauigkeit aufweisen.

Das Verständnis grundlegender Modelle wie Entscheidungsbäume bietet einen wertvollen Kontext in der breiteren Landschaft der künstlichen Intelligenz (KI). Tools wie Scikit-learn bieten beliebte Implementierungen für Entscheidungsbäume, während Plattformen wie Ultralytics HUB die Entwicklung und den Einsatz von fortgeschrittenen Bildgebungsmodellen für komplexere Anwendungsfälle rationalisieren.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert