Glossar

Random Forest

Entdecken Sie, wie Random Forest, ein leistungsstarker Ensemble-Lernalgorithmus, sich in Klassifizierung, Regression und realen KI-Anwendungen auszeichnet.

Random Forest ist ein vielseitiger und leistungsstarker Algorithmus für überwachtes Lernen, der sowohl für Klassifizierungs- als auch für Regressionsaufgaben im maschinellen Lernen (ML) verwendet wird. Als eine Art Ensemble-Methode arbeitet er, indem er eine Vielzahl von Entscheidungsbäumen während des Trainingsprozesses konstruiert. Bei einer Klassifizierungsaufgabe ist die endgültige Ausgabe die Klasse, die von den meisten Bäumen ausgewählt wird; bei einer Regressionsaufgabe ist es die durchschnittliche Vorhersage der einzelnen Bäume. Dieser Ansatz, mehrere Modelle zu kombinieren, trägt dazu bei, die prädiktive Genauigkeit zu verbessern und Overfitting zu kontrollieren, wodurch er robuster ist als ein einzelner Entscheidungsbaum.

Wie Random Forest funktioniert

Die Grundidee hinter Random Forest ist die Einführung von Zufälligkeit, um einen "Wald" von unkorrelierten Entscheidungsbäumen zu erstellen. Diese Zufälligkeit wird auf zwei Hauptarten injiziert:

Bootstrap Aggregating (Bagging): Jeder einzelne Baum im Wald wird auf einer anderen, zufälligen Stichprobe der Trainingsdaten trainiert. Diese Stichprobenziehung erfolgt mit Zurücklegen, was bedeutet, dass einige Datenpunkte in einer einzigen Stichprobe mehrfach verwendet werden können, während andere überhaupt nicht verwendet werden. Diese Technik ist formell als Bootstrap Aggregating bekannt.
Merkmalszufälligkeit: Beim Aufteilen eines Knotens in einem Entscheidungsbaum sucht der Algorithmus nicht nach der besten Aufteilung unter allen Merkmalen. Stattdessen wählt er eine zufällige Teilmenge von Merkmalen aus und findet die optimale Aufteilung nur innerhalb dieser Teilmenge. Dies stellt sicher, dass die Bäume vielfältig sind und verhindert, dass einige wenige starke Merkmale alle Bäume dominieren.

Durch die Kombination der Vorhersagen aus diesen verschiedenen Bäumen reduziert das Modell die Varianz und erzielt in der Regel eine bessere Leistung, als es ein einzelner Baum allein könnte. Der Algorithmus wurde von Leo Breiman und Adele Cutler entwickelt und ist zu einem Go-to-Tool für viele Data Scientists geworden.

Anwendungsfälle in der Praxis

Random Forest wird aufgrund seiner Einfachheit und Effektivität in vielen Branchen eingesetzt, insbesondere bei tabellarischen oder strukturierten Daten.

Finanzdienstleistungen: Banken und Finanzinstitute verwenden Random-Forest-Modelle zur Bewertung des Kreditrisikos. Durch die Analyse von Kundendaten wie Einkommen, Kredithistorie und Alter kann das Modell die Wahrscheinlichkeit vorhersagen, dass ein Kunde einen Kredit nicht zurückzahlen kann. Es ist auch ein wichtiges Werkzeug in der KI im Finanzwesen zur Erkennung betrügerischer Kreditkartentransaktionen.
Gesundheitswesen: Im medizinischen Bereich kann Random Forest zur Krankheitsdiagnose und Patientenrisikostratifizierung eingesetzt werden. So kann er beispielsweise Patientenakten und Symptome analysieren, um vorherzusagen, ob ein Patient eine bestimmte Krankheit hat, und Ärzte bei der Erstellung genauerer Diagnosen unterstützen. In unserer Übersicht über KI im Gesundheitswesen können Sie mehr über ähnliche Anwendungen lesen.
E-Commerce: Online-Händler verwenden Random Forest, um Empfehlungssysteme zu erstellen, die Benutzern Produkte basierend auf ihrem Browserverlauf, ihren Kaufmustern und anderen Benutzerverhalten vorschlagen.

Beziehung zu anderen Modellen

Es ist wichtig zu verstehen, wie Random Forest mit anderen Modellen im Bereich der KI zusammenhängt.

Entscheidungsbäume: Ein Random Forest ist im Wesentlichen ein Ensemble von Entscheidungsbäumen. Während ein einzelner Entscheidungsbaum einfach zu interpretieren ist, neigt er dazu, die Trainingsdaten zu überanpassen. Random Forest überwindet diese Einschränkung, indem er die Ergebnisse vieler Bäume mittelt und so ein stärker verallgemeinertes Modell erstellt.
Boosting-Algorithmen: Ähnlich wie Random Forest sind Algorithmen wie XGBoost und LightGBM ebenfalls Ensemble-Methoden, die auf Entscheidungsbäumen basieren. Sie verwenden jedoch eine andere Strategie, das sogenannte Boosting, bei dem Bäume sequenziell aufgebaut werden, wobei jeder neue Baum versucht, die Fehler des vorherigen zu korrigieren. Im Gegensatz dazu erstellt Random Forest seine Bäume unabhängig und parallel.
Deep-Learning-Modelle: Random Forest ist sehr effektiv für Probleme mit strukturierten Daten. Für unstrukturierte Daten wie Bilder und Texte sind jedoch Deep-Learning-Modelle wie Convolutional Neural Networks (CNNs) oder Vision Transformers (ViT) weitaus besser geeignet. Im Bereich Computer Vision werden Aufgaben wie Objekterkennung oder Instanzsegmentierung am besten durch spezialisierte Architekturen wie Ultralytics YOLO11 bewältigt.

Technologien und Tools

Mehrere populäre Machine-Learning-Bibliotheken bieten Implementierungen des Random-Forest-Algorithmus. Scikit-learn, eine weit verbreitete Python-Bibliothek, bietet eine umfassende Random-Forest-Implementierung mit Optionen zur Hyperparameter-Optimierung. Während dies für viele traditionelle ML-Aufgaben leistungsstark ist, sind für hochmoderne Computer-Vision-Anwendungen spezialisierte Architekturen und Plattformen erforderlich, die den MLOps-Lebenszyklus unterstützen. Entdecken Sie verschiedene Ultralytics-Lösungen, die YOLO-Modelle für reale Vision-AI-Probleme nutzen.

Random Forest

Trainieren Sie Ultralytics YOLO-Modelle, um Arbeitsabläufe in allen Branchen zu rationalisieren

Flexible Enterprise-Lizenzlösung zur Förderung Ihrer Innovationen

Trainieren Sie KI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Wie Random Forest funktioniert

Anwendungsfälle in der Praxis

Beziehung zu anderen Modellen

Technologien und Tools

Mehr in dieser Kategorie lesen

Von Bits zu Qubits: Wie die Quantenoptimierung die KI umgestaltet

Eine Kurzanleitung für Anfänger, wie man ein KI-Modell trainiert

Aus Dubai mit Einblicken: Die wichtigsten Erkenntnisse aus dem GDG MENA-T Summit 2025

Treten Sie der Ultralytics-Community bei