Random Forests®
Breiman und Cutlers Random Forests®
Die Modellierungsengine Random Forests ist eine Sammlung von vielen CART®-Bäumen, die sich gegenseitig nicht beeinflussen, wenn sie erzeugt werden. Die Summe der von Entscheidungsbäumen gemachten Prognosen bestimmt die Gesamtprognose des Forests. Die Stärke von Random Forests ist das Erkennen von Ausreißern und Anomalien in den Daten, das Anzeigen der Proximität von Clustern, das Prognostizieren von zukünftigen Ergebnissen, das Identifizieren von wichtigen Prädiktoren, das Entdecken von Datenmustern, das Ersetzen von fehlenden Werten mittels Imputation und das Bereitstellen von aussagekräftigen Grafiken.
Cluster und Segmentierung
Viele der mit Random Forests gewonnenen Erkenntnisse werden durch Methoden erzeugt, die nach dem Wachsen der Bäume angewendet werden und neue Technologien zur Identifikation von Clustern oder Segmenten in den Daten enthalten sowie neue Methoden zum Ordnen der Variablen nach ihrer Wichtigkeit. Die Methode wurde von Leo Breiman und Adele Cutler von der University of California, Berkeley, entwickelt und ist exklusiv für Minitab Inc. lizenziert.
Geeignet für breite Datensätze
Random Forests ist eine Sammlung von vielen CART-Bäumen, die sich bei ihrer Erstellung nicht gegenseitig beeinflusst haben. Die Summe der Prognosen, die aufgrund von Entscheidungsbäumen gemacht werden, bestimmt die Gesamtprognose des Forests. Random Forests eignen sich am besten für die Analyse von komplexen Datenstrukturen, die in kleinen bis mittleren Datensätzen, mit weniger als 10.000 Zeilen, aber eventuell Millionen von Spalten enthalten, eingebettet sind.
Videos
Zweiteilige Videopräsentation auf der Webseite von Salford Systems: Training in Random Forests