9023
TreeNet

TreeNet®

Prädiktives Tool für das Data-Mining

Prädiktive Power

Die Gradient-Boosting-Methode TreeNet® ist Salford Predictive Modelers flexibelstes und leistungsstärkstes Data-Mining-Tool. Es kann konsistent extrem genaue Modelle erzeugen. Die Genauigkeit der Modellierungsengine TreeNet wird von einzelnen Modellen oder Ensembles wie Bagging oder konventionellem Boosting im Normalfall nicht erreicht. TreeNet zeigt eine bemerkenswerte Performance für Regression und Klassifikation. Der Algorithmus erzeugt typischerweise Tausende von kleinen Entscheidungsbäumen, die in einen sequenziellen Fehlerkorrekturprozess eingebunden sind, um zu einem genauen Modell zu konvergieren. TreeNet ist für die Mehrheit von Minitabs Modellierungsauszeichnungen verantwortlich.

TreeNet screenshots in SPM

Herausragende Genauigkeit

Der Vorteil der Modellierungsengine TreeNet® liegt in dem Grad an Genauigkeit, der von einem einzelnen Modell oder von Ensemble-Methoden wie Bagging oder konventionellem Boosting in der Regel nicht erreicht wird. Im Gegensatz zu Neuralen Netzwerken ist die TreeNet-Methodologie robust gegenüber Datenfehlern und bedarf keiner zeitaufwändigen Datenvorbereitung, Vorverarbeitung oder Imputation von fehlenden Werten. Dieser Datenfehlertyp kann für herkömmliche Data-Mining-Methoden eine große Herausforderung darstellen und sich für das konventionelle Boosting katastrophal auswirken. Das TreeNet-Modell ist dagegen im Allgemeinen immun gegenüber diesen Fehlern, da es dynamisch Trainingsdatenpunkte zurückweist, die zu weit von dem existierenden Modell abweichen. Die Robustheit von TreeNet erstreckt sich sogar auf Daten, die von fehlerhaften Zielbeschriftungen beeinträchtigt sind.

Erweiterte Funktionen

Die Erkennung der Wechselwirkungen – Interaction Detection – bestimmt, ob Wechselwirkungen jeglicher Art in einem prädiktiven Modell benötigt werden, und dient als Suchmaschine, die darauf spezialisiert ist, erforderliche Wechselwirkungen zu entdecken. Das System der Wechselwirkungserkennung unterstützt nicht nur bei der Verbesserung der Modellperformance (teilweise enorm), sondern auch bei der Entdeckung von wertvollen neuen Segmenten und zuvor nicht erkannten Mustern.

Technische Artikel von Jerome Friedman

Technische Artikel von Jerome Friedman sind auch als Download verfügbar:

Greedy Function Approximation: A Gradient Boosting Machine introduces the methodology.

Stochastic Gradient Boosting discusses several improvements to the original idea

Videos

Fünfteilige Videopräsentation auf der Webseite von Salford Systems: Training in TreeNet