SPM & Minitabs Techniken zum Machine Learning
Minitab Statistical Software und Salford Predictive Modeler (SPM) sind die ideale Kombination zur Analyse großer Datensätze unter Einsatz von Machine-Learning-Techniken. Nachfolgende Grafik zeigt das Zusammenspiel von Minitab und SPM.
Modellierungsengine CART®
Klassifizierungs- und Regressionsbäume
CART hat das Feld der erweiterten Analytik und das aktuelle Zeitalter der Data Science revolutioniert. CART ist eines der wichtigsten Werkzeuge im modernen Machine Learning.
Modellierungsengine TreeNet®
Gradient Boosting
Die Modellierungsengine TreeNet stellt Salford Predictive Modelers flexibelstes und leistungsstärkstes Machine-Learning-Werkzeug dar. Seit ihrer Einführung 2001 hat sie mindestens über ein Dutzend Preise in bedeutenden Data-Mining-Wettbewerben gewonnen. Der Vorteil von TreeNet liegt in dem Genauigkeitsgrad, den die Engine erzielt, der für ein einzelnes Modell oder Ensembles wie Bagging bzw. traditionelles Boosting normalerweise nicht zu erreichen ist.
Modellierungsengine Random Forests®
Breimans und Cutlers Random Forests
Random Forests kann zu Erkenntnissen über Daten verhelfen, indem die Engine Methoden erzeugt, die nach dem Wachsen der Klassifizierungsbäume angewendet werden. Außerdem verfügt sie über neue Technologien zum Identifizieren von Clustern bzw. Segmenten in Daten sowie neue Methoden, um Variablen entsprechend ihrer Wichtigkeit in eine Rangfolge zu bringen. Random Forests ist eine Sammlung von vielen CART-Bäumen, die sich bei ihrer Erstellung gegenseitig nicht beeinflussen. Die Summe der Prognosen, die über Entscheidungsbäume gemacht werden, bestimmt die Gesamtprognose des Waldes. Random Forests zeichnet sich besonders beim Analysieren von komplexen Datenstrukturen aus, die in kleinen bis mittelgroßen Datensätzen mit weniger als 10.000 Zeilen, aber eventuell Millionen von Spalten eingebettet sind.
Modellierungsengine MARS®
Automatische nichtlineare Regression
MARS ist ideal für Anwender, die Ergebnisse ähnlich denen einer traditionellen Regression bevorzugen und dabei die wesentlichen Nichtlinearitäten und Wechselwirkungen erhalten wollen. Die Regressionsmodellierung im Rahmen der MARS-Methodik deckt effektiv wichtige Datenmuster und Beziehungen auf, die für andere Regressionsmethoden nur schwer, wenn überhaupt, zu entdecken sind.
ADDITIVE - Ihr Lösungspartner
Machine-Learning-, Data-Mining- und Big-Data-Projekte sind eine komplexe Materie, bei denen viele unterschiedliche Techniken eingesetzt werden müssen, um am Ende ein Ergebnis zu bekommen, das dann aber zuerst bewertet werden muss, um zu entscheiden, ob es denn eine echte Lösung ist - oder anders ausgedrückt: Nicht jedes Ergebnis ist richtig.
Lassen Sie sich von unseren Experten bezüglich Ihrer Data-Mining-Projekte per E-Mail an