9441

Predictive Analytics - optionales, kostenpflichtiges Minitab-Zusatzmodul

Predictive Analytics-Modul in Minitab zeigt zusätzlich erwerbare Funktionen grau hinterlegt
Das Predictive Analytics-Modul in Minitab zeigt zusätzlich erwerbbare Funktionen grau hinterlegt

Das Predictive Analytics-Modul steht Anwendern auf Wunsch gegen Aufpreis in Minitab zur Verfügung. Es erweitert die in Minitab bereits für alle Anwender verfügbaren CART-Technologien um die Algorithmen TreeNet®, Random Forest® und MARS®.

TreeNet® und Random Forest® sind zwei proprietäre baumbasierte Algorithmen für maschinelles Lernen und verwenden eine Reihe von Wenn-Dann-Regeln, um Prognosen aus einem oder mehreren Entscheidungsbäumen zu erstellen. Im Vergleich zu linearen Modellen wie der Regression können baumbasierte Methoden nichtlineare Beziehungen sehr gut abbilden und mit der Unschärfe in Daten umgehen, die andere Methoden einfach nicht bewältigen können. Neben einer schnellen Antwort, die Zeit spart, bieten baumbasierte Methoden auch eine hohe Genauigkeit und sind einfach zu interpretieren.

Das automatisierte maschinelle Lernen (AutoML) unterstützt den Anwender auf Wunsch bei der Auswahl des am besten geeigneten Modells aus den verfügbaren Methoden CART-Klassifikations- und Regessionsbäume, TreeNet und Random Forest. Anwender haben die Möglichkeit, die verschiedenen Modelle miteinander zu vergleichen und gegebenenfalls ein anderes Modell auszuwählen.

Die Modellierungsengine MARS® ist ideal für Anwender, die Ergebnisse bevorzugen, die der Form einer herkömmlichen Regression ähneln, während grundlegende Nichtlinearitäten und Wechselwirkungen erfasst werden. Mit dem Ansatz der Regressionsmodellierung von MARS werden wichtige Datenmuster und Beziehungen effektiv aufgedeckt, die für andere Regressionsmethoden schwierig, wenn nicht sogar unmöglich zu finden sind. Die Modellierungsengine MARS erzeugt ihr Modell, indem sie eine Reihe von Geraden mit jeweils eigener Steigung zusammensetzt. Dies erlaubt MARS das Nachverfolgen von jeglichen in den Daten erkannten Mustern.

Predictive Analytics-Modul in Minitab zeigt zusätzlich erwerbare Funktionen grau hinterlegt
Das Predictive Analytics-Modul in Minitab zeigt zusätzlich erwerbbare Funktionen grau hinterlegt

TreeNet® (Gradient Boosting)

TreeNet ist eine leistungsstarke Umsetzung der modernen Algorithmenklasse für maschinelles Lernen, die allgemein als stochastisches Gradient-Boosting bezeichnet wird. Das Verfahren wurde von Jerome Friedman an der Stanford University entwickelt und ist für seine hohe Prognosegenauigkeit bekannt. Das Geheimnis liegt darin, wie ein Modell erstellt wird: Bei jeder Iteration wird der vorhandenen Baum-Ensembles ein weiterer kleiner Baum hinzugefügt, um die kombinierten Fehler des Ensembles zu korrigieren.

Mit Hilfe einer Vielzahl von Verlustfunktionen kann der Prozess präzise auf bestimmte Aufgaben der prädiktiven Modellerstellung abgestimmt werden, z. B. mit der Regression kleinster Quadrate, robusten Regression, Klassifikation usw. Zur Unterstützung bei der Interpretation der Modelle geht TreeNet noch einen Schritt weiter und generiert verschiedene 2D- und 3D-Plots, anhand derer die Abhängigkeit der Antwortvariablen von den Modelleingaben erklärt wird. Das Modell ist flexibel genug, um verschiedene nicht lineare Beziehungen und Wechselwirkungen mit mehreren Faktoren automatisch zu erkennen und zu berücksichtigen. Mit weiteren Steuerelementen kann der Benutzer Modellinteraktionen optimieren, um bestimmte Designziele zu erfüllen.

Herausragende Genauigkeit

Das TreeNet-Modellierungsmodul ermöglicht einen Grad an Genauigkeit, der normalerweise nicht mit einem einzelnen Modell oder Ensembles wie Bagging oder herkömmlichem Boosting erreicht werden kann. Die TreeNet-Methode ist robust in Bezug auf Datenfehler und benötigt keine zeitaufwändige Vorbereitung der Daten, Aufbereitung oder Imputation fehlender Werte. Bei anderen Methoden können Datenfehler für herkömmliche Data Mining-Verfahren eine große Herausforderung darstellen und für das herkömmliche Boosting katastrophale Auswirkungen haben. Das TreeNet-Modell ist hingegen immun gegen solche Fehler, da Daten, die zu weit vom vorhandenen Modell abweichen oder durch falsche Zielbezeichner verunreinigt sind, dynamisch zurückgewiesen werden.

Erkennung von Wechselwirkungen

Die Erkennung der Wechselwirkungen – Interaction Detection – bestimmt, ob Wechselwirkungen jeglicher Art in einem prädiktiven Modell benötigt werden, und dient als Suchmaschine, die darauf spezialisiert ist, erforderliche Wechselwirkungen zu entdecken. Das System der Wechselwirkungserkennung unterstützt nicht nur bei der Verbesserung der Modellperformance (teilweise enorm), sondern auch bei der Entdeckung von wertvollen neuen Segmenten und zuvor nicht erkannten Mustern.

Predictive Analytics-Modul in Minitab: TreeNet

Random Forests®

Die Modellierungsengine Random Forests erstellt eine Sammlung von hunderten von unabhängigen CART®-Bäumen. Die Summe der von Entscheidungsbäumen gemachten Prognosen bestimmt die Gesamtprognose des Waldes. Die Stärke von Random Forests ist das Erkennen von Ausreißern und Anomalien in den Daten, das Anzeigen der Proximität von Clustern, das Prognostizieren von zukünftigen Ergebnissen, das Identifizieren von wichtigen Prädiktoren, das Entdecken von Datenmustern, das Ersetzen von fehlenden Werten mittels Imputation und das Bereitstellen von aussagekräftigen Grafiken.

Cluster und Segmentierung

Viele der mit Random Forests gewonnenen Erkenntnisse werden durch Methoden erzeugt, die nach dem Wachsen der Bäume angewendet werden und neue Technologien zur Identifikation von Clustern oder Segmenten in den Daten enthalten sowie neue Methoden zum Ordnen der Variablen nach ihrer Wichtigkeit.

Robuste Variablenwichtigkeit

Random Forests nutzt neue Verfahren, um Prädiktoren gemäß ihrer Wichtigkeit zu sortieren. Dies ist hilfreich, wenn die Daten Tausende oder sogar Hunderttausende von Variablen oder Prädiktoren enthalten, was die Kapazität von herkömmlichen Regressions- und Klassifikationsbäumen bei Weitem überschreitet. Random Forests kann mit diesen Extremsituationen umgehen und erkennen, welche Variablen bei der weiteren Analyse verwendet werden sollten. Die Robustheit und Qualität dieser Ergebnisse wird durch mehrere Runden mit Stichprobenziehung gesteigert.

Predictive Analytics-Modul in Minitab: Random Forests

Automatisiertes maschinelles Lernen (AutoML)

Um den am besten für die eigenen prädiktiven Analysen geeigneten Algorithmus zu finden, müssen normalerweise alle Modelle erstellt und miteinander verglichen werden. Dank des automatisierten maschinellen Lernens, kurz AutoML, übernimmt Minitab diese Arbeit für Anwender.

AutoML evaluiert die Methoden TreeNet, Random Forest und CART-Klassifikations- und Regessionsbäume. Das beste Modell wird anhand der Kriterien selektiert und angezeigt. Nutzer haben im Anschluss die Flexibilität, die verfügbaren Modelltypen miteinander zu vergleichen und einfach eine Alternative zu wählen.

Automatisiertes maschinelles Lernen in Minitabs Predictive Analytics Modul

MARS®

Der Ansatz für die Regressionsmodellierung der MARS-Methode deckt wichtige Datenmuster und -beziehungen auf, die mit anderen Regressionsmethoden nur schwer oder gar nicht zu erkennen sind. Das MARS-Modellierungsmodul erstellt Modelle, indem eine Reihe von geraden Linien zusammengesetzt werden, die jeweils eine eigene Steigung haben. So kann das MARS-Modellierungsmodul alle in den Daten erkannten Muster darstellen.

Hochwertige Regression und Klassifikation

Das MARS-Modell wurde entwickelt, um numerische Ergebnisse, wie die durchschnittliche Monatsrechnung eines Mobilfunkkundens oder den Betrag, den ein Käufer erwartungsgemäß bei einem Webseitenbesuch ausgibt, zu prognostizieren. Die MARS-Engine kann auch hochwertige Klassifikationsmodelle für ein Ja/Nein-Ergebnis erzeugen. Die MARS-Engine führt Variablenauswahl, Variablentransformation, Wechselwirkungserkennung und Selbsttest durch, alles automatisch und mit hoher Geschwindigkeit.

Hochperformante Ergebnisse

Bereiche, in denen die MARS-Engine hochperformante Ergebnisse gezeigt hat, umfassen u. a. den Forecast des Elektrizitätsbedarfs für Energieversorgungsunternehmen, die Korrelation der Kundenzufriedenheit mit den technischen Spezifikationen von Produkten und die Modellierung von An-/Abwesenheit in Geoinformationssystemen (GIS).

MARS-Regressionsfunktion im Predictive-Analytics-Modul

Gerne beraten wir Sie zum Minitab-Zusatzmodul "Predictive Analytics" oder erstellen Ihnen ein Angebot, rufen Sie uns einfach unter der Telefonnummer +49 6172 5905 - 30 an oder senden uns eine Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein..