Minitab – Minitab-Zusatzmodul: Predictive Analytics

Predictive Analytics - optionales, kostenpflichtiges Zusatzmodul

Predictive Analytics-Modul in Minitab zeigt zusätzlich erwerbare Funktionen grau hinterlegt
Das Predictive Analytics-Modul in Minitab zeigt zusätzlich erwerbbare Funktionen grau hinterlegt

Mit dem Release von Minitab 20.2 steht dem Anwender das Modul "Predicitive Analytics" auf Wunsch gegen einen Aufpreis in Minitab zur Verfügung. Über das Modul erhält der Anwender Zugriff auf TreeNet® und Random Forests® – zwei proprietären baumbasierten Algorithmen für maschinelles Lernen. Baumbasierte Algorithmen verwenden eine Reihe von Wenn-Dann-Regeln, um Prognosen aus einem oder mehreren Entscheidungsbäumen zu erstellen. Im Vergleich zu linearen Modellen wie der Regression können baumbasierte Methoden nichtlineare Beziehungen sehr gut abbilden und mit der Unschärfe in Daten umgehen, die andere Methoden einfach nicht bewältigen können. Neben einer schnellen Antwort, die Zeit spart, bieten baumbasierte Methoden auch eine hohe Genauigkeit und sind einfach zu interpretieren.

Predictive Analytics-Modul in Minitab zeigt zusätzlich erwerbare Funktionen grau hinterlegt
Das Predictive Analytics-Modul in Minitab zeigt zusätzlich erwerbbare Funktionen grau hinterlegt

TreeNet® (Gradient Boosting)

Predictive Analytics-Modul in Minitab: TreeNet

TreeNet ist eine leistungsstarke Umsetzung der modernen Algorithmenklasse für maschinelles Lernen, die allgemein als stochastisches Gradient-Boosting bezeichnet wird. Das Verfahren wurde von Jerome Friedman an der Stanford University entwickelt und ist für seine hohe Prognosegenauigkeit bekannt. Das Geheimnis liegt darin, wie ein Modell erstellt wird: Bei jeder Iteration wird der vorhandenen Baum-Ensembles ein weiterer kleiner Baum hinzugefügt, um die kombinierten Fehler des Ensembles zu korrigieren.

Mit Hilfe einer Vielzahl von Verlustfunktionen kann der Prozess präzise auf bestimmte Aufgaben der prädiktiven Modellerstellung abgestimmt werden, z. B. mit der Regression kleinster Quadrate, robusten Regression, Klassifikation usw. Zur Unterstützung bei der Interpretation der Modelle geht TreeNet noch einen Schritt weiter und generiert verschiedene 2D- und 3D-Plots, anhand derer die Abhängigkeit der Antwortvariablen von den Modelleingaben erklärt wird. Das Modell ist flexibel genug, um verschiedene nicht lineare Beziehungen und Wechselwirkungen mit mehreren Faktoren automatisch zu erkennen und zu berücksichtigen. Mit weiteren Steuerelementen kann der Benutzer Modellinteraktionen optimieren, um bestimmte Designziele zu erfüllen.

Herausragende Genauigkeit

Das TreeNet-Modellierungsmodul ermöglicht einen Grad an Genauigkeit, der normalerweise nicht mit einem einzelnen Modell oder Ensembles wie Bagging oder herkömmlichem Boosting erreicht werden kann. Die TreeNet-Methode ist robust in Bezug auf Datenfehler und benötigt keine zeitaufwändige Vorbereitung der Daten, Aufbereitung oder Imputation fehlender Werte. Bei anderen Methoden können Datenfehler für herkömmliche Data Mining-Verfahren eine große Herausforderung darstellen und für das herkömmliche Boosting katastrophale Auswirkungen haben. Das TreeNet-Modell ist hingegen immun gegen solche Fehler, da Daten, die zu weit vom vorhandenen Modell abweichen oder durch falsche Zielbezeichner verunreinigt sind, dynamisch zurückgewiesen werden.

Erkennung von Wechselwirkungen

Die Erkennung der Wechselwirkungen – Interaction Detection – bestimmt, ob Wechselwirkungen jeglicher Art in einem prädiktiven Modell benötigt werden, und dient als Suchmaschine, die darauf spezialisiert ist, erforderliche Wechselwirkungen zu entdecken. Das System der Wechselwirkungserkennung unterstützt nicht nur bei der Verbesserung der Modellperformance (teilweise enorm), sondern auch bei der Entdeckung von wertvollen neuen Segmenten und zuvor nicht erkannten Mustern.

Predictive Analytics-Modul in Minitab: TreeNet

Random Forests®

Predictive Analytics-Modul in Minitab: Random Forests

Die Modellierungsengine Random Forests erstellt eine Sammlung von hunderten von unabhängigen CART®-Bäumen. Die Summe der von Entscheidungsbäumen gemachten Prognosen bestimmt die Gesamtprognose des Waldes. Die Stärke von Random Forests ist das Erkennen von Ausreißern und Anomalien in den Daten, das Anzeigen der Proximität von Clustern, das Prognostizieren von zukünftigen Ergebnissen, das Identifizieren von wichtigen Prädiktoren, das Entdecken von Datenmustern, das Ersetzen von fehlenden Werten mittels Imputation und das Bereitstellen von aussagekräftigen Grafiken.

Cluster und Segmentierung

Viele der mit Random Forests gewonnenen Erkenntnisse werden durch Methoden erzeugt, die nach dem Wachsen der Bäume angewendet werden und neue Technologien zur Identifikation von Clustern oder Segmenten in den Daten enthalten sowie neue Methoden zum Ordnen der Variablen nach ihrer Wichtigkeit.

Robuste Variablenwichtigkeit

Random Forests nutzt neue Verfahren, um Prädiktoren gemäß ihrer Wichtigkeit zu sortieren. Dies ist hilfreich, wenn die Daten Tausende oder sogar Hunderttausende von Variablen oder Prädiktoren enthalten, was die Kapazität von herkömmlichen Regressions- und Klassifikationsbäumen bei Weitem überschreitet. Random Forests kann mit diesen Extremsituationen umgehen und erkennen, welche Variablen bei der weiteren Analyse verwendet werden sollten. Die Robustheit und Qualität dieser Ergebnisse wird durch mehrere Runden mit Stichprobenziehung gesteigert.

Predictive Analytics-Modul in Minitab: Random Forests

Gerne beraten wir Sie zum Minitab-Zusatzmodul "Predictive Analytics" oder erstellen Ihnen ein Angebot, rufen Sie uns einfach unter der Telefonnummer +49 (0)6172-5905-30 an oder senden uns eine Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!.

© ADDITIVE GmbH. Alle Rechte, Irrtümer und Änderungen vorbehalten.

Impressum  /  Datenschutz  /  AGB