: Kategorie: Minitab FAQ Analysen

Minitab 22 - Makro für eine automatische Modellauswahl bei einer Prozessfähigkeitsanalyse

Erstellt am 3.12.2018
Überarbeitet am 26.3.2024
Software¹: Minitab 22, 21, 20, 19, 18

Das entsprechende APS-Paket ist über unseren ADDITIVE Professional Service erhältlich. Um das Paket zu erhalten, kontaktieren Sie unseren Support per E-Mail an Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein. oder per Telefon unter +49 6172 5905 20 jeweils unter Angabe der APS-Paketnummer 1032.

In meinem Unternehmen gibt es einige Prozesse, deren Fähigkeit ich gerne in Minitab analysieren möchte. Das Programm soll dabei das Modell (die Verteilung) automatisch nach gewissen Kriterien auswählen. Was kann ich dafür tun?

Erläuterung

Minitab bietet im Untermenü Statistik: Qualitätswerkzeuge: Prozessfähigkeitsanalyse Werkzeuge zur Prozessfähigkeit für Normal- und Nichtnormalverteilte Daten an. Bei letzterem müssen Sie im Dialog manuell eine Verteilung auswählen.

Für die Zuverlässigkeit des Analyseergebnisses ist es wichtig, dass die Verteilung für Ihre Daten geeignet ist. Diese müssen Sie vorher diskutieren - an Hand von technischen Kriterien und mit Hilfe von statistischen Tests. Minitab bietet mit dem Anderson-Darling-Test im Werkzeug Statistik: Qualitätswerkzeuge: Identifikation der Verteilung eine Hilfestellung dafür.

Wenn Sie jedoch bei jeder Verteilung nur den p-Wert betrachten, projizieren Sie die gesamte Verteilungsinformation nur auf diesen einen Wert. Besser ist es, wenn Sie sich den gesamten Sachverhalt ansehen: Die Verteilung sollte generell gut zu den eigenen Daten passen. Besonders gut sollte die Verteilung aber an den Rändern passen, weil dort auch die Spezifikationsgrenzen liegen, die Bereiche also, an denen die Fähigkeitswerte „entstehen“.

Diese differenzierte Betrachtungsweise erfordert eine Automatisierung. Das haben wir für Sie exemplarisch in diesem Makro umgesetzt. Es ist damit auch eine gute Demonstration, wenn Sie allgemein vorhaben, die Verteilungsidentifikation zu automatisieren.

Das Makro, welches wir Ihnen mit dem nächsten Abschnitt im Detail vorstellen, sucht von allen möglichen Verteilungen die drei aus, die den kleinsten AD-Wert (Anderson-Darling-Wert) bezüglich der Verteilung aufzeigen. Von diesen drei besten Verteilungen wird dann nochmal konkret das Verhalten an den Rändern überprüft.

Weitere Informationen zur Automatisierung finden Sie in unseren Artikeln zu Makros und in den Hilfe-Seiten von Minitab zu Makros / Automatisierung:

Wenn Sie an einem Projekt zur Unterstützung beim Erstellen eines unternehmensspezifischen Makros für eine Prozessfähigkeitsanalyse mit automatischer Modellauswahl interessiert sind, Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein..

Das APS-Paket - Automatische Modellauswahl - Anderson-Darling gefolgt von Kleinste-Quadrate an den Rändern - Motivation

Der Anderson-Darling-Test ist ein statistischer Test zur Bewertung der Nullhypothese

H₀: "Die Daten folgen der Verteilung X."

Dabei wird an Hand der angenommenen Verteilung der Daten ein sogenannter AD-Wert und anschließend ein p-Wert als bedingte Wahrscheinlichkeit

P("Die Teststatistik ist ≤ AD." | "Die Daten folgen der Verteilung X.")

berechnet. Das Anderson-Darling-Verfahren wird im Abschnitt Methoden für Identifikation der Verteilung - Test auf Güte der Anpassung der Online-Hilfe von Minitab beschrieben. Je kleiner ein Anderson-Darling-Wert ist, umso größer sollte der p-Wert werden. Nun hängt der p-Wert eng mit einer Wahrscheinlichkeit für einen Fehler 1. Art zusammen - also der Wahrscheinlichkeit, eine richtige Nullhypothese fälschlicherweise zu verwerfen. Was der p-Wert nicht macht, ist eine Aussage über die Nähe der Approximation an den Rändern der Verteilung.

Ein fähiger Prozess ist so verteilt, dass der Großteil der Daten innerhalb der Spezifikationen liegt - insbesondere die für die Berechnung der Prozessfähigkeit relevanten Perzentile. Vor diesem Hintergrund lassen wir dem Vergleich nach den Anderson-Darling-Werten in dem APS-Paket einen Vergleich nach den kleinsten Quadraten an den Rändern durchführen - um in der engeren Auswahl diejenige Verteilung zu begünstigen, bei denen diese am geringsten ist.

Das APS-Paket

Das APS-Paket Nr. 1032 ist eine *.zip-Datei, die zwei lokale Minitab-Makros und ein Minitab-Arbeitsblatt mit Beispieldaten enthält:

ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS.mac
ADD_sup_Verteilungsidentifikation_Automatische_Modellauswahl_AD_LS.mac
ADD_sup_Beispieldaten_Automatische_Modellauswahl_AD_LS.mtw

Ablage und Aufruf der Makros

Den Speicherort für Makros, in dem Sie die *.mac-Dateien speichern müssen, finden Sie im Dialogfeld Datei: Optionen². Bitte legen Sie die beiden Makro-Dateien dort ab. Sie können dann die Befehle zum Aufruf des jeweiligen Makros in das Feld Befehlszeile eingeben und anschließend auf den Button Durchlauf klicken.³

Das Arbeitsblatt ADD_sup_Beispieldaten_Automatische_Modellauswahl_AD_LS.mtw

Die Datensätze für die Verteilungsidentifikation und Prozessfähigkeitsanalyse mit automatischer Modellauswahl sind in den Spalten C1-C5 hinterlegt. Die jeweiligen Spalten C6 und C7 enthalten die jeweiligen Spezifikationsgrenzen.

↓	C6	C7

1	0	8
2	-15	15
3	9,5	10,5
4	0	10
5	0	11

Das Makro ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS.mac

Das Makro ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS.mac wählt für eine oder mehrere angegebene Spalten jeweils automatisch ein Modell aus. Dabei werden die Anderson-Darling-Werte und die Summe der quadratischen Differenzen an den Rändern der angepassten Verteilungskurve berechnet. Die Verteilungen werden zunächst absteigend nach den AD-Werten sortiert. Dann kommen die Verteilungen mit den niedrigsten AD-Werten in die engere Auswahl und werden absteigend nach den quadratischen Differenzen an den Rändern sortiert. Die Verteilung mit dem kleinsten Wert wird ausgewählt und eine auf diesem Verteilungsmodell basierende Prozessfähigkeitsanalyse durchgeführt.

Am Beispieldatensatz ADD_sup_Beispieldaten_Automatische_Modellauswahl_AD_LS.mtw lautet der Befehl zum Aufruf des Makros

%ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS C1-C5;
Spezifikationsgrenzen C6 C7.

Verteilungsidentifikation für C1

Schritt 1: Anderson-Darling

Daten

Zeile	Verteilung	AD
1	Weibull mit 3 Parametern	0,301461
2	Weibull	0,366201
3	Gamma mit 3 Parametern	0,438572
4	Lognormal mit 3 Parametern	0,463107
5	Größter Extremwert	0,559803
6	Normal	0,634630
7	Loglogistisch mit 3 Parametern	0,657217
8	Logistisch	0,776773
9	Gamma	0,824086
10	Loglogistisch	1,360598
11	Kleinster Extremwert	1,850005
12	Lognormal	2,264188
13	Exponential mit 2 Parametern	7,521848
14	Exponential	8,119848

Schritt 2: Kleinste Quadrate an den Rändern

Daten

Zeile	Verteilung	AD	Summe der Quadrate (Rand)
1	Weibull mit 3 Parametern	0,301461	303,95
2	Weibull	0,366201	309,89
3	Gamma mit 3 Parametern	0,438572	332,01

Bericht der Prozessfähigkeit für C1

Verteilungsidentifikation für C2

Schritt 1: Anderson-Darling

Daten

Zeile	Verteilung	AD
1	Logistisch	0,3140
2	Loglogistisch mit 3 Parametern	0,3216
3	Lognormal mit 3 Parametern	0,5495
4	Normal	0,5526
5	Gamma mit 3 Parametern	0,6659
6	Weibull mit 3 Parametern	0,6891
7	Kleinster Extremwert	2,2102
8	Größter Extremwert	2,5717
9	Exponential mit 2 Parametern	19,6025

Schritt 2: Kleinste Quadrate an den Rändern

Daten

Zeile	Verteilung	AD	Summe der Quadrate (Rand)
1	Lognormal mit 3 Parametern	0,5495	700,54
2	Logistisch	0,3140	755,83
3	Loglogistisch mit 3 Parametern	0,3216	758,44

Bericht der Prozessfähigkeit für C2

* WARNUNG * Der Newton-Raphson-Algorithmus ist nach 100 Iterationen nicht konvergiert.

* WARNUNG * Für das Log-Likelihood-Kriterium wurde keine Konvergenz erreicht.

* WARNUNG * Für das Kriterium der Parameterschätzwerte wurde keine Konvergenz erreicht.

Bericht der Prozessfähigkeit für C2

Verteilungsidentifikation für C3

Schritt 1: Anderson-Darling

Daten

Zeile	Verteilung	AD
1	Loglogistisch mit 3 Parametern	0,2322
2	Loglogistisch	0,2657
3	Logistisch	0,2768
4	Gamma mit 3 Parametern	0,3148
5	Lognormal mit 3 Parametern	0,3165
6	Lognormal	0,3745
7	Gamma	0,3761
8	Normal	0,3969
9	Weibull mit 3 Parametern	0,5626
10	Größter Extremwert	1,4582
11	Weibull	2,6431
12	Kleinster Extremwert	2,7658
13	Exponential mit 2 Parametern	22,2800
14	Exponential	53,9259

Schritt 2: Kleinste Quadrate an den Rändern

Daten

Zeile	Verteilung	AD	Summe der Quadrate (Rand)
1	Loglogistisch mit 3 Parametern	0,2322	0,67
2	Loglogistisch	0,2657	0,67
3	Logistisch	0,2768	0,67

Bericht der Prozessfähigkeit für C3

Verteilungsidentifikation für C4

Schritt 1: Anderson-Darling

Daten

Zeile	Verteilung	AD
1	Lognormal mit 3 Parametern	0,5609
2	Loglogistisch mit 3 Parametern	0,5616
3	Lognormal	0,6241
4	Loglogistisch	0,7491
5	Gamma mit 3 Parametern	0,8559
6	Weibull mit 3 Parametern	1,1859
7	Gamma	1,4292
8	Größter Extremwert	1,6065
9	Weibull	2,3379
10	Logistisch	3,3840
11	Normal	4,7120
12	Exponential mit 2 Parametern	5,8461
13	Kleinster Extremwert	9,0128
14	Exponential	12,9062

Schritt 2: Kleinste Quadrate an den Rändern

Daten

Zeile	Verteilung	AD	Summe der Quadrate (Rand)
1	Lognormal	0,6241	239,062
2	Lognormal mit 3 Parametern	0,5609	248,903
3	Loglogistisch mit 3 Parametern	0,5616	413,242

Bericht der Prozessfähigkeit für C4

Verteilungsidentifikation für C5

Schritt 1: Anderson-Darling

Daten

Zeile	Verteilung	AD
1	Lognormal mit 3 Parametern	0,1491
2	Gamma mit 3 Parametern	0,1542
3	Loglogistisch mit 3 Parametern	0,2736
4	Lognormal	0,2760
5	Weibull mit 3 Parametern	0,2801
6	Loglogistisch	0,3731
7	Größter Extremwert	0,4270
8	Gamma	0,7446
9	Logistisch	1,7594
10	Weibull	2,0935
11	Normal	2,7334
12	Exponential mit 2 Parametern	5,3949
13	Kleinster Extremwert	7,5032
14	Exponential	21,5351

Schritt 2: Kleinste Quadrate an den Rändern

Daten

Zeile	Verteilung	AD	Summe der Quadrate (Rand)
1	Gamma mit 3 Parametern	0,1542	153,205
2	Lognormal mit 3 Parametern	0,1491	177,456
3	Loglogistisch mit 3 Parametern	0,2736	311,279

Bericht der Prozessfähigkeit für C5

Standardmäßig kommen in ersten Durchgang die 3 Verteilungen mit den niedrigsten AD-Werten in die engere Auswahl. Sollen dies beispielsweise 5 und nicht 3 Verteilungen sein, können Sie dies mit dem Unterbefehl AnzahlVerteilungen angeben:

%ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS C1-C5;
Spezifikationsgrenzen C6 C7;
AnzahlVerteilungen 5.

Wenn Sie keinen anderen Wert angeben, werden die quadratischen Differenzen zur Verteilungsanpassung am jeweils unteren und oberen 5%-Rand berechnet. Wenn Sie stattdessen zum Beispiel 10% nehmen wollen, können Sie dies mit dem Unterbefehl "ProzentRaender" tun:

%ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS C1-C5;
Spezifikationsgrenzen C6 C7;
ProzentRaender 10.

Sie können dies auch kombinieren:

%ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS C1-C5;
Spezifikationsgrenzen C6 C7;
AnzahlVerteilungen 5;
ProzentRaender 10.

Das Makro ADD_sup_Verteilungsidentifikation_Automatische_Modellauswahl_AD_LS.mac

Das Makro ADD_sup_Verteilungsidentifikation_Automatische_Modellauswahl_AD_LS.mac führt nur die Verteilungsidentifikation, nicht aber die Prozessfähigkeitsanalyse durch.

Der Befehl zum Aufruf des Makros lautet für den Beispieldatensatz ADD_sup_Beispieldaten_Automatische_Modellauswahl_AD_LS.mtw

%ADD_sup_Verteilungsidentifikation_Automatische_Modellauswahl_AD_LS C1-C5

Wie auch im Makro ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS.mac stehen Ihnen auch hier die Unterbefehle AnzahlVerteilungen und ProzentRaender zur Verfügung.

In dem Fall, dass Sie die Verteilungsidentifikation in die Spalte C8 speichern wollen, können Sie das mit dem Unterbefehl BesteVerteilung angeben.

%ADD_sup_Verteilungsidentifikation_Automatische_Modellauswahl_AD_LS C1-C5;
BesteVerteilung C8.

Anmerkung

Im Fall einer Prozessfähigkeitsanalyse einer einzigen Spalte können Sie auch eine Konstante als Argument des Unterbefehls BesteVerteilung angeben. Die Nummerierung für Konstanten ist Kn, wobei n eine ganze Zahl zwischen 1 und 1000 ist. Konstanten und Matrizen sehen Sie nicht direkt im Arbeitsblatt. Bitte wählen Sie Daten: Daten anzeigen aus dem Hauptmenü von Minitab, um sich die Konstante K1 im Sessionfenster anzeigen zu lassen.

Sie können diese Unterbefehle auch hier kombinieren.

%ADD_sup_Verteilungsidentifikation_Automatische_Modellauswahl_AD_LS C1-C5;
AnzahlVerteilungen 5;
ProzentRaender 10;
BesteVerteilung C8.

Diese Makros sind Beispiele für die Automatisierungsmöglichkeiten in Minitab. Trotz aller Sorgfalt übernehmen wir keine Gewährleistung für die Richtigkeit der Berechnungen und Ergebnisse.

Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein., wenn Sie eine Frage zu diesem Artikel haben.

1Wenn Sie eine Minitab 18 einsetzen, bitte beachten Sie die Hinweise in den Fußnoten.
2in Minitab 18: Extras: Optionen
3In Minitab 18 können Sie die Befehle mit dem Befehlszeileneditor übermitteln (Bearbeiten: Befehlszeileneditor oder Strg+L).

Download-ID: 1032

KNOW-HOW

Praxisorientierte Soft- und Hardware-Schulungen
für Einsteiger, Fortgeschrittene und erfahrene Anwender.

Minitab 22 - Makro für eine automatische Modellauswahl bei einer Prozessfähigkeitsanalyse

Erläuterung

Über uns

Kontakt

Zentrale

Auftragsabwicklung

Zertifikate & Gütesiegel

KNOW-HOW

Praxisorientierte Soft- und Hardware-Schulungenfür Einsteiger, Fortgeschrittene und erfahrene Anwender.

Minitab 22 - Makro für eine automatische Modellauswahl bei einer Prozessfähigkeitsanalyse

Erläuterung

Zentrale

Auftragsabwicklung

Praxisorientierte Soft- und Hardware-Schulungen
für Einsteiger, Fortgeschrittene und erfahrene Anwender.