6168

Minitab 22 - Makro für eine automatische Modellauswahl bei einer Prozessfähigkeitsanalyse

  • Erstellt am 3.12.2018
  • Überarbeitet am 26.3.2024
  • Software1 : Minitab 22, 21, 20, 19, 18

apspaketDas entsprechende APS-Paket ist über unseren ADDITIVE Professional Service erhältlich. Um das Paket zu erhalten, kontaktieren Sie unseren Support per E-Mail an Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein. oder per Telefon unter +49 6172 5905 20 jeweils unter Angabe der APS-Paketnummer 1032.

In meinem Unternehmen gibt es einige Prozesse, deren Fähigkeit ich gerne in Minitab analysieren möchte. Das Programm soll dabei das Modell (die Verteilung) automatisch nach gewissen Kriterien auswählen. Was kann ich dafür tun?

Erläuterung

Minitab bietet im Untermenü Statistik: Qualitätswerkzeuge: Prozessfähigkeitsanalyse Werkzeuge zur Prozessfähigkeit für Normal- und Nichtnormalverteilte Daten an. Bei letzterem müssen Sie im Dialog manuell eine Verteilung auswählen.

makro_fuer_eine_automatische_modellauswahl_bei_einer_prozessfaehigkeitsanalyse_01

Für die Zuverlässigkeit des Analyseergebnisses ist es wichtig, dass die Verteilung für Ihre Daten geeignet ist. Diese müssen Sie vorher diskutieren - an Hand von technischen Kriterien und mit Hilfe von statistischen Tests. Minitab bietet mit dem Anderson-Darling-Test im Werkzeug Statistik: Qualitätswerkzeuge: Identifikation der Verteilung eine Hilfestellung dafür.

Wenn Sie jedoch bei jeder Verteilung nur den p-Wert betrachten, projizieren Sie die gesamte Verteilungsinformation nur auf diesen einen Wert. Besser ist es, wenn Sie sich den gesamten Sachverhalt ansehen: Die Verteilung sollte generell gut zu den eigenen Daten passen. Besonders gut sollte die Verteilung aber an den Rändern passen, weil dort auch die Spezifikationsgrenzen liegen, die Bereiche also, an denen die Fähigkeitswerte „entstehen“.

Diese differenzierte Betrachtungsweise erfordert eine Automatisierung. Das haben wir für Sie exemplarisch in diesem Makro umgesetzt. Es ist damit auch eine gute Demonstration, wenn Sie allgemein vorhaben, die Verteilungsidentifikation zu automatisieren.

Das Makro, welches wir Ihnen mit dem nächsten Abschnitt im Detail vorstellen, sucht von allen möglichen Verteilungen die drei aus, die den kleinsten AD-Wert (Anderson-Darling-Wert) bezüglich der Verteilung aufzeigen. Von diesen drei besten Verteilungen wird dann nochmal konkret das Verhalten an den Rändern überprüft.

Weitere Informationen zur Automatisierung finden Sie in unseren Artikeln zu Makros und in den Hilfe-Seiten von Minitab zu Makros / Automatisierung:

Wenn Sie an einem Projekt zur Unterstützung beim Erstellen eines unternehmensspezifischen Makros für eine Prozessfähigkeitsanalyse mit automatischer Modellauswahl interessiert sind, Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein..

Das APS-Paket - Automatische Modellauswahl - Anderson-Darling gefolgt von Kleinste-Quadrate an den Rändern - Motivation

Der Anderson-Darling-Test ist ein statistischer Test zur Bewertung der Nullhypothese

H0: "Die Daten folgen der Verteilung X."

Dabei wird an Hand der angenommenen Verteilung der Daten ein sogenannter AD-Wert und anschließend ein p-Wert als bedingte Wahrscheinlichkeit

P("Die Teststatistik ist ≤ AD." | "Die Daten folgen der Verteilung X.")

berechnet. Das Anderson-Darling-Verfahren wird im Abschnitt Methoden für Identifikation der Verteilung - Test auf Güte der Anpassung der Online-Hilfe von Minitab beschrieben. Je kleiner ein Anderson-Darling-Wert ist, umso größer sollte der p-Wert werden. Nun hängt der p-Wert eng mit einer Wahrscheinlichkeit für einen Fehler 1. Art zusammen - also der Wahrscheinlichkeit, eine richtige Nullhypothese fälschlicherweise zu verwerfen. Was der p-Wert nicht macht, ist eine Aussage über die Nähe der Approximation an den Rändern der Verteilung.

makro_fuer_eine_automatische_modellauswahl_bei_einer_prozessfaehigkeitsanalyse_02

Ein fähiger Prozess ist so verteilt, dass der Großteil der Daten innerhalb der Spezifikationen liegt - insbesondere die für die Berechnung der Prozessfähigkeit relevanten Perzentile. Vor diesem Hintergrund lassen wir dem Vergleich nach den Anderson-Darling-Werten in dem APS-Paket einen Vergleich nach den kleinsten Quadraten an den Rändern durchführen - um in der engeren Auswahl diejenige Verteilung zu begünstigen, bei denen diese am geringsten ist.

Das APS-Paket

Das APS-Paket Nr. 1032 ist eine *.zip-Datei, die zwei lokale Minitab-Makros und ein Minitab-Arbeitsblatt mit Beispieldaten enthält:

  • ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS.mac
  • ADD_sup_Verteilungsidentifikation_Automatische_Modellauswahl_AD_LS.mac
  • ADD_sup_Beispieldaten_Automatische_Modellauswahl_AD_LS.mtw

Ablage und Aufruf der Makros

Den Speicherort für Makros, in dem Sie die *.mac-Dateien speichern müssen, finden Sie im Dialogfeld Datei: Optionen2. Bitte legen Sie die beiden Makro-Dateien dort ab. Sie können dann die Befehle zum Aufruf des jeweiligen Makros in das Feld Befehlszeile eingeben und anschließend auf den Button Durchlauf klicken.3

Das Arbeitsblatt ADD_sup_Beispieldaten_Automatische_Modellauswahl_AD_LS.mtw

Die Datensätze für die Verteilungsidentifikation und Prozessfähigkeitsanalyse mit automatischer Modellauswahl sind in den Spalten C1-C5 hinterlegt. Die jeweiligen Spalten C6 und C7 enthalten die jeweiligen Spezifikationsgrenzen.

C6 C7
     
1 0 8
2 -15 15
3 9,5 10,5
4 0 10
5 0 11

 

Das Makro ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS.mac

Das Makro ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS.mac wählt für eine oder mehrere angegebene Spalten jeweils automatisch ein Modell aus. Dabei werden die Anderson-Darling-Werte und die Summe der quadratischen Differenzen an den Rändern der angepassten Verteilungskurve berechnet. Die Verteilungen werden zunächst absteigend nach den AD-Werten sortiert. Dann kommen die Verteilungen mit den niedrigsten AD-Werten in die engere Auswahl und werden absteigend nach den quadratischen Differenzen an den Rändern sortiert. Die Verteilung mit dem kleinsten Wert wird ausgewählt und eine auf diesem Verteilungsmodell basierende Prozessfähigkeitsanalyse durchgeführt.

Am Beispieldatensatz ADD_sup_Beispieldaten_Automatische_Modellauswahl_AD_LS.mtw lautet der Befehl zum Aufruf des Makros

%ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS C1-C5;
  Spezifikationsgrenzen C6 C7.

 

Verteilungsidentifikation für C1

 

Schritt 1: Anderson-Darling
Daten
Zeile Verteilung AD
1 Weibull mit 3 Parametern 0,301461
2 Weibull 0,366201
3 Gamma mit 3 Parametern 0,438572
4 Lognormal mit 3 Parametern 0,463107
5 Größter Extremwert 0,559803
6 Normal 0,634630
7 Loglogistisch mit 3 Parametern 0,657217
8 Logistisch 0,776773
9 Gamma 0,824086
10 Loglogistisch 1,360598
11 Kleinster Extremwert 1,850005
12 Lognormal 2,264188
13 Exponential mit 2 Parametern 7,521848
14 Exponential 8,119848

 

Schritt 2: Kleinste Quadrate an den Rändern
Daten
Zeile Verteilung AD Summe der
Quadrate
(Rand)
1 Weibull mit 3 Parametern 0,301461 303,95
2 Weibull 0,366201 309,89
3 Gamma mit 3 Parametern 0,438572 332,01

 

Bericht der Prozessfähigkeit für C1
Bericht der Prozessfähigkeit für C1

makro_fuer_eine_automatische_modellauswahl_bei_einer_prozessfaehigkeitsanalyse_03

 

Verteilungsidentifikation für C2

 

Schritt 1: Anderson-Darling
Daten
Zeile Verteilung AD
1 Logistisch 0,3140
2 Loglogistisch mit 3 Parametern 0,3216
3 Lognormal mit 3 Parametern 0,5495
4 Normal 0,5526
5 Gamma mit 3 Parametern 0,6659
6 Weibull mit 3 Parametern 0,6891
7 Kleinster Extremwert 2,2102
8 Größter Extremwert 2,5717
9 Exponential mit 2 Parametern 19,6025

 

Schritt 2: Kleinste Quadrate an den Rändern
Daten
Zeile Verteilung AD Summe der
Quadrate
(Rand)
1 Lognormal mit 3 Parametern 0,5495 700,54
2 Logistisch 0,3140 755,83
3 Loglogistisch mit 3 Parametern 0,3216 758,44

 

Bericht der Prozessfähigkeit für C2
* WARNUNG * Der Newton-Raphson-Algorithmus ist nach 100 Iterationen nicht konvergiert.
* WARNUNG * Für das Log-Likelihood-Kriterium wurde keine Konvergenz erreicht.
* WARNUNG * Für das Kriterium der Parameterschätzwerte wurde keine Konvergenz erreicht.
Bericht der Prozessfähigkeit für C2

makro_fuer_eine_automatische_modellauswahl_bei_einer_prozessfaehigkeitsanalyse_04

 

Verteilungsidentifikation für C3

 

Schritt 1: Anderson-Darling
Daten
Zeile Verteilung AD
1 Loglogistisch mit 3 Parametern 0,2322
2 Loglogistisch 0,2657
3 Logistisch 0,2768
4 Gamma mit 3 Parametern 0,3148
5 Lognormal mit 3 Parametern 0,3165
6 Lognormal 0,3745
7 Gamma 0,3761
8 Normal 0,3969
9 Weibull mit 3 Parametern 0,5626
10 Größter Extremwert 1,4582
11 Weibull 2,6431
12 Kleinster Extremwert 2,7658
13 Exponential mit 2 Parametern 22,2800
14 Exponential 53,9259

 

Schritt 2: Kleinste Quadrate an den Rändern
Daten
Zeile Verteilung AD Summe der
Quadrate
(Rand)
1 Loglogistisch mit 3 Parametern 0,2322 0,67
2 Loglogistisch 0,2657 0,67
3 Logistisch 0,2768 0,67

 

Bericht der Prozessfähigkeit für C3
Bericht der Prozessfähigkeit für C3

makro_fuer_eine_automatische_modellauswahl_bei_einer_prozessfaehigkeitsanalyse_05

 

Verteilungsidentifikation für C4

 

Schritt 1: Anderson-Darling
Daten
Zeile Verteilung AD
1 Lognormal mit 3 Parametern 0,5609
2 Loglogistisch mit 3 Parametern 0,5616
3 Lognormal 0,6241
4 Loglogistisch 0,7491
5 Gamma mit 3 Parametern 0,8559
6 Weibull mit 3 Parametern 1,1859
7 Gamma 1,4292
8 Größter Extremwert 1,6065
9 Weibull 2,3379
10 Logistisch 3,3840
11 Normal 4,7120
12 Exponential mit 2 Parametern 5,8461
13 Kleinster Extremwert 9,0128
14 Exponential 12,9062

 

Schritt 2: Kleinste Quadrate an den Rändern
Daten
Zeile Verteilung AD Summe der
Quadrate
(Rand)
1 Lognormal 0,6241 239,062
2 Lognormal mit 3 Parametern 0,5609 248,903
3 Loglogistisch mit 3 Parametern 0,5616 413,242

 

Bericht der Prozessfähigkeit für C4
Bericht der Prozessfähigkeit für C4

makro_fuer_eine_automatische_modellauswahl_bei_einer_prozessfaehigkeitsanalyse_06

 

Verteilungsidentifikation für C5

 

Schritt 1: Anderson-Darling
Daten
Zeile Verteilung AD
1 Lognormal mit 3 Parametern 0,1491
2 Gamma mit 3 Parametern 0,1542
3 Loglogistisch mit 3 Parametern 0,2736
4 Lognormal 0,2760
5 Weibull mit 3 Parametern 0,2801
6 Loglogistisch 0,3731
7 Größter Extremwert 0,4270
8 Gamma 0,7446
9 Logistisch 1,7594
10 Weibull 2,0935
11 Normal 2,7334
12 Exponential mit 2 Parametern 5,3949
13 Kleinster Extremwert 7,5032
14 Exponential 21,5351

 

Schritt 2: Kleinste Quadrate an den Rändern
Daten
Zeile Verteilung AD Summe der
Quadrate
(Rand)
1 Gamma mit 3 Parametern 0,1542 153,205
2 Lognormal mit 3 Parametern 0,1491 177,456
3 Loglogistisch mit 3 Parametern 0,2736 311,279

 

Bericht der Prozessfähigkeit für C5
Bericht der Prozessfähigkeit für C5

makro_fuer_eine_automatische_modellauswahl_bei_einer_prozessfaehigkeitsanalyse_07

Standardmäßig kommen in ersten Durchgang die 3 Verteilungen mit den niedrigsten AD-Werten in die engere Auswahl. Sollen dies beispielsweise 5 und nicht 3 Verteilungen sein, können Sie dies mit dem Unterbefehl AnzahlVerteilungen angeben:

%ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS C1-C5;
Spezifikationsgrenzen C6 C7;
AnzahlVerteilungen 5.

Wenn Sie keinen anderen Wert angeben, werden die quadratischen Differenzen zur Verteilungsanpassung am jeweils unteren und oberen 5%-Rand berechnet. Wenn Sie stattdessen zum Beispiel 10% nehmen wollen, können Sie dies mit dem Unterbefehl "ProzentRaender" tun:

%ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS C1-C5;
Spezifikationsgrenzen C6 C7;
ProzentRaender 10.

Sie können dies auch kombinieren:

%ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS C1-C5;
Spezifikationsgrenzen C6 C7;
AnzahlVerteilungen 5;
ProzentRaender 10.

Das Makro ADD_sup_Verteilungsidentifikation_Automatische_Modellauswahl_AD_LS.mac

Das Makro ADD_sup_Verteilungsidentifikation_Automatische_Modellauswahl_AD_LS.mac führt nur die Verteilungsidentifikation, nicht aber die Prozessfähigkeitsanalyse durch.

Der Befehl zum Aufruf des Makros lautet für den Beispieldatensatz ADD_sup_Beispieldaten_Automatische_Modellauswahl_AD_LS.mtw

%ADD_sup_Verteilungsidentifikation_Automatische_Modellauswahl_AD_LS C1-C5

Wie auch im Makro ADD_sup_Prozessfaehigkeit_Automatische_Modellauswahl_AD_LS.mac stehen Ihnen auch hier die Unterbefehle AnzahlVerteilungen und ProzentRaender zur Verfügung.

In dem Fall, dass Sie die Verteilungsidentifikation in die Spalte C8 speichern wollen, können Sie das mit dem Unterbefehl BesteVerteilung angeben.

%ADD_sup_Verteilungsidentifikation_Automatische_Modellauswahl_AD_LS C1-C5;
  BesteVerteilung C8.

Anmerkung

Im Fall einer Prozessfähigkeitsanalyse einer einzigen Spalte können Sie auch eine Konstante als Argument des Unterbefehls BesteVerteilung angeben. Die Nummerierung für Konstanten ist Kn, wobei n eine ganze Zahl zwischen 1 und 1000 ist. Konstanten und Matrizen sehen Sie nicht direkt im Arbeitsblatt. Bitte wählen Sie Daten: Daten anzeigen aus dem Hauptmenü von Minitab, um sich die Konstante K1 im Sessionfenster anzeigen zu lassen.

Sie können diese Unterbefehle auch hier kombinieren.

%ADD_sup_Verteilungsidentifikation_Automatische_Modellauswahl_AD_LS C1-C5;
  AnzahlVerteilungen 5;
  ProzentRaender 10;
  BesteVerteilung C8.

 

Diese Makros sind Beispiele für die Automatisierungsmöglichkeiten in Minitab. Trotz aller Sorgfalt übernehmen wir keine Gewährleistung für die Richtigkeit der Berechnungen und Ergebnisse.

Question?

Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein., wenn Sie eine Frage zu diesem Artikel haben.

1Wenn Sie eine Minitab 18 einsetzen, bitte beachten Sie die Hinweise in den Fußnoten.
2in Minitab 18: Extras: Optionen
3In Minitab 18 können Sie die Befehle mit dem Befehlszeileneditor übermitteln (Bearbeiten: Befehlszeileneditor oder Strg+L).

  • Download-ID: 1032