9207

Minitab 21 - Beispiel für ein Simulationsmakro: Zufallszahlen mit Verteilung X, Anderson-Darling-Test mit Verteilung Y

  • Erstellt am 17.5.2022
  • Software: Minitab 21

Der folgende Datensatz stammt aus einer Grundgesamtheit mit der Kleinster-Extremwert-Verteilung.

C1
 
1 9,817033220725554
2 9,923132541025424
3 9,816320621483278
4 10,019013708858033
5 10,044332690184957
6 9,931381279064357
7 10,037108379340605
8 9,994075359764125
9 9,894572197918626
10 9,956763624437192
11 9,984305750118823
12 9,918934289347751
13 10,056290948086287
14 9,966368598355086
15 9,945258709208247
16 9,863105305151091
17 10,036597570769512
18 10,003020877940658
19 9,974694216395703
20 10,026467700180721
21 9,868618131246048
22 9,976699185740644
23 9,904347537979556
24 9,867271911169157
25 10,006565583166083
26 9,891993049423313
27 9,956101241918081
28 10,006793457212012
29 9,798087075945118
30 9,967283500949232
31 9,935655864558287
32 9,986708313108775
33 10,013251464530653
34 9,904664556126297
35 9,973980786947710
36 9,972654694220742
37 9,985084795176142
38 9,973708179194722
39 9,952433143332607
40 9,897206885128393
41 10,006854554639526
42 10,060054621089160
43 9,979125212165231
44 9,922561165427085
45 9,946462541112245
46 10,022134738585954
47 9,902966081307062
48 9,976393408237954
49 10,054876460043216
50 9,852161704479540
51 10,030133463296405
52 9,952616407648817
53 10,006121815093874
54 10,015546390998182
55 9,922715023322263
56 9,994220989600384
57 9,925014240294985
58 9,891642751013180
59 9,899513928308359
60 9,930385743915767
61 9,994401538097652
62 10,051571136664508
63 9,990944924003484
64 9,880400871014691
65 9,946654887415871
66 9,977491075951859
67 9,930984931556891
68 9,964629547244108
69 9,933768674188284
70 10,015917119689412
71 10,005489833701267
72 9,869987659831772
73 10,027799878008512
74 9,995247994977163
75 9,904646773349752
76 9,969519825625227
77 9,980047560061005
78 9,956458821563039
79 9,966710464187512
80 9,967420735803520

 

Jedoch weicht seine Verteilung auch nicht statistisch signifikant von der Normalverteilung ab:

simulation_zufallszahlen_mit_verteilung_x_anderson_darling_test_mit_verteilung_y_02 simulation_zufallszahlen_mit_verteilung_x_anderson_darling_test_mit_verteilung_y_01
Wahrscheinlichkeitsnetz mit Kleinster-Extremwert-Verteilung Wahrscheinlichkeitsnetz mit Normalverteilung

Wenn ich Spezifikationsgrenzen von 9,5 und 10,5 habe und mit Hilfe von Toleranzintervallen überprüfen will, ob dass 95%-Toleranzintervall, das mindestens 99,9937% Grundgesamtheit abdeckt, noch innerhalb dieser Grenzen liegt, ist dies für die Kleinster-Extremwert-Verteilung nicht der Fall, für die Normalverteilung jedoch schon.

Toleranzintervall: C1

Toleranzintervall: C1

Methode

Verteilung

Kleinster Extremwert

Konfidenzniveau

95%

Prozent der Grundgesamtheit in Intervall

99,9937%

Methode

Konfidenzniveau

95%

Prozent der Grundgesamtheit in Intervall

99,9937%

Statistik

Variable

N

Mittelwert

StdAbw

C1

80

9,958

0,059

Statistik

Variable

N

Mittelwert

StdAbw

C1

80

9,958

0,059

Verteilungsparameter

Variable

Lage

Skala

C1

9,986

0,049

 

95%-Toleranzintervall

Variable

Methode:
Kleinster
Extremwert

Verteilungsfreie
Methode

Erreichte
Konfidenz

C1

(9,362; 10,126)

(9,798; 10,060)

0,00%

Das erreichte Konfidenzniveau gilt nur für die verteilungsfreie Methode.

 

95%-Toleranzintervall

Variable

Normalverteilungsmethode

Verteilungsfreie
Methode

Erreichte
Konfidenz

C1

(9,685; 10,231)

(9,798; 10,060)

0,0%

Das erreichte Konfidenzniveau gilt nur für die verteilungsfreie Methode.

 

simulation_zufallszahlen_mit_verteilung_x_anderson_darling_test_mit_verteilung_y_03 simulation_zufallszahlen_mit_verteilung_x_anderson_darling_test_mit_verteilung_y_04

Für Stichprobenumfänge von 80, 100 und 120 will ich deshalb simulieren, wie häufig für Datensätze aus der Kleinster-Extremwert-Verteilung mit Lageparameter 10 und Skalenparameter 0,05 die Nullhypothese

H0: Der Datensatz ist normalverteilt.

des Anderson-Darling-Tests auf Normalverteilung fälschlicherweise nicht verworfen würde. Gibt es ein Makro, mit dem ich das tun kann?

apspaketDas entsprechende APS-Paket ist über unseren ADDITIVE Professional Service erhältlich. Um das Paket zu erhalten, kontaktieren Sie unseren Support per E-Mail an Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein. oder per Telefon unter +49 6172 5905 20 jeweils unter Angabe der APS-Paketnummer 1049.

Erläuterung

Das APS-Paket Nr. 1049 besteht aus dem lokalen Makro ADD_sup_Simulationen_Zufallszahlen_versus_AD_Test.mac. Dieses Makro erstellt für

  • eine oder mehrere vorgegebene Verteilungen, einschließlich der vorgegebenen Verteilungsparameter, sowie
  • einen oder mehrere vorgegebene Stichprobenumfänge

entsprechend einer vorgegebenen Anzahl an simulierten Datensätzen mit den vorgegebenen Stichprobenumfängen Zufallszahlen und führt an jeder einzelnen Simulation einen Anderson-Darling-Test an einer Verteilung durch, die Sie ebenfalls vorgeben.

Bitte legen Sie das Makro in dem Verzeichnis ab, dass Sie in Minitab unter Datei: Optionen als Speicherort für Makros festgelegt haben. Stellen Sie sicher, dass das Verzeichnis C:\Temp auf Ihrem Rechner existiert.

Angenommen,

  • die Verteilungsformen für die Zufallszahlen sind in Spalte C1 hinterlegt (im einleitenden Beispiel ist dies die Kleinster-Extremwert-Verteilung),

  • die Verteilung für den Anderson-Darling-Test ist die Normalverteilung,

  • die ersten Parameter sind in Spalte C2 hinterlegt (im Beispiel der Lageparameter 10),

  • die zweiten Parameter sind in Spalte C3 hinterlegt (im Beispiel der Skalenparameter 0,05),

  • die Stichprobenumfänge sind in Spalte C4 hinterlegt,

    C1 C2 C3 C4
    Verteilung Parameter 1 Parameter 2 Stichprobenumfang
    1 Kleinster Extremwert 10 0,05 80
    2 Kleinster Extremwert 10 0,05 100
    3 Kleinster Extremwert 10 0,05 120
  • für jede Zeile sollen 100000 Datensätze mit den in der jeweiligen Zeile angegebenen Verteilungsmodellen und Stichprobenumfänge erstellt und mit dem Anderson-Darling getestet werden,

  • das Signifikanzniveau α für den Anderson-Darling-Test ist 0,05, und

  • die prozentualen Anteile derjenigen Datensätze, für die der Anderson-Darling-Test einen p-Wert ≤ α berechnet, sollen in Spalte C5 gespeichert werden.

Der Befehl für den Makroaufruf ist

%ADD_sup_Simulationen_Zufallszahlen_versus_AD_Test C1 "Normal" C2 C3 C4 100000 0,05 C5

Wenn Sie zusätzlich in Spalte C6 und C7 die unteren und oberen Grenzen der 95%-Konfidenzintervalle für die simulierten Anteile nach dem Test von Anteilen für eine Stichprobe (Exakte Methode) speichern wollen, können Sie das Makro mit dem Befehl

%ADD_sup_Simulationen_Zufallszahlen_versus_AD_Test C1 "Normal" C2 C3 C4 100000 0,05 C5;
  KIfuerSimulierteAnteile 95;
    KIUnten C6;
    KIOben C7.

aufrufen. Wir haben das für das Beispiel in der Einleitung gemacht und dabei folgende Simulationsergebnisse erhalten:

C1 C2 C3 C4 C5 C6 C7
Verteilung Parameter 1 Parameter 2 Stichprobenumfang Anteil der Tests mit p ≤ 0,05  Untere 95%-KI-Grenze  Obere 95%-KI-Grenze 
1 Kleinster Extremwert 10 0,05 80 81,22% 80,98% 81,46%
2 Kleinster Extremwert 10 0,05 100 88,95% 88,76% 89,15%
3 Kleinster Extremwert 10 0,05 120 93,92% 93,77% 94,06%

In 81,22% unserer simulierten Datensätze mit Stichprobenumfang 80 hat der Anderson-Darling-Test einen p-Wert ≤ 0,05 berechnet und damit die Nullhypothese richtigerweise verworfen. Das 95%-Konfidenzintervall für diesen Anteil wurde als [80,98%, 81,46%] berechnet.

In 93,92% unserer simulierten Datensätze mit Stichprobenumfang 120 hat der Anderson-Darling-Test einen p-Wert ≤ 0,05 berechnet und damit die Nullhypothese richtigerweise verworfen. Das 95%-Konfidenzintervall für diesen Anteil wurde als [93,77%, 94,06%] berechnet.

Anmerkung

Durch die Simulation in diesem Beispiel wird nur geschätzt, wie gut der Anderson-Darling-Test die Nicht-Normalverteilung in dem Fall erkennt, dass eine Stichprobe in Wirklichkeit aus einer Kleinsten-Extremwert-Verteilung mit Lageparameter 10 und Skalenparameter 0,05 entnommen wurde. Daraus lässt sich keine Aussage ableiten, wie das im Fall anderer Nicht-Normalverteilungen wäre.

Befehle und Argumente

Das sind die Befehle und Argumente, mit denen Sie das Makro aufrufen können:

%ADD_sup_Simulationen_Zufallszahlen_versus_AD_Test dist1 dist2 par.1-par.m n anz α erg;
  KIfuerSimulierteAnteile konf;
    KIUnten uerg;
    KIOben oerg;
  Hinweis notiz
;
  SimulationsdatenSpeichern ordner.

Sie haben die folgende Bedeutung:

Befehl/Argument Typ
 Bedeutung
%ADD_sup_Simulationen_Zufallszahlen_versus_AD_Test Hauptbefehl Aufruf des Makros 
dist1 Spalte oder Konstante Verteilung für den Anderson-Darling-Test
dist2 Konstante Verteilung für die Zufallszahlen
par.1 Spalte oder Konstante Erster Verteilungsparameter für die Zufallszahlen
par.2 Spalte oder Konstante Wenn benötigt: Zweiter Verteilungsparameter für die Zufallszahlen
par.3 Spalte oder Konstante Wenn benötigt: Dritter Verteilungsparameter für die Zufallszahlen
n Spalte oder Konstante Stichprobenumfang
anz Konstante Anzahl der Simulationen
α Konstante Signifikanzniveau für den Anderson-Darling-Test
erg Spalte Ausgabespalte für die simulierten Anteile
KIfuerSimulierteAnteile Unterbefehl des Makroaufrufs

Verwenden Sie diesen Unterbefehl, wenn Sie zusätzlich
Konfidenzintervalle für die simulierten Anteile berechnen
lassen wollen.

konf Konstante Konfidenzniveau der Konfidenzintervalle für die simulierten Anteile
KIUnten Unterbefehl von KIfuerSimulierteAnteile

Verwenden Sie mindestens einen der Unterbefehle KIUnten und KIOben,
wenn Sie für die simulierten Anteile berechnen lassen wollen. Wenn Sie
nur KIUnten verwenden, werden einseitige Untergrenzen ausgegeben.
Wenn Sie KIUnten und KIOben verwenden, werden untere und obere
KI-Grenzen ausgegeben.

uerg Spalte Spalte für die unteren Grenzen
KIOben Unterbefehl von KIfuerSimulierteAnteile Verwenden Sie mindestens einen der Unterbefehle KIUnten und KIOben,
wenn Sie für die simulierten Anteile berechnen lassen wollen. Wenn Sie
nur KIOben verwenden, werden einseitige Obergrenzen ausgegeben.
Wenn Sie KIUnten und KIOben verwenden, werden untere und obere
KI-Grenzen ausgegeben.
oerg Spalte Spalte für die oberen Grenzen
Hinweis Unterbefehl des Makroaufrufs

Verwenden Sie diesen Unterbefehl, wenn Sie für die Simulationen die
Informationen über den Verteilungstyp der Zufallszahlen und über den
Verteilungstyp für den Anderson-Darling-Test in eine Spalte speichern
wollen.

notiz Spalte Ausgabespalte für die Informationen über den Verteilungstyp der
Zufallszahlen und über den Verteilungstyp für den Anderson-Darling-Test.
SimulationsdatenSpeichern Unterbefehl des Makroaufrufs

Verwenden Sie diesen Unterbefehl, wenn dist1 nur eine Zeile hat und Sie
Simulationsdaten speichern wollen.

ordner Konstante Verzeichnis, in das die Datei mit den Simulationsdaten gespeichert werden soll.

Für die Zufallszahlen (dist1) kommen folgende Verteilungen in Frage:

Normal, Lognormal, Lognormal mit 3 Parametern, Gamma, Gamma mit 3 Parametern, Exponential, Exponential mit 2 Parametern, Kleinster Extremwert, Weibull, Weibull mit 3 Parametern, Größter Extremwert, Logistisch, Loglogistisch, Loglogistisch mit 3 Parametern, Beta, Cauchy, Chi-Quadrat, F, Laplace, t, Dreieck, Gleich

Für den Anderson-Darling-Test (dist2) kommen folgende Verteilungen in Frage:

Normal, Lognormal, Lognormal mit 3 Parametern, Gamma, Gamma mit 3 Parametern, Exponential, Exponential mit 2 Parametern, Kleinster Extremwert, Weibull, Weibull mit 3 Parametern, Größter Extremwert, Logistisch, Loglogistisch, Loglogistisch mit 3 Parametern

Die Parameter werden für die einzelnen Verteilungen (für die Zufallszahlen) in der folgenden Reihenfolge eingegeben:

dist1 par.1 par.2 par.3
Normal Mittelwert Standardabweichung  
Lognormal Lage Skala  
Lognormal mit 3 Parametern Lage Skala Schwellenwert
Gamma Form Skala  
Gamma mit 3 Parametern Form Skala Schwellenwert
Exponential Skala    
Exponential mit 2 Parametern Skala Schwellenwert  
Kleinster Extremwert Lage Skala  
Weibull Form Skala  
Weibull mit 3 Parametern Form Skala Schwellenwert
Größter Extremwert Lage Skala  
Logistisch Lage Skala  
Loglogistisch Lage Skala  
Loglogistisch mit 3 Parametern Lage Skala Schwellenwert
Beta Erster Formparameter Zweiter Formparameter  
Cauchy Lage Skala  
Chi-Quadrat Freiheitsgrade    
F Freiheitsgrade des Zählers Freiheitsgrade des Nenners  
Laplace Lage Skala  
t Freiheitsgrade    
Dreieck Unterer Endpunkt Modalwert Oberer Endpunkt
Gleich Unterer Endpunkt Oberer Endpunkt  

Dieses Makro ist ein Beispiel für die Automatisierungsmöglichkeiten für Minitab. Trotz aller Sorgfalt übernehmen wir keine Gewährleistung für die Richtigkeit der Berechnungen und Ergebnisse.

Question?

Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein., wenn Sie eine Frage zu diesem Artikel haben.

  • Download-ID: 1049