9406

Minitab 21 - Normalverteilte Zufallszahlen - Warum schlägt der Test auf Normalverteilung manchmal fehl?

  • Erstellt am 8.2.2021
  • Überarbeitet am 4.5.2022
  • Software: Minitab 21, 20

Ich arbeite oft mit normalverteilten Zufallszahlen und erhalte in manchmal einen Datensatz, bei dem der Test auf Normalverteilung einen p-Wert ≤ 0,05 ergibt. Bei einem Signifikanzniveau von 0,05 würde ich damit die Nullhypothese der Normalverteilung der Daten verwerfen. Sollten die Zufallszahlen aber nicht normalverteilt sein?

Erläuterung am Beispiel des Anderson-Darling-Tests

Der p-Wert des Anderson-Darling-Tests auf Normalverteilung ist die Wahrscheinlichkeit, dass wenn die Daten tatsächlich aus einer normalverteilten Grundgesamtheit stammen würden, man einen AD-Wert erhalten würde, der mindestens so groß ist wie der beim Test beobachtete Wert.

Wenn Sie beispielsweise für 100 Werte einen AD-Wert von 0,755 und einen p-Wert von 0,048, also 4,8% erhalten, würden Sie die Nullhypothese der Normalverteilung der Daten bei einem Signifikanzniveau von 0,05 verwerfen, das heißt schlussfolgern, dass die Daten nicht aus einer normalverteilten Grundgesamtheit stammen, da sie sonst nur in durchschnittlich 4,8% der Stichproben einen mindestens so großen AD-Wert wie den beobachteten oder einen höheren AD-Wert erhalten würden.

Wenn Sie jetzt normalverteilte Zufallszahlen erstellen, unterschreitet der p-Wert des Anderson-Darling-Tests in 5% der Fälle den Wert 0,05, denn das Signifikanzniveau ist die Wahrscheinlichkeit, einen Fehler 1. Art zu machen, das heißt die hier richtige Nullhypothese der Normalverteilung der Daten fälschlicherweise zu verwerfen. Man könnte sagen, die Zufallszahlen sehen nur so aus, als ob Sie aus einer Nichtnormalverteilung stammen, da sie im Falle einer normalverteilten Grundgesamtheit unwahrscheinlich sind.

Erstellen Sie als kleines Experiment zur Veranschaulichung eine Million Zufallszahlen und ziehen Sie aus dieser "Grundgesamtheit" mehrmals eine Stichprobe von 100 zufälligen Werten und beobachten Sie, wie häufig der p-Wert bei der jeweiligen Stichprobe ≤ 0,05 ist.

Question?

Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein., wenn Sie eine Frage zu diesem Artikel haben.

Download

Das Makro ADD_sup_Simulation_AD_Test_auf_Normalverteilung führt an einer von Ihnen angegebene Anzahl an Simulationen von normalverteilten Zufallszahlen mit einem von Ihnen angegebenen Stichprobenumfang jeweils einen Anderson-Darling-Test durch und erstellt ein Histogramm der p-Werte, um darzustellen, wie häufig das Signifikanzniveau von 0,05 unterschritten wird.

Beispiel

Sie wollen 10000 Stichproben vom Stichprobenumfang 100 simulieren. Der Befehl für den Aufruf des Makros ist:

%ADD_sup_Simulation_AD_Test_auf_Normalverteilung 100 10000

 

ARBEITSBLATT 1

Simulation für den AD-Test auf Normalverteilung

Stichprobenumfang: 100                                                         

Anzahl der Simulationen: 10000                                                 

Anzahl der p-Werte <= 0,05: 527                                                

Anteil der p-Werte <= 0,05: 5,27%                                              

simulation_ad_test_auf_normalverteilung

Wenn Sie zusätzlich die simulierten p-Werte in Spalte C1 Speichern wollen, rufen Sie das Makro mit dem Befehl

%ADD_sup_Simulation_AD_Test_auf_Normalverteilung 100 10000
PWerte C1.

auf.

Dieses Makro ist ein Beispiel für die Automatisierungsmöglichkeiten für Minitab 20. Trotz aller Sorgfalt übernehmen wir keine Gewährleistung für die Richtigkeit der Berechnungen und Ergebnisse.