6058

Minitab 22 - Binäre logistische Regression - Berechnung der Abweichungen

  • Erstellt am 25.05.2018
  • Überarbeitet am 10.4.2024
  • Software: Minitab 22, 21, 20, 19, 18

Wie werden bei der binären logistischen Regression die Abweichungen und darauf basierend die Abweichungsresiduen für die einzelnen Datenpunkte berechnet?

In diesem Artikel vollziehen wir die Berechnung dieser Werte am Beispiel für das Anpassen eines binären logistischen Regressionsmodells aus der Online-Hilfe von Minitab nach. Bei einer binären logistischen Regression wird eine Anpassungsgleichung für die Ereigniswahrscheinlichkeiten berechnet. Diese sieht in dem Fallbeispiel so aus:

Regressionsgleichung

p(1)

=

exp(Y')/(1 + exp(Y'))

Kinder

SpotGesehen

     

Ja

Ja

Y'

=

-0,5490 + 0,01374 Einkommen

 

 

 

 

 

Ja

Nein

Y'

=

-1,583 + 0,01374 Einkommen

 

 

 

 

 

Nein

Ja

Y'

=

-1,982 + 0,01374 Einkommen

 

 

 

 

 

Nein

Nein

Y'

=

-3,016 + 0,01374 Einkommen

Die angepassten Ereigniswahrscheinlichkeiten und für den späteren Vergleich die Abweichungsresiduen können Sie mit dem Unterdialog Binäre logistische Regression: Speichern in Spalten des Minitab-Arbeitsblatts speichern.

binaere_logistische_regression_berechnung_der_abweichungen_01

Die Loglikelihood-Anteile werden mit der Gleichung

Lnpiyi(1-pi)1-yi

berechnet, wobei

  • yi = 1 ist, wenn in Zeile i das Referenzereignis beobachtet wurde, und ansonsten 0 ist; und
  • pi die durch das Modell prognostizierte Ereigniswahrscheinlichkeiten in Zeile i ist.

Der Beitrag di jeden Datenpunkts zur Abweichung entspricht dem jeweiligen Loglikelihood-Anteil, multipliziert mit dem Faktor -2:

di=-2 Lnpiyi(1-pi)1-yi

Wenn Sie die Spalte mit den angepassten Ereigniswahrscheinlichkeiten also p genannt haben, die Spalte der Antwortvariablen y und diese wie beschrieben mit 1 und 0 kodiert ist, können Sie eine neue Spalte d für die Abweichungsresiduen benennen und im Minitab-Rechner die Formel

-2*Ln(p^y*(1-p)^(1-y)) 

eingeben, um die Abweichungen (englisch: Deviances) in Spalte d zu berechnen.

Die Summe der Loglikelihood-Anteile Ln(piyi(1-pi)1-yi) ist genau der Loglikelihood-Wert des Modells. Entsprechend erhalten Sie durch das Aufsummieren der Abweichungen di der einzelnen Beobachtungen genau den Chi-Quadrat-Wert der Abweichung in der Tabelle der Tests auf Güte der Anpassung, der das (-2)-fache des Loglikelihood-Wertes des Modells ist.

 

Tests auf Güte der Anpassung

Test

DF

Chi-Quadrat

p-Wert

Abweichung

67

76,77

0,194

Pearson

67

76,11

0,209

Hosmer-Lemeshow

8

5,58

0,694

 

Die Abweichungsresiduen wiederrum erhalten Sie daraus aus der Formel

sgnyi-pidi

Wenn Sie die Spalte mit den angepassten Ereigniswahrscheinlichkeiten p, die Spalte der Antwortvariablen y und die Spalte mit den Abweichungen d genannt haben, können Sie zur Berechnung der Abweichungsresiduen mit dem Minitab-Rechner die Formel

Sign(y - p)*Sqrt(d)

eingeben.

Siehe hierzu auch:

Methoden und Formeln - Binäres logistisches Modell anpassen - Statistiken für die Güte der Anpassung - Abweichung

Methoden und Formeln - Binäres logistisches Modell anpassen - Bewertungsmaße - AbweichungsresiduenBinäres logistisches Modell anpassen - Bewertungsmaße - Abweichungsresiduen

In der Tabelle der Tests auf Güte der Anpassung bekomme ich eine Abweichung von 0. Was ist eine mögliche Ursache hierfür?

Die Abweichung ist dann von 0 verschieden, wenn der Likelihood-Wert von 1 verschieden bzw. der Loglikelihood-Wert von 0 verschieden ist, was dann der Fall ist, wenn der Wert R-Qd der Abweichung, also der Anteil der Gesamtabweichung der Antwortvariablen, der vom Modell erklärt wird, gleich 100% ist.

Siehe hierzu auch:

Methoden und Formeln für die Zusammenfassung des Modells in Binäres logistisches Modell anpassen - R2 der Abweichung

Tabelle mit der Zusammenfassung des Modells für Binäres logistisches Modell anpassen - R2 der Abweichung

Question?

Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein., wenn Sie eine Frage zu diesem Artikel haben.