Sitzung 10 ūĚúí¬≤-Tests

Lernziele dieser Sitzung

Sie können…

  • einen \(\chi^2\)-Unabh√§ngigkeitstest durchf√ľhren.
  • einen \(\chi^2\)-Anpassungstest durchf√ľhren.

Lernvideos (Sommersemester 2020)

Anwendungsbereich

In Sitzung 9 haben wir gelernt, wie f√ľr bivariate Verteilungen Korrelationen beschrieben werden k√∂nnen, wenn beide Variablen nominalskaliert sind. Grundlage daf√ľr waren die H√§ufigkeiten von Wertekombinationen in der Kreuztabelle.

Auch f√ľr \(\chi^2\)-Tests sind beobachtete H√§ufigkeiten in einer Kreuztabelle unser Ausgangspunkt. Wir fragen jedoch nicht nach einem Kennwert f√ľr die St√§rke der Korrelation, sondern wollen wissen, ob es einen statistisch signifikanten Zusammenhang zwischen den beiden Variablen gibt ‚Äď also einen Zusammenhang, der h√∂chstens mit einer Wahrscheinlichkeit \(\alpha\) (Signifikanzniveau) zuf√§llig zustande gekommen sein kann.

Um den Unterschied zu verdeutlichen: Bei sehr gro√üen Fallzahlen kann auch eine leichte Korrelation statistisch signifikant sein, bei kleinen Fallzahlen wird es es selbst f√ľr starke Korrelationen schwierig, eine statistische Signifikanz nachzuweisen.

Mit dem \(\chi^2\)-Unabh√§ngigkeitstest und dem \(\chi^2\)-Anpassungstest lernen wir im Folgenden zwei unterschiedliche Varianten des \(\chi^2\)-Tests kennen. Beide sollen direkt an Beispielen ausgef√ľhrt werden.

10.1 ūĚúí¬≤-Unabh√§ngigkeitstest

Grundlage sind bivariate Häufigkeiten, die in einer Kreuztabelle dargestellt werden können (s. Tabelle 10.1). Wie Kreuztabellen erstellt werden, haben wir bereits in Sitzung 9 behandelt.

Tabelle 10.1: Kreuztabelle der Beispieldaten
→ Dienst
Wohnort¬†‚Üď Grundwehrdienst Zivildienst
Land 18 11
Stadt 10 23

Unser Beispieldatensatz besch√§ftigt sich mit Kriegsdienstverweigerern. Zwischen 1956 und 2011 galt in der BRD die Wehrpflicht, d.¬†h. alle vom Staat als m√§nnlich erfassten und als tauglich gemusterte jungen Menschen mussten Dienst an der Waffe leisten ‚Äď es sei denn, sie verweigerten den Kriegsdienst und leisteten stattdessen Zivildienst (z.¬†B. in sozialen Einrichtungen).

Zus√§tzlich zur Frage der Kriegsdienstverweigerung sei in einer Zufallsstichprobe von als tauglich gemusterten erhoben, ob der Wohnort eine Gemeinde mit √ľber oder unter 20¬†000 Einwohner*innen (Stadt oder Land) ist.5 Die Ergebnisse sind in Tabelle¬†10.1 zusammengefasst.

Wir interessieren uns f√ľr den statistischen Zusammenhang dieser beiden Variablen, und zwar m√∂chten wir die Hypothese pr√ľfen, dass Menschen aus der Stadt eher den Kriegsdienst verweigerten als Menschen vom Land. Der Test wird entlang der bekannten sechs Schritte ausgef√ľhrt.

10.1.1 Test w√§hlen und Voraussetzungen pr√ľfen

F√ľr den \(\chi^2\)-Unabh√§ngigkeitstest m√ľssen folgende Voraussetzungen erf√ľllt sein:

  • Ziel ist die √úberpr√ľfung einer bivariaten Verteilung auf einen statistisch signifikanten Zusammenhang zwischen zwei nominalskalierten Variablen.
  • Grundlage sind beobachtete H√§ufigkeiten aus einer einfachen, unabh√§ngigen Zufallsstichprobe.
  • Alle Tabellenfelder enthalten beobachtete H√§ufigkeiten \((n_{ij}\geq 5)\).

F√ľr unsere Beispieldaten sind diese Voraussetzungen gegeben.

10.1.2 Hypothesen formulieren

Wir haben wieder zwei Möglichkeiten: die gerichtete und die ungerichtete Alternativhypothese.

10.1.2.1 Ungerichtete Alternativhypothese

Wir verzichten an dieser Stelle auf mathematische Notationen und w√ľrden bei ungerichteter Alternativhypothese im Klartext schreiben:

\[ \begin{aligned} H_0 &: \textrm{Es gibt keinen Zusammenhang zwischen Wohnort und Verweigerungsentscheidung.}\\ H_1 &: \textrm{Es gibt einen Zusammenhang zwischen Wohnort und Verweigerungsentscheidung.} \end{aligned} \]

10.1.2.2 Gerichtete Alternativhypothese

Im Falle einer gerichteten Alternativhypothese bleibt die Nullhypothese bestehen, aber die Alternativhypothese gibt eine bestimmte Richtung des Zusammenhangs vor.

\[ \begin{aligned} H_0 &: \textrm{Es gibt keinen Zusammenhang zwischen Wohnort und Verweigerungsentscheidung.}\\ H_1 &: \textrm{Es gibt einen positiven Zusammenhang zwischen Wohnort in der Stadt} \\ &\quad\textrm{und Kriegsdienstverweigerung.} \end{aligned} \]

Gerichtete Alternativhypothesen sind im \(\chi^2\)-Unabh√§ngigkeitstest nur f√ľr \(2\times2\)-Tabellen m√∂glich.

Im Beispiel entscheiden wir uns f√ľr die gerichtete Alternativhypothese, denn wir vermuten einen Zusammenhang in diese bestimmte Richtung.

10.1.3 Signifikanzniveau entscheiden

Wie in anderen Tests ist ein Signifikanzniveau von \(\alpha=0{,}05\) √ľblich, wof√ľr wir uns auch im Beispiel entscheiden.

10.1.4 Kritischen Wert bestimmen

Bei \(\chi^2\)-Tests gibt es immer nur einen kritischen Wert. Zun√§chst m√ľssen beim \(\chi^2\)-Unabh√§ngigkeitstest die Freiheitsgrade bestimmt werden mit der Formel:

\[ \mathit{df} = (k - 1) \cdot (\ell - 1) \tag{10.1} \]

wobei auch hier wieder \(k\) f√ľr die Zeilenanzahl und \(\ell\) f√ľr die Spaltenanzahl steht.

Im Beispiel also:

\[ \begin{aligned} \mathit{df} &= (k - 1) \cdot (\ell - 1)\\ &=(2-1)\cdot (2 - 1) = 1 \end{aligned} \]

Damit l√§sst sich der kritische Wert aus der Tabelle f√ľr \(\chi^2\)-Verteilungen ablesen, die allerdings f√ľr ungerichtete Alternativhypothesen ausgelegt ist.

H√§tten wir eine ungerichtete Alternativhypothese gew√§hlt, w√ľrde der Ablehnungsbereich also definiert durch:

\[ \begin{aligned} \chi^2 &\geq \chi^2_{df;(1-\alpha)}\\ \chi^2 &\geq \chi^2_{1;95\%}\\ \chi^2 &\geq 3{,}841 \end{aligned} \]

F√ľr unsere gerichtete Alternativhypothese d√ľrfen wir den Ablehnungsbereich jedoch verdoppeln (m√ľssen aber einem sp√§teren Schritt unbedingt auch pr√ľfen, ob die Richtung stimmt):

\[ \begin{aligned} \chi^2 &\geq \chi^2_{df;(1-2\cdot\alpha)}\\ \chi^2 &\geq \chi^2_{1;90\%}\\ \chi^2 &\geq 2{,}706 \end{aligned} \]

10.1.5 Pr√ľfgr√∂√üe berechnen

Wie in Sitzung 9 besprochen, wird die Pr√ľfgr√∂√üe \(\chi^2\) anhand der Formel

\[ \chi^2= \sum_{i=1}^{k}\sum_{j=1}^{\ell}\frac{(n_{ij}-m_{ij})^{2}}{m_{ij}} \tag{9.2} \]

errechnet. Dabei ist die Ermittlung der Randsummen und Erwartungswerte \(m_{ij}\) ein notwendiger Schritt, und auch die Teilwerte f√ľr \(\chi^2\) k√∂nnen wieder direkt in die Kreuztabelle eingetragen werden.

Tabelle 10.2: Kreuztabelle mit Erwartungswerten und Teilwerten f√ľr \(\chi^2\)
→ Dienst
Wohnort¬†‚Üď Grundwehrdienst Zivildienst
Land 18
(13,1)
1,833
11
(15,9)
1,51
29
Stadt 10
(14,9)
1,611
23
(18,1)
1,327
33
28 34 62

F√ľr unser Beispiel erfolgt die Berechnung anhand Tabelle¬†10.2.

Zun√§chst muss dabei gepr√ľft werden, ob die Richtung unserer Alternativhypothese stimmt. Die beobachtete H√§ufigkeit der Zivildienstleistenden in der Stadt \(n_{22}=23\) ist gr√∂√üer als der Erwartungswert \(m_{22}=18{,}1\). Wenn eine Signifikanz nachgewiesen werden kann, dann also f√ľr den positiven Zusammenhang zwischen Wohnort in der Stadt und Kriegsdienstverweigerung (wie in unserer Alternativhypothese spezifiziert).

F√ľr \(\chi^2\) ergibt sich im Beispiel:

\[ \begin{aligned} \chi^2 &= \sum_{i=1}^{k}\sum_{j=1}^{\ell}\frac{(n_{ij}-m_{ij})^{2}}{m_{ij}}\\[4pt] &=1{,}833+1{,}51+1{,}611+1{,}327\\ &=6{,}281 \end{aligned} \]

10.1.6 Ergebnis interpretieren

Der Wert der Pr√ľfgr√∂√üe \(\chi^2=6{,}281\) liegt deutlich im Ablehnungsbereich \(\chi^2\geq 2{,}706\). Die Nullhypothese kann abgelehnt werden. Es wurde ein statistisch signifikanter positiver Zusammenhang zwischen Wohnort in Gemeinden mit √ľber 20¬†000 Einwohner*innen und Kriegsdienstverweigerung festgestellt (\(\alpha=0{,}05\)).

Softwarehinweis
In R l√§sst sich ein \(\chi^2\)-Unabh√§ngigkeitstest mit dem Befehl chisq.test() durchf√ľhren.

10.2 ūĚúí¬≤-Anpassungstest

Beim \(\chi^2\)-Anpassungstest geht es um die H√§ufigkeiten eines nominalskalierten Merkmals ‚Äď er ist deshalb der univariaten Teststatistik zuzuordnen. Der Test √ľberpr√ľft, ob das Merkmal entlang einer vorgegebenen Verteilung (im Normalfall gleichm√§√üig) verteilt ist, oder ob es signifikante Abweichungen von dieser erwarteten Verteilung gibt.

Ein Beispiel: F√ľr gr√∂√üere Versp√§tungen (\(\geq\) 10 Minuten) beim √ĖPNV einer Gro√üstadt wird festgehalten, an welchen Wochentagen sie auftreten. Wir ignorieren Wochenenden und Feiertage und fragen uns, ob sich die Verz√∂gerungen gleichm√§√üig auf Werktage verteilen, oder ob es signifikante Abweichungen in Bezug auf den Wochentag gibt. Die Werte in Tabelle¬†10.3 seien √ľber drei Monate hinweg erhoben worden.

Tabelle 10.3: Beispielwerte f√ľr Versp√§tungen nach Wochentagen
Montag Dienstag Mittwoch Donnerstag Freitag
459 409 414 387 437

Wir befolgen wieder die sechs Schritte f√ľr statistische Testverfahren.

10.2.1 Test w√§hlen und Voraussetzungen pr√ľfen

F√ľr den \(\chi^2\)-Anpassungstest m√ľssen folgende Voraussetzungen erf√ľllt sein:

  • Ziel ist die √úberpr√ľfung einer nominalskalierten Variable auf eine statistisch signifikante Abweichung von einer vorgegebenen Verteilung.
  • Grundlage sind beobachtete H√§ufigkeiten aus einer einfachen, unabh√§ngigen Zufallsstichprobe.
  • Alle Tabellenfelder enthalten beobachtete H√§ufigkeiten \((n_{i}\geq 5)\).

In unserem Beispiel sind diese Voraussetzungen gegeben.

10.2.2 Hypothesen formulieren

\[\begin{aligned} H_0 &: \textrm{Starke Verspätungen sind an allen Werktagen gleich wahrscheinlich.}\\ H_1 &: \textrm{Starke Verspätungen sind an manchen Werktagen wahrscheinlicher als an anderen.} \end{aligned}\]

Gerichtete Hypothesen d√ľrften hier wieder nur bei dichotomen Variablen formuliert werden (also bei genau zwei Tabellenfeldern) ‚Äď denn sonst k√∂nnen wir die Richtung der Vermutung nicht genau genug formulieren.

10.2.3 Signifikanzniveau entscheiden

Wie gewohnt: \(\alpha=0{,}05\)

10.2.4 Kritischen Wert bestimmen

Die Freiheitsgrade bestimmen sich aus

\[ \mathit{df}=k-1 \tag{10.2} \]

wobei \(k\) hier einfach die Anzahl der Katorien ist.

In unserem Beispiel (bei f√ľnf Werktagen) also:

\[ \begin{aligned} \mathit{df}&=k-1\\ &=5-1=4 \end{aligned} \]

Der kritische Wert f√ľr den Ablehnungsbereich ist der Tabelle f√ľr \(\chi^2\)-Verteilungen zu entnehmen.

\[ \begin{aligned} \chi^2 &\geq \chi^2_{\mathit{df};(1-\alpha)}\\ \chi^2 &\geq \chi^2_{4;95\%}\\ \chi^2 &\geq 9{,}488 \end{aligned} \]

Auch hier d√ľrften wir bei einer gerichteten Hypothese den Ablehnungsbereich verdoppeln, d.¬†h. der kritische Wert \(\chi^2_{\mathit{df};(1-2\cdot \alpha)}\) w√§re anzuwenden ‚Äď dies ist allerdings wie bereits erw√§hnt nur f√ľr dichotome Variablen m√∂glich.

10.2.5 Pr√ľfgr√∂√üe berechnen

Die Pr√ľfgr√∂√üe \(\chi^2\) berechnet sich analog zu vorherigen Beispielen. Einzige Besonderheit: Die Erwartungswerte werden direkt anhand der zu erwartenden (im unserem Fall: gleichm√§√üigen) Verteilung bestimmt.

Im Beispiel ergibt sich in den f√ľnf Kategorien jeweils ein Erwartungswert von

\[\frac{n}{k}=\frac{2106}{5}=421{,}2\]

Tabelle 10.4: Tabelle f√ľr den \(\chi^2\)-Anpassungstest
Montag Dienstag Mittwoch Donnerstag Freitag
459
(421,2)
3,392
409
(421,2)
0,353
414
(421,2)
0,123
387
(421,2)
2,777
437
(421,2)
0,593
2106

Dann nehmen wir wieder eine Tabelle zu Hilfe um die Pr√ľfgr√∂√üe \(\chi^2\) zu berechnen (s. Tabelle¬†10.4). Wie gehabt werden einfach die Teilwerte zusammengez√§hlt:

\[ \begin{aligned} \chi^2 &= \sum_{i=1}^{k}\frac{(n_{i}-m_{i})^{2}}{m_{i}}\\[4pt] &\approx 3{,}392 + 0{,}353 + 0{,}123 + 2{,}777 + 0{,}593\\ &=7{,}238 \end{aligned} \]

10.2.6 Ergebnis interpretieren

Der Ablehnungsbereich \(\chi^2 \geq 9{,}488\) wurde nicht erreicht. Die Nullhypothese muss beibehalten werden. Eine statistisch signifikante Abweichung von einer gleichmäßigen Verteilung konnte nicht nachgewiesen werden (\(\alpha=0{,}05\)).

Softwarehinweis
Mit einer univariaten Verteilung als Eingabe f√ľhrt der Befehl chisq.test() einen \(\chi^2\)-Anpassungstest durch.

10.2.7 Andere Verteilungen

Die theoretische Verteilung, von der eine signifikante Abweichung festgestellt werden soll, ist im obigen Beispiel uniform, d.¬†h. die Erwartungswerte sind gleichm√§√üig √ľber die Wochentage verteilt. Allerdings kann beim Anpassungstest auch von anderen Verteilungen ausgegangen werden ‚Äď so k√∂nnte eine (begr√ľndete) Nullhypothese auch lauten, dass Kategorie A doppelt so viele Fallzahlen aufweist wie Kategorie B und C.

In der Praxis wird der \(\chi^2\)-Anpassungstest oft verwendet, um nachzuweisen, dass keine signifikante Abweichung von der Normalverteilung zu beobachten ist ‚Äď nur dann d√ľrfen n√§mlich viele statistische Verfahren durchgef√ľhrt werden.

Tipps zur Vertiefung

  • Kapitel 9 in Bortz und Schuster (2010)
  • Kapitel 8.2.7 in Lange und Nipper (2018) (\(\chi^2\)-Anpassungstest)
  • Kapitel 5.3.4 in Bahrenberg, Giese und Nipper (2010)
  • Kapitel 13 in Klemm (2002)
  • Englisch: Kapitel 11.3 in Burt und Barber (1996)

√úbungsaufgaben

10.2.8 Aufgabe 10-1

zur Lösung

Bestimmen Sie die folgenden Werte:

  1. \(\chi^2_{80;99{,}95\%}\)
  2. \(\chi^2_{3;70\%}\)
  3. \(\chi^2_{19;60\%}\)
  4. \(\chi^2_{400;85\%}\)
  5. \(\chi^2_{90;99{,}9\%}\)
  6. \(\chi^2_{15;99{,}5\%}\)
  7. \(\chi^2_{110;97{,}5\%}\)
  8. \(\chi^2_{14;80\%}\)

10.2.9 Aufgabe 10-2

zur Lösung

Sie sollen untersuchen, ob in einem Unternehmen der Tätigkeitsbereich mit dem Geschlecht der Angestellten zusammenhängt.

In den Personalakten sind Angestellte als weiblich oder männlich erfasst und ihre Tätigkeitsfelder in Leitende Tätigkeit, Administration und Fertigung unterteilt.

Folgende Häufigkeiten sind erfasst:

Leitende Tätigkeit Administration Fertigung
weiblich 38 185 397
männlich 102 290 888
  1. Welchen Test f√ľhren Sie durch?

  2. Formulieren Sie die Hypothesen.

  3. Das Thema wird in der Unternehmensleitung bereits kontrovers diskutiert, weshalb Sie einen Fehler 1. Art zu 99% ausschließen möchten. Wie lautet das Signifikanzniveau?

  4. Bestimmen Sie die Freiheitsgrade und den kritischen Wert.

  5. Berechnen Sie die Pr√ľfgr√∂√üe.

  6. Wie interpretieren Sie das Ergebnis?

  7. Der Aufsichtsratsvorsitzende kritisiert die Studie in einem Interview:

    Dass im Betrieb nur etwa die H√§lfte der F√ľhrungskr√§fte Frauen sind, ist nicht weiter verwunderlich. Schlie√ülich arbeiten insgesamt doppelt so viele M√§nner wie Frauen bei uns. Daf√ľr h√§tte ich keine wissenschaftliche Untersuchung gebraucht.

    Wie antworten Sie (aus methodischer Perspektive) auf die Kritik am Testverfahren?

10.2.10 Aufgabe 10-3

zur Lösung

Eine Ihrer Bekannten behauptet, dass beim Elfmeterschie√üen ‚Äď statistisch gesehen ‚Äď das Team h√§ufiger gewinnt, das den ersten Elfmeter ausf√ľhrt.

Sie m√∂chten das empirisch √ľberpr√ľfen und schauen sich Archivmaterial von siebzig Fu√üballpartien an, die durch Elfmeterschie√üen entschieden wurden. Tats√§chlich stellen Sie fest, dass in genau 60% der F√§lle das zuerst ausf√ľhrende Team gewann.

Pr√ľfen Sie, ob diese Beobachtung auch statistisch relevant ist. W√§hlen Sie 5% als Signifikanzniveau.

10.2.11 Aufgabe 10-4

zur Lösung

Sie f√ľhren eine Untersuchung zum Konsumverhalten von Studierenden mit und ohne Nebenjob in Hinblick auf Bio-Produkte durch. Eine Umfrage ergibt folgendes Ergebnis:

→ Tätigkeit
Bio-Kaufverhalten¬†‚Üď mit Nebenjob ohne Nebenjob
regelmäßiger Kauf 141 70
kein regelmäßiger Kauf 253 149
  1. √úberpr√ľfen Sie anhand dieser Daten, ob ein signifikanter positiver Zusammenhang zwischen der Aus√ľbung eines Nebenjobs und dem regelm√§√üigen Konsum von Bio-Produkten besteht. W√§hlen Sie 0,05 als Signifikanzniveau.

  2. Berechnen Sie eine Kennzahl, die aussagt, wie stark der Zusammenhang ausfällt.

10.2.12 Aufgabe 10-5

zur Lösung

Das Global Volcanism Program des Smithsonian Institute (2021) stellt eine Datenbank f√ľr Vulkanaktivit√§ten zur Verf√ľgung. In Indonesien wurden f√ľr die Jahre 1919 bis inklusive 2018 insgesamt 643 Ausbr√ľche aufgezeichnet, f√ľr die der Monat erfasst ist, in dem die Aktivit√§t begann. Die Verteilung aller Ausbr√ľche auf Monate ist in der folgenden Grafik festgehalten:

Pr√ľfen Sie, ob bei einem Signifikanzniveau von 1% ein systematischer Zusammenhang zwischen Monat und Zahl der Ausbr√ľche vorliegt.

Quellenverzeichnis

Bahrenberg, Gerhard, Ernst Giese und Josef Nipper. 2010. Statistische Methoden in der Geographie. Bd. 1. Univariate und bivariate Statistik. Stuttgart: Bornträger.
Bortz, J√ľrgen und Christof Schuster. 2010. Statistik f√ľr Human- und Sozialwissenschaftler. Berlin: Springer.
Burt, James E. und Gerald M. Barber. 1996. Elementary statistics for geographers. 2nd ed. New York: Guilford Press.
Klemm, Elmar. 2002. Einf√ľhrung in die Statistik. F√ľr die Sozialwissenschaften. Wiesbaden: Westdeutscher Verlag.
Lange, Norbert de und Josef Nipper. 2018. Quantitative Methodik in der Geographie. UTB Geographie, Methoden, Statistische Verfahren 4933. Paderborn: Ferdinand Schöningh.
Smithsonian Institute. 2021. Global Volcanism Program. https://volcano.si.edu/.

  1. Hier wird also eine verh√§ltnisskalierte Variable (Bev√∂lkerungszahl der Gemeinde) in eine nominalskalierte Variable transformiert. In F√§llen wie diesen, wo die Variable nach der Transformation nur zwei Werte annehmen kann, sprechen wir auch von der Dichotomisierung einer Variable.‚Ü©Ôłé