Sitzung 10 𝜒²-Tests
Lernziele dieser Sitzung
Sie können…
- einen \(\chi^2\)-Unabhängigkeitstest durchführen.
- einen \(\chi^2\)-Anpassungstest durchführen.
Lernvideos (Sommersemester 2020)
- 10a) \(\chi^2\)-Unabhängigkeitstest
- 10a) \(\chi^2\)-Anpassungstest
- Der Hinweis am Ende auf die Vorbereitungssitzung ist natürlich nicht mehr aktuell. Wir treffen uns am 29. Juni und am 6. Juli 2021 zur Klausurvorbereitung.
Anwendungsbereich
In Sitzung 9 haben wir gelernt, wie für bivariate Verteilungen Korrelationen beschrieben werden können, wenn beide Variablen nominalskaliert sind. Grundlage dafür waren die Häufigkeiten von Wertekombinationen in der Kreuztabelle.
Auch für \(\chi^2\)-Tests sind beobachtete Häufigkeiten in einer Kreuztabelle unser Ausgangspunkt. Wir fragen jedoch nicht nach einem Kennwert für die Stärke der Korrelation, sondern wollen wissen, ob es einen statistisch signifikanten Zusammenhang zwischen den beiden Variablen gibt – also einen Zusammenhang, der höchstens mit einer Wahrscheinlichkeit \(\alpha\) (Signifikanzniveau) zufällig zustande gekommen sein kann.
Um den Unterschied zu verdeutlichen: Bei sehr großen Fallzahlen kann auch eine leichte Korrelation statistisch signifikant sein, bei kleinen Fallzahlen wird es es selbst für starke Korrelationen schwierig, eine statistische Signifikanz nachzuweisen.
Mit dem \(\chi^2\)-Unabhängigkeitstest und dem \(\chi^2\)-Anpassungstest lernen wir im Folgenden zwei unterschiedliche Varianten des \(\chi^2\)-Tests kennen. Beide sollen direkt an Beispielen ausgeführt werden.
10.1 𝜒²-Unabhängigkeitstest
Grundlage sind bivariate Häufigkeiten, die in einer Kreuztabelle dargestellt werden können (s. Tabelle 10.1). Wie Kreuztabellen erstellt werden, haben wir bereits in Sitzung 9 behandelt.
Wohnort ↓ | Grundwehrdienst | Zivildienst |
---|---|---|
Land | 18 | 11 |
Stadt | 10 | 23 |
Unser Beispieldatensatz beschäftigt sich mit Kriegsdienstverweigerern. Zwischen 1956 und 2011 galt in der BRD die Wehrpflicht, d. h. alle vom Staat als männlich
erfassten und als tauglich
gemusterte jungen Menschen mussten Dienst an der Waffe leisten – es sei denn, sie verweigerten den Kriegsdienst und leisteten stattdessen Zivildienst (z. B. in sozialen Einrichtungen).
Zusätzlich zur Frage der Kriegsdienstverweigerung sei in einer Zufallsstichprobe von als tauglich gemusterten erhoben, ob der Wohnort eine Gemeinde mit über oder unter 20 000 Einwohner*innen (Stadt
oder Land
) ist.5 Die Ergebnisse sind in Tabelle 10.1 zusammengefasst.
Wir interessieren uns für den statistischen Zusammenhang dieser beiden Variablen, und zwar möchten wir die Hypothese prüfen, dass Menschen aus der Stadt eher den Kriegsdienst verweigerten als Menschen vom Land. Der Test wird entlang der bekannten sechs Schritte ausgeführt.
10.1.1 Test wählen und Voraussetzungen prüfen
Für den \(\chi^2\)-Unabhängigkeitstest müssen folgende Voraussetzungen erfüllt sein:
- Ziel ist die Überprüfung einer bivariaten Verteilung auf einen statistisch signifikanten Zusammenhang zwischen zwei nominalskalierten Variablen.
- Grundlage sind beobachtete Häufigkeiten aus einer einfachen, unabhängigen Zufallsstichprobe.
- Alle Tabellenfelder enthalten beobachtete Häufigkeiten \((n_{ij}\geq 5)\).
Für unsere Beispieldaten sind diese Voraussetzungen gegeben.
10.1.2 Hypothesen formulieren
Wir haben wieder zwei Möglichkeiten: die gerichtete und die ungerichtete Alternativhypothese.
10.1.2.1 Ungerichtete Alternativhypothese
Wir verzichten an dieser Stelle auf mathematische Notationen und würden bei ungerichteter Alternativhypothese im Klartext schreiben:
\[ \begin{aligned} H_0 &: \textrm{Es gibt keinen Zusammenhang zwischen Wohnort und Verweigerungsentscheidung.}\\ H_1 &: \textrm{Es gibt einen Zusammenhang zwischen Wohnort und Verweigerungsentscheidung.} \end{aligned} \]
10.1.2.2 Gerichtete Alternativhypothese
Im Falle einer gerichteten Alternativhypothese bleibt die Nullhypothese bestehen, aber die Alternativhypothese gibt eine bestimmte Richtung des Zusammenhangs vor.
\[ \begin{aligned} H_0 &: \textrm{Es gibt keinen Zusammenhang zwischen Wohnort und Verweigerungsentscheidung.}\\ H_1 &: \textrm{Es gibt einen positiven Zusammenhang zwischen Wohnort in der Stadt} \\ &\quad\textrm{und Kriegsdienstverweigerung.} \end{aligned} \]
Gerichtete Alternativhypothesen sind im \(\chi^2\)-Unabhängigkeitstest nur für \(2\times2\)-Tabellen möglich.
Im Beispiel entscheiden wir uns für die gerichtete Alternativhypothese, denn wir vermuten einen Zusammenhang in diese bestimmte Richtung.
10.1.3 Signifikanzniveau entscheiden
Wie in anderen Tests ist ein Signifikanzniveau von \(\alpha=0{,}05\) üblich, wofür wir uns auch im Beispiel entscheiden.
10.1.4 Kritischen Wert bestimmen
Bei \(\chi^2\)-Tests gibt es immer nur einen kritischen Wert. Zunächst müssen beim \(\chi^2\)-Unabhängigkeitstest die Freiheitsgrade bestimmt werden mit der Formel:
\[ \mathit{df} = (k - 1) \cdot (\ell - 1) \tag{10.1} \]
wobei auch hier wieder \(k\) für die Zeilenanzahl und \(\ell\) für die Spaltenanzahl steht.
Im Beispiel also:
\[ \begin{aligned} \mathit{df} &= (k - 1) \cdot (\ell - 1)\\ &=(2-1)\cdot (2 - 1) = 1 \end{aligned} \]
Damit lässt sich der kritische Wert aus der Tabelle für \(\chi^2\)-Verteilungen ablesen, die allerdings für ungerichtete Alternativhypothesen ausgelegt ist.
Hätten wir eine ungerichtete Alternativhypothese gewählt, würde der Ablehnungsbereich also definiert durch:
\[ \begin{aligned} \chi^2 &\geq \chi^2_{df;(1-\alpha)}\\ \chi^2 &\geq \chi^2_{1;95\%}\\ \chi^2 &\geq 3{,}841 \end{aligned} \]
Für unsere gerichtete Alternativhypothese dürfen
wir den Ablehnungsbereich jedoch verdoppeln (müssen aber einem späteren Schritt unbedingt auch prüfen, ob die Richtung stimmt):
\[ \begin{aligned} \chi^2 &\geq \chi^2_{df;(1-2\cdot\alpha)}\\ \chi^2 &\geq \chi^2_{1;90\%}\\ \chi^2 &\geq 2{,}706 \end{aligned} \]
10.1.5 Prüfgröße berechnen
Wie in Sitzung 9 besprochen, wird die Prüfgröße \(\chi^2\) anhand der Formel
\[ \chi^2= \sum_{i=1}^{k}\sum_{j=1}^{\ell}\frac{(n_{ij}-m_{ij})^{2}}{m_{ij}} \tag{9.2} \]
errechnet. Dabei ist die Ermittlung der Randsummen und Erwartungswerte \(m_{ij}\) ein notwendiger Schritt, und auch die Teilwerte für \(\chi^2\) können wieder direkt in die Kreuztabelle eingetragen werden.
Wohnort ↓ | Grundwehrdienst | Zivildienst | |
---|---|---|---|
Land |
18 (13,1) 1,833 |
11 (15,9) 1,51 |
29 |
Stadt |
10 (14,9) 1,611 |
23 (18,1) 1,327 |
33 |
28 | 34 | 62 |
Für unser Beispiel erfolgt die Berechnung anhand Tabelle 10.2.
Zunächst muss dabei geprüft werden, ob die Richtung unserer Alternativhypothese stimmt. Die beobachtete Häufigkeit der Zivildienstleistenden in der Stadt \(n_{22}=23\) ist größer als der Erwartungswert \(m_{22}=18{,}1\). Wenn eine Signifikanz nachgewiesen werden kann, dann also für den positiven Zusammenhang zwischen Wohnort in der Stadt und Kriegsdienstverweigerung (wie in unserer Alternativhypothese spezifiziert).
Für \(\chi^2\) ergibt sich im Beispiel:
\[ \begin{aligned} \chi^2 &= \sum_{i=1}^{k}\sum_{j=1}^{\ell}\frac{(n_{ij}-m_{ij})^{2}}{m_{ij}}\\[4pt] &=1{,}833+1{,}51+1{,}611+1{,}327\\ &=6{,}281 \end{aligned} \]
10.1.6 Ergebnis interpretieren
Der Wert der Prüfgröße \(\chi^2=6{,}281\) liegt deutlich im Ablehnungsbereich \(\chi^2\geq 2{,}706\). Die Nullhypothese kann abgelehnt werden. Es wurde ein statistisch signifikanter positiver Zusammenhang zwischen Wohnort in Gemeinden mit über 20 000 Einwohner*innen und Kriegsdienstverweigerung festgestellt (\(\alpha=0{,}05\)).
chisq.test()
durchführen.
10.2 𝜒²-Anpassungstest
Beim \(\chi^2\)-Anpassungstest geht es um die Häufigkeiten eines nominalskalierten Merkmals – er ist deshalb der univariaten Teststatistik zuzuordnen. Der Test überprüft, ob das Merkmal entlang einer vorgegebenen Verteilung (im Normalfall gleichmäßig) verteilt ist, oder ob es signifikante Abweichungen von dieser erwarteten Verteilung gibt.
Ein Beispiel: Für größere Verspätungen (\(\geq\) 10 Minuten) beim ÖPNV einer Großstadt wird festgehalten, an welchen Wochentagen sie auftreten. Wir ignorieren Wochenenden und Feiertage und fragen uns, ob sich die Verzögerungen gleichmäßig auf Werktage verteilen, oder ob es signifikante Abweichungen in Bezug auf den Wochentag gibt. Die Werte in Tabelle 10.3 seien über drei Monate hinweg erhoben worden.
Montag | Dienstag | Mittwoch | Donnerstag | Freitag |
---|---|---|---|---|
459 | 409 | 414 | 387 | 437 |
Wir befolgen wieder die sechs Schritte für statistische Testverfahren.
10.2.1 Test wählen und Voraussetzungen prüfen
Für den \(\chi^2\)-Anpassungstest müssen folgende Voraussetzungen erfüllt sein:
- Ziel ist die Überprüfung einer nominalskalierten Variable auf eine statistisch signifikante Abweichung von einer vorgegebenen Verteilung.
- Grundlage sind beobachtete Häufigkeiten aus einer einfachen, unabhängigen Zufallsstichprobe.
- Alle Tabellenfelder enthalten beobachtete Häufigkeiten \((n_{i}\geq 5)\).
In unserem Beispiel sind diese Voraussetzungen gegeben.
10.2.2 Hypothesen formulieren
\[\begin{aligned} H_0 &: \textrm{Starke Verspätungen sind an allen Werktagen gleich wahrscheinlich.}\\ H_1 &: \textrm{Starke Verspätungen sind an manchen Werktagen wahrscheinlicher als an anderen.} \end{aligned}\]
Gerichtete Hypothesen dürften hier wieder nur bei dichotomen Variablen formuliert werden (also bei genau zwei Tabellenfeldern) – denn sonst können wir die Richtung der Vermutung nicht genau genug formulieren.
10.2.4 Kritischen Wert bestimmen
Die Freiheitsgrade bestimmen sich aus
\[ \mathit{df}=k-1 \tag{10.2} \]
wobei \(k\) hier einfach die Anzahl der Katorien ist.
In unserem Beispiel (bei fünf Werktagen) also:
\[ \begin{aligned} \mathit{df}&=k-1\\ &=5-1=4 \end{aligned} \]
Der kritische Wert für den Ablehnungsbereich ist der Tabelle für \(\chi^2\)-Verteilungen zu entnehmen.
\[ \begin{aligned} \chi^2 &\geq \chi^2_{\mathit{df};(1-\alpha)}\\ \chi^2 &\geq \chi^2_{4;95\%}\\ \chi^2 &\geq 9{,}488 \end{aligned} \]
Auch hier dürften wir bei einer gerichteten Hypothese den Ablehnungsbereich verdoppeln, d. h. der kritische Wert \(\chi^2_{\mathit{df};(1-2\cdot \alpha)}\) wäre anzuwenden – dies ist allerdings wie bereits erwähnt nur für dichotome Variablen möglich.
10.2.5 Prüfgröße berechnen
Die Prüfgröße \(\chi^2\) berechnet sich analog zu vorherigen Beispielen. Einzige Besonderheit: Die Erwartungswerte werden direkt anhand der zu erwartenden (im unserem Fall: gleichmäßigen) Verteilung bestimmt.
Im Beispiel ergibt sich in den fünf Kategorien jeweils ein Erwartungswert von
\[\frac{n}{k}=\frac{2106}{5}=421{,}2\]
Montag | Dienstag | Mittwoch | Donnerstag | Freitag | |
---|---|---|---|---|---|
459 (421,2) 3,392 |
409 (421,2) 0,353 |
414 (421,2) 0,123 |
387 (421,2) 2,777 |
437 (421,2) 0,593 |
2106 |
Dann nehmen wir wieder eine Tabelle zu Hilfe um die Prüfgröße \(\chi^2\) zu berechnen (s. Tabelle 10.4). Wie gehabt werden einfach die Teilwerte zusammengezählt:
\[ \begin{aligned} \chi^2 &= \sum_{i=1}^{k}\frac{(n_{i}-m_{i})^{2}}{m_{i}}\\[4pt] &\approx 3{,}392 + 0{,}353 + 0{,}123 + 2{,}777 + 0{,}593\\ &=7{,}238 \end{aligned} \]
10.2.6 Ergebnis interpretieren
Der Ablehnungsbereich \(\chi^2 \geq 9{,}488\) wurde nicht erreicht. Die Nullhypothese muss beibehalten werden. Eine statistisch signifikante Abweichung von einer gleichmäßigen Verteilung konnte nicht nachgewiesen werden (\(\alpha=0{,}05\)).
chisq.test()
einen \(\chi^2\)-Anpassungstest durch.
10.2.7 Andere Verteilungen
Die theoretische Verteilung, von der eine signifikante Abweichung festgestellt werden soll, ist im obigen Beispiel uniform, d. h. die Erwartungswerte sind gleichmäßig über die Wochentage verteilt. Allerdings kann beim Anpassungstest auch von anderen Verteilungen ausgegangen werden – so könnte eine (begründete) Nullhypothese auch lauten, dass Kategorie A doppelt so viele Fallzahlen aufweist wie Kategorie B und C.
In der Praxis wird der \(\chi^2\)-Anpassungstest oft verwendet, um nachzuweisen, dass keine signifikante Abweichung von der Normalverteilung zu beobachten ist – nur dann dürfen nämlich viele statistische Verfahren durchgeführt werden.
Übungsaufgaben
10.2.8 Aufgabe 10-1
Bestimmen Sie die folgenden Werte:
- \(\chi^2_{80;99{,}95\%}\)
- \(\chi^2_{3;70\%}\)
- \(\chi^2_{19;60\%}\)
- \(\chi^2_{400;85\%}\)
- \(\chi^2_{90;99{,}9\%}\)
- \(\chi^2_{15;99{,}5\%}\)
- \(\chi^2_{110;97{,}5\%}\)
- \(\chi^2_{14;80\%}\)
10.2.9 Aufgabe 10-2
Sie sollen untersuchen, ob in einem Unternehmen der Tätigkeitsbereich mit dem Geschlecht der Angestellten zusammenhängt.
In den Personalakten sind Angestellte als weiblich
oder männlich
erfasst und ihre Tätigkeitsfelder in Leitende Tätigkeit
, Administration
und Fertigung
unterteilt.
Folgende Häufigkeiten sind erfasst:
Leitende Tätigkeit | Administration | Fertigung | |
---|---|---|---|
weiblich | 38 | 185 | 397 |
männlich | 102 | 290 | 888 |
Welchen Test führen Sie durch?
Formulieren Sie die Hypothesen.
Das Thema wird in der Unternehmensleitung bereits kontrovers diskutiert, weshalb Sie einen Fehler 1. Art zu 99% ausschließen möchten. Wie lautet das Signifikanzniveau?
Bestimmen Sie die Freiheitsgrade und den kritischen Wert.
Berechnen Sie die Prüfgröße.
Wie interpretieren Sie das Ergebnis?
Der Aufsichtsratsvorsitzende kritisiert die Studie in einem Interview:
Dass im Betrieb nur etwa die Hälfte der Führungskräfte Frauen sind, ist nicht weiter verwunderlich. Schließlich arbeiten insgesamt doppelt so viele Männer wie Frauen bei uns. Dafür hätte ich keine wissenschaftliche Untersuchung gebraucht.
Wie antworten Sie (aus methodischer Perspektive) auf die Kritik am Testverfahren?
10.2.10 Aufgabe 10-3
Eine Ihrer Bekannten behauptet, dass beim Elfmeterschießen – statistisch gesehen
– das Team häufiger gewinnt, das den ersten Elfmeter ausführt.
Sie möchten das empirisch überprüfen und schauen sich Archivmaterial von siebzig Fußballpartien an, die durch Elfmeterschießen entschieden wurden. Tatsächlich stellen Sie fest, dass in genau 60% der Fälle das zuerst ausführende Team gewann.
Prüfen Sie, ob diese Beobachtung auch statistisch relevant ist. Wählen Sie 5% als Signifikanzniveau.
10.2.11 Aufgabe 10-4
Sie führen eine Untersuchung zum Konsumverhalten von Studierenden mit und ohne Nebenjob in Hinblick auf Bio-Produkte durch. Eine Umfrage ergibt folgendes Ergebnis:
Bio-Kaufverhalten ↓ | mit Nebenjob | ohne Nebenjob |
---|---|---|
regelmäßiger Kauf | 141 | 70 |
kein regelmäßiger Kauf | 253 | 149 |
Überprüfen Sie anhand dieser Daten, ob ein signifikanter positiver Zusammenhang zwischen der Ausübung eines Nebenjobs und dem regelmäßigen Konsum von Bio-Produkten besteht. Wählen Sie 0,05 als Signifikanzniveau.
Berechnen Sie eine Kennzahl, die aussagt, wie stark der Zusammenhang ausfällt.
10.2.12 Aufgabe 10-5
Das Global Volcanism Program des Smithsonian Institute (2021) stellt eine Datenbank für Vulkanaktivitäten zur Verfügung. In Indonesien wurden für die Jahre 1919 bis inklusive 2018 insgesamt 643 Ausbrüche aufgezeichnet, für die der Monat erfasst ist, in dem die Aktivität begann. Die Verteilung aller Ausbrüche auf Monate ist in der folgenden Grafik festgehalten:
Prüfen Sie, ob bei einem Signifikanzniveau von 1% ein systematischer Zusammenhang zwischen Monat und Zahl der Ausbrüche vorliegt.
Quellenverzeichnis
Hier wird also eine verhältnisskalierte Variable (Bevölkerungszahl der Gemeinde) in eine nominalskalierte Variable transformiert. In Fällen wie diesen, wo die Variable nach der Transformation nur zwei Werte annehmen kann, sprechen wir auch von der
Dichotomisierung
einer Variable.↩︎