Sitzung 10 𝜒²-Tests

Lernziele dieser Sitzung

Sie können…

  • einen \(\chi^2\)-Unabhängigkeitstest durchführen.
  • einen \(\chi^2\)-Anpassungstest durchführen.

Lernvideos (Sommersemester 2020)

Anwendungsbereich

In Sitzung 9 haben wir gelernt, wie für bivariate Verteilungen Korrelationen beschrieben werden können, wenn beide Variablen nominalskaliert sind. Grundlage dafür waren die Häufigkeiten von Wertekombinationen in der Kreuztabelle.

Auch für \(\chi^2\)-Tests sind beobachtete Häufigkeiten in einer Kreuztabelle unser Ausgangspunkt. Wir fragen jedoch nicht nach einem Kennwert für die Stärke der Korrelation, sondern wollen wissen, ob es einen statistisch signifikanten Zusammenhang zwischen den beiden Variablen gibt – also einen Zusammenhang, der höchstens mit einer Wahrscheinlichkeit \(\alpha\) (Signifikanzniveau) zufällig zustande gekommen sein kann.

Um den Unterschied zu verdeutlichen: Bei sehr großen Fallzahlen kann auch eine leichte Korrelation statistisch signifikant sein, bei kleinen Fallzahlen wird es es selbst für starke Korrelationen schwierig, eine statistische Signifikanz nachzuweisen.

Mit dem \(\chi^2\)-Unabhängigkeitstest und dem \(\chi^2\)-Anpassungstest lernen wir im Folgenden zwei unterschiedliche Varianten des \(\chi^2\)-Tests kennen. Beide sollen direkt an Beispielen ausgeführt werden.

10.1 𝜒²-Unabhängigkeitstest

Grundlage sind bivariate Häufigkeiten, die in einer Kreuztabelle dargestellt werden können (s. Tabelle 10.1). Wie Kreuztabellen erstellt werden, haben wir bereits in Sitzung 9 behandelt.

Tabelle 10.1: Kreuztabelle der Beispieldaten
→ Dienst
Wohnort ↓ Grundwehrdienst Zivildienst
Land 18 11
Stadt 10 23

Unser Beispieldatensatz beschäftigt sich mit Kriegsdienstverweigerern. Zwischen 1956 und 2011 galt in der BRD die Wehrpflicht, d. h. alle vom Staat als männlich erfassten und als tauglich gemusterte jungen Menschen mussten Dienst an der Waffe leisten – es sei denn, sie verweigerten den Kriegsdienst und leisteten stattdessen Zivildienst (z. B. in sozialen Einrichtungen).

Zusätzlich zur Frage der Kriegsdienstverweigerung sei in einer Zufallsstichprobe von als tauglich gemusterten erhoben, ob der Wohnort eine Gemeinde mit über oder unter 20 000 Einwohner*innen (Stadt oder Land) ist.5 Die Ergebnisse sind in Tabelle 10.1 zusammengefasst.

Wir interessieren uns für den statistischen Zusammenhang dieser beiden Variablen, und zwar möchten wir die Hypothese prüfen, dass Menschen aus der Stadt eher den Kriegsdienst verweigerten als Menschen vom Land. Der Test wird entlang der bekannten sechs Schritte ausgeführt.

10.1.1 Test wählen und Voraussetzungen prüfen

Für den \(\chi^2\)-Unabhängigkeitstest müssen folgende Voraussetzungen erfüllt sein:

  • Ziel ist die Überprüfung einer bivariaten Verteilung auf einen statistisch signifikanten Zusammenhang zwischen zwei nominalskalierten Variablen.
  • Grundlage sind beobachtete Häufigkeiten aus einer einfachen, unabhängigen Zufallsstichprobe.
  • Alle Tabellenfelder enthalten beobachtete Häufigkeiten \((n_{ij}\geq 5)\).

Für unsere Beispieldaten sind diese Voraussetzungen gegeben.

10.1.2 Hypothesen formulieren

Wir haben wieder zwei Möglichkeiten: die gerichtete und die ungerichtete Alternativhypothese.

10.1.2.1 Ungerichtete Alternativhypothese

Wir verzichten an dieser Stelle auf mathematische Notationen und würden bei ungerichteter Alternativhypothese im Klartext schreiben:

\[ \begin{aligned} H_0 &: \textrm{Es gibt keinen Zusammenhang zwischen Wohnort und Verweigerungsentscheidung.}\\ H_1 &: \textrm{Es gibt einen Zusammenhang zwischen Wohnort und Verweigerungsentscheidung.} \end{aligned} \]

10.1.2.2 Gerichtete Alternativhypothese

Im Falle einer gerichteten Alternativhypothese bleibt die Nullhypothese bestehen, aber die Alternativhypothese gibt eine bestimmte Richtung des Zusammenhangs vor.

\[ \begin{aligned} H_0 &: \textrm{Es gibt keinen Zusammenhang zwischen Wohnort und Verweigerungsentscheidung.}\\ H_1 &: \textrm{Es gibt einen positiven Zusammenhang zwischen Wohnort in der Stadt} \\ &\quad\textrm{und Kriegsdienstverweigerung.} \end{aligned} \]

Gerichtete Alternativhypothesen sind im \(\chi^2\)-Unabhängigkeitstest nur für \(2\times2\)-Tabellen möglich.

Im Beispiel entscheiden wir uns für die gerichtete Alternativhypothese, denn wir vermuten einen Zusammenhang in diese bestimmte Richtung.

10.1.3 Signifikanzniveau entscheiden

Wie in anderen Tests ist ein Signifikanzniveau von \(\alpha=0{,}05\) üblich, wofür wir uns auch im Beispiel entscheiden.

10.1.4 Kritischen Wert bestimmen

Bei \(\chi^2\)-Tests gibt es immer nur einen kritischen Wert. Zunächst müssen beim \(\chi^2\)-Unabhängigkeitstest die Freiheitsgrade bestimmt werden mit der Formel:

\[ \mathit{df} = (k - 1) \cdot (\ell - 1) \tag{10.1} \]

wobei auch hier wieder \(k\) für die Zeilenanzahl und \(\ell\) für die Spaltenanzahl steht.

Im Beispiel also:

\[ \begin{aligned} \mathit{df} &= (k - 1) \cdot (\ell - 1)\\ &=(2-1)\cdot (2 - 1) = 1 \end{aligned} \]

Damit lässt sich der kritische Wert aus der Tabelle für \(\chi^2\)-Verteilungen ablesen, die allerdings für ungerichtete Alternativhypothesen ausgelegt ist.

Hätten wir eine ungerichtete Alternativhypothese gewählt, würde der Ablehnungsbereich also definiert durch:

\[ \begin{aligned} \chi^2 &\geq \chi^2_{df;(1-\alpha)}\\ \chi^2 &\geq \chi^2_{1;95\%}\\ \chi^2 &\geq 3{,}841 \end{aligned} \]

Für unsere gerichtete Alternativhypothese dürfen wir den Ablehnungsbereich jedoch verdoppeln (müssen aber einem späteren Schritt unbedingt auch prüfen, ob die Richtung stimmt):

\[ \begin{aligned} \chi^2 &\geq \chi^2_{df;(1-2\cdot\alpha)}\\ \chi^2 &\geq \chi^2_{1;90\%}\\ \chi^2 &\geq 2{,}706 \end{aligned} \]

10.1.5 Prüfgröße berechnen

Wie in Sitzung 9 besprochen, wird die Prüfgröße \(\chi^2\) anhand der Formel

\[ \chi^2= \sum_{i=1}^{k}\sum_{j=1}^{\ell}\frac{(n_{ij}-m_{ij})^{2}}{m_{ij}} \tag{9.2} \]

errechnet. Dabei ist die Ermittlung der Randsummen und Erwartungswerte \(m_{ij}\) ein notwendiger Schritt, und auch die Teilwerte für \(\chi^2\) können wieder direkt in die Kreuztabelle eingetragen werden.

Tabelle 10.2: Kreuztabelle mit Erwartungswerten und Teilwerten für \(\chi^2\)
→ Dienst
Wohnort ↓ Grundwehrdienst Zivildienst
Land 18
(13,1)
1,833
11
(15,9)
1,51
29
Stadt 10
(14,9)
1,611
23
(18,1)
1,327
33
28 34 62

Für unser Beispiel erfolgt die Berechnung anhand Tabelle 10.2.

Zunächst muss dabei geprüft werden, ob die Richtung unserer Alternativhypothese stimmt. Die beobachtete Häufigkeit der Zivildienstleistenden in der Stadt \(n_{22}=23\) ist größer als der Erwartungswert \(m_{22}=18{,}1\). Wenn eine Signifikanz nachgewiesen werden kann, dann also für den positiven Zusammenhang zwischen Wohnort in der Stadt und Kriegsdienstverweigerung (wie in unserer Alternativhypothese spezifiziert).

Für \(\chi^2\) ergibt sich im Beispiel:

\[ \begin{aligned} \chi^2 &= \sum_{i=1}^{k}\sum_{j=1}^{\ell}\frac{(n_{ij}-m_{ij})^{2}}{m_{ij}}\\[4pt] &=1{,}833+1{,}51+1{,}611+1{,}327\\ &=6{,}281 \end{aligned} \]

10.1.6 Ergebnis interpretieren

Der Wert der Prüfgröße \(\chi^2=6{,}281\) liegt deutlich im Ablehnungsbereich \(\chi^2\geq 2{,}706\). Die Nullhypothese kann abgelehnt werden. Es wurde ein statistisch signifikanter positiver Zusammenhang zwischen Wohnort in Gemeinden mit über 20 000 Einwohner*innen und Kriegsdienstverweigerung festgestellt (\(\alpha=0{,}05\)).

Softwarehinweis
In R lässt sich ein \(\chi^2\)-Unabhängigkeitstest mit dem Befehl chisq.test() durchführen.

10.2 𝜒²-Anpassungstest

Beim \(\chi^2\)-Anpassungstest geht es um die Häufigkeiten eines nominalskalierten Merkmals – er ist deshalb der univariaten Teststatistik zuzuordnen. Der Test überprüft, ob das Merkmal entlang einer vorgegebenen Verteilung (im Normalfall gleichmäßig) verteilt ist, oder ob es signifikante Abweichungen von dieser erwarteten Verteilung gibt.

Ein Beispiel: Für größere Verspätungen (\(\geq\) 10 Minuten) beim ÖPNV einer Großstadt wird festgehalten, an welchen Wochentagen sie auftreten. Wir ignorieren Wochenenden und Feiertage und fragen uns, ob sich die Verzögerungen gleichmäßig auf Werktage verteilen, oder ob es signifikante Abweichungen in Bezug auf den Wochentag gibt. Die Werte in Tabelle 10.3 seien über drei Monate hinweg erhoben worden.

Tabelle 10.3: Beispielwerte für Verspätungen nach Wochentagen
Montag Dienstag Mittwoch Donnerstag Freitag
459 409 414 387 437

Wir befolgen wieder die sechs Schritte für statistische Testverfahren.

10.2.1 Test wählen und Voraussetzungen prüfen

Für den \(\chi^2\)-Anpassungstest müssen folgende Voraussetzungen erfüllt sein:

  • Ziel ist die Überprüfung einer nominalskalierten Variable auf eine statistisch signifikante Abweichung von einer vorgegebenen Verteilung.
  • Grundlage sind beobachtete Häufigkeiten aus einer einfachen, unabhängigen Zufallsstichprobe.
  • Alle Tabellenfelder enthalten beobachtete Häufigkeiten \((n_{i}\geq 5)\).

In unserem Beispiel sind diese Voraussetzungen gegeben.

10.2.2 Hypothesen formulieren

\[\begin{aligned} H_0 &: \textrm{Starke Verspätungen sind an allen Werktagen gleich wahrscheinlich.}\\ H_1 &: \textrm{Starke Verspätungen sind an manchen Werktagen wahrscheinlicher als an anderen.} \end{aligned}\]

Gerichtete Hypothesen dürften hier wieder nur bei dichotomen Variablen formuliert werden (also bei genau zwei Tabellenfeldern) – denn sonst können wir die Richtung der Vermutung nicht genau genug formulieren.

10.2.3 Signifikanzniveau entscheiden

Wie gewohnt: \(\alpha=0{,}05\)

10.2.4 Kritischen Wert bestimmen

Die Freiheitsgrade bestimmen sich aus

\[ \mathit{df}=k-1 \tag{10.2} \]

wobei \(k\) hier einfach die Anzahl der Katorien ist.

In unserem Beispiel (bei fünf Werktagen) also:

\[ \begin{aligned} \mathit{df}&=k-1\\ &=5-1=4 \end{aligned} \]

Der kritische Wert für den Ablehnungsbereich ist der Tabelle für \(\chi^2\)-Verteilungen zu entnehmen.

\[ \begin{aligned} \chi^2 &\geq \chi^2_{\mathit{df};(1-\alpha)}\\ \chi^2 &\geq \chi^2_{4;95\%}\\ \chi^2 &\geq 9{,}488 \end{aligned} \]

Auch hier dürften wir bei einer gerichteten Hypothese den Ablehnungsbereich verdoppeln, d. h. der kritische Wert \(\chi^2_{\mathit{df};(1-2\cdot \alpha)}\) wäre anzuwenden – dies ist allerdings wie bereits erwähnt nur für dichotome Variablen möglich.

10.2.5 Prüfgröße berechnen

Die Prüfgröße \(\chi^2\) berechnet sich analog zu vorherigen Beispielen. Einzige Besonderheit: Die Erwartungswerte werden direkt anhand der zu erwartenden (im unserem Fall: gleichmäßigen) Verteilung bestimmt.

Im Beispiel ergibt sich in den fünf Kategorien jeweils ein Erwartungswert von

\[\frac{n}{k}=\frac{2106}{5}=421{,}2\]

Tabelle 10.4: Tabelle für den \(\chi^2\)-Anpassungstest
Montag Dienstag Mittwoch Donnerstag Freitag
459
(421,2)
3,392
409
(421,2)
0,353
414
(421,2)
0,123
387
(421,2)
2,777
437
(421,2)
0,593
2106

Dann nehmen wir wieder eine Tabelle zu Hilfe um die Prüfgröße \(\chi^2\) zu berechnen (s. Tabelle 10.4). Wie gehabt werden einfach die Teilwerte zusammengezählt:

\[ \begin{aligned} \chi^2 &= \sum_{i=1}^{k}\frac{(n_{i}-m_{i})^{2}}{m_{i}}\\[4pt] &\approx 3{,}392 + 0{,}353 + 0{,}123 + 2{,}777 + 0{,}593\\ &=7{,}238 \end{aligned} \]

10.2.6 Ergebnis interpretieren

Der Ablehnungsbereich \(\chi^2 \geq 9{,}488\) wurde nicht erreicht. Die Nullhypothese muss beibehalten werden. Eine statistisch signifikante Abweichung von einer gleichmäßigen Verteilung konnte nicht nachgewiesen werden (\(\alpha=0{,}05\)).

Softwarehinweis
Mit einer univariaten Verteilung als Eingabe führt der Befehl chisq.test() einen \(\chi^2\)-Anpassungstest durch.

10.2.7 Andere Verteilungen

Die theoretische Verteilung, von der eine signifikante Abweichung festgestellt werden soll, ist im obigen Beispiel uniform, d. h. die Erwartungswerte sind gleichmäßig über die Wochentage verteilt. Allerdings kann beim Anpassungstest auch von anderen Verteilungen ausgegangen werden – so könnte eine (begründete) Nullhypothese auch lauten, dass Kategorie A doppelt so viele Fallzahlen aufweist wie Kategorie B und C.

In der Praxis wird der \(\chi^2\)-Anpassungstest oft verwendet, um nachzuweisen, dass keine signifikante Abweichung von der Normalverteilung zu beobachten ist – nur dann dürfen nämlich viele statistische Verfahren durchgeführt werden.

Tipps zur Vertiefung

  • Kapitel 9 in Bortz und Schuster (2010)
  • Kapitel 8.2.7 in Lange und Nipper (2018) (\(\chi^2\)-Anpassungstest)
  • Kapitel 5.3.4 in Bahrenberg, Giese und Nipper (2010)
  • Kapitel 13 in Klemm (2002)
  • Englisch: Kapitel 11.3 in Burt und Barber (1996)

Übungsaufgaben

10.2.8 Aufgabe 10-1

zur Lösung

Bestimmen Sie die folgenden Werte:

  1. \(\chi^2_{80;99{,}95\%}\)
  2. \(\chi^2_{3;70\%}\)
  3. \(\chi^2_{19;60\%}\)
  4. \(\chi^2_{400;85\%}\)
  5. \(\chi^2_{90;99{,}9\%}\)
  6. \(\chi^2_{15;99{,}5\%}\)
  7. \(\chi^2_{110;97{,}5\%}\)
  8. \(\chi^2_{14;80\%}\)

10.2.9 Aufgabe 10-2

zur Lösung

Sie sollen untersuchen, ob in einem Unternehmen der Tätigkeitsbereich mit dem Geschlecht der Angestellten zusammenhängt.

In den Personalakten sind Angestellte als weiblich oder männlich erfasst und ihre Tätigkeitsfelder in Leitende Tätigkeit, Administration und Fertigung unterteilt.

Folgende Häufigkeiten sind erfasst:

Leitende Tätigkeit Administration Fertigung
weiblich 38 185 397
männlich 102 290 888
  1. Welchen Test führen Sie durch?

  2. Formulieren Sie die Hypothesen.

  3. Das Thema wird in der Unternehmensleitung bereits kontrovers diskutiert, weshalb Sie einen Fehler 1. Art zu 99% ausschließen möchten. Wie lautet das Signifikanzniveau?

  4. Bestimmen Sie die Freiheitsgrade und den kritischen Wert.

  5. Berechnen Sie die Prüfgröße.

  6. Wie interpretieren Sie das Ergebnis?

  7. Der Aufsichtsratsvorsitzende kritisiert die Studie in einem Interview:

    Dass im Betrieb nur etwa die Hälfte der Führungskräfte Frauen sind, ist nicht weiter verwunderlich. Schließlich arbeiten insgesamt doppelt so viele Männer wie Frauen bei uns. Dafür hätte ich keine wissenschaftliche Untersuchung gebraucht.

    Wie antworten Sie (aus methodischer Perspektive) auf die Kritik am Testverfahren?

10.2.10 Aufgabe 10-3

zur Lösung

Eine Ihrer Bekannten behauptet, dass beim Elfmeterschießen – statistisch gesehen – das Team häufiger gewinnt, das den ersten Elfmeter ausführt.

Sie möchten das empirisch überprüfen und schauen sich Archivmaterial von siebzig Fußballpartien an, die durch Elfmeterschießen entschieden wurden. Tatsächlich stellen Sie fest, dass in genau 60% der Fälle das zuerst ausführende Team gewann.

Prüfen Sie, ob diese Beobachtung auch statistisch relevant ist. Wählen Sie 5% als Signifikanzniveau.

10.2.11 Aufgabe 10-4

zur Lösung

Sie führen eine Untersuchung zum Konsumverhalten von Studierenden mit und ohne Nebenjob in Hinblick auf Bio-Produkte durch. Eine Umfrage ergibt folgendes Ergebnis:

→ Tätigkeit
Bio-Kaufverhalten ↓ mit Nebenjob ohne Nebenjob
regelmäßiger Kauf 141 70
kein regelmäßiger Kauf 253 149
  1. Überprüfen Sie anhand dieser Daten, ob ein signifikanter positiver Zusammenhang zwischen der Ausübung eines Nebenjobs und dem regelmäßigen Konsum von Bio-Produkten besteht. Wählen Sie 0,05 als Signifikanzniveau.

  2. Berechnen Sie eine Kennzahl, die aussagt, wie stark der Zusammenhang ausfällt.

10.2.12 Aufgabe 10-5

zur Lösung

Das Global Volcanism Program des Smithsonian Institute (2021) stellt eine Datenbank für Vulkanaktivitäten zur Verfügung. In Indonesien wurden für die Jahre 1919 bis inklusive 2018 insgesamt 643 Ausbrüche aufgezeichnet, für die der Monat erfasst ist, in dem die Aktivität begann. Die Verteilung aller Ausbrüche auf Monate ist in der folgenden Grafik festgehalten:

Prüfen Sie, ob bei einem Signifikanzniveau von 1% ein systematischer Zusammenhang zwischen Monat und Zahl der Ausbrüche vorliegt.

Quellenverzeichnis

Bahrenberg, Gerhard, Ernst Giese und Josef Nipper. 2010. Statistische Methoden in der Geographie. Bd. 1. Univariate und bivariate Statistik. Stuttgart: Bornträger.
Bortz, Jürgen und Christof Schuster. 2010. Statistik für Human- und Sozialwissenschaftler. Berlin: Springer.
Burt, James E. und Gerald M. Barber. 1996. Elementary statistics for geographers. 2nd ed. New York: Guilford Press.
Klemm, Elmar. 2002. Einführung in die Statistik. Für die Sozialwissenschaften. Wiesbaden: Westdeutscher Verlag.
Lange, Norbert de und Josef Nipper. 2018. Quantitative Methodik in der Geographie. UTB Geographie, Methoden, Statistische Verfahren 4933. Paderborn: Ferdinand Schöningh.
Smithsonian Institute. 2021. Global Volcanism Program. https://volcano.si.edu/.

  1. Hier wird also eine verhältnisskalierte Variable (Bevölkerungszahl der Gemeinde) in eine nominalskalierte Variable transformiert. In Fällen wie diesen, wo die Variable nach der Transformation nur zwei Werte annehmen kann, sprechen wir auch von der Dichotomisierung einer Variable.↩︎