Sitzung 5 Grundlagen der Teststatistik

Lernziele dieser Sitzung

Sie können…

  • Hypothesen formulieren.
  • einen \(z\)-Test durchführen.
  • einen 1-Stichproben-\(t\)-Test durchführen.

Lernvideos (Sommersemester 2020)

5.1 Statistische Tests

Gemeinsam mit der Schätzstatistik bildet die Test- bzw. Prüfstatistik jenen Teil statistischer Verfahren, die ausgehend von einer Stichprobenverteilung Rückschlüsse auf die Beschaffenheit von Grundgesamtheiten anstreben (schließende Statistik).

Dabei haben Schätz- und Teststatistik jedoch grundlegend verschiedene Vorgehensweisen. Wie in Sitzung 4 besprochen ermöglicht die Schätzstatistik die Angabe statistischer Parameter einer Grundgesamtheit anhand von Stichprobenwerten, und unter Angabe von Wahrscheinlichkeiten.

Ziel statistischer Tests hingegen ist es, mit Hilfe von Stichproben Hypothesen (also Vermutungen) über die Grundgesamtheit zu prüfen. Geprüft wird dabei ein empirischer Sachverhalt gegen die Zufälligkeit seiner Realisierung. Ein statistischer Test fragt, ab welcher Größenordnung ein Stichprobenergebnis nicht mehr als zufällig, sondern als signifikant anzusehen ist.

Dabei folgt die grundsätzliche Vorgehensweise von (hier behandelten) statistischen Tests immer diesem Schema:

  1. Test wählen und Voraussetzungen prüfen
  2. Hypothesen formulieren
  3. Signifikanzniveau entscheiden
  4. Ablehnungsbereich bestimmen
  5. Prüfgröße berechnen
  6. Ergebnis interpretieren

Die einzelnen Schritte werden im Folgenden direkt anhand des \(z\)-Tests besprochen.

5.2 𝑧-Test

Die mathematischen Grundlagen des \(z\)-Tests leiten sich direkt aus der in Sitzung 4 besprochenen Stichprobenverteilung für \(\bar{x}\) ab.

Ein illustrierendes Beispiel: Wir wissen, dass die Anzahl der täglichen Besucher*innen einer Eissporthalle annähernd normalverteilt ist, und zwar mit dem arithmetischen Mittel \(\mu=94{,}2\) und der Standardabweichung \(\sigma=11{,}8\). Wir vermuten, dass die Anzahl der Besucher*innen an bewölkten Tagen größer ist, weil an sonnigen Tagen andere Freizeitbeschäftigungen attraktiver sind.

An fünf zufälligen bewölkten Tagen zählen wir die Besucher*innen und kommen auf einen Mittelwert der Stichprobe von \(\bar{x} = 103{,}0\).

Dieser Wert ist höher als das arithmetische Mittel der Grundgesamtheit (\(\mu\)). Aber heißt das auch, dass unsere Vermutung stimmt? Wir wissen aus Sitzung 4, dass die Stichprobenverteilung einem Standardfehler (\(\sigma_{\bar{x}}\)) unterliegt (s. Abbildung 5.1).

Ist das Ergebnis also nur zufällig zustande gekommen, oder liegt ein statistisch signifikantes Ergebnis vor? Mit anderen Worten: Ist die Stichprobe überhaupt der Verteilung \(x_0\) um \(\mu_0\) entnommen, oder gibt es eine andere Verteilung (\(x\) um ein anderes \(\mu\)) für bewölkte Tage, denen unser Stichprobenmittelwert \(\bar{x}\) entstammt? Genau diese Art von Frage versuchen statistische Tests zu beantworten.

Theoretische Stichprobenverteilung (unter Annahme der Nullhypothese)

Abbildung 5.1: Theoretische Stichprobenverteilung (unter Annahme der Nullhypothese)

5.2.1 Test wählen und Voraussetzungen prüfen

Je nachdem, was überprüft werden soll, was über die Grundgesamtheit bekannt ist und wie die Stichprobe beschaffen ist, müssen verschiedene Testverfahren angewendet werden.

Statistische Tests unterscheiden sich zunächst in Bezug auf ihre Prüfgröße (und sind auch nach ihrer Prüfgröße benannt). Wir werden zunächst den \(z\)-Test kennenlernen, der mit dem (uns seit Sitzung 3 bekannten) \(z\)-Wert als Prüfgröße arbeitet.

Der \(z\)-Test hat zum Ziel, den Mittelwert einer Stichprobe mit den zu erwartenden Werten bei einer bekannten Verteilung zu vergleichen.

Um den \(z\)-Test anwenden zu können, müssen also folgende Voraussetzungen gegeben sein:

  • Das Ziel der Untersuchung ist es, eine signifikante Abweichung des Mittelwerts festzustellen.
  • Das arithmetische Mittel \(\mu\) und die Standardabweichung \(\sigma\) der (ursprünglichen) Grundgesamtheit müssen bekannt sein.
  • Der Test muss anhand einer reinen Zufallsstichprobe erfolgen.
  • Die Stichprobenverteilung muss (annähernd) normalverteilt sein, das heißt:
    • entweder die Grundgesamtheit ist (annähernd) normalverteilt,
    • oder die Stichprobe hat die Größe \(n\geq30\).

5.2.1.1 Beispiel

In unserem Beispiel (Besuchszahlen der Eissporthalle) sind diese Voraussetzungen gegeben. Wir können und wollen also einen \(z\)-Test durchführen.

5.2.2 Hypothesen formulieren

Es müssen immer zwei Hypothesen formuliert werden: die Nullhypothese und die Alternativhypothese. Die Nullhypothese geht immer davon aus, dass es keine Abweichung gibt, die Alternativhypothese formuliert eine Abweichung.

Dabei werden zwei Verteilungen konstruiert: Die bekannte Grundgesamtheit (in unserem Beispiel: Besuchszahlen insgesamt) \(x_0\) mit Mittelwert \(\mu_0\) und eine neue Verteilung (Besuchszahlen an bewölkten Tagen) \(x\) mit Mittelwert \(\mu\).

Die Hypothesen sind theoriegeleitet (formulieren also eine begründete Vermutung) und stehen stets am Anfang der statistischen Untersuchung. Es ist unzulässig, sie im Nachhinein anzupassen.

5.2.2.1 Nullhypothese

Die Nullhypothese (engl. null hypothesis) geht immer davon aus, das die forscherische Vermutung nicht stimmt. Im \(z\)-Test besagt die Nullhypothese, dass es zwischen dem Mittelwert \(\mu_0\) und dem Mittelwert \(\mu\) keinen Unterschied gibt. Generell heißt die Nullhypothese:

\[ H_0 : \mu = \mu_0 \tag{5.1} \]

5.2.2.2 Alternativhypothese

Die Alternativhypothese (engl. alternative hypothesis) stellt die Vermutung dar, die überprüft werden soll. Dabei gibt es zwei unterschiedliche Möglichkeiten: ungerichtete und gerichtete Alternativhypothesen.

5.2.2.2.1 Ungerichtete Alternativhypothese (zweiseitiger Test)

Die ungerichtete Alternativhypothese besagt nur, dass es einen Unterschied zwischen \(\mu\) und \(\mu_0\) gibt, aber nicht in welche Richtung (größer oder kleiner). Sie lautet daher:

\[ H_1 : \mu \neq \mu_0 \tag{5.2} \]

Wenn eine ungerichtete Alternativhypothese formuliert wird, spricht man auch von einem zweiseitigen Testverfahren.

5.2.2.2.2 Gerichtete Alternativhypothese (einseitiger Test)

Die gerichtete Alternativhyptothese gibt eine Richtung des vermuteten Unterschieds (nach oben oder unten) vor. Sie lautet entweder:

\[ H_1 : \mu < \mu_0 \quad \textrm{(abwärts gerichtet)} \tag{5.3} \]

oder:

\[ H_1 : \mu > \mu_0 \quad \textrm{(aufwärts gerichtet)} \tag{5.4} \]

Wenn eine gerichtete Alternativhypothese formuliert wird, spricht man auch von einem einseitigen Testverfahren.

5.2.2.3 Beispiel

In unserem Beispiel geben wir eine Richtung vor, denn wir vermuten ja, dass die Besuchszahlen an bewölkten Tagen höher sind. Wir schreiben also:

\[\begin{aligned} H_0: \mu = 94{,}2\\[4pt] H_1: \mu>94{,}2 \end{aligned}\]

5.2.3 Signifikanzniveau entscheiden

Das Signifikanzniveau \(\alpha\) (engl. significance level) entscheidet, wie unwahrscheinlich eine Prüfgröße unter Annahme der Nullhypothese sein muss, damit wir die Nullhypothese ablehnen können (und damit unsere Annahme bestätigen).

Übliche Werte für das Signifikanzniveau sind \(\alpha=0{,}05\) oder \(\alpha=0{,}01\).

Für die Wahl des Signifikanzniveaus ist jeweils der Kontext entscheidend: Wenn die irrtümliche Bestätigung der forscherischen Annahme gravierende Auswirkungen hat, möchte man das Signifikanzniveau besonders niedrig wählen um diese Art von Fehler auszuschließen.

Auch das Signifikanzniveau muss vor der statistischen Erhebung formuliert werden, und es ist unzulässig, es im Nachhinein an das Ergebnis anzupassen.

5.2.3.1 Beispiel

Ein Irrtum in der statistischen Signifikanz der Besucherzahl hat vermutlich keine gravierenden Folgen. Wir legen das Signifikanzniveau auf \(\alpha=0{,}05\) fest.

5.2.4 Ablehnungsbereich bestimmen

Zusammen mit der (Un-)Gerichtetheit der Alternativhypothese bestimmt das Signifikanzniveau \(\alpha\) den Ablehnungsbereich – also den Bereich für die zu errechnende Prüfgröße \(z\), in dem die Nullhypothese abgelehnt würde.

Der Ablehnungsbereich für die ungerichtete Alternativhypothese ist \(\frac{\alpha}{2}\) auf beiden Seiten (s. Abbildung 5.2). Die kritischen Werte sind dann die Schwellen des Ablehnungsbereich auf beiden Seiten:

\[ z \leq z_{\alpha/2} \quad \textrm{und} \quad z \geq z_{(1-\alpha/2)} \quad \textrm{für} \quad H_1: \mu \neq \mu_0 \tag{5.5} \]

Kritische Werte für $z$ bei ungerichteter Alternativhypothese und $\alpha=0{,}05$

Abbildung 5.2: Kritische Werte für \(z\) bei ungerichteter Alternativhypothese und \(\alpha=0{,}05\)

Bei den gerichteten Alternativhypothesen ist der Ablehnungsbereich jeweils nur auf einer Seite (s. Abbildungen 5.3 und 5.4). Die kritischen Werte ergeben sich aus:

\[ z \leq z_{\alpha} \quad \textrm{für} \quad H_1: \mu < \mu_0 \tag{5.6} \]

\[ z \geq z_{(1-\alpha)} \quad \textrm{für} \quad H_1: \mu > \mu_0 \tag{5.7} \]

Kritischer Wert für $z$ bei gerichteter Alternativhypothese nach unten und $\alpha=0{,}05$

Abbildung 5.3: Kritischer Wert für \(z\) bei gerichteter Alternativhypothese nach unten und \(\alpha=0{,}05\)

Kritischer Wert für $z$ bei gerichteter Alternativhypothese nach oben und $\alpha=0{,}05$

Abbildung 5.4: Kritischer Wert für \(z\) bei gerichteter Alternativhypothese nach oben und \(\alpha=0{,}05\)

5.2.4.1 Beispiel

In unserem Beispiel haben wir eine gerichtete Alternativhypothese nach oben und ein Signifikanzniveau von \(\alpha=0{,}05\) verwendet. Der kritische Wert (bei dessen Überschreitung wir die Nullhypothese ablehnen und unsere Vermutung bestätigt sehen) lautet also:

\[ z \geq z_{95\%}\approx 1{,}65 \]

Der Mittelwert unserer Stichprobe fällt höher aus als \(\mu\). Aber übersteigt er auch den kritischen Wert (und ist damit statistisch signifikant)?

5.2.5 Prüfgröße berechnen

Für den \(z\)-Test ist die Prüfgröße der \(z\)-Wert der Stichprobe, und zwar standardisiert in Bezug auf \(\mu_0\) und den Standardfehler (\(\sigma_{\bar{x}}\)):

\[ z=\frac{\bar{x}-\mu_0}{\sigma_{\bar{x}}} \tag{5.8} \]

Wie wir bereits wissen, ergibt sich der Standardfehler (\(\sigma_{\bar{x}}\)) wiederum aus der Stichprobengröße (\(n\)) und der Standardabweichung der Grundgesamtheit (\(\sigma\)):

\[ \sigma_{\bar{x}}=\frac{\sigma}{\sqrt{n}} \tag{5.9} \]

Durch einsetzen ergibt sich die generelle Formel für die Prüfgröße des \(z\)-Tests:

\[ z=\sqrt{n}\cdot\frac{\bar{x}-\mu_0}{\sigma} \tag{5.10} \]

Das grundsätzliche Schema dieser Formel werden wir in anderen Tests wiedererkennen.

5.2.5.1 Beispiel

An dieser Stelle (also nachdem wir uns für einen Test und ein Signifikanzniveau entschieden und den kritischen Wert berechnet haben) dürften wir streng genommen erst die Stichprobe erheben.

Diese ergibt bei \(n=5\) den Mittelwert \(\bar{x}=103{,}0\). Die Verteilung \(x_0\) (also unter Annahme der Nullhypothese) hatte die Kennwerte \(\mu_0=94{,}2\) und \(\sigma=11{,}8\).

Wir setzen ein in die Formel aus Gleichung (5.10):

\[\begin{aligned} z&=\sqrt{n}\cdot\frac{\bar{x}-\mu_0}{\sigma}\\[4pt] &\approx\sqrt{5}\cdot\frac{103{,}0-94{,}2}{11{,}8}\\[4pt] &\approx1{,}67 \end{aligned}\]

5.2.6 Ergebnis inerpretieren

Je nachdem, ob die Prüfgröße in den Ablehnungsbereich fällt (ob der kritische Wert also unter- bzw. überschritten wird), können wir die Nullhypothese ablehnen (und damit unsere Alternativhypothese bestätigen) oder nicht.

Eine Ablehnung der Nullhypothese bedeutet, dass wir ein statistisch signifikantes Ergebnis zugunsten unserer Vermutung vorliegen haben.

Diese Art von Ergebnis wird oft falsch interpretiert. Bei einem Signifikanzniveau von \(\alpha=0{,}01\) heißt das zum Beispiel, dass die beobachteten Werte nur mit 1% Wahrscheinlichkeit vorkommen, wenn unsere Vermutung nicht stimmt. Wichtig dabei: Das ist etwas ganz anderes als zu behaupten, dass unsere Vermutung zu 99% stimme. Über die Wahrscheinlichkeit, dass eine Hypothese stimmt (oder nicht) können wir mit den Methoden der klassischen Statistik keine Aussage machen!

5.2.6.1 Beispiel

In unserem Beispiel liegt der \(z\)-Wert knapp über dem kritischen Wert von 1,65. Wir können also die Nullhypothese ablehnen und unsere Alternativhypothese annehmen. Unsere statistische Untersuchung hat gezeigt, dass die Eissporthalle an bewölkten Tagen besser besucht ist als an sonnigen (und zwar mit Signifikanzniveau \(\alpha=0,05\)).

Gut, dass wir eine gerichtete Alternativhypothese aufgestellt haben. Hätten wir nur vermutet, dass sich die Besuchszahlen je nach Wetter unterscheiden (ohne Angabe einer Richtung), dann wäre der kritische Wert nicht erreicht worden und wir hätten die Nullhypothese beibehalten müssen. Hinterher die Hypothesen anzupassen ist natürlich nicht zulässig!

Softwarehinweis
R hat in der Grundversion keinen dezidierten Befehl für einen \(z\)-Test. Mit der Funktion qnorm() können kritische Werte jedoch einfach bestimmt werden.

5.3 Die 𝑡-Verteilung

Wenn die Standardabweichung \(\sigma\) eines Merkmals in der Grundgesamtheit unbekannt ist, kann sie durch die Standardabweichung \(s\) der Stichprobe geschätzt werden (s. Sitzung 4). Dann ist die Stichprobenverteilung für \(\bar{x}\) jedoch nicht mehr normalverteilt, sondern sie folgt einer \(t\)-Verteilung.

Im Gegensatz zur Standardnormalverteilung (die wir für den \(z\)-Test benutzen) gibt es aber nicht nur eine \(t\)-Verteilung, sondern die Form der \(t\)-Verteilung hängt von so genannten Freiheitsgraden (engl. degrees of freedom) ab. Mit steigender Zahl der Freiheitsgrade nähert sich die \(t\)-Verteilung einer Standardnormalverteilung an (s. Abbildung 5.5).

$t$-Verteilungen mit verschiedenen Freiheitsgraden

Abbildung 5.5: \(t\)-Verteilungen mit verschiedenen Freiheitsgraden

5.3.1 Freiheitsgrade

In Anlehnung an Bortz und Schuster (2010) kürzen wir Freiheitsgrade mit \(\mathit{df}\) ab. Dort findet sich auch eine brauchbare Erklärung dieses Phänomens:

Die Freiheitsgrade, welche mit einem Kennwert verbunden sind, entsprechen der Anzahl der Werte, die bei seiner Berechnung frei variieren können. Der Mittelwert \(\bar{x}\) besitzt beispielsweise \(n\) Freiheitsgrade, weil es keinerlei Bedingung gibt, der die \(n\) Werte genügen müssen. Dies ist für die Varianz \(s^2=\mathit{QS}/(n-1)\) nicht der Fall. Nur \(n-1\) Abweichungen, welche in die Berechnung der Quadratsumme \(\mathit{QS}=\sum_i(x_i-\bar{x})^2\) eingehen, können frei variieren. [D]ie Summe der Abweichungen von ihrem Mittelwert [ist] null, d.h. \(\sum_i(x_i-\bar{x})=0\). Von \(n\) Abweichungen können deshalb nur \(n - 1\) frei variieren. Ergeben sich beispielsweise bei einer Stichprobe aus drei Werten die Abweichungen \(x_1 - \bar{x} = -4\) und \(x_2 - \bar{x} = 0\), muss zwangsläufig \(x_3 -\bar{x} = 4\) sein, damit die Summe aller Abweichungen null ergibt. Bei der Varianzberechnung ist eine der \(n\) Abweichungen festgelegt, d.h. die Varianz hat nur \(n - 1\) Freiheitsgrade. Man schreibt die Stichprobenvarianz deshalb gelegentlich auch als \(s^2 = \mathit{QS}/\mathit{df}\). Da die Varianz mit \(n - 1\) Freiheitsgraden verbunden ist, gilt dies auch für die Standardabweichung \(s\). (Bortz und Schuster 2010: 121)

5.4 1-Stichproben-𝑡-Test

Der 1-Stichproben-\(t\)-Test vergleicht (wie der \(z\)-Test) die Werte einer Stichprobe mit der Grundgesamtheit. Das Vorgehen ist dabei analog zum \(z\)-Test, mit dem einzigen Unterschied, dass eine \(t\)-Verteilung mit \((n-1)\) Freiheitsgraden herangezogen wird.

Wir besprechen den 1-Stichproben-\(t\)-Test direkt an einem Beispiel:

Beim Frankfurter Amt für Wohnungswesen betrage die durchschnittliche Bearbeitungsdauer von Anträgen auf Wohngeld 30,2 Tage und sei normalverteilt. Wir vermuten, dass die Bearbeitungszeit zu Anfang des Wintersemesters höher ist als im Jahresdurchschnitt und planen eine zufällige Stichprobe von 12 Anträgen mit Einreichungsdatum im Oktober.

5.4.1 Test wählen und Voraussetzungen prüfen

Um den 1-Stichproben-\(t\)-Test durzuführen müssen folgende Voraussetzungen erfüllt sein:

  • Das Ziel der Untersuchung ist es, eine statistisch signifikante Abweichung des Mittelwerts einer Stichprobe im Vergleich zu einer Grundgesamtheit festzustellen.
  • Das zu untersuchende Merkmal ist in der Grundgesamtheit normalverteilt.
  • Das arithmetische Mittel (\(\mu\)) des Merkmals in der Grundgesamtheit ist bekannt. (Im Gegensatz zum \(z\)-Test ist \(\sigma\) hier unbekannt!)
  • Der Test erfolgt anhand einer reinen Zufallsstichprobe.

5.4.1.1 Beispiel

In unserem Beispiel (Bearbeitungszeit Wohngeldanträge) sind diese Bedingungen erfüllt und wir können einen 1-Stichproben-\(t\)-Test durchführen.

5.4.2 Hypothesen formulieren

Die Hypothesen werden genauso wie beim \(z\)-Test formuliert:

5.4.2.1 Nullhypothese

\[ H_0 : \mu = \mu_0 \tag{5.11} \]

5.4.2.2 Alternativhypothese

\[ H_1 : \mu \neq \mu_0 \quad \textrm{(ungerichtet)} \tag{5.12} \]

oder

\[ H_1 : \mu < \mu_0 \quad \textrm{(abwärts gerichtet)} \tag{5.13} \]

oder

\[ H_1 : \mu > \mu_0 \quad \textrm{(aufwärts gerichtet)} \tag{5.14} \]

5.4.2.3 Beispiel

In unserem Beispiel geben wir eine Richtung vor, denn wir vermuten ja, dass die Bearbeitungsdauer zu Semesteranfang höher ist. Wir schreiben also:

\[\begin{aligned} H_0: \mu = 30{,}2\\ H_1: \mu>30{,}2 \end{aligned}\]

5.4.3 Signifikanzniveau entscheiden

Wie beim \(z\)-Test entscheidet das Signifikanzniveau \(\alpha\), wie unwahrscheinlich eine Prüfgröße unter Annahme der Nullhypothese sein muss, damit wir die Nullhypothese ablehnen können (und damit unsere Annahme bestätigen).

Übliche Werte für das Signifikanzniveau sind auch beim \(t\)-Test \(\alpha=0{,}05\) oder \(\alpha=0{,}01\).

5.4.3.1 Beispiel

Ein Irrtum zugunsten der Alternativhypothese hat bei unserer Untersuchung keine gravierenden Folgen. Angenommen, wir wollen uns in der Analyse trotzdem ganz sicher sein. Dann entscheiden wir uns für das Signifikanzniveau \(\alpha=0{,}01\).

5.4.4 Ablehnungsbereich bestimmen

Genau wie beim \(z\)-Test bestimmt das Signifikanzniveau \(\alpha\) den Ablehnungsbereich – also den Bereich für die zu errechnende Prüfgröße \(t\), in dem die Nullhypothese abgelehnt würde.

Der Ablehnungsbereich für die ungerichtete Alternativhypothese ist \(\frac{\alpha}{2}\) auf beiden Seiten. Die kritischen Werte sind dann die Schwellen des Ablehnungsbereich auf beiden Seiten:

\[ t \leq t_{\mathit{df};\alpha/2} \quad \textrm{und} \quad t \geq t_{\mathit{df};(1-\alpha/2)} \quad \textrm{für} \quad H_1: \mu \neq \mu_0 \tag{5.15} \]

Bei den gerichteten Alternativhypothesen ist der Ablehnungsbereich jeweils nur auf einer Seite. Die kritischen Werte ergeben sich aus:

\[ t \leq t_{\mathit{df};\alpha} \quad \textrm{für} \quad H_1: \mu < \mu_0 \tag{5.16} \]

\[ t \geq t_{\mathit{df};(1-\alpha)} \quad \textrm{für} \quad H_1: \mu > \mu_0 \tag{5.17} \]

Die kritischen Werte für \(t\) bei gegebenem Freiheitsgrad \((n-1)\) und Flächenabschnitt lassen sich aus der Tabelle für \(t\)-Vereilungen ablesen. Dabei ist zu beachten, dass aufgrund der Symmetrie die Werte für Flächenanteile unter 50% nicht in der Tabelle verzeichnet sind. Es gilt die Formel:

\[ P(-t_\mathit{df})=1-P(t_\mathit{df}) \tag{5.18} \]

So ist zum Beispiel der Wert für \(t_{5;1\%}=-t_{5;99\%}=-3{,}365\).

5.4.4.1 Beispiel

In unserem Beispiel haben wir eine gerichtete Alternativhypothese nach oben und ein Signifikanzniveau von \(\alpha=0{,}01\) verwendet. Wir haben uns zudem für eine Stichprobengröße von \(n=12\) entschieden, woraus der Freiheitsgrad \(\mathit{df}=n-1=11\) resultiert.

Der kritische Wert (bei dessen Überschreitung wir die Nullhypothese ablehnen und unsere Vermutung bestätigt sehen) lautet also:

\[ \begin{aligned} t &\geq t_{\mathit{df};(1-\alpha)}\\[4pt] t &\geq t_{11;99\%}\\[4pt] t &\geq 2,718 \end{aligned} \]

Graphisch ist der Ablehnungsbereich für unser Beispiel in Abbildung 5.6 dargestellt.

Ablehnungsbereich bei gerichteter Alternativhypothese nach oben, $n=12$ und $\alpha=0{,}01$

Abbildung 5.6: Ablehnungsbereich bei gerichteter Alternativhypothese nach oben, \(n=12\) und \(\alpha=0{,}01\)

5.4.5 Prüfgröße berechnen

Die Formel für die Berechnung der Prüfgröße \(t\) im 1-Stichproben-\(t\)-Test lautet ganz ähnlich wie die für die Prüfgröße \(z\) im \(z\)-Test – mit dem Unterschied, dass statt der (hier unbekannten) Standardabweichung der Grundgesamtheit (\(\sigma\)) die Standardabweichung der Stichprobe (\(s\)) eingesetzt wird:

\[ t=\sqrt{n}\cdot\frac{\bar{x}-\mu_0}{s} \tag{5.19} \]

Zum direkten Vergleich noch einmal die Prüfgröße im \(z\)-Test:

\[ z=\sqrt{n}\cdot\frac{\bar{x}-\mu_0}{\sigma} \]

5.4.5.1 Beispiel (ausführlich)

Wir erheben die Stichprobe von \(n=12\) Anträgen im Oktober und erhalten folgende Werte für die Bearbeitungsdauer (in Tagen):

\[ 45\quad41\quad37\quad41\quad35\quad44\quad34\quad44\quad38\quad41\quad39\quad36 \]

Wir errechnen zunächst das arithmetische Mittel \(\bar{x}\) (s. Sitzung 2):

\[\begin{aligned} \bar{x}&=\frac{\sum\limits_{i=1}^nx_i}{n}\\[5pt] &=\frac{45+41+37+41+35+44+34+44+38+41+39+36}{12}\\ &\approx 39{,}58 \end{aligned}\]

Damit können wir die Standardabweichung \(s\) berechnen:

\[\begin{aligned} s&=\sqrt{\frac{\sum\limits_{i=1}^n(x_i-\bar{x})^2}{n-1}}\\[6pt] &\approx\sqrt{\frac{29{,}38+2{,}02+6{,}66+2{,}02+20{,}98+19{,}54+31{,}14+19{,}54+2{,}5+2{,}02+0{,}34+12{,}82}{11}}\\ &\approx 3{,}67 \end{aligned}\]

Schließlich setzen wir diese Werte in die Formel für die Prüfgröße \(t\) (5.19) ein:

\[\begin{aligned} t&=\sqrt{n}\cdot\frac{\bar{x}-\mu_0}{s}\\[6pt] &\approx\sqrt{12}\cdot\frac{39{,}58-30{,}2}{3{,}67}\\ &\approx8{,}854 \end{aligned}\]

5.4.6 Ergebnis interpretieren

Genau wie beim \(z\)-Test kommt es darauf an, ob die Prüfgröße in den Ablehnungsbereich fällt (ob der kritische Wert also unter- bzw. überschritten wird). Wenn dies der Fall ist, können wir die Nullhypothese ablehnen (und damit unsere Alternativhypothese bestätigen). Wenn nicht, müssen wir die Nullhypothese beibehalten.

5.4.6.1 Beispiel

In unserem Beispiel liegt der \(t\)-Wert deutlich über dem kritischen Wert von 2,718. Wir können also die Nullhypothese ablehnen und unsere Alternativhypothese annehmen. Unsere statistische Untersuchung hat gezeigt, dass die Bearbeitungsdauer von Anträgen, die im Oktober eingehen, länger ist als im Jahresdurchschnitt (und zwar mit Signifikanzniveau \(\alpha=0,01\)).

Softwarehinweis
In R kann ein \(t\)-Test mit dem Befehl t.test() durchgeführt werden. Neben der Prüfgröße \(t\) gibt der Befehl einen \(p\)-Wert aus – ist dieser kleiner als \(\alpha\), so liegt eine signifikante Abweichung vor.

Tipps zur Vertiefung

Übungsaufgaben

5.4.7 Aufgabe 5-1

zur Lösung

Sie interessieren sich für die durchschnittliche Haushaltsgröße in Frankfurt im europäischen Vergleich. In der EU sei die durchschnittliche Haushaltsgröße 2,30 Personen mit einer Standardabweichung von 1,42.

Sie vermuten, dass Frankfurter Haushalte sich in ihrer Größe vom europäischen Durchschnitt unterscheiden, können aber nicht sagen, in welche Richtung.

  1. Welche Stichprobengröße ist für einen \(z\)-Test in diesem Fall nötig und warum?
  2. Formulieren Sie Null- und Alternativhypothese.
  3. Sie entscheiden Sich für ein Signifikanzniveau von \(\alpha=0{,}05\). Notieren Sie die kritischen Werte.
  4. Eine Stichprobe von 40 Frankfurter Haushalten ergibt eine durchschnittliche Größe von 1,82. Berechnen Sie die Prüfgröße \(z\).
  5. Wie bewerten Sie das Ergebnis?

5.4.8 Aufgabe 5-2

zur Lösung

Bestimmen Sie die folgenden kritischen Werte:

  1. \(t_{4;0{,}5\%}\)
  2. \(t_{19;0{,}1\%}\)
  3. \(t_{7;2{,}5\%}\)
  4. \(t_{13;5\%}\)
  5. \(t_{11;97{,}5\%}\)
  6. \(t_{3;95\%}\)
  7. \(t_{6;99{,}5\%}\)
  8. \(t_{16;99{,}9\%}\)
  9. \(t_{5;99\%}\)
  10. \(t_{20;1\%}\)

5.4.9 Aufgabe 5-3

zur Lösung

Die Prüfungsergebnisse für eine Klausur im Geographiestudium seien normalverteilt mit einer mittleren Punktzahl von 61,5 und einer Standardabweichung von 10,3. Sie vermuten, dass berufstätige Studierende im Durchschnitt schlechter abschneiden, weil ihnen die Vorbereitungszeit fehlt. Eine Zufallsstichprobe berufstätiger Studierender ergibt die Prüfungsergebnisse: 42 78 46 65

Prüfen Sie Ihre Vermutung. Begründen Sie die Wahl des Tests und des Signifikanzniveaus.

5.4.10 Aufgabe 5-4

zur Lösung

Sie vermuten, dass Angestellte mit Migrationshintergrund in einem bestimmten Betrieb weniger als das Durchschnittsgehalt verdienen. Die Personalabteilung bestätigt Ihnen gegenüber die annähernde Normalverteilung der Bruttogehälter mit Mittelwert \(\mu=3042{,}43\) (in EUR). Sie planen, das Bruttogehalt von sechs zufälligen Angestellten mit Migrationshintergrund direkt zu ermitteln.

  1. Welchen Test führen Sie durch?
  2. Formulieren Sie die Hypothesen.
  3. Bestimmen Sie den kritischen Wert bei Signifikanzniveau \(\alpha=0{,}01\).

5.4.11 Aufgabe 5-5

zur Lösung

(Fortführung von Aufgabe 4)

Sie ermitteln die folgenden Werte (in EUR): \[ 2927{,}35\quad2930{,}68\quad2903{,}58\quad3032{,}59\quad3013{,}37\quad2979{,}4 \]

  1. Berechnen Sie die Prüfgröße.
  2. Welche Schlüsse ziehen Sie aus der Untersuchung?

5.4.12 Aufgabe 5-6

zur Lösung

In Ermberg ist die Verteilung der Mietpreise für Ladenflächen pro Quadratmeter (in €) annähernd normalverteilt mit Mittelwert 11,8 und Varianz 5,2.

Die Baudezernentin sagt, dass die Ladenmieten im Neubaugebiet Auwiese deutlich günstiger seien als im Gemeindedurchschnitt. Um die Behauptung zu überprüfen, erheben Sie die folgende Zufallsstichprobe von Ladenmieten im Neubaugebiet (pro m² in €):

\[8{,}54\quad7{,}16\quad14{,}47\quad11{,}84\quad10{,}27\]

Prüfen Sie die Behauptung. Schließen Sie einen Fehler 1. Art zu 95% aus.

5.4.13 Aufgabe 5-7

zur Lösung

In einem landwirtschaftlichen Großbetrieb wird ein neues Düngemittel für Zuckerrüben getestet. Zunächst wird es nur auf sechs zufällig ausgewählten Feldern (von 60) eingesetzt.

Der durchschnittliche Ertrag aller 60 Felder beträgt 69 Tonnen pro Hektar (t/ha). Für die sechs Felder mit dem neuen Düngemittel wurden folgende Ertragswerte erhoben:

Feld Ertrag in t/ha
1 93
2 74
3 65
4 69
5 89
6 85

Prüfen Sie, ob der Einsatz des neuen Düngemittels zu einem signifikanten Unterschied im Ertrag der Felder geführt hat. Akzeptieren Sie in Ihrer Analyse 5% als Wahrscheinlichkeit für einen Fehler 1. Art.

Quellenverzeichnis

Bahrenberg, Gerhard, Ernst Giese und Josef Nipper. 2010. Statistische Methoden in der Geographie. Bd. 1. Univariate und bivariate Statistik. Stuttgart: Bornträger.
Bortz, Jürgen und Christof Schuster. 2010. Statistik für Human- und Sozialwissenschaftler. Berlin: Springer.
Burt, James E. und Gerald M. Barber. 1996. Elementary statistics for geographers. 2nd ed. New York: Guilford Press.
Klemm, Elmar. 2002. Einführung in die Statistik. Für die Sozialwissenschaften. Wiesbaden: Westdeutscher Verlag.
Lange, Norbert de und Josef Nipper. 2018. Quantitative Methodik in der Geographie. UTB Geographie, Methoden, Statistische Verfahren 4933. Paderborn: Ferdinand Schöningh.