Sitzung 6 Testverfahren mit zwei Stichproben

Lernziele dieser Sitzung

Sie können…

  • einen 2-Stichproben-\(t\)-Test durchführen.
  • einen \(F\)-Test durchführen.
  • Fehler 1. und 2. Art unterscheiden.

Lehrvideos (Sommersemester 2020)

6.1 Statistische Tests

In Sitzung 5 haben wir mit dem \(z\)-Test und dem 1-Stichproben-\(t\)-Test die ersten Testverfahren kennengelernt. In dieser Sitzung kommt der 2-Stichproben-\(t\)-Test sowie der \(F\)-Test dazu.

Das grundsätzliche Verfahren bleibt dabei stets das gleiche. Zur Erinnerung noch einmal die sechs Schritte:

  1. Test auswählen und Voraussetzungen prüfen
  2. Hypothesen formulieren
  3. Signifikanzniveau entscheiden
  4. Ablehnungsbereich bestimmen
  5. Prüfgröße berechnen
  6. Ergebnis interpretieren

6.2 2-Stichproben-𝑡-Test

Bei der folgenden Variante des \(t\)-Tests (und beim \(F\)-Test) wird nicht wie gehabt eine Stichprobe auf signifikante Abweichungen von der Grundgesamtheit überprüft, sondern zwei Stichproben auf signifikante Abweichungen voneinander. An den sechs Schritten ändert sich nichts.

Den 2-Stichproben-\(t\)-Test gibt es je nach Voraussetzungen bzw. Annahmen in vielen unterschiedlichen Varianten. In dieser Veranstaltung wird nur eine bestimmte (vergleichsweise einfache) Variante behandelt. In der Praxis geht es aber oft darum, für ganz bestimmte empirische Bedingungen den „richtigen“ 2-Stichproben-\(t\)-Test auszuwählen.

Die hier behandelte Variante soll mit folgendem Beispiel illustriert werden: Wir interessieren uns für die Mietpreise von kleine Gewerbeflächen in den beiden Frankfurter Stadtteilen Höchst und Praunheim. Wir vermuten, dass es einen signifikanten Unterschied gibt, wissen aber nicht in welche Richtung. Wir planen eine Befragung von je 6 Mieter*innen von kleinen Gewerberäumen, die nach Zufallsprinzip ausgewählt werden.

6.2.1 Test wählen und Voraussetzungen prüfen

Der hier behandelte 2-Stichproben-\(t\)-Test hat folgende Voraussetzungen und Annahmen:

  • Es soll untersucht werden, ob ein Merkmal in zwei Stichproben signifikant voneinander abweicht.
  • Die Stichproben sind einfache Zufallsstichproben und unabhängig voneinander erhoben.
  • Die Stichproben haben dieselbe Anzahl an Elementen (\(n_1=n_2\)).
  • Das Merkmal ist grundsätzlich (annähernd) normalverteilt.
  • Die Varianzen der zu vergleichenden Populationen sind gleich (\(\sigma^2_1=\sigma^2_2\)).

Die letzte Voraussetzung ist etwas merkwürdig, denn beim \(t\)-Test kennen wir ja die Varianzen der Grundgesamtheiten gar nicht. Der \(F\)-Test kann diese Voraussetzung anhand der Stichprobenverteilungen prüfen.

6.2.1.1 Beispiel

Probleme bereiten hier die Voraussetzungen der Normalverteilung und der gleichen Varianzen. Mit der Annahme der Normalverteilung können wir leben (weil wir uns mit Statistik gut auskennen und wissen, dass der \(t\)-Test „robust“ auf nicht-ganz-normalverteilte Merkmale reagiert). Wenn sich während des Tests jedoch herausstellen sollte, dass die Varianzen zu unterschiedlich sind, müssten wir das Vorgehen neu überdenken.

6.2.2 Hypothesen formulieren

Im Unterschied zu zuvor besprochenen Verfahren gibt es hier keine übergeordnete Grundgesamtheit, und damit kein \(\mu_0\). Stattdessen werden Hypothesen über die Populationen der beiden Stichproben (\(\mu_1\) und \(\mu_2\)) formuliert.

6.2.2.1 Nullhypothese

Die Nullhypothese geht davon aus, dass es keinen Unterschied zwischen den beiden Populationen gibt. Sie lautet daher:

\[ H_0 : \mu_1 = \mu_2 \tag{6.1} \]

6.2.2.2 Alternativhypothese

Die Alternativhypothese stellt üblicherweise die forscherische Vermutung dar, die überprüft werden soll. Dabei gibt es auch hier zwei unterschiedliche Möglichkeiten: ungerichtete und gerichtete Alternativhypothesen.

6.2.2.2.1 Ungerichtete Alternativhypothese

Die ungerichtete Alternativhypothese besagt nur, dass es einen Unterschied zwischen \(\mu_1\) und \(\mu_2\) gibt, aber nicht in welche Richtung (größer oder kleiner). Sie lautet daher:

\[ H_1 : \mu_1 \neq \mu_2 \tag{6.2} \]

6.2.2.2.2 Gerichtete Alternativhypothese

Die gerichtete Alternativhypothese gibt eine Richtung des vermuteten Unterschieds vor. Sie lautet entweder:

\[ H_1 : \mu_1 < \mu_2 \tag{6.3} \]

oder:

\[ H_1 : \mu_1 > \mu_2 \tag{6.4} \]

6.2.2.3 Beispiel

Wir vermuten zwar einen Unterschied, wissen aber nicht in welche Richtung. Deshalb formulieren wir neben der Nullhypothese eine ungerichtete Alternativhypothese:

\[\begin{aligned} H_0 : \mu_1 = \mu_2\\ H_1 : \mu_1 \neq \mu_2 \end{aligned}\]

6.2.3 Signifikanzniveau entscheiden

Wie auch sonst sind übliche Werte hier \(\alpha=0{,}01\) und \(\alpha=0{,}05\).

6.2.3.1 Beispiel

Wir entscheiden uns für das Signifikanzniveau \(\alpha=0{,}05\).

6.2.4 Ablehnungsbereich bestimmen

Der kritische Wert wird genau wie bei dem 1-Stichproben-\(t\)-Test aus der Wertetabelle für \(t\)-Verteilungen abgelesen. Der einzige (wichtige!) Unterschied ist die Bestimmung der Freiheitsgrade: Bei zwei Stichproben der Größe \(n\) werden die Freiheitsgrade bestimmt durch:

\[ \mathit{df}=2\cdot n - 2 \tag{6.5} \]

6.2.4.1 Beispiel

Wir planen mit je 6 Stichproben. Deswegen berechnen wir die Freiheitsgrade:

\[ \begin{aligned} \mathit{df} &= 2 \cdot n -2\\ &= 2 \cdot 6 - 2\\ &= 10 \end{aligned} \]

Kritische Werte gibt es nun in beide Richtungen. Aufgrund der Symmetrie der \(t\)-Verteilung reicht es, wenn wir einen Wert (mit \(\alpha=0{,}05\)) nachschlagen:

\[\begin{aligned} t &\leq t_{\mathit{df};\alpha/2} \quad \textrm{und} \quad t \geq t_{\mathit{df};(1-\alpha/2)}\\ t &\leq t_{10;2{,}5\%} \quad \textrm{und} \quad t \geq t_{10;97{,}5\%}\\ t &\leq -2{,}228 \quad \textrm{und} \quad t \geq 2{,}228 \end{aligned}\]

6.2.5 Prüfgröße berechnen

Bei zwei Stichproben mit Mittelwert \(\bar{x}_1\) bzw. \(\bar{x}_1\) und Varianz \(s^2_1\) bzw. \(s^2_2\) lautet die Formel zur Bestimmung der Prüfgröße \(t\):

\[ t=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{\frac{s^2_1+s^2_2}{n}}} \tag{6.6} \]

6.2.5.1 Beispiel

Wir erheben folgende Werte für die Kaltmiete pro m²:

\[ \begin{aligned} \textrm{Höchst} (x_1): \quad7{,}96\quad8{,}46\quad7{,}13\quad8{,}95\quad7{,}62\quad8{,}22\\ \textrm{Praunheim} (x_2): \quad5{,}54\quad5{,}80\quad8{,}70\quad7{,}99\quad6{,}23\quad6{,}75 \end{aligned} \]

Für die arithmetischen Mittel ergibt sich:

\[ \begin{aligned} \bar{x}_1\approx8{,}06\\[4pt] \bar{x}_2\approx6{,}84 \end{aligned} \]

Für die Varianzen:

\[ \begin{aligned} s^2_1\approx0{,}41\\[4pt] s^2_2\approx1{,}59 \end{aligned} \]

Diese Varianzen sehen auf den ersten Blick sehr unterschiedlich aus, was ein Problem ist: Der 2-Stichproben-\(t\)-Test hat ja zur Annahme, dass die Varianzen in den beiden Populationen gleich sind.

Andererseits sind ja auch die Stichprobenvarianzen zu einem gewissen Grad Zufallsprodukte, und diese beiden Varianzen bewegen sich auch irgendwie noch in der selben Größenordnung – schließlich könnten sie auch 0,1 und 20 lauten.

Wir entscheiden uns zunächst dazu, den Test fortzuführen und lernen gleich eine Methode kennen, wie wir überprüfen können, ob das auch gerechtfertigt ist.

Um die Prüfgröße \(t\) zu bestimmen, setzen wir einfach unsere Stichprobenwerte in Formel (6.6) ein:

\[ \begin{aligned} t&=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{\frac{s^2_1+s^2_2}{n}}}\\ &\approx\frac{8{,}06-6{,}84}{\sqrt{\frac{0{,}41+1{,}59}{6}}}\\ &\approx2{,}113 \end{aligned} \]

6.2.6 Ergebnis interpretieren

Genau wie bei den anderen Tests wird je nach erreichen des kritischen Werts (des Ablehnungsbereichs) die Nullhypothese verworfen oder beibehalten.

6.2.6.1 Beispiel

Der kritische Wert von \(t \geq 2{,}228\) wurde nicht überschritten. Wir müssen die Nullhypothese beibehalten, d. h. wir konnten keinen signifikanten Unterschied zwischen den Mietpreisen in Höchst und Praunheim feststellen (\(\alpha=0{,}05\)).

Softwarehinweis
In R wird auch der 2-Stichproben-\(t\)-Test mit dem Befehl t.test() durchgeführt. Im Gegensatz zum 1-Stichproben-\(t\)-Test werden dabei zwei Verteilungen als Argumente eingegeben.

6.3 Die 𝐹-Verteilung

Die Prüfgröße \(F\) im \(F\)-Test ist unter Annahme der Nullhypothese \(F\)-verteilt. Im Gegensatz zu den Verteilungen von \(z\) und \(t\) ist die \(F\)-Verteilung nicht symmetrisch und nimmt nur positive Werte an (s. Abbildung 6.1).

Dazu ist die \(F\)-Verteilung nicht wie \(t\) von einem, sondern von zwei Freiheitsgraden abhängig. Die Reihenfolge dieser Freiheitsgrade ist auch wichtig: Wir sprechen vom Zähler-Freiheitsgrad (\(\mathit{df}_1\)) und vom Nenner-Freiheitsgrad (\(\mathit{df}_2\)). Die \(F\)-Verteilung wird also notiert mit: \(F_{\mathit{df}_1;\mathit{df}_2}\)

$F$-Verteilungen mit verschiedenen Freiheitsgraden

Abbildung 6.1: \(F\)-Verteilungen mit verschiedenen Freiheitsgraden

6.4 𝐹-Test

Auch der \(F\)-Test untersucht zwei unabhängige Stichproben. Er unterscheidet sich jedoch insofern grundlegend von den zuvor besprochenen Testverfahren, als dass sein Untersuchungsgegenstand nicht der Mittelwert (\(\mu\)) sondern die Varianz (\(\sigma^2\)) der beiden Populationen ist.

Die Prüfgröße \(F\) ist dann unter Annahme der Nullhypothese \(F\)-verteilt.

Unser Beispiel ist eine Fortführung des vorigen Beispiels für den 2-Stichproben-\(t\)-Test (Mietpreise für Gewerbeflächen). Uns interessiert: Sind die Varianzen eventuell so unterschiedlich, dass wir den obigen \(t\)-Test gar nicht hätten durchführen dürfen?

6.4.1 Test wählen und Voraussetzungen prüfen

Das Ziel des \(F\)-Tests ist die Feststellung eines signifikanten Unterschieds in der Varianz von zwei Populationen. Die Voraussetzungen lauten:

  • Ausgangspunkt sind zwei unabhängig voneinander erhobene Stichproben (die aber grundsätzlich unterschiedlich groß sein dürfen).
  • Das Merkmal ist in beiden Populationen (annähernd) normalverteilt.

6.4.1.1 Beispiel

Die Voraussetzung der Normalverteilung ist hier besonders wichtig, denn der Test wird bei anderen Verteilungen stark verfälscht. (Der \(F\)-Test ist also nicht „robust“, was die Normalverteilung angeht.)

Wir müssen also explizit die Annahme treffen, dass die Mietpreise annähernd normalverteilt sind. Das ist einerseits nicht ganz abwegig, andererseits würden wir in der Praxis unsere statistische Untersuchung dadurch angreifbar machen.

6.4.2 Hypothesen formulieren

Alles wie gehabt – nur, dass es um die Varianz \(\sigma^2\) der jeweiligen Populationen geht.

6.4.2.1 Nullhypothese

\[ H_0: \sigma^2_1=\sigma^2_2 \tag{6.7} \]

6.4.2.2 Alternativhypothesen

6.4.2.2.1 Ungerichtet

\[ H_1: \sigma^2_1\neq\sigma^2_2 \tag{6.8} \]

6.4.2.2.2 Gerichtet

\[ H_1: \sigma^2_1>\sigma^2_2 \tag{6.9} \] oder \[ H_1: \sigma^2_1<\sigma^2_2 \tag{6.10} \]

6.4.2.3 Beispiel

Die Nullhypothese ist einfach:

\[ H_0: \sigma^2_1=\sigma^2_2 \]

Bei der Alternativhypothese ist die Ausgangslage, dass wir empirisch einen Unterschied zwischen \(s^2_1\approx0{,}41\) und \(s^2_2\approx1{,}59\) festgestellt haben. Die Frage, ob die Varianz der Mietpreise in Höchst tatsächlich signifikant kleiner ist, wird übersetzt in die Alternativhypothese:

\[ H_1: \sigma^2_1<\sigma^2_2 \]

Interessanterweise wäre hier (zur Abwechslung) das forscherische Interesse, die Nullhypothese beizubehalten – denn wir wollen ja den \(t\)-Test durchführen dürfen.

6.4.3 Signifikanzniveau entscheiden

Die Logik ist hier genau dieselbe: Wie unwahrscheinlich muss das empirische Ergebnis unter Annahme der Nullhypothese sein, damit wir diese ablehnen (müssen)?

6.4.3.1 Beispiel

Wir entscheiden uns für das (für unsere Zwecke sehr übliche) Signifikanzniveau von \(\alpha=0{,}05\).

6.4.4 Ablehnungsbereich bestimmen

Für die ungerichtete Alternativhypothese sind die kritischen Werte:

\[ F \leq F_{\mathit{df}_1;\mathit{df}_2;\alpha/2} \quad \textrm{und} \quad F \geq F_{\mathit{df}_1;\mathit{df}_2;(1-\alpha/2)} \tag{6.11} \]

Für die gerichtete Alternativhypothese:

\[ F \leq F_{\mathit{df}_1;\mathit{df}_2;\alpha} \tag{6.12} \]

bzw.

\[ F \geq F_{\mathit{df}_1;\mathit{df}_2;(1-\alpha)} \tag{6.13} \]

Die Besonderheit der \(F\)-Verteilung ist, dass sie gleich von zwei Freiheitsgraden abhängt: dem Zähler-Freiheitsgrad \(\mathit{df}_1\) und dem Nenner-Freiheitsgrad \(\mathit{df}_2\).

Dabei bestimmen sich die Freiheitsgrade wieder durch die Stichprobengrößen:

\[ \begin{aligned} \mathit{df}_1=n_1-1\\ \mathit{df}_2=n_2-1 \end{aligned} \tag{6.14} \]

In der Wertetabelle für \(F\)-Verteilungen sind nur die Werte für Flächenanteile von 0,95 vermerkt. Die Werte für Flächenanteile von 0,05 (also am linken Rand) können durch Gleichung (6.15) bestimmt werden:

\[ F_{\mathit{df}_1;\mathit{df}_2;\alpha}=\frac{1}{F_{\mathit{df}_2;\mathit{df}_1;(1-\alpha)}} \tag{6.15} \]

Dabei ist zu beachten, dass im Nenner die Reihenfolge der Freiheitsgrade getauscht wird!

Zur Verdeutlichung könnte – losgelöst von unserem Beispiel – ein unterer kritischer Wert berechnet werden durch:

\[\begin{aligned} F_{13;20;5\%}&=\frac{1}{F_{20;13;95\%}} \\[5pt] &\approx\frac{1}{2{,}46}\approx0{,}41 \end{aligned}\]

6.4.4.1 Beispiel

Die Freiheitsgrade berechnen sich durch Gleichung (6.14):

\[\begin{aligned} \mathit{df}_1=n_1-1=5\\[4pt] \mathit{df}_2=n_2-1=5 \end{aligned}\]

Durch unsere gerichtete Alternativhypothese ergibt sich der kritische Wert aus Gleichung (6.12) (unter Anwendung des Tricks aus Gleichung (6.15)):

\[ \begin{aligned} F &\leq F_{\mathit{df}_1;\mathit{df}_2;\alpha}\\ F &\leq F_{5;5;5\%}\\[5pt] F &\leq \frac{1}{F_{5;5;95\%}}\\[5pt] F &\leq \frac{1}{5{,}05}\\[4pt] F &\leq 0{,}20\\[4pt] \end{aligned} \]

Der so berechnete Ablehnungsbereich ist grafisch in Abbildung 6.2 aufbereitet.

Ablehnungsbereich für $F \leq F_{5;5;5\%}$

Abbildung 6.2: Ablehnungsbereich für \(F \leq F_{5;5;5\%}\)

6.4.5 Prüfgröße berechnen

Die Formel für die Prüfgröße \(F\) ist denkbar einfach:

\[\begin{aligned} F=\frac{s^2_1}{s^2_2} \end{aligned} \tag{6.16}\]

6.4.5.1 Beispiel

Wir hatten die Varianzen der Stichproben berechnet mit:

\[\begin{aligned} s^2_1\approx0{,}41\\ s^2_2\approx1{,}59 \end{aligned}\]

Einsetzen in die Formel aus (6.16) ergibt:

\[\begin{aligned} F&=\frac{s^2_1}{s^2_2}\\[6pt] &=\frac{0{,}41}{1{,}59}\approx0{,}26 \end{aligned}\]

6.4.6 Nullhypothese ablehnen oder beibehalten

Auch hier gilt dasselbe wie bei allen Tests.

6.4.6.1 Beispiel

Der kritische Wert von 0,20 müsste unterschritten werden, um die Nullhypothese abzulehnen. Das ist nicht passiert – wir „dürfen“ die Nullhypothese also beibehalten: Es gibt keinen statistisch signifikanten Unterschied in den beiden Varianzen (\(\alpha=0{,}05\)).

Damit haben wir im vorherigen Beispiel die Voraussetzungen des 2-Stichproben-\(t\)-Tests also nicht verletzt.

Softwarehinweis
In R lautet der Befehl für den \(F\)-Test var.test().

6.5 Fehlerarten

Bei statistischen Tests sind „Fehler“ nicht etwa Rechenfehler, sondern Angaben über die Wahrscheinlichkeit, die Nullhypothese aufgrund des Zufalls, dem die Stichprobe ja unterliegt, fälschlicherweise beizubehalten oder abzulehnen. Dabei wird unterschieden zwischen Fehlern 1. und 2. Art.

6.5.1 Fehler 1. Art

Der Fehler 1. Art (engl. type I error) steht für die Wahrscheinlichkeit, dass die Nullhypothese fälschlicherweise abgelehnt wird. Das passiert, wenn die Ergebnisse nur zufällig in den Ablehnungsbereich fallen. Konsequenz ist, dass eine Vermutung statistisch belegt wird, obwohl sie gar nicht stimmt. Die Wahrscheinlichkeit dafür ist also gleich dem Signifikanzniveau (\(\alpha\)).

6.5.2 Fehler 2. Art

Der Fehler 2. Art (engl. type II error) ist die Wahrscheinlichkeit, dass die Nullhypothese fälschlicherweise beibehalten wird. Das passiert immer dann, wenn die Vermutung also eigentlich stimmt, die Stichprobenwerte aber zufällig so ausfallen, dass der Ablehnungsbereich nicht erreicht wird. Konsequenz ist, dass eine korrekte Vermutung statistisch nicht belegt werden kann. Die Wahrscheinlichkeit für einen Fehler 2. Art wird mit \(\beta\) gekennzeichnet.

Tipps zur Vertiefung

Übungsaufgaben

6.5.3 Aufgabe 6-1

zur Lösung

Bestimmen Sie die folgenden kritischen Werte:

  1. \(F_{4;1;5\%}\)
  2. \(F_{8;9;95\%}\)
  3. \(F_{7;10;95\%}\)
  4. \(F_{9;4;95\%}\)
  5. \(F_{3;15;95\%}\)
  6. \(F_{5;6;5\%}\)
  7. \(F_{2;2;5\%}\)
  8. \(F_{100;100;5\%}\)
  9. \(F_{1;20;95\%}\)
  10. \(F_{20;50;95\%}\)

6.5.4 Aufgabe 6-2

zur Lösung

Sie wissen, dass in städtischen Freibädern die Wassertemperatur an verschiedenen Tagen normalverteilt ist. Sie vermuten, dass die Temperatur in zwei Bädern unterschiedlich stark variiert. Sie planen zwei unabhängige Erhebungen an zufälligen Tagen während der Badesaison. Aus organisatorischen Gründen beträgt die Stichprobengröße in „Schwimmbad 1“ \(n_1=5\) und in „Schwimmbad 2“ \(n_2=7\).

  1. Welchen Test führen Sie durch?
  2. Formulieren Sie die Hypothesen.
  3. Sie wählen das Signifikanzniveau \(\alpha=0{,}1\). Was bedeutet diese Zahl?
  4. Bestimmen Sie den Ablehnungsbereich.

6.5.5 Aufgabe 6-3

zur Lösung

(Fortführung von Aufgabe 2)

Sie erheben folgende Werte für die Wassertemperatur:

\[\begin{aligned} \textrm{Schwimmbad 1}:\quad 23{,}3\quad21{,}4\quad20{,}9\quad19{,}4\quad21{,}6&\\ \textrm{Schwimmbad 2} : \quad 21{,}5\quad21{,}7\quad21{,}5\quad21{,}4\quad22{,}0&\quad20{,}9\quad21{,}8 \end{aligned}\]

  1. Berechnen Sie die Prüfgröße.
  2. Welche Schlüsse ziehen Sie aus der Untersuchung?

6.5.6 Aufgabe 6-4

zur Lösung

Sie interessieren sich für das Kommunikationsverhalten von Jugendlichen über WhatsApp. Sie vermuten, dass Nutzer*innen, die die „Gelesen-Benachrichtigung“ deaktiviert haben, im Durchschnitt langsamer antworten als diejenigen, die die Benachrichtigung aktiviert lassen.

Sie finden je Einstellung sechs freiwillige Schüler*innen, die Sie ihre WhatsApp-Protokolle auf die Durchschnittliche Antwortzeit (in Minuten) auswerten lassen (natürlich unter Einwilligung der Eltern).

  1. Welchen Test wollen Sie durchführen? Prüfen Sie die Voraussetzungen. Was könnte hier problematisch sein?
  2. Formulieren Sie die Hypothesen.
  3. Bestimmen Sie den Ablehnungsbereich bei Signifikanzniveau \(\alpha=0{,}05\).

6.5.7 Aufgabe 6-5

zur Lösung

(Fortführung von Aufgabe 4)

Sie ermitteln die folgenden durchschnittlichen Antwortzeiten der individuellen Nutzer*innen (in Minuten): \[\begin{aligned} \textrm{Ohne Benachrichtigung} &: \quad 24{,}7\quad32{,}0\quad48{,}9\quad23{,}7\quad23{,}0\quad10{,}0\\ \textrm{Mit Benachrichtigung} &: \quad18{,}2\quad14{,}3\quad23{,}4\quad31{,}6\quad36{,}4\quad 9{,}2 \end{aligned}\]

  1. Berechnen Sie die Prüfgröße.
  2. Welche Schlüsse ziehen Sie aus der Untersuchung?

6.5.8 Aufgabe 6-6

zur Lösung

In zwei Naturschutzgebieten wird zu zufälligen Zeitpunkten die jeweilige Storchenpopulation erhoben:

\[\begin{aligned} \textrm{Naturschutzgebiet Esselrode}&: \quad17\quad15\quad16\quad22\quad17\quad21\\ \textrm{Naturschutzgebiet Albwald}&:\quad 23\quad17\quad13\quad20\quad19\quad19 \end{aligned}\]

Sie berechnen Mittelwerte, die sich sehr ähneln: 18,0 für Esselrode und 18,5 für Albwald. Sie haben jedoch die Vermutung, dass die Varianzen signifikant voneinander abweichen. Prüfen Sie die Vermutung mit \(\alpha=0{,}1\). (Es sei bekannt, dass die Populationen annähernd normalverteilt sind.)

6.5.9 Aufgabe 6-7

zur Lösung

Ein Musikstreaming-Portal zeichnet die Anzahl der Aufrufe einzelner Tracks nach Aufenthaltsort auf. Sie sind beauftragt nachvollziehen, ob sich die täglichen Aufrufzahlen eines angehenden Sommerhits in Hessen und in Niedersachsen – zwei Länder mit vergleichbaren Abonnent*innenzahlen – signifikant voneinander unterscheiden.

In der letzten Woche waren folgende Zahlen zu verzeichnen:

\[\begin{aligned} \textrm{Hessen}: & \quad 1172 \quad 1180 \quad 1307 \quad 1178 \quad 1156 \quad 1205 \quad 1212 \quad 1150 \quad 1114\\ \textrm{Niedersachsen}: & \quad 1337 \quad 1178 \quad 1230 \quad 1594 \quad 1658 \quad 1274 \quad 1094 \quad 1617 \quad 1056\\ \end{aligned}\]

Wählen Sie \(\alpha = 0{,}01\).

Quellenverzeichnis

Bahrenberg, Gerhard, Ernst Giese und Josef Nipper. 2010. Statistische Methoden in der Geographie. Bd. 1. Univariate und bivariate Statistik. Stuttgart: Bornträger.
Bortz, Jürgen und Christof Schuster. 2010. Statistik für Human- und Sozialwissenschaftler. Berlin: Springer.
Burt, James E. und Gerald M. Barber. 1996. Elementary statistics for geographers. 2nd ed. New York: Guilford Press.
Klemm, Elmar. 2002. Einführung in die Statistik. Für die Sozialwissenschaften. Wiesbaden: Westdeutscher Verlag.
Lange, Norbert de und Josef Nipper. 2018. Quantitative Methodik in der Geographie. UTB Geographie, Methoden, Statistische Verfahren 4933. Paderborn: Ferdinand Schöningh.