Sitzung 4 Schätzstatistik

Lernziele dieser Sitzung

Sie können…

  • eine Punktschätzung für \(\mu\) und \(\sigma\) durchführen.
  • den Standardfehler der Stichprobenverteilung von \(\bar{x}\) bestimmen.
  • eine Intervallschätzung für \(\mu\) durchführen.

Lehrvideos (Sommersester 2020)

4.1 Stichprobenverteilung

Die Stichprobenverteilung ist eine theoretische Verteilung, welche die möglichen Ausprägungen eines statistischen Kennwertes (z. B. \(\bar{x}\)) sowie deren Auftretenswahrscheinlichkeit beim Ziehen von Zufallsstichproben des Umfanges \(n\) beschreibt. (Bortz und Schuster 2010: 83)

Hier ist zunächst die theoretische Verteilung des Mittelwerts einer Stichprobe relevant. Insbesondere interessiert uns, wie sich die theoretische Verteilung des Mittelwerts abhängig von der Stichprobengröße verhält.

4.1.1 Szenario 1: Normalverteilte Grundgesamtheit

Die Grundgesamtheit (Population) einer Variable \(x\) sei normalverteilt mit \(\mu=50\) und \(\sigma^2=25\). Wir können also schreiben:

\[ x \sim N(50, \enspace 25) \]

Die Standardabweichung der Population beträgt entsprechend:

\[\begin{aligned} \sigma&=\sqrt{\sigma^2}\\[4pt] &=\sqrt{25}=5\end{aligned}\]

Graphisch ist die Dichtefunktion der Verteilung in Abbildung 4.1 veranschaulicht.

Dichtefunktion der Grundgesamtheit

Abbildung 4.1: Dichtefunktion der Grundgesamtheit

Wenn eine einzelne Stichprobe der Größe \(n=3\) aus dieser Verteilung gezogen würde, hätte sie drei konkrete Werte (\(x_1\), \(x_2\) und \(x_3\)) sowie ein konkretes arithmetisches Mittel (\(\bar{x}\)).

Es lässt sich jedoch auch eine Wahrscheinlichkeitsdichtefunktion der Mittelwerte aller theoretisch möglichen Stichproben der Größe \(n=3\) (und zusätzlich der Größe \(n=6\)) zeichnen (s. Abbildung 4.2).

Dichtefunktionen der Stichprobenverteilungen

Abbildung 4.2: Dichtefunktionen der Stichprobenverteilungen

4.1.1.1 Erwartungswert

Es fällt auf, dass die Stichprobenverteilungen für \(\bar{x}\) normalverteilt sind und um das arithmetische Mittel der Grundgesamtheit (\(\mu\)) symmetrisch sind.

Das arithmetische Mittel der Stichprobenverteilung \(\mu_{\bar{x}}\) wird auch als Erwartungswert (engl. expected value) von \(\bar{x}\) bezeichnet. Es gilt:

\[ \mu_{\bar{x}} = \mu \tag{4.1} \]

Wir können auch sagen: \(\bar{x}\) ist ein erwartungstreuer Schätzparameter für \(\mu\); nicht weil er in der Empirie zwangsläufig identisch mit \(\mu\) wäre, sondern weil er mit zunehmender Stichprobengröße immer stärker zu \(\mu\) tendiert.

4.1.1.2 Standardfehler

Zusätzlich fällt in Abbildung 4.2 auf: Je größer die Stichprobe, desto gestauchter die Dichtekurve der Stichprobenverteilung: Die theoretische Verteilung von \(\bar{x}\) bei \(n=6\) weist eine kleinere Varianz auf als bei \(n=3\). Das ist einigermaßen intuitiv, denn wir können uns vorstellen, dass das arithmetische Mittel \(\bar{x}\) bei steigender Stichprobengröße ein immer präziserer Schätzwert für \(\mu\) wird.

Die Varianz der Stichprobenverteilung für \(\bar{x}\) bezeichnen wir mit \(\sigma^2_{\bar{x}}\). Sie hängt von der Varianz der Population ab und ist invers proportional zur Stichprobengröße. Es gilt:

\[ \sigma^2_{\bar{x}} = \frac{\sigma^2}{n} \tag{4.2} \]

Die Standardabweichung der Stichprobenverteilung (\(\sigma_{\bar{x}}\)) wird auch Standardfehler (engl. standard error) genannt. Durch Wurzelziehen ergibt sich:

\[ \sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}} \tag{4.3} \]

Zusammenfassend lässt sich sagen:

\[ \begin{aligned} \bar{x} \sim N(\mu, {\textstyle \frac{\sigma^2}{n}}) \quad \textrm{für} \quad x\sim N(\mu, \sigma^2) \end{aligned} \tag{4.4} \]

4.1.2 Szenario 2: Nicht normalverteilte Grundgesamtheit

Die Gleichungen (4.1), (4.2) und (4.3) gelten uneingeschränkt auch für die Stichprobenverteilungen von nicht normalverteilten Populationen. Nur die Normalverteilung der Stichprobenverteilung (Gleichung (4.4)) ist bei nicht normalverteilten Grundgesamtheiten nicht automatisch gegeben.

Das zentrale Grenzwerttheorem (engl. central limit theorem) besagt jedoch:

Die Verteilung von Mittelwerten aus Stichproben des Umfangs \(n\), die derselben Grundgesamtheit entnommen wurden, geht mit wachsendem Stichprobenumfang in eine Normalverteilung über. (Bortz und Schuster 2010: 86)

Abbildung 4.3 veranschaulicht diesen Effekt für eine nicht normalverteilte Grundgesamtheit.

Stichprobenverteilung bei nicht normalverteilter Population

Abbildung 4.3: Stichprobenverteilung bei nicht normalverteilter Population

In der Praxis gilt die Faustregel: Ab einer Stichprobengröße von \(n=30\) können wir statistische Verfahren anwenden, die von einer theoretischen Normalverteilung von \(\bar{x}\) ausgehen – und zwar unabhängig von der Verteilung der Grundgesamtheit.

4.2 Punktschätzung

Bei statistischen Untersuchungen geht es oft darum, ausgehend von der empirischen Verteilung einer Stichprobe auf Parameter der Grundgesamtheit zu schließen.

Die Punktschätzung (engl. point estimation) ist dabei eine vergleichsweise einfache und intuitive Vorgehensweise.

4.2.1 Punktschätzung des arithmetischen Mittels

Wenn eine Stichprobe vorliegt, dann ist ihr arithmetisches Mittel (\(\bar{x}\)) als erwartungstreuer Punktschätzer der wahrscheinlichste Wert für das arithmetische Mittel der Grundgesamtheit (\(\mu\)). Es gilt

\[ \hat{\mu} = \bar{x} \tag{4.5} \]

wobei das Dach auf dem \(\mu\) dafür steht, dass es sich nur um eine Schätzung handelt.

Beispiel:

  • Zehn Studierende der Humangeographie werden zufällig ausgewählt, um ihre Pendelzeit zum IG-Farben-Campus zu erfassen.
  • Die Angaben in Minuten lauten: 22 26 12 23 48 31 15 71 17 35
  • Das arithmetische Mittel der Messreihe lässt sich – wie in Sitzung 2 ausführlich besprochen – berechnen: \(\bar{x}=30\)
  • Da es sich um eine erwartungstreue Schätzgröße (und eine valide Zufallsstichprobe) handelt, kann die durchschnittliche Pendelzeit aller Studierenden der Humangeographie gemäß Gleichung (4.5) auf \(\hat{\mu}=\bar{x}=30\) Minuten geschätzt werden.

Gleichzeitig wissen wir jedoch, dass diese Punktschätzung des arithmetischen Mittels vermutlich nicht ganz präzise ist, sondern einem Standardfehler (\(\sigma_{\bar{x}}\)) unterliegt. Woher wissen wir, wie groß dieser Standardfehler ist (und wie unpräzise damit unsere Schätzung)?

4.2.2 Punktschätzung der Varianz und der Standardabweichung

Bei der Varianz einer Stichprobe \(s^2\) handelt es sich ebenfalls um einen erwartungstreuen Punktschätzer für die Varianz der Grundgesamtheit \(\sigma^2\).

Es gilt also

\[ \hat{\sigma^2} = s^2 \tag{4.6} \]

und damit natürlich auch

\[ \hat{\sigma} = s \tag{4.7} \]

4.2.3 Schätzung des Standardfehlers

Wir führen das obige Beispiel fort:

  • Die Varianz der Stichprobe können wir berechnen: \(s^2\approx319{,}78\) (s.Sitzung 2).
  • Die Varianz der Grundgesamtheit kann also mit Gleichung (4.5) auch auf \(\hat{\sigma^2}=s^2\approx319{,}78\) geschätzt werden.
  • Analog können wir die Standardabweichung der Population auf \(\hat{\sigma}=s\approx17{,}88\) schätzen.
  • Den Standardfehler können wir mit diesem Schätzwert anhand Gleichung (4.3) berechnen. Allerdings benutzen wir statt \(\sigma_{\bar{x}}\) das Symbol \(s_{\bar{x}}\), da es sich um einen Schätzwert handelt:

\[ \begin{aligned} s_{\bar{x}} &= \frac{s}{\sqrt{n}}\\[4pt] &\approx \frac{17{,}88}{\sqrt{10}}\approx5{,}65 \end{aligned} \]

Je größer die Stichprobe, desto genauer lassen sich also Parameter der Population schätzen. Die statistische Antwort auf die Frage, wie groß die Stichprobe denn sein müsse, lautet demnach zunächst immer: Möglichst groß!

Bemerkenswert ist jedoch, dass dabei die Größe der Grundgesamtheit (\(N\), im Beispiel die Anzahl aller Studierenden der Humangeographie) bei diesen Überlegungen überhaupt keine Rolle spielt.

4.3 Intervallschätzung

Um eine Intervallschätzung durchführen zu können, muss:

  • die Standardabweichung der Grundgesamtheit \(\sigma\) bekannt und
  • die theoretische Verteilung von \(\bar{x}\) normalverteilt sein. Das bedeutet:
    • Entweder es ist bekannt, dass die Grundgesamtheit normalverteilt ist
    • Und/oder die Stichprobengröße ist \(n\geq30\)

Für das obige Beispiel der Pendelzeiten wissen wir nicht, wie die Verteilung der Grundgesamtheit aussieht, und die Stichprobengröße (\(n=10\)) ist kleiner als 30. Eine Intervallschätzung können wir hier also nicht durchführen!

Auch bei der Intervallschätzung (engl. interval estimation) geht es darum, das arithmetische Mittel der Population (\(\mu\)) zu schätzen. Allerdings geben wir nicht einfach nur den wahrscheinlichsten Wert an, sondern einen Bereich (ein Intervall), in dem \(\mu\) mit einer bestimmten Wahrscheinlichkeit liegt.

Die Grundüberlegung ist dabei folgende:

  • Wir haben eine empirische Stichprobe vorliegen (und können ihren Mittelwert \(\bar{x}\) und ihre Standardabweichung \(s\) berechnen).
  • Wir wissen dass die theoretische Verteilung aller möglichen Stichproben normalverteilt ist, und um den gesuchten Wert \(\mu\) symmetrisch ist.
  • Den Mittelwert unserer empirischen Stichprobe \(\bar{x}\) können wir uns als zufälligen Wert der theoretischen Stichprobenverteilung von \(\bar{x}\) vorstellen.
  • Wo genau in dieser theoretischen Verteilung wir mit unserem empirischen Wert gelandet sind, wissen wir nicht.
  • Wenn wir den Wert \(\mu\) kennen würden, könnten wir (mit den Methoden aus Sitzung 3) die Wahrscheinlichkeit für einen beliebeigen Bereich angeben, in den ein zufälliges \(\bar{x}\) fällt.
  • Der entscheidende Trick: Weil die Normalverteilung symmetrisch ist, sind diese Wahrscheinlichkeiten analog anzuwenden auf die Bereiche einer konstruierten Verteilung mit gleichem \(\sigma_{\bar{x}}\) um unser \(\bar{x}\), in die der wirkliche Wert \(\mu\) fällt. (s. Abbildung 4.4).
Konstruierte Verteilung um $\bar{x}$

Abbildung 4.4: Konstruierte Verteilung um \(\bar{x}\)

Dabei heißt der Bereich Konfidenzintervall (engl. confidence interval), und seine Breite wird mit \(\textrm{KIB}\) abgekürzt. Die Wahrscheinlichkeit, dass wir mit unserer Schätzung außerhalb des Konfidenzintervalls liegen wird mit \(\alpha\) gekennzeichnet. Ein 95%-Konfidenzintervall hat also ein \(\alpha\) von 0,05 (s. Abbildung 4.5).

Konfidenzintervall

Abbildung 4.5: Konfidenzintervall

Tabelle 4.1: Jahresniederschlag in Hessen
Jahr Niederschlag (l/m²)
2011 855,3
2012 839,5
2013 850,6
2014 873,1
2015 858,3
2016 857,1
2017 861,4

Ein Beispiel soll dies verdeutlichen: Wir wissen, dass die jährliche Niederschlagsmenge in Hessen normalverteilt ist mit \(\sigma=10{,}23\). Wir haben die Messwerte in Tabelle 1 erhoben und möchten den Mittelwert (\(\mu\)) per Intervallschätzung angeben.

Zunächst errechnen wir den Mittelwert unserer empirischen Stichprobe:

\[ \begin{aligned} \bar{x}&\approx856{,}47 \end{aligned} \]

Dann errechnen wir anhand Gleichung (4.3) den Standardfehler der theoretischen Verteilung von \(\bar{x}\):

\[\begin{aligned} \sigma_{\bar{x}}&=\frac{\sigma}{\sqrt{n}}\\[4pt] &\approx\frac{10{,}23}{\sqrt{7}}\approx3,86 \end{aligned}\]

4.3.1 Gesuchtes \(\alpha\)

Nun könnte eine Fragerichtung lauten: Wie groß ist die Wahrscheinlichkeit, dass der Mittelwert der Population \(\mu\) in einem Korridor von ± 5 l/m² um \(\bar{x}\) liegt? 3

Gesucht ist bei einer Konfidenzintervallbreite von \(\textit{KIB}=10\) also die Wahrscheinlichkeit:

\[1-\alpha\approx P(851{,}47 < \mu < 861{,}47)\]

Generalisierend lässt sich schreiben:

\[ 1-\alpha=P(x_{\alpha/2} < \mu < x_{(1-\alpha/2)}) \]

…wobei \(x_{\alpha/2}\) die Untergrenze darstellt und \(x_{(1-\alpha/2)}\) die Obergrenze.

In \(z\)-Werten ausgedrückt:

\[ 1-\alpha=P(z_{\alpha/2} < z_{\mu} < z_{(1-\alpha/2)}) \tag{4.8} \]

In Sitzung 3 haben wir bereits gelernt, wie diese Wahrscheinlichkeit berechnet werden kann. Im Folgenden wird der Rechenweg noch einmal am Beispiel dargelegt.

4.3.1.1 Die umständliche Variante

Zunächst müssen wir die Intervallgrenzen in\(z\)-Werte umwandeln, um die Unter- bzw. Überschreitungswahrscheinlichkeiten ermitteln zu können. Die \(z\)-Transformation muss hier jedoch anhand des Standardfehlers \(\sigma_{\bar{x}}\) geschehen, da wir ja an der Stichprobenverteilung interessiert sind. Durch \(z\)-Transformation mit \(\bar{x}\) und dem Standardfehler \(\sigma_{\bar{x}}\) erhalten wir die standardisierten Intervallgrenzen.

Untergrenze:

\[\begin{aligned} z_{\alpha/2} &= \frac{x_{\alpha/2}-\bar{x}}{\sigma_{\bar{x}}}\\[4pt] &\approx\frac{851{,}47-856,47}{3,86}\approx-1,30 \end{aligned}\]

Obergrenze:

\[\begin{aligned} z_{(1-\alpha/2)} &= \frac{x_{(1-\alpha/2)}-\bar{x}}{\sigma_{\bar{x}}}\\[4pt] &\approx\frac{861{,}47-856,47}{3,86}\approx1,30 \end{aligned}\]

Es ist wenig überraschend, dass die \(z\)-transformierten Werte symmetrisch sind. Wir setzen in Gleichung (4.8) ein:

\[1-\alpha\approx P(-1{,}30 <z_{\mu} < 1{,}30)\]

Dies lässt sich umformen in:

\[ 1-\alpha\approx P(z_{\mu}<1{,}30) - P(z_{\mu}<-1{,}30) \]

Die jeweiligen Wahrscheinlichkeiten lassen sich in der Tabelle für \(p\)-Werte der Normalverteilung nachschauen (bzw. für den negativen \(z\)-Wert errechnen):

\[ \begin{aligned} 1-\alpha&\approx 0,9032 - 0,0968\\ &=0,8064 \end{aligned} \]

Die Wahrscheinlichkeit, dass \(\mu\) im Konfidenzintervall 856,47 ± 5 l/m² liegt, beträgt also 80,64%.

4.3.1.2 Die schnelle Variante

Wir können den \(z\)-Wert für die Obergrenze des Konfidenzintervalls ganz einfach ausrechnen, weil wir wissen, dass die Obergrenze um 5 größer ist als \(\bar{x}\) und dass \(z_{\bar{x}}=0\):

\[\begin{aligned} z_{(1-\alpha/2)}&=\frac{5}{\sigma_{\bar{x}}}\\ &\approx\frac{5}{3,86}\\ &\approx1{,}30 \end{aligned}\]

Oberhalb dieses Werts liegt bekanntermaßen der Anteil \(\frac{\alpha}{2}\), woraus sich mit Blick auf die Tabelle ergibt:

\[\begin{aligned} \frac{\alpha}{2}&=1-0,9032\\[4pt] \alpha&=0,1936 \end{aligned}\]

4.3.2 Gesuchtes Konfidenzintervall

Eine weitere Möglichkeit der Fragestellung lautet: In welchem Bereich liegt das arithmetische Mittel \(\mu\) mit einer Wahscheinlichkeit von 90%?

Vorgegeben ist also \(\alpha=0{,}1\), und gesucht sind die Unter- und die Obergrenze des Konfidenzintervalls.

Wir setzen ein:

\[\begin{aligned} 1-\alpha&=P(z_{\alpha/2} < z_{\mu} < z_{(1-\alpha/2)})\\[4pt] 0{,}9 &= P(z_{5\%} < z_{\mu} < z_{95\%}) \end{aligned}\]

Die entsprechenden \(z\)-Werte der Intervallgrenzen lassen sich (in umgekehrter Suchrichtung) aus der Tabelle ablesen:

\[\begin{aligned} z_{5\%}&\approx-1{,}64\\[4pt] z_{95\%}&\approx 1{,}64 \end{aligned}\]

Durch umgekehrte z-Transformation – auch hier weider mit \(\bar{x}\) und \(\sigma_{\bar{x}}\) – ergeben sich die Intervallgrenzen.

Untergrenze:

\[\begin{aligned} x_{5\%} &= z_{5\%} \cdot \sigma_{\bar{x}} + \bar{x}\\[4pt] &\approx -1{,}64 \cdot 3,86 + 856{,}47\\[4pt] &\approx 850,14\\[6pt] \end{aligned}\]

Obergrenze:

\[ \begin{aligned} x_{95\%}&= z_{95\%} \cdot \sigma_{\bar{x}} + \bar{x}\\[4pt] &\approx 1{,}64 \cdot 3,86 + 856{,}47\\[4pt] &\approx 862,80 \end{aligned}\]

Auch hier gibt es wieder eine kleine Abkürzung: Aufgrund der Symmetrie unserer theoretischen Verteilung gilt für die Konfidenzintervallbreite generell:

\[ \frac{\mathit{KIB}}{2} = z_{(1-\alpha/2)} \cdot \sigma_{\bar{x}} \tag{4.9} \]

Wir setzen einfach unsere Werte ein:

\[\begin{aligned} \frac{\mathit{KIB}}{2} &= z_{95\%} \cdot s_{\bar{x}}\\[4pt] &\approx1{,}64 \cdot 3,86\\[4pt] &\approx 6,33 \end{aligned}\]

Die Intervallgrenzen ergeben sich dann trivial aus \(\bar{x} \pm \frac{\mathit{KIB}}{2}\).

4.3.3 Gesuchtes \(n\)

Eine letzte Fragerichtung lautet: Wie viele Messwerte müssten vorliegen, um den durchschnittlichen Niederschlag mit einem Konfidenzniveau von 99% und einer Genauigkeit von ± 5 l/m² schätzen zu können?

Gegeben sind also das Konfidenzintervall und \(\alpha=0{,}01\), gesucht wird \(n\). Wir wissen, dass die Stichprobengröße \(n\) den Standardfehler \(\sigma_{\bar{x}}\) bestimmt. Also benutzen wir zunächst Gleichung (4.9) und formen um:

\[\begin{aligned} \frac{\mathit{KIB}}{2} &= z_{(1-\alpha/2)} \cdot \sigma_{\bar{x}}\\[4pt] \sigma_{\bar{x}} &= \frac{\mathit{KIB}}{2\cdot z_{(1-\alpha/2)}} \end{aligned}\]

Durch Einsetzen und mit Blick auf die Tabelle erhalten wir:

\[\begin{aligned} \sigma_{\bar{x}} &= \frac{10}{2\cdot z_{99{,}5\%}}\\[4pt] &\approx \frac{10}{2\cdot 2{,}58}\\[4pt] &\approx 1{,}94 \end{aligned}\]

Dieser Standardfehler \(\sigma_{\bar{x}}\approx1{,}94\) würde unseren Anforderungen genügen. Welches \(n\) ist nötig, um diesen Standardfehler zu erreichen? Wir formen Gleichung (4.3) um…

\[\begin{aligned} \sigma_{\bar{x}} &= \frac{\sigma}{\sqrt{n}}\\[4pt] n &= \Big(\frac{\sigma}{\sigma_{\bar{x}}}\Big)^2 \end{aligned}\]

…und setzen den angestrebten Standardfehler sowie die Standardabweichung der Population (\(\sigma=10{,}23\)) ein:

\[ \begin{aligned} n&=\Big(\frac{\sigma}{\sigma_{\bar{x}}}\Big)^2\\[4pt] n&\approx\bigg(\frac{10{,}23}{1{,}94}\bigg)^2\\[4pt] &\approx27{,}80 \end{aligned} \]

Wir müssten also 28 Stichproben vorliegen haben.

Tipps zur Vertiefung

Übungsaufgaben

Die folgenden Aufgaben sind zur eigenständigen Überprüfung Ihrer Lernleistung gedacht (als Vor- oder Nachbereitung der Vorlesung, oder als Klausurübung) und nicht etwa als Hausaufgabe.

4.3.4 Aufgabe 4-1

zur Lösung

Eine Messreihe habe die Werte:

165  173  155  179  158  142
  1. Führen Sie eine Punktschätzung für \(\mu\) und \(\sigma\) der Grundgesamtheit durch.
  2. Welcher Standardfehler für \(\bar{x}\) ist zu erwarten?

4.3.5 Aufgabe 4-2

zur Lösung

Die Sonnenstunden auf einer Ferieninsel (pro Tag, im Jahresdurschnitt) sind annähernd normalverteilt mit einer Standardabweichung von vier Minuten. Der Mittelwert \(\mu\) ist unbekannt, es liegen neun Messwerte vor.

  1. Welcher Standardfehler für \(\bar{x}\) ist zu erwarten?
  2. Welche Konfidenzintervallbreite korrespondiert mit einem Konfidenzniveau von 95%?
  3. Mit welchem Konfidenzniveau lässt sich \(\mu\) auf die Minute genau (± 30 Sekunden) schätzen?
  4. Welche Stichprobengröße ist nötig um den Mittelwert mit einer Konfidenzintervallbreite von zwei Minuten und -niveau von 90% zu schätzen?

4.3.6 Aufgabe 4-3

zur Lösung

Sie intressieren sich für das Durchschnittseinkommen (in EUR) der Haushalte eines Stadtteils. Die Varianz ist mit \(\sigma^2=4096\) bekannt. Eine Zufallsstichprobe von 40 befragten Haushalten weist einen Mittelwert von \(\bar{x}=2650\) auf.

  1. Wie lautet das 90%-Konfidenzintervall?
  2. Mit welcher Wahrscheinlichkeit liegt das Durchschnittseinkommen zwischen 2640 und 2660 EUR?

4.3.7 Aufgabe 4-4

zur Lösung

Es sei bekannt, dass die Lieferzeit eines Bauteils aus Übersee annähernd normalverteilt ist mit einer Standardabweichung von 11,5 Tagen.

Bei sieben Bestellvorgängen werden folgende Lieferzeiten festgestellt (in Tagen):

\[116{,}5\quad 94{,}5\quad101{,}5\quad109{,}0\quad125{,}0\quad112{,}5\quad100{,}5\]

Sie interessieren sich für die tatsächliche durchschnittliche Lieferzeit, von der Sie auch in Zukunft ausgehen können.

  1. Berechnen Sie das arithmetische Mittel der beobachteten Werte für die Lieferzeit.
  2. Was ist der Standardfehler für die Stichprobenverteilung von \(\bar{x}\)?
  3. Zwischen welchen Werten liegt die tatsächliche durchschnittliche Lieferzeit mit 95% Wahrscheinlichkeit?
  4. Wie viele zusätzliche Messungen müssten Sie vornehmen, um den tatsächlichen Mittelwert im selben Wertebereich zu 99% verorten zu können?

Quellenverzeichnis

Bahrenberg, Gerhard, Ernst Giese und Josef Nipper. 2010. Statistische Methoden in der Geographie. Bd. 1. Univariate und bivariate Statistik. Stuttgart: Bornträger.
Bortz, Jürgen und Christof Schuster. 2010. Statistik für Human- und Sozialwissenschaftler. Berlin: Springer.
Burt, James E. und Gerald M. Barber. 1996. Elementary statistics for geographers. 2nd ed. New York: Guilford Press.
Klemm, Elmar. 2002. Einführung in die Statistik. Für die Sozialwissenschaften. Wiesbaden: Westdeutscher Verlag.
Lange, Norbert de und Josef Nipper. 2018. Quantitative Methodik in der Geographie. UTB Geographie, Methoden, Statistische Verfahren 4933. Paderborn: Ferdinand Schöningh.

  1. Genau genommen ist das nicht ganz korrekt, denn tatsächlich kann der Parameter nur innerhalb oder außerhalb des gefundenen Bereichs liegen. Die Wahrscheinlichkeit, dass ein Parameter in einen bestimmten Bereich fällt, ist damit entweder 0 oder 1. (Bortz und Schuster 2010: 93). Mathematisch korrekt müsste es heißen: Die Wahrscheinlichkeit, dass \(\bar{x}\) zu einer Population gehört, deren Parameter \(\mu\) in diesem Bereich liegt…↩︎