Was die Welt im Innersten zusammenhält

Ein wissenschaftlicher Blog über die verblüffenden Zusammenhänge der Welt

Kategorie: Statistik (page 1 of 2)

Alternative Formel für den Erwartungswert

In der Mathematik kann man durch Wechsel der Perspektive mitunter sehr hilfreiche Formeln ans Tageslicht befördern. Für den Erwartungswert einer Zufallsvariable X gilt im diskreten Fall:

\displaystyle \mu=E(X)=\sum_{x=0}^{\infty} \Big(1-F(x)\Big)

Und im kontinuierlichen Fall gilt:

 \displaystyle \mu=E(X)=\int_{x=0}^{\infty} \Big(1-F(x)\Big)

Dieser Beitrag erklärt, wie sich diese Formeln herleiten lassen.

Lesen Sie weiter →

Zusammenhang zwischen Varianz und Chi-Quadrat-Verteilung

Eine der Sachen, die ich nie so richtig nachvollziehen konnte, ist die Beziehung der Chi-Quadrat-Verteilung zur Stichprobenarianz. Diese Beziehung nutzt man beispielsweise, um bei vorliegender Stichprobenvarianz einer normalverteilten Grundgesamtheit auf die Varianz der Population zu schließen. Wir sprechen also über eines der wichtigeren Kapitel der Statistik. Lesen Sie weiter →

Mittelwerte und Erwartungswerte dividieren

In meinen früheren Beiträgen habe ich bereits über Addieren und Multiplizieren von Mittel- und Erwartungswerten berichtet. Was das Dividieren angeht, möchte ich jedoch etwas zur Vorsicht mahnen. Man muss genau schauen, ob tatsächlich der Kehrwert vom Mittelwert gemeint ist!

Man bedenke folgendes Beispiel: Alex behält seine Autos in der Regel für ein Jahr, Ina zwei Jahre und Peter 9 Jahre. Im Mittel behalten sie die Autos also 4 Jahre. Heißt das nun, dass die drei Personen im Durchschnitt 10/4=2,5 Autos pro 10 Jahre besitzen? Sehen wir uns die Sache anhand des Bildes unten genauer an.

Das Reziproke des Mittelwertes der Besitzdauer entspricht nicht dem Mittelwert der Autos je 10 Jahre

Das Reziproke des Mittelwertes der Besitzdauer entspricht nicht dem Mittelwert der Autos je 10 Jahre

Lesen Sie weiter →

(Irreführendes) Erscheinungsbild der Log-Normalverteilung

Eine der bekanntesten Verteilungen der Statistik ist die Normalverteilung. Und weil sie so bekannt ist, sind auch relativ viele Menschen schnell dabei, Sachverhalte als normalverteilt hinzunehmen. Oftmals kann aber die Log-Normalverteilung – sozusagen der kleine Bruder der Normalverteilung – das passendere Modell sein! Prominente Beispiele für logarithmisch normalverteilte Daten sind wichtige Themen wie Spritverbräuche und Renditen. In diesem Beitrag soll es darum gehen, dass man den Unterschied zwischen der Normalverteilung und der Log-Normalverteilung manchmal nicht auf den ersten Blick sieht.

Lesen Sie weiter →

Warum man Erwartungswerte / Mittelwerte multiplizieren darf

Zum Überschlagen von Erwartungswerten kann es hilfreich sein, wenn man Erwartungswerte multipliziert. Dieser Beitrag zeigt, dass es legitim ist Erwartungswerte zu multiplizieren, wenn es sich – anders als beim Addieren von Erwartungswerten – um Erwartungswerte unabhängiger Zufallsvariablen handelt. Da Mittelwerte Schätzer von Erwartungswerten sind, gelten die Ausführungen auch für Mittelwerte. Lesen Sie weiter →

Warum man Erwartungswerte und Mittelwerte addieren darf

Es handelt sich zwar um einen sehr intuitiven Aspekt der Statistik, der Vollständigkeit wegen sollte er aber nicht unerwähnt bleiben: Warum man Erwartungswerte addieren darf. Da Mittelwerte Schätzer von Erwartungswerten sind, gelten die Ausführungen auch für Mittelwerte. Lesen Sie weiter →

Die Sterbewahrscheinlichkeit – Tödlich langweilige Statistik?

In ihrem Beitrag „Warum es keine 140jährigen Menschen gibt“ beschreibt die sympathische Autorin, weshalb die Wahrscheinlichkeit sehr gering ist, dass ein Mensch in die Alterssphären von 110, 120 oder gar 130 Jahren vordringt. Demnach erreichen beispielsweise von tausend 100jährigen gerade einmal 6 ein Alter von 110. Die Rechnung ist durchdacht und hinsichtlich ihrer Schlüsse kann ich der Autorin in weiten Teilen reinen Gewissens folgen. Nichtsdestotrotz erscheinen einige Zwischenergebnisse unter Berücksichtigung von Wahrscheinlichkeitsverteilungen in einem ganz anderen Licht – wie ich zeigen werde! Lesen Sie weiter →

Das Zwei-Zettel-Spiel

Früher hatten die Menschen wohl noch Zeit, um sich den wirklich interessanten Fragen des Alltags zu stellen. Thomas M. Cover stieß beispielsweise auf das Phänomen des Zwei-Zettel-Spieles. Die Idee ist simpel: Man nehme zwei Zettel und lasse von einer Person zwei zufällige (und sinnvollerweise auch unterschiedliche) Zahlen darauf schreiben. Nun darf man einen der beiden Zettel wählen. Nach Betrachtung der darauf notierten Zahl, muss man einen Tipp darüber abgeben, ob die Zahl auf dem anderen Zettel größer oder kleiner ist. Da es sich um beliebige Zahlen handeln kann, müsste die Wahrscheinlichkeit für einen korrekten Tipp bei 50% liegen. Tatsächlich gibt es aber eine Strategie, die mindestens 50% Trefferwahrscheinlichkeit erzielt. Es gibt Dinge, die sind schon verblüffend! Lesen Sie weiter →

Verteilung multiplizierter Zufallsvariablen

Vor Kurzem fragte ich mich, wie man wohl die Verteilungsfunktionen des Produktes zweier unabhängiger Zufallsvariablen bestimmen könne. Nachdem die Internetrecherchen nicht viel hergaben, musste ich meinen Hirnschmalz zusammennehmen… und meine Erkenntnisse mit euch teilen 🙂 Lesen Sie weiter →

Warum man Varianzen addieren darf

Viele Menschen verwenden ja Regeln, die garnicht mehr hinterfragt werden. Beispielsweise dürfen Varianzen unabhängiger Zufallsvariablen direkt addiert werden, sofern die Zufallsvariablen unabhängig sind. Die Begründung für diesen Umstand weiß man dann oft nicht so genau. Daher möchte ich hier die Herleitung der Regel kurz skizzieren. Vielleicht hilft es euch, im Vorfeld zu lesen, warum man Erwartungswerte addieren und multiplizieren kann. Lesen Sie weiter →

Older posts