Wer schon einmal mit diskreten Zufallsvariablen zu tun hatte, der weiß, dass man den Erwartungswert manchmal vor lauter Summenzeichen nicht mehr erkennt 🙂 In der Regel kommt man in der Welt der kontinuierlichen Statistik deutlich schneller ans Ziel. Daher zeige ich heute, wie man den Erwartungswert einer diskreten Zufallsvariable über die analoge kontinuierliche Verteilung nähern kann.

Diskret

Der Erwartungswert diskreter Zufallsvariablen berechnet sich als Summe aller möglichen Werte, multipliziert mit deren Wahrscheinlichkeit. Die Werte  x_{d} \in N ergeben sich aus dem Sachverhalt und die Wahrscheinlichkeiten – nun ja – eben aus der Wahrscheinlichkeitsverteilung 😉

\displaystyle E[X]=\sum_{x_{d}=1}^{n} \Big(x\cdot P(X=x_{d})\Big)

Nehmen wir dazu ein altbekanntes Beispiel her: Würfeln. Für einen sechsseitigen ungezinkten Würfel kommen wir auf den Wert, welchen wir ja aus der Schule bereits kennen:

\displaystyle E[X]=\sum_{x_{d}=1}^{6} \Big(x_{d}\cdot P(X=x_{d})\Big)=\left(\frac{1}{6}\right)\cdot \Big(1+2+3+4+5+6\Big)=3,5

Was wir hier getan haben ist ja eher so etwas wie „numerisches Bestimmen“ des Erwartungswertes. Um eine allgemeine Formel für einen n-seitigen Würfel angeben zu können, bedarf es der Gaußschen Summenformel. Damit ergibt sich die nachfolgende Formel.

\displaystyle E[X]=\sum_{x_{d}=1}^{n} \Big(x_{d}\cdot P(X=x_{d})\Big)=\left(\frac{1}{n}\right)\sum_{x_{d}}^{ } x_{d}=\left(\frac{1}{n}\right)\cdot \left(\frac{n(n+1)}{2}\right)=\frac {n+1}{2}

So einfach wie im Fall der Gaußschen Summenformel lassen sich die Summenterme aber selten ersetzen. Um nicht in die Untiefen von Reihen und Folgen abtauchen zu müssen, werden wir versuchen, die Formel auch ohne Herrn Gauß herzuleiten!

Kontinuierlich

Tauschen wir also Summe gegen Integral, Wahrscheinlichkeitsverteilung gegen Dichtefunktion und die diskrete Laufvariable x_{d} gegen ein kontinuierliches x_{k} \in R :

\displaystyle E[X]=\int\displaylimits_{a}^{b}x_{k} \cdot f(x_{k})\,dx_{k}

Zuerst sollten wir kurz den Übergang der diskreten Wahrscheinlichkeitsverteilung in die Dichtefunktion f(x) betrachten. Statt mit diskreten Werten muss diese mit Intervallen befüttert und integriert werden, da sie per Definition an einer einzelnen Stelle 0 ist.

\displaystyle P(X=x_{d}) \neq \int\displaylimits_{x_{d}}^{x_{d}}f(x_{k})\,dx_{k} = 0

\displaystyle P(X=x_{d})=\int\displaylimits_{x_{k}-\frac{1}{2}}^{x_{d}+\frac{1}{2}}f(x_{k})\,dx_{k} =\int\displaylimits_{x_{d}-\frac{1}{2}}^{x_{d}+\frac{1}{2}}\frac{1}{n}\,dx_{k}=\frac{1}{n}

Wie man sieht, kommt man durch Integration der uniformen Dichtefunktion mit Betrag 1/n letztlich auch zur Wahrscheinlichkeit von 1/n für die einzelnen Würfelergebnisse x_{d} . Der ein oder andere mag sich jetzt wegen der Integrationsgrenzen irritiert zeigen. Prinzipiell hätte ja auch die Integration von x_{d}-1 bis  x_{d} das gleiche Ergebnis zu Tage gefördert. Spätestens bei der Berechnung des Erwartungswertes löst die Wahl dieser Intervallgrenzen aber einige Probleme, da  x_{k} um den Wert von x_{d} herum im Mittel zu x_{d} wird. Dies ist für die Approximation von sehr großer Bedeutung. Nun aber zurück zur Berechnung des Erwartungswertes:

\displaystyle E[X] \approx \int\displaylimits_{x_{min}-\frac{1}{2}}^{x_{max}+\frac{1}{2}}x_{k} \cdot f(x_{k})\,dx_{k}=\int\displaylimits_{\frac{1}{2}}^{n+\frac{1}{2}}x_{k} \cdot \left(\frac{1}{n}\right)\,dx_{k}=\left [ \frac{x_{k}^{2}}{2n} \right ]_{\frac{1}{2}}^{n+\frac{1}{2}}=\frac{n+1}{2}

Was für eine Überraschung: Wir kommen auf den gleichen Term wie der, den wir eingangs als exakte Formel für den Erwartungswert der gleichverteilten Zufallsvariable X kennengelernt haben! Fairerweise muss man jedoch auch erwähnen, dass dies nur in diesem Fall so hervoragend funktioniert, weil die Dichtefunktion konstant ist und dadurch wie ein Faktor um das Integral \int x_{k} wirkt, welches sich bei den gewählten Integrationsgrenzen wiederrum wie \sum x_{d} verhält.

Etwas weniger Linearität bitte!

Was in diesem einfach Beispiel funktioniert hat, geht natürlich auch komplizierter 🙂 Wir können den Erwartungswert beliebiger Transformationen von X nähern:

\displaystyle E[g(X)] \approx \int\displaylimits_{x_{min}-\frac{1}{2}}^{x_{max}+\frac{1}{2}}g(x_{k}) \cdot f(x_{k})\,dx_{k}

Als Beispiel können wir ja mal schauen, welchen Erwartungswert wir erhalten, wenn wir die Zahlen des n-seitigen Würfels quadrieren. Dabei ist g(z)=z^{2}  wodurch sich nach Einsetzen folgendes Resultat einstellt.

\displaystyle E[X^{2}] \approx \int\displaylimits_{x_{min}-\frac{1}{2}}^{x_{max}+\frac{1}{2}}x_{k}^{2} \cdot f(x_{k})\,dx_{k}=\int\displaylimits_{\frac{1}{2}}^{n+\frac{1}{2}}x_{k}^{2} \cdot \left(\frac{1}{n}\right)\,dx_{k}=\left [ \frac{x_{k}^{3}}{3n} \right ]_{\frac{1}{2}}^{n+\frac{1}{2}}=\frac{n^{2}}{3}+\frac{n}{2}+\frac{1}{4}

 Nur mal zum Vergleich: Für einen 6-seitigen Würfel ist der Erwartungswert tatsächlich (1^{2}+2^{2}+3^{2}+4^{2}+5^{2}+6^{2})/6 \approx 15,167  während die Approximation 15,25 ergibt. Es existieren weniger lineare Näherungen also durchaus Abweichungen. Diese Abweichungen, also den Fehler der Approximation, werde ich in meinem nächsten Beitrag genauer untersuchen. Es bleibt also spannend!

Nachtrag:

Zum Thema Abweichung der Approximation habe ich den Artikel „Fehlerbetrachtung bei der Approximation diskreter Erwartungswerte“ online gestellt.