Eine der Sachen, die ich nie so richtig nachvollziehen konnte, ist die Beziehung der Chi-Quadrat-Verteilung zur Stichprobenarianz. Diese Beziehung nutzt man beispielsweise, um bei vorliegender Stichprobenvarianz einer normalverteilten Grundgesamtheit auf die Varianz der Population zu schließen. Wir sprechen also über eines der wichtigeren Kapitel der Statistik.
Einfache Variante mit Populationsmittelwert
Die Chi-Quadrat-Verteilung ist definiet als Summe unabhängiger quadrierter standardnormalverteilter Zufallsvariablen wobei .
Die (Populations-)Varianz einer Zufallsgröße hingegen ist definiet als:
Ein Schätzer hierfür ist:
Der Zusammenhang zur Chi-Quadrat-Verteilung wird offenkundig, wenn wir beide Seite mit multiplzieren.
Wir sehen, dass mittels der Division durch eine statistische z-Transformation stattfindet. Diese wiederum führt für die Stichprobenwerte aus einer normalverteilten Grundgesamtheit zu einer Summe unabhängiger quadrierter standardnormalverteilter Zufallsvariablen. Genau diese haben wir am Anfang des Beitrags für die Definition der Chi-Quadrat-Verteilung hergenommen. Das Verhältnis zwischen Stichproben- und Populationsvarianz folgt also in Abhängigkeit des Stichprobenumfanges einer Chi-Quadrat-Verteilung!
Fortgeschrittene Variante mit Stichprobenmittelwert
Gerechtfertigterweise muss auch die Gültigkeit unter Verwendung der korrigierten Stichprobenvarianz für Stichproben (und damit unbekanntem Populationsmittelwert) gezeigt werden.
Wir nutzen den Zusammenhang
und können die Formel für die Stichprobenvarianz schreiben als:
Eine Multiplikation mit ergibt:
Und wir stellen um:
Um einfacher auf die Terme referenzieren zu können, führe ich die Variablen ein. Damit liest sich die Gleichung nun so:
und , weil die Terme sich auf den echten Populationsmittelwert beziehen und damit unabhängig sind. Im Gegensatz dazu basieren die Summanden in auf . Da aus den berechnet wird, kann man maximal der verschiedenen verändern ohne die Summe zu verändern. hat daher nur Freiheitsgrade. Sinngemäß sagt uns der Satz von Cochran, dass und dass die Freiheitsgrade für die 3 Ausdrücke konstant sind. Also: , und .
Gemäß Cochran muss dann aber analog zu auch . Also,
Mir leuchtet die Sache nun ein und ich hoffe, dass auch euch der Zusammenhang zwischen Varianz und Chi-Quadrat-Verteilung etwas klar geworden ist. 😉
Read about the relationship between variance and chi-squared distribution on Insight Things.
16. Juni 2017 at 7:38
Danke!
Endlich mal eine ordentliche Herleitung warum die Stichprobenvarianz Chi-Quadrat verteilt. Der Satz von Cochran ist auch ein guter Hinweis an dieser Stelle. Kannte ich vorher nicht.