Die Zerlegung der Varianzen
Ziel ist die Zerlegung in \(QS_{innerhalb}\) und \(QS_{zwischen}\) zur Berechnung der Varianzen \(\hat{\sigma}_{innerhalb}^2\) und \(\hat{\sigma}_{zwischen}^2\).
Gleichungen und Grundideen der Quadartsummen
\(QS_{Total} = QS_{innerhalb}+ QS_{zwischen}\)
Gesamtabweichung
\(QS_{Total} = \sum \limits_{i=1}^p \sum \limits_{v=1}^n (x_{vi}-\hat{u})^2\)
Summe der quadratischen Gesamtabweichung
Abweichung durch Faktor
\(QS_{zwischen} = n_i* \sum \limits_{i=1}^p (\hat{u_i}-\hat{u})^2\)
Summe der quadrierten Abweichung zwischen den Faktorstufen (Bedingungen der UV, Gruppe)
Abweichung durch Fehler
\(QS_{innerhalb} = \sum \limits_{i=1}^p \sum \limits_{v=1}^n (x_{vi}-\hat{u_i})^2\)
Summe der quadrierten Abweichung innerhalb der Faktorstufen
\(\hat{u} = Gesamtmittelwert\)
\(\hat{u_i} = Mittelwert\,der\, Faktorstufe_i\)
\(n_i = Stichprobeumfang\,in\,Faktor\)
\(x_{vi} = Messwert\, von\, VP.\, in\, der\, Faktorstufe \,i\)
Rohdaten
1 |
45 |
52 |
23 |
18 |
2 |
41 |
53 |
27 |
16 |
3 |
40 |
48 |
29 |
19 |
4 |
44 |
51 |
24 |
21 |
5 |
43 |
52 |
25 |
17 |
Summe |
213 |
256 |
128 |
91 |
Mittelwert |
42.6 |
51.2 |
25.6 |
18.2 |
\(\hat{u} = \frac{213+256+128+91}{4*5} =34.4\)
Berechnung der Quadratsumme-Total
Abweichungsquadrate der Messwerte vom Gesamtmittel
Die \(QS_{total}\) berechnet sich aus der Summe der quadrierten Abweichungen aller Messwerte vom Gesamtmittelwert. Es können auch die Summe der \(QS_{zwischen}\) und der \(QS_{innerhalb}\) zur Berechnung der \(QS_{total}\) addiert werden. Grundsätzlich ist die totale Quadratsumme weniger von Interesse zur Berechnung des Signifikanztests, da diese nicht benötigt wird. Bei der Effektstärkeberechnung wird die \(QS_{total}\) notwendigt.
\((x_{vi}-\hat{u})^2 = (45-34.4)^2 =112.36\)
\((x_{vi}-\hat{u})^2 = (41-34.4)^2 =43.56\)
\((x_{vi}-\hat{u})^2 = (52-34.4)^2 =309.76\)
1 |
112.36 |
309.76 |
129.96 |
268.96 |
2 |
43.56 |
345.96 |
54.76 |
338.56 |
3 |
31.6 |
184.96 |
29.16 |
237.16 |
4 |
92.16 |
275.56 |
108.16 |
179.56 |
5 |
73.96 |
309.76 |
88.36 |
302.76 |
Summe |
353.64 |
1426 |
410.4 |
1327 |
T1<- 112.36+43.56+31.6+92.16+73.96
T1
[1] 353.64
T2<- 309.76+345.96+184.96+275.56+309.76#
T2
[1] 1426
T3<- 129.96+54.76+29.16+108.16+88.36
T3
[1] 410.4
T4<- 268.96+338.56+237.16+179.56+302.76
T4
[1] 1327
Ergebnis der \(QS_{Total}\), \(df_{Total}\), \(\hat{\sigma}_{Total}^2\)
\(QS_{Total} =356.64 + 1426 + 410.4 + 1327 = 3520.04\)
\(df_{Total} =(4*5)-1 = 19\)
\(\hat{\sigma}_{Total}^2 =3520.04 / 19 = 185.265\)
356.64 + 1426 + 410.4 + 1327
[1] 3520.04
3520.04 / 19
[1] 185.2653
Berechnung der Quardartsumme-Zwischen
Die Grundidee bei der \(QS_{Zwischen}\) liegt in der Erklärung der Unterschiede, die auf die UV bzw. das Treatment zurück gehen. Dabei geht es nicht um die Unterschiede zwischen den Personen in einer Gruppe, sondern um die Unterschiede in der Ausprägung. Daher wird bei der Berechnung der \(QS_{Zwischen}\) angenommen, dass es diese Unterschiede gar nicht gibt und somit alle Personen in einer Gruppe denselben Messwert erzielt haben.
Es ist für die Berechnung der \(QS_{Zwischen}\) von Interesse, wie stark die Gruppenmittelwerte um den Gesamtmittelwert streuen.
\((\hat{u_i}-\hat{u})^2 = (42.6-34.4)^2 =67.24\)
\((\hat{u_i}-\hat{u})^2 = (51.2-34.4)^2 =282.24\)
\((\hat{u_i}-\hat{u})^2 = (25.6-34.4)^2 =77.44\)
\((\hat{u_i}-\hat{u})^2 = (18.2-34.4)^2 =262.44\)
1 |
67.24 |
282.24 |
77.44 |
262.44 |
2 |
67.24 |
282.24 |
77.44 |
262.44 |
3 |
67.24 |
282.24 |
77.44 |
262.44 |
4 |
67.24 |
282.24 |
77.44 |
262.44 |
5 |
67.24 |
282.24 |
77.44 |
262.44 |
Summe |
336.2 |
1411.2 |
387.2 |
1312.2 |
Ergebnis der \(QS_{Zwischen}\), \(df_{Zwischen}\), \(\hat{\sigma}_{Zwischen}^2\)
\(QS_{Zwischen} = 336.2 + 1411.2 + 387.2 + 1312.2 = 3446.8\)
\(df_{Zwischen} = 4-1 = 3\)
\(\hat{\sigma}_{Zwischen}^2 = 3446.8 / 3 = 1148.933\)
Berechnung der Quardartsumme-Innerhalb
Die \(QS_{innerhalb}\) spiegelt die Abweichungen wider, die aufgrund von Messfehlern und individuellen Eigenheiten einer Person dafür sorgen, dass der individuelle Messwert vom geschätzten Gruppenmittelwert abweicht. Um die \(QS_{innerhalb}\) zu berechnen, wird für jede Gruppe die quadrierte Abweichung der Messwerte von jeder Personen mit dem jeweiligen Gruppenmittelwert berechnet.
Rohwerte
1 |
45 |
52 |
23 |
18 |
2 |
41 |
53 |
27 |
16 |
3 |
40 |
48 |
29 |
19 |
4 |
44 |
51 |
24 |
21 |
5 |
43 |
52 |
25 |
17 |
Summe |
213 |
256 |
128 |
91 |
Mittelwert |
42.6 |
51.2 |
25.6 |
18.2 |
\[(x_{2,1}-\hat{v})^2 = (45-42.6)^2 = 5.76 \]
\[(x_{2,2}-\hat{v})^2 = (41-42.6)^2 = 2.56 \]
\[(x_{3,1}-\hat{v})^2 = (52-51.2)^2 = 0.64 \] \[(x_{4,1}-\hat{v})^2 = (23-25.6)^2 = 6.76 \]
1 |
5.76 |
0.64 |
6.76 |
0.04 |
2 |
2.56 |
3.24 |
1.96 |
4.84 |
3 |
6.76 |
10.24 |
11.56 |
0.64 |
4 |
1.96 |
0.04 |
2.56 |
7.84 |
5 |
0.16 |
0.64 |
0.36 |
1.44 |
Summe |
17.2 |
14.8 |
23.2 |
14.8 |
Ergebnis der \(QS_{innerhalb}\), \(df_{innerhalb}\), \(\hat{\sigma}_{innerhalb}^2\)
\(QS_{innerhalb} = 17.2 + 14.8 + 23.2 + 14.8 = 70\)
\(df_{innerhalb} = 4*(5-1) = 16\)
\(\hat{\sigma}_{innerhalb}^2 = 70 / 16 = 4.375\)
\(F_{kritisch}\)
F-Verteilung
\(df_{Zähler} = df_{zwischen} = 3\)
\(df_{Nenner} = df_{innerhalb} = 16\)
Der Wert für \(F_{kritisch}\) liegt bei 3.24.
\(F_{empirisch}\)
\[F_{emp}= \frac{\hat{\sigma}_{Zwischen}^2}{\hat{\sigma}_{innerhalb}^2} = \frac{1148.933} {4.375} = 262.61\]
Signifikanz der Teststatistik
Je mehr Variation durch die Stufenzugehörigkeit erklärt wird, desto höher fällt der F-Wert aus.
\(QS_{zwischen}\) ein Mass für die erklärte Varianz darstellt, während \(QS_{innerhalb}\) ein Mass für die Residualvarianz des Modells darstellt.
Ist der F-Wert höher als der kritische Wert, so ist der Test signifikant.
\[F_{kritisch} = 3.24 < 262.61 = F_{emp}\]
