Die Zerlegung der Varianzen
Gleichungen und Grundideen der Quadratsummen
Ziel ist die Zerlegung in \(QS_{treat}\) und \(QS_{Res}\) zur Berechnung der Varianzen \(σ^2_{treat}\) und \(σ^2_{Res}\).
\(QS_{Total} = QS_{zwischen} + QS_{innerhalb}= QS_{zwischen}+ QS_{treat}+ QS_{Res}\)
Gesamtabweichung
\[QS_{Total} = \sum \limits_{i=1}^p \sum \limits_{v=1}^n (x_{vi}-\hat{u})^2\]
Summe der quadratischen Gesamtabweichung
Abweichung durch Faktor
\[QS_{zwischen} = p* \sum \limits_{v=1}^n (\hat{u_v}-\hat{u})^2\]
Summe der quadrierten Abweichung zwischen der Faktorstufen (Bedingungen der UV, Gruppe)
Abweichung innerhalb der Faktorstufen
\[QS_{innerhalb} = \sum \limits_{i=1}^p \sum \limits_{v=1}^n (x_{vi}-\hat{u_v})^2\]
Summe der quadrierten Abweichung innerhalb der Faktorstufen
Abweichung durch Residuums (“Fehler”)
\[QS_{Res} = \sum \limits_{i=1}^p \sum \limits_{v=1}^n (x_{vi}-\hat{u_i}-\hat{u_v}+\hat{u})^2\]
Summe der quadrierten Abweichung der Residual
Abweichung durch Treatment (Faktorstufen)
\[QS_{treat} = n* \sum \limits_{i=1}^p (\hat{u_i}-\hat{u})^2\]
\(\hat{u} = Gesamtmittelwert\)
\(\hat{u_i} = Mittelwert\,der\, Faktorstufe_i\)
\(n_i = Stichprobeumfang\,in\,Faktor\)
\(x_{vi} = Messwert\, von\, VP.\, in\, der\, Faktorstufe \,i\)
Rohdaten
1 |
85 |
82 |
75 |
70 |
312 |
78 |
2 |
81 |
78 |
73 |
66 |
298 |
74.5 |
3 |
80 |
72 |
68 |
62 |
282 |
70.5 |
4 |
74 |
71 |
65 |
61 |
271 |
67.75 |
5 |
79 |
68 |
61 |
59 |
267 |
66.75 |
Summe |
399 |
371 |
342 |
318 |
1430 |
|
Mittelwert |
79.8 |
74.2 |
68.4 |
63.6 |
- |
71.5 |
\(\hat{u} = \frac{79.8+74.2+68.4+63.6}{4} =71.5\)
Berechnung der Quadratsumme-Total
Abweichungsquardrate der Messwerte vom Gesamtmittel Zur Berechnung der \(QS_{Total}\) werden die Rohwerte der 5 Teilnehmern zu den 4 Messzeitpunkten mit dem Gesamtmittelwert subtrahiert und anschließend quadriert. Die Summe dieser 20 Werte ist \(QS_{Total}\).
Die totale Quadratsumme repräsentiert die Gesamtvariation der Messwerte. Die Berechnung ist identisch zur einfaktoriellen Varianzanalyse ohne Messwiederholung.
\(QS_{Total} = (85-71.5)²+ (82-71.5)²+(75-71.5)²+(70-71.5)²+(81-71.5)²\\+....+(68-71.5)²+(61-71.5)²+(59-71.5)²= 1141\)
\(df_{Total} = (n*p)-1= 20-1 = 19\)
\(\hat{\sigma}_{Total}^2 =1141 / 19 = 285.25\)
Berechnung der Quadratsumme-Zwischen
Es wird die Summe der quadrierten Abweichungen der Mittelwerte jeder Person über alle vier Messzeitpunkte vom Grundniveau ermittelt. Dazu werden die unterschiedlichen beobachteten Messwerte einer Person zu den vier Messzeitpunkten durch den Mittelwert der Person über die vier Messzeitpunkte ersetzt. Da man davon ausgeht, dass die A-priori Unterschiede zwischen den Personen am besten durch die Mittelwerte der Personen über die Messzeitpunkte repräsentiert werden.
Rohdaten
1 |
85 |
82 |
75 |
70 |
312 |
78 |
2 |
81 |
78 |
73 |
66 |
298 |
74.5 |
3 |
80 |
72 |
68 |
62 |
282 |
70.5 |
4 |
74 |
71 |
65 |
61 |
271 |
67.75 |
5 |
79 |
68 |
61 |
59 |
267 |
66.75 |
Summe |
399 |
371 |
342 |
318 |
1430 |
|
Mittelwert |
79.8 |
74.2 |
68.4 |
63.6 |
- |
71.5 |
\((\hat{u_v}-\hat{u})^2 = (78-71.5)^2 = 42.25\)
\((\hat{u_v}-\hat{u})^2 = (74.5-71.5)^ = 9\)
\((\hat{u_v}-\hat{u})^2 = (70.5-71.5)^2 = 1\)
\((\hat{u_v}-\hat{u})^2 = (67.75-71.5)^2 = 14.06\)
\((\hat{u_v}-\hat{u})^2 = (66.75-71.5)^2 = 22.56\)
1 |
42.25 |
42.25 |
42.25 |
42.25 |
169 |
2 |
9 |
9 |
9 |
9 |
36 |
3 |
1 |
1 |
1 |
1 |
4 |
4 |
14.06 |
14.06 |
14.06 |
14.06 |
56.25 |
5 |
22.56 |
22.56 |
22.56 |
22.56 |
90.24 |
Summe |
88.87 |
88.87 |
88.87 |
88.87 |
355.48 |
88.87*4
[1] 355.48
169+36+4+56.25+90.24
[1] 355.49
\(QS_{Zwischen} = 4*[(78-71.5)² +(74.5-71.5)²+(70.5-71.5)²+(67.75-71.75)²+(66.75-71.5)²]= 355.48\)
\(df_{Zwischen} = n-1 = 5-1 = 4\)
\(\hat{\sigma}_{Zwischen}^2= 355.48 / 4 = 88.87\)
Berechnung der Quadratsumme-Innerhalb
In diesem Punkt ermitteln wir die Abweichungen der Messwerte einer Person, die zu den unterschiedlichen Messzeitpunkten erhoben wurden, vom jeweiligen Mittelwert der Person über die Messzeitpunkte hinweg. Dabei werden die individuellen Mittelwerte eine Schätzung der „wahren“ Ausprägung der Person darstellt. Dadurch müssen wir einen Korrektur bei jeder Person p durchführen. Damit ergibt sich folgende Formel für die Freiheitsgrade n·(p−1).
Rohdaten
1 |
85 |
82 |
75 |
70 |
312 |
78 |
2 |
81 |
78 |
73 |
66 |
298 |
74.5 |
3 |
80 |
72 |
68 |
62 |
282 |
70.5 |
4 |
74 |
71 |
65 |
61 |
271 |
67.75 |
5 |
79 |
68 |
61 |
59 |
267 |
66.75 |
Summe |
399 |
371 |
342 |
318 |
1430 |
|
Mittelwert |
79.8 |
74.2 |
68.4 |
63.6 |
- |
71.5 |
\((x_{vi}-\hat{u_v})^2 = (85-78)^2 = 49\)
\((x_{vi}-\hat{u_v})^2 = (82-78)^2 = 16\)
\((x_{vi}-\hat{u_v})^2 = (82-78)^2 = 9\)
\((x_{vi}-\hat{u_v})^2 = (70-78)^2 = 64\)
\((x_{vi}-\hat{u_v})^2 = (81-74.5)^2 = 42.25\)
1 |
49 |
16 |
9 |
64 |
138 |
2 |
42.25 |
12.25 |
2.25 |
72.25 |
129 |
3 |
90.25 |
2.25 |
6.25 |
72.25 |
171 |
4 |
39.06 |
10.56 |
7.56 |
45.56 |
102.74 |
5 |
150.06 |
1.56 |
33.06 |
60.06 |
244.74 |
|
|
|
|
|
785.48 |
138+129+171+102.74+244.74
[1] 785.48
\(QS_{innerhalb} = (85-78)²+(82-78)²+(75-78)²+(70-78)²+(81-74.5)²+....+(61-66.75)²+(59-66.75)²= 785.48\)
\(df_{innerhalb} = n*(p-1) =5*(4-1) = 15\)
\(\hat{\sigma}_{innerhalb}^2 = 785.48/ 15 = 52.365\)
Berechnung der Quadratsumme-Treatment (Faktorstufen)
Die \(QS_{treat}\) stellen den Anteil der Unterschiedlichkeit aller Messwerte dar, der auf die Aufprägunstufen zurückgeführt werden kann. Das bedeutet, dass es sich um ein “systematischen” Veränderungen der Messwerte aufgrund des Treatments zwischen den Messzeitpunkten handelt.
Die \(QS_{treat}\) berechnet sich durch das Aufsummieren der quadrierten Abweichungen der jeweiligen Mittelwerte zu jedem Messzeitpunkt vom Gesamtmittelwert.
Rohdaten
1 |
85 |
82 |
75 |
70 |
312 |
78 |
2 |
81 |
78 |
73 |
66 |
298 |
74.5 |
3 |
80 |
72 |
68 |
62 |
282 |
70.5 |
4 |
74 |
71 |
65 |
61 |
271 |
67.75 |
5 |
79 |
68 |
61 |
59 |
267 |
66.75 |
Summe |
399 |
371 |
342 |
318 |
1430 |
|
Mittelwert |
79.8 |
74.2 |
68.4 |
63.6 |
- |
71.5 |
\((\hat{u_i}-\hat{u})^2 = (79.8-71.5)^2 = 68.89\)
\((\hat{u_i}-\hat{u})^2 = (74.2-71.5)^2 = 7.29\)
\((\hat{u_i}-\hat{u})^2 = (68.4-71.5)^2 = 9.61\)
\((\hat{u_i}-\hat{u})^2 = (63.6-71.5)^2 = 62.41\)
1 |
68.89 |
7.29 |
9.61 |
62.41 |
148.2 |
2 |
68.89 |
7.29 |
9.61 |
62.41 |
148.2 |
3 |
68.89 |
7.29 |
9.61 |
62.41 |
148.2 |
4 |
68.89 |
7.29 |
9.61 |
62.41 |
148.2 |
5 |
68.89 |
7.29 |
9.61 |
62.41 |
148.2 |
Summe |
344.45 |
36.45 |
48.05 |
312.05 |
741 |
a <-((79.8-71.5)^2 )*5
b <-((74.2-71.5)^2 )*5
c <-((68.4-71.5)^2 )*5
d <-((63.6-71.5)^2 )*5
a+b+c+d
\(QS_{treat} = 5*[(79.8-71.5)²+(74.2-71.5)²+(68.4-71.5)²+(63.6-71.5)²]= 741\)
\(df_{treat} = p-1= 4-1 = 3\)
\(\hat{\sigma}_{treat}^2 = 741 /3 = 247\)
a <-((79.8-71.5)^2 )*5
b <-((74.2-71.5)^2 )*5
c <-((68.4-71.5)^2 )*5
d <-((63.6-71.5)^2 )*5
a+b+c+d
Berechnung der Quadratsumme-Residuals
Es werden vier Werte zur Berechnung herangezogen:
+die beobachteten Messwerte der Person zu dem Messzeitpunkt
+der Mittelwert der jeweiligen Person
+der Mittelwert des jeweiligen Messzeitpunkts
+der Mittelwert der Person über alle Messwiederholungsstufen
In der Residualvarianz werden die Effekte der Interaktion zwischen Person und Messzeitpunkt, sowie auch die Residuals berücksichtigt. Allerdings sind der Messzeitpunkteffekt und der Personeneffekt in dieser Quadratsumme multiplikativ verknüpft, da es sich um eine Interaktion handelt. Demzufolge werden auch bei der Berechnung der Freiheitsgrade (n−1) und (p−1) multipliziert.
Rohdaten
1 |
85 |
82 |
75 |
70 |
312 |
78 |
2 |
81 |
78 |
73 |
66 |
298 |
74.5 |
3 |
80 |
72 |
68 |
62 |
282 |
70.5 |
4 |
74 |
71 |
65 |
61 |
271 |
67.75 |
5 |
79 |
68 |
61 |
59 |
267 |
66.75 |
Summe |
399 |
371 |
342 |
318 |
1430 |
|
Mittelwert |
79.8 |
74.2 |
68.4 |
63.6 |
- |
71.5 |
\((x_{vi}-\hat{u_i}-\hat{u_v}+\hat{u})^2 = (85-79.8-78+71.5)^2 = 1.69\)
\((x_{vi}-\hat{u_i}-\hat{u_v}+\hat{u})^2 = (82-74.2-78+71.5)^2 = 1.69\)
\((x_{vi}-\hat{u_i}-\hat{u_v}+\hat{u})^2 = (75-68.4-78+71.5)^2 = 0.01\)
\((x_{vi}-\hat{u_i}-\hat{u_v}+\hat{u})^2 = (70-63.6-78+71.5)^2 = 0.01\)
\((x_{vi}-\hat{u_i}-\hat{u_v}+\hat{u})^2 = (81-79.8-74.5+71.5)^2 = 3.24\)
(82-74.2-78+71.5)^2
[1] 1.69
(82-74.2-78+71.5)^2
[1] 1.69
Rohdaten
1 |
1.69 |
1.69 |
0.01 |
0.01 |
3.4 |
2 |
3.24 |
0.64 |
2.56 |
0.36 |
6.8 |
3 |
1.44 |
1.44 |
0.36 |
0.36 |
3.6 |
4 |
4.2025 |
0.3025 |
0.122 |
1.322 |
5.949 |
5 |
15.6025 |
2.102 |
7.022 |
0.0225 |
24.749 |
|
|
|
|
|
44.498 |
\(QS_{Res} = (85-79.8-78+71.5)²+(82-74.2-78+71.5)²+(75-68.4-78+71.5)²+(70-63.6-78+71.5)²\\ +(81-79.8-74.5+71.5)²+....+(61-68.4-66.75+71.5)²+(59-63.6-66.75+71.5)²= 44.498\)
\(df_{Res} = (n-1)*(p-1)= (5-1)*(4-1) = 12\)
\(\hat{\sigma}_{Res} ^2= 44.498 / 12 = 3.70\)
