Die Zerlegung der Varianzen

Gleichungen und Grundideen der Quadratsummen

Ziel ist die Zerlegung in \(QS_{treat}\) und \(QS_{Res}\) zur Berechnung der Varianzen \(σ^2_{treat}\) und \(σ^2_{Res}\).

\(QS_{Total} = QS_{zwischen} + QS_{innerhalb}= QS_{zwischen}+ QS_{treat}+ QS_{Res}\)

Gesamtabweichung

\[QS_{Total} = \sum \limits_{i=1}^p \sum \limits_{v=1}^n (x_{vi}-\hat{u})^2\]
Summe der quadratischen Gesamtabweichung

Abweichung durch Faktor

\[QS_{zwischen} = p* \sum \limits_{v=1}^n (\hat{u_v}-\hat{u})^2\]
Summe der quadrierten Abweichung zwischen der Faktorstufen (Bedingungen der UV, Gruppe)

Abweichung innerhalb der Faktorstufen

\[QS_{innerhalb} = \sum \limits_{i=1}^p \sum \limits_{v=1}^n (x_{vi}-\hat{u_v})^2\]

Summe der quadrierten Abweichung innerhalb der Faktorstufen

Abweichung durch Residuums (“Fehler”)

\[QS_{Res} = \sum \limits_{i=1}^p \sum \limits_{v=1}^n (x_{vi}-\hat{u_i}-\hat{u_v}+\hat{u})^2\]
Summe der quadrierten Abweichung der Residual

Abweichung durch Treatment (Faktorstufen)

\[QS_{treat} = n* \sum \limits_{i=1}^p (\hat{u_i}-\hat{u})^2\]

\(\hat{u} = Gesamtmittelwert\)
\(\hat{u_i} = Mittelwert\,der\, Faktorstufe_i\)
\(n_i = Stichprobeumfang\,in\,Faktor\)
\(x_{vi} = Messwert\, von\, VP.\, in\, der\, Faktorstufe \,i\)

Rohdaten

Person T0 T1 T2 T3 \(P_v\) \(\hat{u}_{v}\)
1 85 82 75 70 312 78
2 81 78 73 66 298 74.5
3 80 72 68 62 282 70.5
4 74 71 65 61 271 67.75
5 79 68 61 59 267 66.75
Summe 399 371 342 318 1430
Mittelwert 79.8 74.2 68.4 63.6 - 71.5

\(\hat{u} = \frac{79.8+74.2+68.4+63.6}{4} =71.5\)

Berechnung der Quadratsumme-Total

Abweichungsquardrate der Messwerte vom Gesamtmittel Zur Berechnung der \(QS_{Total}\) werden die Rohwerte der 5 Teilnehmern zu den 4 Messzeitpunkten mit dem Gesamtmittelwert subtrahiert und anschließend quadriert. Die Summe dieser 20 Werte ist \(QS_{Total}\).

Die totale Quadratsumme repräsentiert die Gesamtvariation der Messwerte. Die Berechnung ist identisch zur einfaktoriellen Varianzanalyse ohne Messwiederholung.

\(QS_{Total} = (85-71.5)²+ (82-71.5)²+(75-71.5)²+(70-71.5)²+(81-71.5)²\\+....+(68-71.5)²+(61-71.5)²+(59-71.5)²= 1141\)
\(df_{Total} = (n*p)-1= 20-1 = 19\)
\(\hat{\sigma}_{Total}^2 =1141 / 19 = 285.25\)



Berechnung der Quadratsumme-Zwischen

Es wird die Summe der quadrierten Abweichungen der Mittelwerte jeder Person über alle vier Messzeitpunkte vom Grundniveau ermittelt. Dazu werden die unterschiedlichen beobachteten Messwerte einer Person zu den vier Messzeitpunkten durch den Mittelwert der Person über die vier Messzeitpunkte ersetzt. Da man davon ausgeht, dass die A-priori Unterschiede zwischen den Personen am besten durch die Mittelwerte der Personen über die Messzeitpunkte repräsentiert werden.

Rohdaten

Person T0 T1 T2 T3 \(P_v\) \(\hat{u}_{v}\)
1 85 82 75 70 312 78
2 81 78 73 66 298 74.5
3 80 72 68 62 282 70.5
4 74 71 65 61 271 67.75
5 79 68 61 59 267 66.75
Summe 399 371 342 318 1430
Mittelwert 79.8 74.2 68.4 63.6 - 71.5

\((\hat{u_v}-\hat{u})^2 = (78-71.5)^2 = 42.25\)
\((\hat{u_v}-\hat{u})^2 = (74.5-71.5)^ = 9\)
\((\hat{u_v}-\hat{u})^2 = (70.5-71.5)^2 = 1\)
\((\hat{u_v}-\hat{u})^2 = (67.75-71.5)^2 = 14.06\)
\((\hat{u_v}-\hat{u})^2 = (66.75-71.5)^2 = 22.56\)

Person T0 T1 T2 T3 \(Summe\)
1 42.25 42.25 42.25 42.25 169
2 9 9 9 9 36
3 1 1 1 1 4
4 14.06 14.06 14.06 14.06 56.25
5 22.56 22.56 22.56 22.56 90.24
Summe 88.87 88.87 88.87 88.87 355.48
88.87*4
[1] 355.48
169+36+4+56.25+90.24
[1] 355.49

\(QS_{Zwischen} = 4*[(78-71.5)² +(74.5-71.5)²+(70.5-71.5)²+(67.75-71.75)²+(66.75-71.5)²]= 355.48\)
\(df_{Zwischen} = n-1 = 5-1 = 4\)
\(\hat{\sigma}_{Zwischen}^2= 355.48 / 4 = 88.87\)

Berechnung der Quadratsumme-Innerhalb

In diesem Punkt ermitteln wir die Abweichungen der Messwerte einer Person, die zu den unterschiedlichen Messzeitpunkten erhoben wurden, vom jeweiligen Mittelwert der Person über die Messzeitpunkte hinweg. Dabei werden die individuellen Mittelwerte eine Schätzung der „wahren“ Ausprägung der Person darstellt. Dadurch müssen wir einen Korrektur bei jeder Person p durchführen. Damit ergibt sich folgende Formel für die Freiheitsgrade n·(p−1).

Rohdaten

Person T0 T1 T2 T3 \(P_v\) \(\hat{u}_{v}\)
1 85 82 75 70 312 78
2 81 78 73 66 298 74.5
3 80 72 68 62 282 70.5
4 74 71 65 61 271 67.75
5 79 68 61 59 267 66.75
Summe 399 371 342 318 1430
Mittelwert 79.8 74.2 68.4 63.6 - 71.5

\((x_{vi}-\hat{u_v})^2 = (85-78)^2 = 49\)
\((x_{vi}-\hat{u_v})^2 = (82-78)^2 = 16\)
\((x_{vi}-\hat{u_v})^2 = (82-78)^2 = 9\)
\((x_{vi}-\hat{u_v})^2 = (70-78)^2 = 64\)
\((x_{vi}-\hat{u_v})^2 = (81-74.5)^2 = 42.25\)

Person T0 T1 T2 T3 \(Summe\)
1 49 16 9 64 138
2 42.25 12.25 2.25 72.25 129
3 90.25 2.25 6.25 72.25 171
4 39.06 10.56 7.56 45.56 102.74
5 150.06 1.56 33.06 60.06 244.74
785.48
138+129+171+102.74+244.74
[1] 785.48

\(QS_{innerhalb} = (85-78)²+(82-78)²+(75-78)²+(70-78)²+(81-74.5)²+....+(61-66.75)²+(59-66.75)²= 785.48\)
\(df_{innerhalb} = n*(p-1) =5*(4-1) = 15\)
\(\hat{\sigma}_{innerhalb}^2 = 785.48/ 15 = 52.365\)

Berechnung der Quadratsumme-Treatment (Faktorstufen)

Die \(QS_{treat}\) stellen den Anteil der Unterschiedlichkeit aller Messwerte dar, der auf die Aufprägunstufen zurückgeführt werden kann. Das bedeutet, dass es sich um ein “systematischen” Veränderungen der Messwerte aufgrund des Treatments zwischen den Messzeitpunkten handelt.

Die \(QS_{treat}\) berechnet sich durch das Aufsummieren der quadrierten Abweichungen der jeweiligen Mittelwerte zu jedem Messzeitpunkt vom Gesamtmittelwert.

Rohdaten

Person T0 T1 T2 T3 \(P_v\) \(\hat{u}_{v}\)
1 85 82 75 70 312 78
2 81 78 73 66 298 74.5
3 80 72 68 62 282 70.5
4 74 71 65 61 271 67.75
5 79 68 61 59 267 66.75
Summe 399 371 342 318 1430
Mittelwert 79.8 74.2 68.4 63.6 - 71.5

\((\hat{u_i}-\hat{u})^2 = (79.8-71.5)^2 = 68.89\)
\((\hat{u_i}-\hat{u})^2 = (74.2-71.5)^2 = 7.29\)
\((\hat{u_i}-\hat{u})^2 = (68.4-71.5)^2 = 9.61\)
\((\hat{u_i}-\hat{u})^2 = (63.6-71.5)^2 = 62.41\)

Person T0 T1 T2 T3 \(Summe\)
1 68.89 7.29 9.61 62.41 148.2
2 68.89 7.29 9.61 62.41 148.2
3 68.89 7.29 9.61 62.41 148.2
4 68.89 7.29 9.61 62.41 148.2
5 68.89 7.29 9.61 62.41 148.2
Summe 344.45 36.45 48.05 312.05 741
a <-((79.8-71.5)^2 )*5
b <-((74.2-71.5)^2 )*5
c <-((68.4-71.5)^2 )*5
d <-((63.6-71.5)^2 )*5
a+b+c+d

\(QS_{treat} = 5*[(79.8-71.5)²+(74.2-71.5)²+(68.4-71.5)²+(63.6-71.5)²]= 741\)
\(df_{treat} = p-1= 4-1 = 3\)
\(\hat{\sigma}_{treat}^2 = 741 /3 = 247\)

a <-((79.8-71.5)^2 )*5
b <-((74.2-71.5)^2 )*5
c <-((68.4-71.5)^2 )*5
d <-((63.6-71.5)^2 )*5
a+b+c+d

Berechnung der Quadratsumme-Residuals

Es werden vier Werte zur Berechnung herangezogen:

+die beobachteten Messwerte der Person zu dem Messzeitpunkt
+der Mittelwert der jeweiligen Person
+der Mittelwert des jeweiligen Messzeitpunkts
+der Mittelwert der Person über alle Messwiederholungsstufen

In der Residualvarianz werden die Effekte der Interaktion zwischen Person und Messzeitpunkt, sowie auch die Residuals berücksichtigt. Allerdings sind der Messzeitpunkteffekt und der Personeneffekt in dieser Quadratsumme multiplikativ verknüpft, da es sich um eine Interaktion handelt. Demzufolge werden auch bei der Berechnung der Freiheitsgrade (n−1) und (p−1) multipliziert.

Rohdaten

Person T0 T1 T2 T3 \(P_v\) \(\hat{u}_{v}\)
1 85 82 75 70 312 78
2 81 78 73 66 298 74.5
3 80 72 68 62 282 70.5
4 74 71 65 61 271 67.75
5 79 68 61 59 267 66.75
Summe 399 371 342 318 1430
Mittelwert 79.8 74.2 68.4 63.6 - 71.5

\((x_{vi}-\hat{u_i}-\hat{u_v}+\hat{u})^2 = (85-79.8-78+71.5)^2 = 1.69\)
\((x_{vi}-\hat{u_i}-\hat{u_v}+\hat{u})^2 = (82-74.2-78+71.5)^2 = 1.69\)
\((x_{vi}-\hat{u_i}-\hat{u_v}+\hat{u})^2 = (75-68.4-78+71.5)^2 = 0.01\)
\((x_{vi}-\hat{u_i}-\hat{u_v}+\hat{u})^2 = (70-63.6-78+71.5)^2 = 0.01\)
\((x_{vi}-\hat{u_i}-\hat{u_v}+\hat{u})^2 = (81-79.8-74.5+71.5)^2 = 3.24\)

(82-74.2-78+71.5)^2
[1] 1.69
(82-74.2-78+71.5)^2
[1] 1.69

Rohdaten

Person T0 T1 T2 T3 \(Summe\)
1 1.69 1.69 0.01 0.01 3.4
2 3.24 0.64 2.56 0.36 6.8
3 1.44 1.44 0.36 0.36 3.6
4 4.2025 0.3025 0.122 1.322 5.949
5 15.6025 2.102 7.022 0.0225 24.749
44.498

\(QS_{Res} = (85-79.8-78+71.5)²+(82-74.2-78+71.5)²+(75-68.4-78+71.5)²+(70-63.6-78+71.5)²\\ +(81-79.8-74.5+71.5)²+....+(61-68.4-66.75+71.5)²+(59-63.6-66.75+71.5)²= 44.498\)
\(df_{Res} = (n-1)*(p-1)= (5-1)*(4-1) = 12\)
\(\hat{\sigma}_{Res} ^2= 44.498 / 12 = 3.70\)

Zusammenfassung

Varianzquelle Quadratsumme df mittlere Quadratsumme
Treatment 802.25 3 267.42
Residuals 44.498 12 3.70
Innerhalb 785.48 15 52.365
Zwischen 355.46 4 88.865
Gesamt 1141.79 19 285.25

\(F_{kritisch}\)

\(DF-Zähler: df_{treat} -> 3\)
\(DF-Nenner: df_{Res}-> 12\)

Der Wert für \(F_{kritisch}\) liegt bei 3.49.

\(F_{emp}\)

\[F_{emp}= \frac{\hat{\sigma}_{treat}^2}{\hat{\sigma}_{Res}^2} = \frac{802.25} {44.49} = 18.03\]

\[F_{kritisch} = 3.49 < 18.03 = F_{emp}\]

