Die Zerlegung der Varianzen

Ziel ist die Zerlegung in \(QS_{innerhalb}\) und \(QS_{zwischen}\) zur Berechnung der Varianzen \(\hat{\sigma}_{innerhalb}^2\) und \(\hat{\sigma}_{zwischen}^2\).

Gleichungen und Grundideen der Quadartsummen

\(QS_{Total} = QS_{innerhalb}+ QS_{zwischen}\)

Gesamtabweichung

\(QS_{Total} = \sum \limits_{i=1}^p \sum \limits_{v=1}^n (x_{vi}-\hat{u})^2\)
Summe der quadratischen Gesamtabweichung

Abweichung durch Faktor

\(QS_{zwischen} = n_i* \sum \limits_{i=1}^p (\hat{u_i}-\hat{u})^2\)
Summe der quadrierten Abweichung zwischen den Faktorstufen (Bedingungen der UV, Gruppe)

Abweichung durch Fehler

\(QS_{innerhalb} = \sum \limits_{i=1}^p \sum \limits_{v=1}^n (x_{vi}-\hat{u_i})^2\)
Summe der quadrierten Abweichung innerhalb der Faktorstufen

\(\hat{u} = Gesamtmittelwert\)
\(\hat{u_i} = Mittelwert\,der\, Faktorstufe_i\)
\(n_i = Stichprobeumfang\,in\,Faktor\)
\(x_{vi} = Messwert\, von\, VP.\, in\, der\, Faktorstufe \,i\)

Rohdaten

\(VP\, in\,Gruppen_i\) Trainingsart1 Trainingsart2 Trainingsart3 Trainingsart4
1 45 52 23 18
2 41 53 27 16
3 40 48 29 19
4 44 51 24 21
5 43 52 25 17
Summe 213 256 128 91
Mittelwert 42.6 51.2 25.6 18.2

\(\hat{u} = \frac{213+256+128+91}{4*5} =34.4\)

Berechnung der Quadratsumme-Total

Abweichungsquadrate der Messwerte vom Gesamtmittel

Die \(QS_{total}\) berechnet sich aus der Summe der quadrierten Abweichungen aller Messwerte vom Gesamtmittelwert. Es können auch die Summe der \(QS_{zwischen}\) und der \(QS_{innerhalb}\) zur Berechnung der \(QS_{total}\) addiert werden. Grundsätzlich ist die totale Quadratsumme weniger von Interesse zur Berechnung des Signifikanztests, da diese nicht benötigt wird. Bei der Effektstärkeberechnung wird die \(QS_{total}\) notwendigt.

\((x_{vi}-\hat{u})^2 = (45-34.4)^2 =112.36\)
\((x_{vi}-\hat{u})^2 = (41-34.4)^2 =43.56\)
\((x_{vi}-\hat{u})^2 = (52-34.4)^2 =309.76\)

\(VP\, in\,Gruppen_i\) Trainingsart1 Trainingsart2 Trainingsart3 Trainingsart4
1 112.36 309.76 129.96 268.96
2 43.56 345.96 54.76 338.56
3 31.6 184.96 29.16 237.16
4 92.16 275.56 108.16 179.56
5 73.96 309.76 88.36 302.76
Summe 353.64 1426 410.4 1327
T1<- 112.36+43.56+31.6+92.16+73.96
T1
[1] 353.64
T2<- 309.76+345.96+184.96+275.56+309.76#
T2
[1] 1426
T3<- 129.96+54.76+29.16+108.16+88.36
T3
[1] 410.4
T4<- 268.96+338.56+237.16+179.56+302.76
T4
[1] 1327

Ergebnis der \(QS_{Total}\), \(df_{Total}\), \(\hat{\sigma}_{Total}^2\)

\(QS_{Total} =356.64 + 1426 + 410.4 + 1327 = 3520.04\)
\(df_{Total} =(4*5)-1 = 19\)
\(\hat{\sigma}_{Total}^2 =3520.04 / 19 = 185.265\)

356.64 + 1426 + 410.4 + 1327
[1] 3520.04
3520.04 / 19
[1] 185.2653

Berechnung der Quardartsumme-Zwischen

Die Grundidee bei der \(QS_{Zwischen}\) liegt in der Erklärung der Unterschiede, die auf die UV bzw. das Treatment zurück gehen. Dabei geht es nicht um die Unterschiede zwischen den Personen in einer Gruppe, sondern um die Unterschiede in der Ausprägung. Daher wird bei der Berechnung der \(QS_{Zwischen}\) angenommen, dass es diese Unterschiede gar nicht gibt und somit alle Personen in einer Gruppe denselben Messwert erzielt haben.

Es ist für die Berechnung der \(QS_{Zwischen}\) von Interesse, wie stark die Gruppenmittelwerte um den Gesamtmittelwert streuen.

\((\hat{u_i}-\hat{u})^2 = (42.6-34.4)^2 =67.24\)
\((\hat{u_i}-\hat{u})^2 = (51.2-34.4)^2 =282.24\)
\((\hat{u_i}-\hat{u})^2 = (25.6-34.4)^2 =77.44\)
\((\hat{u_i}-\hat{u})^2 = (18.2-34.4)^2 =262.44\)

\(VP\, in\,Gruppen_i\) Trainingsart1 Trainingsart2 Trainingsart3 Trainingsart4
1 67.24 282.24 77.44 262.44
2 67.24 282.24 77.44 262.44
3 67.24 282.24 77.44 262.44
4 67.24 282.24 77.44 262.44
5 67.24 282.24 77.44 262.44
Summe 336.2 1411.2 387.2 1312.2

Ergebnis der \(QS_{Zwischen}\), \(df_{Zwischen}\), \(\hat{\sigma}_{Zwischen}^2\)

\(QS_{Zwischen} = 336.2 + 1411.2 + 387.2 + 1312.2 = 3446.8\)
\(df_{Zwischen} = 4-1 = 3\)
\(\hat{\sigma}_{Zwischen}^2 = 3446.8 / 3 = 1148.933\)

Berechnung der Quardartsumme-Innerhalb

Die \(QS_{innerhalb}\) spiegelt die Abweichungen wider, die aufgrund von Messfehlern und individuellen Eigenheiten einer Person dafür sorgen, dass der individuelle Messwert vom geschätzten Gruppenmittelwert abweicht. Um die \(QS_{innerhalb}\) zu berechnen, wird für jede Gruppe die quadrierte Abweichung der Messwerte von jeder Personen mit dem jeweiligen Gruppenmittelwert berechnet.

Rohwerte

\(VP\, in\,Gruppen_i\) Trainingsart1 Trainingsart2 Trainingsart3 Trainingsart4
1 45 52 23 18
2 41 53 27 16
3 40 48 29 19
4 44 51 24 21
5 43 52 25 17
Summe 213 256 128 91
Mittelwert 42.6 51.2 25.6 18.2

\[(x_{2,1}-\hat{v})^2 = (45-42.6)^2 = 5.76 \]

\[(x_{2,2}-\hat{v})^2 = (41-42.6)^2 = 2.56 \]

\[(x_{3,1}-\hat{v})^2 = (52-51.2)^2 = 0.64 \] \[(x_{4,1}-\hat{v})^2 = (23-25.6)^2 = 6.76 \]

\(VP\, in\,Gruppen_i\) Trainingsart1 Trainingsart2 Trainingsart3 Trainingsart4
1 5.76 0.64 6.76 0.04
2 2.56 3.24 1.96 4.84
3 6.76 10.24 11.56 0.64
4 1.96 0.04 2.56 7.84
5 0.16 0.64 0.36 1.44
Summe 17.2 14.8 23.2 14.8

Ergebnis der \(QS_{innerhalb}\), \(df_{innerhalb}\), \(\hat{\sigma}_{innerhalb}^2\)

\(QS_{innerhalb} = 17.2 + 14.8 + 23.2 + 14.8 = 70\)
\(df_{innerhalb} = 4*(5-1) = 16\)
\(\hat{\sigma}_{innerhalb}^2 = 70 / 16 = 4.375\)

\(F_{kritisch}\)

F-Verteilung

\(df_{Zähler} = df_{zwischen} = 3\)
\(df_{Nenner} = df_{innerhalb} = 16\)

Der Wert für \(F_{kritisch}\) liegt bei 3.24.

\(F_{empirisch}\)

\[F_{emp}= \frac{\hat{\sigma}_{Zwischen}^2}{\hat{\sigma}_{innerhalb}^2} = \frac{1148.933} {4.375} = 262.61\]

Signifikanz der Teststatistik

Je mehr Variation durch die Stufenzugehörigkeit erklärt wird, desto höher fällt der F-Wert aus.

\(QS_{zwischen}\) ein Mass für die erklärte Varianz darstellt, während \(QS_{innerhalb}\) ein Mass für die Residualvarianz des Modells darstellt.

Ist der F-Wert höher als der kritische Wert, so ist der Test signifikant.

\[F_{kritisch} = 3.24 < 262.61 = F_{emp}\]

---
output: html_notebook
---
# Die Zerlegung der Varianzen 


**Ziel ist die Zerlegung in $QS_{innerhalb}$ und $QS_{zwischen}$ zur Berechnung der Varianzen $\hat{\sigma}_{innerhalb}^2$ und $\hat{\sigma}_{zwischen}^2$.**

### Gleichungen und Grundideen der Quadartsummen 


$QS_{Total} = QS_{innerhalb}+ QS_{zwischen}$
<br><br>

### Gesamtabweichung
$QS_{Total} = \sum \limits_{i=1}^p \sum \limits_{v=1}^n (x_{vi}-\hat{u})^2$ <br>
Summe der quadratischen Gesamtabweichung<br><br>

### Abweichung durch Faktor
$QS_{zwischen} = n_i* \sum \limits_{i=1}^p (\hat{u_i}-\hat{u})^2$  <br>
Summe der quadrierten Abweichung zwischen den Faktorstufen (Bedingungen der UV, Gruppe)<br><br>

### Abweichung durch Fehler
$QS_{innerhalb} = \sum \limits_{i=1}^p \sum \limits_{v=1}^n (x_{vi}-\hat{u_i})^2$  <br>
Summe der quadrierten Abweichung innerhalb der Faktorstufen<br><br>

$\hat{u} = Gesamtmittelwert$<br>
$\hat{u_i} = Mittelwert\,der\, Faktorstufe_i$<br>
$n_i = Stichprobeumfang\,in\,Faktor$<br>
$x_{vi} = Messwert\, von\, VP.\, in\, der\, Faktorstufe \,i$<br>


### Rohdaten 

$VP\, in\,Gruppen_i$|	Trainingsart1 |	Trainingsart2 |	Trainingsart3 |	Trainingsart4	
--------------------|---------------|---------------|---------------|---------------
1	                  |45             |	52            |	23            |	  18	
2	                  |41             |	53            |	27            |	  16	
3	                  |40             |	48            |	29            |	  19	
4                   |44             |	51            |	24            |	  21	
5                   |43             |	52            |	25            |	  17	
**Summe**           |**213**        |	**256  **     |**128**        |	  **91**	
**Mittelwert**      |**42.6**       |	**51.2 **     |**25.6**       |	  **18.2**	

$\hat{u} = \frac{213+256+128+91}{4*5} =34.4$<br>



###	Berechnung der Quadratsumme-Total 		

Abweichungsquadrate der Messwerte vom Gesamtmittel


Die $QS_{total}$ berechnet sich aus der Summe der quadrierten Abweichungen aller Messwerte vom Gesamtmittelwert. Es können auch die Summe der $QS_{zwischen}$ und der $QS_{innerhalb}$ zur Berechnung der $QS_{total}$ addiert werden. Grundsätzlich ist die totale Quadratsumme weniger von Interesse zur Berechnung des Signifikanztests, da diese nicht benötigt wird. Bei der Effektstärkeberechnung wird die $QS_{total}$ notwendigt. 

$(x_{vi}-\hat{u})^2 = (45-34.4)^2 =112.36$<br>
$(x_{vi}-\hat{u})^2 = (41-34.4)^2 =43.56$<br>
$(x_{vi}-\hat{u})^2 = (52-34.4)^2 =309.76$<br>


					
$VP\, in\,Gruppen_i$|	Trainingsart1 |	Trainingsart2 |	Trainingsart3 |	Trainingsart4	
--------------------|---------------|---------------|---------------|---------------
1	                  |112.36         |309.76         |	129.96        |	  268.96	
2	                  |43.56          |345.96         |	54.76         |	  338.56	
3	                  |31.6           |184.96         |	29.16         |	  237.16	
4                   |92.16          |275.56         |	108.16        |	  179.56	
5                   |73.96          |309.76         |	88.36         |	  302.76	
**Summe**           |**353.64**      |	**1426**      |**410.4**      |	  **1327**	



```{r}
T1<- 112.36+43.56+31.6+92.16+73.96
T1
T2<- 309.76+345.96+184.96+275.56+309.76
T2
T3<- 129.96+54.76+29.16+108.16+88.36
T3
T4<- 268.96+338.56+237.16+179.56+302.76
T4
```




#### Ergebnis der $QS_{Total}$, $df_{Total}$, $\hat{\sigma}_{Total}^2$
$QS_{Total} =356.64 + 1426 + 410.4 + 1327 = 3520.04$<br>
$df_{Total} =(4*5)-1 = 19$<br>
$\hat{\sigma}_{Total}^2 =3520.04 / 19 = 185.265$<br>

```{r}
356.64 + 1426 + 410.4 + 1327
3520.04 / 19
```


###	Berechnung der Quardartsumme-Zwischen 	


Die Grundidee bei der $QS_{Zwischen}$ liegt in der Erklärung der  Unterschiede, die auf die UV bzw. das Treatment zurück gehen. Dabei geht es nicht um die Unterschiede zwischen den Personen in einer Gruppe, sondern um die Unterschiede in der Ausprägung. Daher wird bei der Berechnung der $QS_{Zwischen}$ angenommen, dass es diese Unterschiede gar nicht gibt und somit alle Personen in einer Gruppe denselben Messwert erzielt haben. 

**Es ist für die Berechnung der $QS_{Zwischen}$ von Interesse, wie stark die Gruppenmittelwerte um den Gesamtmittelwert streuen.** 




$(\hat{u_i}-\hat{u})^2 = (42.6-34.4)^2 =67.24$<br>
$(\hat{u_i}-\hat{u})^2 = (51.2-34.4)^2 =282.24$<br>
$(\hat{u_i}-\hat{u})^2 = (25.6-34.4)^2 =77.44$<br>
$(\hat{u_i}-\hat{u})^2 = (18.2-34.4)^2 =262.44$<br>


$VP\, in\,Gruppen_i$|	Trainingsart1 |	Trainingsart2 |	Trainingsart3 |	Trainingsart4	
--------------------|---------------|---------------|---------------|---------------
1	                  |67.24          |	282.24        |	77.44         |	  262.44	
2	                  |67.24          |	282.24        |	77.44         |	  262.44	
3	                  |67.24          |	282.24        |	77.44         |	  262.44	
4	                  |67.24          |	282.24        |	77.44         |	  262.44	
5	                  |67.24          |	282.24        |	77.44         |	  262.44	
**Summe**           |**336.2**      |	**1411.2**    |**387.2**      |	  **1312.2**

#### Ergebnis der $QS_{Zwischen}$, $df_{Zwischen}$, $\hat{\sigma}_{Zwischen}^2$


$QS_{Zwischen} = 336.2 + 1411.2 + 387.2 + 1312.2 = 3446.8$<br>
$df_{Zwischen} = 4-1 = 3$<br>
$\hat{\sigma}_{Zwischen}^2 = 3446.8 / 3 = 1148.933$<br>


###	Berechnung der Quardartsumme-Innerhalb 


Die $QS_{innerhalb}$ spiegelt die Abweichungen wider, die aufgrund von Messfehlern und individuellen Eigenheiten einer Person dafür sorgen, dass der individuelle Messwert vom geschätzten Gruppenmittelwert abweicht. Um die $QS_{innerhalb}$ zu berechnen, wird für jede Gruppe die quadrierte Abweichung der Messwerte von jeder Personen mit dem jeweiligen Gruppenmittelwert berechnet.

#### Rohwerte 
 
$VP\, in\,Gruppen_i$|	Trainingsart1 |	Trainingsart2 |	Trainingsart3 |	Trainingsart4	
--------------------|---------------|---------------|---------------|---------------
1	                  |45             |	52            |	23            |	  18	
2	                  |41             |	53            |	27            |	  16	
3	                  |40             |	48            |	29            |	  19	
4                   |44             |	51            |	24            |	  21	
5                   |43             |	52            |	25            |	  17	
**Summe**           |**213**        |	**256  **     |**128**        |	  **91**	
**Mittelwert**      |**42.6**       |	**51.2 **     |**25.6**       |	  **18.2**	

$$(x_{2,1}-\hat{v})^2 = (45-42.6)^2 = 5.76 $$ 

$$(x_{2,2}-\hat{v})^2 = (41-42.6)^2 = 2.56 $$ 

$$(x_{3,1}-\hat{v})^2 = (52-51.2)^2 = 0.64 $$ 
$$(x_{4,1}-\hat{v})^2 = (23-25.6)^2 = 6.76 $$



$VP\, in\,Gruppen_i$|	Trainingsart1 |	Trainingsart2 |	Trainingsart3 |	Trainingsart4	
--------------------|---------------|---------------|---------------|---------------
1	                  |5.76           |	0.64          |	6.76          |	  0.04	
2	                  |2.56           |	3.24          |	1.96          |	  4.84	
3	                  |6.76           |	10.24         |	11.56         |	  0.64
4	                  |1.96           |	0.04          |	2.56          |	  7.84	
5	                  |0.16           |	0.64          |	0.36          |	  1.44	
**Summe**           |**17.2**       |	**14.8**      |**23.2**       |	  **14.8**	

#### Ergebnis der $QS_{innerhalb}$, $df_{innerhalb}$, $\hat{\sigma}_{innerhalb}^2$

$QS_{innerhalb} = 17.2 + 14.8 + 23.2 + 14.8 = 70$<br>
$df_{innerhalb} = 4*(5-1) = 16$<br>
$\hat{\sigma}_{innerhalb}^2 = 70 / 16 = 4.375$<br>




###  $F_{kritisch}$ 
**F-Verteilung** 

$F_{kritisch}$
$df_{Zähler} = df_{zwischen} = 3$<br> 
$df_{Nenner} = df_{innerhalb} = 16$<br>

Der Wert für $F_{kritisch}$ liegt bei 3.24.





###  $F_{empirisch}$ 

$$F_{emp}= \frac{\hat{\sigma}_{Zwischen}^2}{\hat{\sigma}_{innerhalb}^2} = \frac{1148.933} {4.375} = 262.61$$




## Signifikanz der Teststatistik


Je mehr Variation durch die Stufenzugehörigkeit erklärt wird, desto höher fällt der F-Wert aus. 

$QS_{zwischen}$ ein Mass für die erklärte Varianz darstellt, während $QS_{innerhalb}$ ein Mass für die Residualvarianz des Modells darstellt. 

Ist der F-Wert höher als der kritische Wert, so ist der Test signifikant.

$$F_{kritisch}  = 3.24 < 262.61 = F_{emp}$$
