Mehrfaktorielle Varianzanalyse

mehranova$Alkohol<-factor(mehranova$Alkohol, levels=c("gering", "mittel", "hoch")) 

Hypothese

Haupteffekt A
H0:Es gibt keinen Unterschied zwischen dem Geschlecht und der gesungenen Anzahl an Songs.
H1:Es gibt einen Unterschied zwischen dem Geschlecht und der gesungenen Anzahl an Songs.

Haupteffekt B
H0:Es gibt einen Unterschied zwischen dem Alkoholgehalt und der gesungenen Anzahl an Songs.
H1:Es gibt einen Unterschied zwischen dem Alkoholgehalt und der gesungenen Anzahl an Songs.

Interaktion AxB
H1: Es gibt einen Unterschied zwischen dem Geschlecht, bzw. dem Alkoholgehalt des ersten Getränkes und der Anzahl der gesungenen Songs.
H0: Es gibt keinen Unterschied zwischen dem Geschlecht, bzw. dem Alkoholgehalt des ersten Getränkes und der Anzahl der gesungenen Songs.

Voraussetzungen für die mehrfaktorielle Varianzanalyse (ohne Messwiederholung)

Die abhängige Variable ist intervallskaliert -> ist gegeben, sogar absolutskaliert.

Die unabhängigen Variablen (Geschlecht und Alkoholgehalt) sind kategorial (nominal- oder ordinalskaliert) -> sind sie. Die durch die Faktoren gebildeten Gruppen sind unabhängig -> Entweder ist der Gast biologisch weiblich / männlich , bzw. der Alkoholgehalt des ersten Getränkes ist entweder 0.05 | 0.15 | 0.35.

Die abhängige Variablen ist normalverteilt innerhalb jeder der Gruppen. Ab 25 Probanden pro Gruppe sind Verletzungen dieser Voraussetzung unproblematisch-> siehe Histogramm

omogenität der Varianzen: Die Gruppen stammen aus Grundgesamtheiten mit annähernd identischen Varianzen der abhängigen Variablen -> siehe Levene-Test

Deskriptive Statistiken + Prüfung der Voraussetzung

Histogramm zur Prüfung der Normalvertweilung

Alkohol

library(dplyr)
library(ggplot2)
mehranova %>%
  group_by(Alkohol) %>%
  ggplot(aes(Songs, color=Alkohol)) + 
  geom_histogram(aes(fill = Alkohol), binwidth = 1.5) +
  facet_wrap(~Alkohol) +
  theme_grey()+
  labs(x= "Anzahl der Songs",y = "Anzahl" )

Die Daten sind normalverteilt innerhalb der Gruppe Alkohol und Anzahl der gesungenen Songs.


mehranova %>%
  group_by(Geschlecht) %>%
  ggplot(aes(Songs, color=Geschlecht)) + 
  geom_histogram(aes(fill = Geschlecht), binwidth = 3.3) +
  facet_wrap(~Geschlecht) +
  theme_grey()+
  labs(x= "Anzahl der Songs",y = "Anzahl" )

Die Daten sind normalverteilt innerhalb der Gruppe Geschlecht und Anzahl der gesungenen Songs, nicht sehr schön. Ab 25 Teilnehmer pro Gruppe ist das Testverfahren robust.

ggplot(mehranova, aes(x=Songs))+
geom_histogram()+
theme_grey()+
facet_wrap(Alkohol~Geschlecht, ncol = 2)

Ab 25 Teilnehmer pro Gruppe ist das Testverfahren robust. Jedoch gibt es Schwierigkeiten bei der Normalverteilung bei mittlerem Alkoholgehalt bei den weiblichen Barbesuchern.

Boxplot

ggplot(mehranova, aes(Geschlecht, Songs, fill=factor(Alkohol))) +
geom_boxplot() +
theme_minimal()+
labs(fill = "Alkoholniveau", x="Geschlecht", y="Anzahl Songs")

Deskriptive Statistiken

mehranova %>%
group_by(Alkohol) %>%
  summarize(Anzahl = n(), Mittelwert = mean(Songs), Median = median(Songs), Standardabweichung = sd(Songs)) %>%
  mutate_if(is.numeric, round, 2)

Bei geringem Alkoholgehalt werden 2.66 Songs im Schnitt gesungen (SD = 1.15, n = 50). Bei mittlerem Alkoholgehalt singen die Barbesucher 5.88 Songs im Durchschnitt (SD = 1.92, n = 50). Bei hoher Alkoholgehalt singen die Barbesucher deutlich mehr Songs - im Schnitt 11 Songs (SD = 2.54, n = 50).

mehranova %>%
group_by(Geschlecht) %>%
  summarize(Anzahl = n(), Mittelwert = mean(Songs), Median = median(Songs), Standardabweichung = sd(Songs)) %>%
  mutate_if(is.numeric, round, 2)

Es zeichnet sich ein schwieriges Bild. Der Geschlechterunterschied ist nur minimal. Barbesucher singen 6.44 Songs im Schnitt, wohingegen Barbesucherinnen 6.59 Songs singen. Darüber hinaus zeigen auch die Standardabweichung und der Mittelwert, dass wahrscheinlich keine Signifikanz vorliegt.

mehranova %>%
group_by(Geschlecht, Alkohol) %>%
  summarize(Anzahl = n(), Mittelwert = mean(Songs), Median = median(Songs), Standardabweichung = sd(Songs)) %>%
  mutate_if(is.numeric, round, 2)
`summarise()` has grouped output by 'Geschlecht'. You can override using the `.groups` argument.
`mutate_if()` ignored the following grouping variables:
Column `Geschlecht`

Bei geringer Alkoholgehalt singen die Männer (M = 3.24, SD = 1.164) mehr Songs als die Frauen (M = 2.08, SD = .81). Dies ist auch bei mittlerer Alkoholgehalt ebenfalls der Fall (Männer: M = 6.8, SD = 1.75; Frauen: M = 4.96, SD = .1.64). Bei hoher Alkoholgehalt ist es genau umgekehrt: Die Frauen (M = 12.72, SD = 2.03) singen deutlich mehr Songs als die Männer(M = 9.28, SD = 1.69).

Alternative


mittel <-tapply(mehranova$Songs, list(mehranova$Alkohol, mehranova$Geschlecht), mean, na.rm=TRUE)
mittel
          m     w
gering 3.24  2.08
mittel 6.80  4.96
hoch   9.28 12.72

sd <-tapply(mehranova$Songs, list(mehranova$Alkohol, mehranova$Geschlecht), sd, na.rm=TRUE)
sd
              m         w
gering 1.164760 0.8124038
mittel 1.755942 1.6451950
hoch   1.696074 2.0314199

anzahlprogruppe <- tapply(mehranova$Songs, list(mehranova$Alkohol, mehranova$Geschlecht), function(x) sum(!is.na(x)))
anzahlprogruppe 
        m  w
gering 25 25
mittel 25 25
hoch   25 25

Profildiagramm


ggplot(mehranova, aes(x=Alkohol, y=Songs, group=Geschlecht, color= Geschlecht))+
  stat_summary(fun.y = mean, geom="point", size=3)+
  stat_summary(fun.y = mean, geom="line")+
  stat_summary(fun.data = mean_cl_normal, geom="errorbar",width=.2, size=.25)+
  labs(x="Alkohol", y="Anzahl der Songs")+
  theme_classic()
`fun.y` is deprecated. Use `fun` instead.`fun.y` is deprecated. Use `fun` instead.

Levene -Test

Der Levene-Test prüft die Nullhypothese, dass die Varianzen der Gruppen sich nicht unterscheiden. Ist der Levene-Test nicht signifikant, so kann von homogenen Varianzen ausgegangen. Wäre der Levene-Test jedoch signifikant, so wäre eine der Grundvoraussetzungen der Varianzanalyse verletzt. Gegen leichte Verletzungen gilt die Varianzanalyse als robust; vor allem bei genügend grossen und etwa gleich grossen Gruppen sind Verletzungen nicht problematisch. Bei ungleich grossen Gruppen führt eine starke Verletzung der Varianzhomogenität zu einer Verzerrung des F-Tests. Alternativ können dann auf den Brown-Forsythe-Test oder den Welch-Test zurückgegriffen werden. Dabei handelt es sich um adjustierte F-Tests.

library(car)
leveneTest(Songs ~ Alkohol*Geschlecht, data = mehranova, center = "mean")
Levene's Test for Homogeneity of Variance (center = "mean")
       Df F value    Pr(>F)    
group   5  5.6264 9.088e-05 ***
      144                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Im vorliegenden Beispiel ist der Levene-Test signifikant (F(5,144) = 5.626, p < .000 ), so dass von Varianzheterogenität ausgegangen werden kann. Da die Varianzen leider nicht gleich sind, ist es zu empfehlen eine Korrektur mithilfe des Welch-Tests durchzuführen.

Entscheiungsregeln

Mit Welch-Korrektur: p < 0.05 => Ergebnis Signifikant –> Varianzen heterogen

Ohne Welch-Korrektur: p > 0.05 => Ergebnis nicht Signifikant –> Varianzen homogen –> H0 mit Annahme Var1=Var2=… -> Var_n wird angenommen

Ergebnisse der mehrfaktorielle Varianzanalyse (ohne Messwiederholung)

Keine Welch-Korrektur - ist der Standard


mehrAnova1 <- lm(Songs ~ Geschlecht*Alkohol, data = mehranova)
myAnova <- Anova(mehrAnova1 , type = 3)
myAnova
Anova Table (Type III tests)

Response: Songs
                   Sum Sq  Df  F value    Pr(>F)    
(Intercept)        262.44   1 106.3228 < 2.2e-16 ***
Geschlecht          16.82   1   6.8143  0.009999 ** 
Alkohol            460.88   2  93.3585 < 2.2e-16 ***
Geschlecht:Alkohol 206.25   2  41.7799 4.912e-15 ***
Residuals          355.44 144                       
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

mit Welch-Korrektur ist zur Kontrolle gedacht

Es liegt eine Verletzung der Varianzhomogenität vor(siehe Levene-Test). Daher sollte ein robusterer Test berücksichtigt werden (* mit welch* ). Allerdings bieten sich hier keine weitgehend akzeptierten Verfahren an. Daher wird der Standard weitergeführt.


geschlechtwelch <- oneway.test(Songs~Geschlecht, data = mehranova, var.equal = F)
geschlechtwelch

    One-way analysis of means (not assuming equal variances)

data:  Songs and Geschlecht
F = 0.051224, num df = 1.00, denom df = 122.72, p-value = 0.8213

Für den Faktor Geschlecht wird kein Haupteffekt ersichtlich. Die Anzahl der gesungenen Songs scheint demnach unabhängig vom Geschlecht zu sein (F(1,122.72) = .0512, p = .8213).


alkoholwelch <- oneway.test(Songs~Alkohol, data = mehranova, var.equal = F)
alkoholwelch

    One-way analysis of means (not assuming equal variances)

data:  Songs and Alkohol
F = 238.45, num df = 2.000, denom df = 88.419, p-value < 2.2e-16

Es gibt einen Haupteffekt der Alkoholgehalt auf die Anzahl der gesungenen Songs (F(2,88.419) = 238.45, p = .000). Das bedeutet, dass Gäste der Karaoke-Bar in Abhängigkeit des Alkoholgehalt unterschiedlich viele Songs singen.


AXBwelch <- oneway.test(Songs~Alkohol*Geschlecht, data = mehranova, var.equal = F)
AXBwelch 

    One-way analysis of means (not assuming equal variances)

data:  Songs and Alkohol * Geschlecht
F = 173.72, num df = 5.000, denom df = 65.716, p-value < 2.2e-16

Der Interaktionsterm von Alkoholgehalt und Geschlecht auf die Anzahl der gesungenen Songs ist signifikant (F(5,65.716) = 173.72, p = .000). Der Effekt von Alkoholgehalt hängt demnach zu einem gewissen Teil vom Geschlecht ab.

#zusammenfassung <- rbind(alkoholwelch,geschlechtwelch,AXBwelch)

Post-Hoc-Test

st ein Haupteffekt oder eine Interaktion signifikant, so ist zwar bestätigt, dass ein Effekt vorliegt, doch ist nach wie vor unklar, welche Faktorstufen sich unterscheiden, sobald ein Faktor mehr als zwei Ausprägungen aufweist. (Bei zwei Ausprägungen unterscheiden sich eben diese zwei Ausprägungen voneinander, sonst wäre der F-Test nicht signifikant.) Im vorliegenden Beispiel liegen ein Effekt der Alkoholgehalt sowie ein Interaktionseffekt vor. Post-hoc-Tests können einfach eingesetzt werden, um zu prüfen, welche Levels der Alkoholgehalt sich unterscheiden. Für die Interaktion ist dies in SPSS nicht implementiert.

Wie bereits erwähnt wurde, beinhaltet der Faktor Alkoholgehalt drei Stufen. Aus dem signifikanten Haupteffekt lässt sich nicht ableiten, welche der Faktorstufen einen signifikant unterschiedlichen Einfluss auf die abhängige Variable haben. Zu diesem Zweck werden Tukey-korrigierte Mehrfachvergleiche berechnet.

Bei der Berechnung von Post-hoc-Tests wird im Prinzip für jede Kombination von zwei Mittelwerten ein t-Test durchgeführt. Im aktuellen Beispiel der Alkoholgehalt mit drei Gruppen, bzw. zwei Gruppen sind dies 15 Tests. Multiple Tests sind jedoch problematisch, da der Alpha-Fehler (die fälschliche Ablehnung der Nullhypothese) mit der Anzahl der Vergleiche steigt. Wird nur ein t-Test mit einem Signifikanzlevel von .05 durchgeführt, so beträgt die Wahrscheinlichkeit des Nicht-Eintreffens des Alpha-Fehlers 95%. Werden jedoch 15 solcher Paarvergleiche vorgenommen, so beträgt die Nicht-Eintreffens-Wahrscheinlichkeit des Alpha-Fehlers (.95)15 = .4632. Um die Wahrscheinlichkeit des Eintreffens des Alpha-Fehlers zu bestimmen, wird 1 -.4632 = .5367 gerechnet. Die Wahrscheinlichkeit des Eintreffens des Alpha-Fehlers liegt somit bei 53.67%. Diese Fehlerwahrscheinlichkeit wird als “Familywise Error Rate” bezeichnet.

Um dieses Problem zu beheben, kann zum Beispiel die Tukey-Korrektur angewendet werden. Hierbei wird α durch die Anzahl der Paarvergleiche dividiert. Im hier aufgeführten Fall ist dies .05/15 = .00333. Bei diesem Kozept handelt es sich um eine allgemeine Information.

Die Tukey berücksichtigt die Korrektur, daher kann weiter gegen 0.05 getestet werden.


PostHoc <- aov(Songs ~ Geschlecht*Alkohol, data=mehranova) 
#Alternativ auch der Name des Zwischenspeichers "mehr" - PostHoc <- aov(mehr)  
TukeyHSD(PostHoc)
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = Songs ~ Geschlecht * Alkohol, data = mehranova)

$Geschlecht
         diff        lwr       upr    p adj
w-m 0.1466667 -0.3604403 0.6537736 0.568437

$Alkohol
              diff      lwr      upr p adj
mittel-gering 3.22 2.475868 3.964132     0
hoch-gering   8.34 7.595868 9.084132     0
hoch-mittel   5.12 4.375868 5.864132     0

$`Geschlecht:Alkohol`
                   diff        lwr        upr     p adj
w:gering-m:gering -1.16 -2.4435564  0.1235564 0.1013365
m:mittel-m:gering  3.56  2.2764436  4.8435564 0.0000000
w:mittel-m:gering  1.72  0.4364436  3.0035564 0.0022313
m:hoch-m:gering    6.04  4.7564436  7.3235564 0.0000000
w:hoch-m:gering    9.48  8.1964436 10.7635564 0.0000000
m:mittel-w:gering  4.72  3.4364436  6.0035564 0.0000000
w:mittel-w:gering  2.88  1.5964436  4.1635564 0.0000000
m:hoch-w:gering    7.20  5.9164436  8.4835564 0.0000000
w:hoch-w:gering   10.64  9.3564436 11.9235564 0.0000000
w:mittel-m:mittel -1.84 -3.1235564 -0.5564436 0.0008204
m:hoch-m:mittel    2.48  1.1964436  3.7635564 0.0000017
w:hoch-m:mittel    5.92  4.6364436  7.2035564 0.0000000
m:hoch-w:mittel    4.32  3.0364436  5.6035564 0.0000000
w:hoch-w:mittel    7.76  6.4764436  9.0435564 0.0000000
w:hoch-m:hoch      3.44  2.1564436  4.7235564 0.0000000

Wie vermutet, zeichnet sich bei Geschlecht keine signifikant ab. Die Alkoholgehaltskombinationen unterscheiden sich signifikant.

Für das vorliegende Beispiel wird ersichtlich, dass sich der Alkoholgehalt und das Geschlecht bezüglich der gesungenen Songs signifikant unterscheiden (p < .05). Jedoch kann kein Unterschied für das Geschlecht mit einer geringem Alkoholgehalt von 0.05 Prozent festgestellt werden (p < .05). Es können 5 Gruppen gebildet werden.

  1. Was ist sig und was nicht? 14 von 15 Vergleichen sind sig. (p < .05). Nicht sig. ist w:gering-m:gering (p = .1013365)

  2. Generalisierbarkeit /Unabhängigkeit - global?

Vier Gruppen sind unabhängige / generalisierbar.

  1. Gruppenbildung?

Es können 5 Gruppen gebildet werden.

  1. Interaktion?

Bei geringerem Alkoholgehalt lag Männer (M = 3.24, SD = 1.164) über jenem der Frauen (M = 2.08, SD = .81), allerdings konnte der Unterschied im Post-Hoc nicht bestätigt werden. Bei mittlerer Alkoholgehalt (Männer: M = 6.8, SD = 1.75; Frauen: M = 4.96, SD = .1.64) konnte der Mittelwertsunterschied bestätigt werden. Bei hohem Alkoholgehalt verhält es sich genau andersrum - Frauen sangen (M = 12.72, SD = 2.03) deutlich mehr Songs als die Männer (M = 12.72, SD = 2.03). Das Ergebnis konnte bestätigt werden.

Alternativ

Bonferroni und Tukey: sehr strenge Kontrolle des Fehlers 1. Art, zu geringe Teststärke, deshalb zu konservativ. Bei wenigen Paarvergleichen hat Bonferroni mehr Teststärke, bei vielen Paarvergleichen hat Tukey mehr Teststärke.



pairwise.t.test(mehranova$Songs, mehranova$Geschlecht, data=mehranova, pool.sd=T,var.equal=FALSE)

    Pairwise comparisons using t tests with pooled SD 

data:  mehranova$Songs and mehranova$Geschlecht 

  m   
w 0.82

P value adjustment method: holm 
pairwise.t.test(mehranova$Songs, mehranova$Alkohol, data=mehranova, pool.sd=T,var.equal=F)

    Pairwise comparisons using t tests with pooled SD 

data:  mehranova$Songs and mehranova$Alkohol 

       gering  mittel 
mittel 9.2e-14 -      
hoch   < 2e-16 < 2e-16

P value adjustment method: holm 

Bei diesem Testverfahren muss der aplhawert korrigiert werden.

newalpha<-  0.05/15
newalpha
[1] 0.003333333
interaktion=paste(mehranova$Geschlecht, mehranova$Alkohol, sep=".") 

pairwise.t.test(mehranova$Songs, interaktion, data=mehranova, var.equal=FALSE)

    Pairwise comparisons using t tests with pooled SD 

data:  mehranova$Songs and interaktion 

         m.gering m.hoch  m.mittel w.gering w.hoch 
m.hoch   < 2e-16  -       -        -        -      
m.mittel 2.5e-12  4.6e-07 -        -        -      
w.gering 0.01000  < 2e-16 < 2e-16  -        -      
w.hoch   < 2e-16  9.5e-12 < 2e-16  < 2e-16  -      
w.mittel 0.00033  < 2e-16 0.00018  6.8e-09  < 2e-16

P value adjustment method: holm 

Games - Howell

interaktion=paste(mehranova$Geschlecht, mehranova$Alkohol, sep=".") 

mehranova["interaktion"] <- interaktion

View(mehranova)
#Faktor A
mehranova$Geschlecht <- as.factor(mehranova$Geschlecht)
ANOVA <- aov(Songs~Geschlecht, mehranova)
erg <- PMCMRplus::gamesHowellTest(ANOVA)
summary (erg)

    Pairwise comparisons using Games-Howell test

data: Songs by Geschlecht
alternative hypothesis: two.sided
P value adjustment method: none
H0
---
Signif. codes: 0 㤼㸱***㤼㸲 0.001 㤼㸱**㤼㸲 0.01 㤼㸱*㤼㸲 0.05 㤼㸱.㤼㸲 0.1 㤼㸱 㤼㸲 1
# Faktor B
mehranova$Alkohol <- as.factor(mehranova$Alkohol)
ANOVA <- aov(Songs~Alkohol, mehranova)
erg <- PMCMRplus::gamesHowellTest(ANOVA)
summary (erg)

    Pairwise comparisons using Games-Howell test

data: Songs by Alkohol
alternative hypothesis: two.sided
P value adjustment method: none
H0
---
Signif. codes: 0 㤼㸱***㤼㸲 0.001 㤼㸱**㤼㸲 0.01 㤼㸱*㤼㸲 0.05 㤼㸱.㤼㸲 0.1 㤼㸱 㤼㸲 1
#Interaktion

mehranova$interaktion <- as.factor(mehranova$interaktion)
ANOVA <- aov(Songs~interaktion, mehranova)
erg <- PMCMRplus::gamesHowellTest(ANOVA)
summary (erg)

    Pairwise comparisons using Games-Howell test

data: Songs by interaktion
alternative hypothesis: two.sided
P value adjustment method: none
H0
---
Signif. codes: 0 㤼㸱***㤼㸲 0.001 㤼㸱**㤼㸲 0.01 㤼㸱*㤼㸲 0.05 㤼㸱.㤼㸲 0.1 㤼㸱 㤼㸲 1

Das par. Eta-Quadrat

Das partielle Eta-Quadrat (partielles η2) ist in Abbildung ausgegeben.

\[\eta^2_{partial A}= \frac {QS_A}{QS_A+QS_{inn}}\]

\[\eta^2_{partial B}= \frac {QS_B}{QS_B+QS_{inn}}\]

\[\eta^2_{partial AxB}= \frac {QS_{AxB}}{QS_{AxB}+QS_{inn}}\]

\[\eta_A= \frac {QS_A}{QS_{total}}\] \[\eta_B= \frac {QS_B}{QS_{total}}\] \[\eta_{AxB}= \frac {QS_{AxB}}{QS_{total}}\]


eta <- effectsize::eta_squared(mehrAnova1, partial = TRUE)
eta
Parameter          | Eta2 (partial) |       90% CI
--------------------------------------------------
Geschlecht         |       2.26e-03 | [0.00, 0.03]
Alkohol            |           0.83 | [0.80, 0.86]
Geschlecht:Alkohol |           0.37 | [0.26, 0.45]

Im vorliegenden Beispiel ist der Effekt des Geschlechts nicht signifikant. Daher wird dessen partielles Eta-Quadrat nicht betrachtet. Für die Alkoholgehalt beträgt das partielle Eta-Quadrat .833. Das heisst, die Alkoholgehalt erklärt 83% derjenigen Fehlervariation, die das Modell hätte, wäre Alkoholgehalt nicht im Modell. Das partielle Eta-Quadrat der Interaktion beträgt .367 und erklärt daher 3% der ohne die Interaktion ungeklärten Variation.

Berechnung der Effektstärke

\[f=\sqrt\frac{\eta^{2}}{1-\eta^{2}}=\sqrt\frac{eta^{2}}{1-eta^{2}}\]

Effektstärke fürs Geschlecht


effgender <- sqrt(eta$Eta2_partial[1]/(1-eta$Eta2_partial[1]))

sprintf("Effektstärke fürs Geschlecht: f= %.3f", effgender)
[1] "Effektstärke fürs Geschlecht: f= 0.048"

Effektstärke fürs Alkoholgehalt


effalk <- sqrt(eta$Eta2_partial[2]/(1-eta$Eta2_partial[2]))

sprintf("Effektstärke fürs Alkoholgehalt: f= %.3f",effalk)
[1] "Effektstärke fürs Alkoholgehalt: f= 2.231"

Effektstärke für die Interaktion


effAxB <- sqrt(eta$Eta2_partial[3]/(1-eta$Eta2_partial[3]))

sprintf("Effektstärke für die Interaktion: f= %.3f",effAxB)
[1] "Effektstärke für die Interaktion: f= 0.762"

Um zu beurteilen, wie gross dieser Effekt ist, kann man sich an der Einteilung von Cohen (1988) orientieren:

\[ \begin{align} \text{Schwacher Effekt: } 0.10 &< ||f|| < 0.25 \\ \text{Schwacher bis mittlerer Effekt: } 0.25 &= ||f|| \\ \text{Mittlerer Effekt: } 0.25 &< ||f|| < 0.40 \\ \text{Mittlerer bis starker Effekt: }0.40 &= ||f|| \\ \text{Starker Effekt: } 0.40 &< ||f|| \end{align} \]

Damit entsprechen die Effektstärken von 2.23 und 0.76 einem starken Effekt. Für Geschlecht liegt natürlich kein Effekt vor - es sei nur der Vollständigkeit erwähnt.

Eine Aussage

Hypothesen

Es zeigt sich, dass es keinen Unterschied zwichen dem Geschlecht und der Anzahl an gesungenen Songs allein gibt (F(1,122.72) = .0512, p = .8213). H0 für den Haupteffekt A wird angenommen.

Allerdings je nach Alkoholgehalt des ersten Getränkes gibt es einen Unterschied zwischen den gesungenen Songs (F(2,88.419) = 238.45, p = .000). H0 für den Haupteffekt B wird verworfen.

Der Interaktionsterm von Alkoholgehalt und Geschlecht auf die Anzahl der gesungenen Songs ist signifikant (F(5,65.716) = 173.72, p = .000). Der Effekt von Alkoholgehalt hängt demnach zu einem gewissen Teil vom Geschlecht ab. H0 für den Interaktion AxB wird verworfen.

Post- Hoc - Test

Der PostHoc wurde mit Tukey durchgeführt. Für Geschlecht zeigte sich keine signifikant ab (p = 0.101). Es zeigt, dass sich alle Gruppen für Alkoholgehalt signifikant unterscheiden: Gering (M = 2.66 ,SD = 1.15, N=50), mittlere Alkoholniveau (M = 5.88, SD = 1.92, n=50) und hohe Alkoholniveau (M = 11, SD = 2.54, n=50).

Zudem zeigt sich eine signifikante Interaktion von Geschlecht und Alkoholgehalt auf die Anzahl der gesungenen Songs.Dies weist darauf hin, dass sich Alkoholgehalt je nach Geschlecht unterschiedlich auswirkt.

Bei geringerem Alkoholgehalt lag Männer (M = 3.24, SD = 1.164) über jenem der Frauen (M = 2.08, SD = .81), allerdings konnte der Unterschied im Post-Hoc nicht bestätigt werden. Bei mittlerer Alkoholgehalt (Männer: M = 6.8, SD = 1.75; Frauen: M = 4.96, SD = .1.64) konnte der Mittelwertsunterschied bestätigt werden.

Bei hohem Alkoholgehalt verhält es sich genau andersrum - Frauen sangen (M = 12.72, SD = 2.03) deutlich mehr Songs als die Männer (M = 12.72, SD = 2.03). Das Ergebnis konnte bestätigt werden.

Effektstärke

Die Effektstärken sind sowohl für den Haupteffekt der Alkoholgehalt (f = 2.23) als auch für die Interaktion (f = 0,76) nach Cohen (1988) ein starker Effekt

