Mehrfaktorielle Varianzanalyse
mehranova$Alkohol<-factor(mehranova$Alkohol, levels=c("gering", "mittel", "hoch"))
Hypothese
Haupteffekt A
H0:Es gibt keinen Unterschied zwischen dem Geschlecht und der gesungenen Anzahl an Songs.
H1:Es gibt einen Unterschied zwischen dem Geschlecht und der gesungenen Anzahl an Songs.
Haupteffekt B
H0:Es gibt einen Unterschied zwischen dem Alkoholgehalt und der gesungenen Anzahl an Songs.
H1:Es gibt einen Unterschied zwischen dem Alkoholgehalt und der gesungenen Anzahl an Songs.
Interaktion AxB
H1: Es gibt einen Unterschied zwischen dem Geschlecht, bzw. dem Alkoholgehalt des ersten Getränkes und der Anzahl der gesungenen Songs.
H0: Es gibt keinen Unterschied zwischen dem Geschlecht, bzw. dem Alkoholgehalt des ersten Getränkes und der Anzahl der gesungenen Songs.
Voraussetzungen für die mehrfaktorielle Varianzanalyse (ohne Messwiederholung)
Die abhängige Variable ist intervallskaliert -> ist gegeben, sogar absolutskaliert.
Die unabhängigen Variablen (Geschlecht und Alkoholgehalt) sind kategorial (nominal- oder ordinalskaliert) -> sind sie. Die durch die Faktoren gebildeten Gruppen sind unabhängig -> Entweder ist der Gast biologisch weiblich / männlich , bzw. der Alkoholgehalt des ersten Getränkes ist entweder 0.05 | 0.15 | 0.35.
Die abhängige Variablen ist normalverteilt innerhalb jeder der Gruppen. Ab 25 Probanden pro Gruppe sind Verletzungen dieser Voraussetzung unproblematisch-> siehe Histogramm
omogenität der Varianzen: Die Gruppen stammen aus Grundgesamtheiten mit annähernd identischen Varianzen der abhängigen Variablen -> siehe Levene-Test
Deskriptive Statistiken + Prüfung der Voraussetzung
Histogramm zur Prüfung der Normalvertweilung
Alkohol
library(dplyr)
library(ggplot2)
mehranova %>%
group_by(Alkohol) %>%
ggplot(aes(Songs, color=Alkohol)) +
geom_histogram(aes(fill = Alkohol), binwidth = 1.5) +
facet_wrap(~Alkohol) +
theme_grey()+
labs(x= "Anzahl der Songs",y = "Anzahl" )

Die Daten sind normalverteilt innerhalb der Gruppe Alkohol und Anzahl der gesungenen Songs.
mehranova %>%
group_by(Geschlecht) %>%
ggplot(aes(Songs, color=Geschlecht)) +
geom_histogram(aes(fill = Geschlecht), binwidth = 3.3) +
facet_wrap(~Geschlecht) +
theme_grey()+
labs(x= "Anzahl der Songs",y = "Anzahl" )

Die Daten sind normalverteilt innerhalb der Gruppe Geschlecht und Anzahl der gesungenen Songs, nicht sehr schön. Ab 25 Teilnehmer pro Gruppe ist das Testverfahren robust.
ggplot(mehranova, aes(x=Songs))+
geom_histogram()+
theme_grey()+
facet_wrap(Alkohol~Geschlecht, ncol = 2)

Ab 25 Teilnehmer pro Gruppe ist das Testverfahren robust. Jedoch gibt es Schwierigkeiten bei der Normalverteilung bei mittlerem Alkoholgehalt bei den weiblichen Barbesuchern.
Boxplot
ggplot(mehranova, aes(Geschlecht, Songs, fill=factor(Alkohol))) +
geom_boxplot() +
theme_minimal()+
labs(fill = "Alkoholniveau", x="Geschlecht", y="Anzahl Songs")

Deskriptive Statistiken
mehranova %>%
group_by(Alkohol) %>%
summarize(Anzahl = n(), Mittelwert = mean(Songs), Median = median(Songs), Standardabweichung = sd(Songs)) %>%
mutate_if(is.numeric, round, 2)
Bei geringem Alkoholgehalt werden 2.66 Songs im Schnitt gesungen (SD = 1.15, n = 50). Bei mittlerem Alkoholgehalt singen die Barbesucher 5.88 Songs im Durchschnitt (SD = 1.92, n = 50). Bei hoher Alkoholgehalt singen die Barbesucher deutlich mehr Songs - im Schnitt 11 Songs (SD = 2.54, n = 50).
mehranova %>%
group_by(Geschlecht) %>%
summarize(Anzahl = n(), Mittelwert = mean(Songs), Median = median(Songs), Standardabweichung = sd(Songs)) %>%
mutate_if(is.numeric, round, 2)
Es zeichnet sich ein schwieriges Bild. Der Geschlechterunterschied ist nur minimal. Barbesucher singen 6.44 Songs im Schnitt, wohingegen Barbesucherinnen 6.59 Songs singen. Darüber hinaus zeigen auch die Standardabweichung und der Mittelwert, dass wahrscheinlich keine Signifikanz vorliegt.
mehranova %>%
group_by(Geschlecht, Alkohol) %>%
summarize(Anzahl = n(), Mittelwert = mean(Songs), Median = median(Songs), Standardabweichung = sd(Songs)) %>%
mutate_if(is.numeric, round, 2)
`summarise()` has grouped output by 'Geschlecht'. You can override using the `.groups` argument.
`mutate_if()` ignored the following grouping variables:
Column `Geschlecht`
Bei geringer Alkoholgehalt singen die Männer (M = 3.24, SD = 1.164) mehr Songs als die Frauen (M = 2.08, SD = .81). Dies ist auch bei mittlerer Alkoholgehalt ebenfalls der Fall (Männer: M = 6.8, SD = 1.75; Frauen: M = 4.96, SD = .1.64). Bei hoher Alkoholgehalt ist es genau umgekehrt: Die Frauen (M = 12.72, SD = 2.03) singen deutlich mehr Songs als die Männer(M = 9.28, SD = 1.69).
Alternative
mittel <-tapply(mehranova$Songs, list(mehranova$Alkohol, mehranova$Geschlecht), mean, na.rm=TRUE)
mittel
m w
gering 3.24 2.08
mittel 6.80 4.96
hoch 9.28 12.72
sd <-tapply(mehranova$Songs, list(mehranova$Alkohol, mehranova$Geschlecht), sd, na.rm=TRUE)
sd
m w
gering 1.164760 0.8124038
mittel 1.755942 1.6451950
hoch 1.696074 2.0314199
anzahlprogruppe <- tapply(mehranova$Songs, list(mehranova$Alkohol, mehranova$Geschlecht), function(x) sum(!is.na(x)))
anzahlprogruppe
m w
gering 25 25
mittel 25 25
hoch 25 25
Profildiagramm
ggplot(mehranova, aes(x=Alkohol, y=Songs, group=Geschlecht, color= Geschlecht))+
stat_summary(fun.y = mean, geom="point", size=3)+
stat_summary(fun.y = mean, geom="line")+
stat_summary(fun.data = mean_cl_normal, geom="errorbar",width=.2, size=.25)+
labs(x="Alkohol", y="Anzahl der Songs")+
theme_classic()
`fun.y` is deprecated. Use `fun` instead.`fun.y` is deprecated. Use `fun` instead.

Levene -Test
Der Levene-Test prüft die Nullhypothese, dass die Varianzen der Gruppen sich nicht unterscheiden. Ist der Levene-Test nicht signifikant, so kann von homogenen Varianzen ausgegangen. Wäre der Levene-Test jedoch signifikant, so wäre eine der Grundvoraussetzungen der Varianzanalyse verletzt. Gegen leichte Verletzungen gilt die Varianzanalyse als robust; vor allem bei genügend grossen und etwa gleich grossen Gruppen sind Verletzungen nicht problematisch. Bei ungleich grossen Gruppen führt eine starke Verletzung der Varianzhomogenität zu einer Verzerrung des F-Tests. Alternativ können dann auf den Brown-Forsythe-Test oder den Welch-Test zurückgegriffen werden. Dabei handelt es sich um adjustierte F-Tests.
library(car)
leveneTest(Songs ~ Alkohol*Geschlecht, data = mehranova, center = "mean")
Levene's Test for Homogeneity of Variance (center = "mean")
Df F value Pr(>F)
group 5 5.6264 9.088e-05 ***
144
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Im vorliegenden Beispiel ist der Levene-Test signifikant (F(5,144) = 5.626, p < .000 ), so dass von Varianzheterogenität ausgegangen werden kann. Da die Varianzen leider nicht gleich sind, ist es zu empfehlen eine Korrektur mithilfe des Welch-Tests durchzuführen.
Entscheiungsregeln
Mit Welch-Korrektur: p < 0.05 => Ergebnis Signifikant –> Varianzen heterogen
Ohne Welch-Korrektur: p > 0.05 => Ergebnis nicht Signifikant –> Varianzen homogen –> H0 mit Annahme Var1=Var2=… -> Var_n wird angenommen
Ergebnisse der mehrfaktorielle Varianzanalyse (ohne Messwiederholung)
Keine Welch-Korrektur - ist der Standard
mehrAnova1 <- lm(Songs ~ Geschlecht*Alkohol, data = mehranova)
myAnova <- Anova(mehrAnova1 , type = 3)
myAnova
Anova Table (Type III tests)
Response: Songs
Sum Sq Df F value Pr(>F)
(Intercept) 262.44 1 106.3228 < 2.2e-16 ***
Geschlecht 16.82 1 6.8143 0.009999 **
Alkohol 460.88 2 93.3585 < 2.2e-16 ***
Geschlecht:Alkohol 206.25 2 41.7799 4.912e-15 ***
Residuals 355.44 144
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
mit Welch-Korrektur ist zur Kontrolle gedacht
Es liegt eine Verletzung der Varianzhomogenität vor(siehe Levene-Test). Daher sollte ein robusterer Test berücksichtigt werden (* mit welch* ). Allerdings bieten sich hier keine weitgehend akzeptierten Verfahren an. Daher wird der Standard weitergeführt.
geschlechtwelch <- oneway.test(Songs~Geschlecht, data = mehranova, var.equal = F)
geschlechtwelch
One-way analysis of means (not assuming equal variances)
data: Songs and Geschlecht
F = 0.051224, num df = 1.00, denom df = 122.72, p-value = 0.8213
Für den Faktor Geschlecht wird kein Haupteffekt ersichtlich. Die Anzahl der gesungenen Songs scheint demnach unabhängig vom Geschlecht zu sein (F(1,122.72) = .0512, p = .8213).
alkoholwelch <- oneway.test(Songs~Alkohol, data = mehranova, var.equal = F)
alkoholwelch
One-way analysis of means (not assuming equal variances)
data: Songs and Alkohol
F = 238.45, num df = 2.000, denom df = 88.419, p-value < 2.2e-16
Es gibt einen Haupteffekt der Alkoholgehalt auf die Anzahl der gesungenen Songs (F(2,88.419) = 238.45, p = .000). Das bedeutet, dass Gäste der Karaoke-Bar in Abhängigkeit des Alkoholgehalt unterschiedlich viele Songs singen.
AXBwelch <- oneway.test(Songs~Alkohol*Geschlecht, data = mehranova, var.equal = F)
AXBwelch
One-way analysis of means (not assuming equal variances)
data: Songs and Alkohol * Geschlecht
F = 173.72, num df = 5.000, denom df = 65.716, p-value < 2.2e-16
Der Interaktionsterm von Alkoholgehalt und Geschlecht auf die Anzahl der gesungenen Songs ist signifikant (F(5,65.716) = 173.72, p = .000). Der Effekt von Alkoholgehalt hängt demnach zu einem gewissen Teil vom Geschlecht ab.
#zusammenfassung <- rbind(alkoholwelch,geschlechtwelch,AXBwelch)
Post-Hoc-Test
st ein Haupteffekt oder eine Interaktion signifikant, so ist zwar bestätigt, dass ein Effekt vorliegt, doch ist nach wie vor unklar, welche Faktorstufen sich unterscheiden, sobald ein Faktor mehr als zwei Ausprägungen aufweist. (Bei zwei Ausprägungen unterscheiden sich eben diese zwei Ausprägungen voneinander, sonst wäre der F-Test nicht signifikant.) Im vorliegenden Beispiel liegen ein Effekt der Alkoholgehalt sowie ein Interaktionseffekt vor. Post-hoc-Tests können einfach eingesetzt werden, um zu prüfen, welche Levels der Alkoholgehalt sich unterscheiden. Für die Interaktion ist dies in SPSS nicht implementiert.
Wie bereits erwähnt wurde, beinhaltet der Faktor Alkoholgehalt drei Stufen. Aus dem signifikanten Haupteffekt lässt sich nicht ableiten, welche der Faktorstufen einen signifikant unterschiedlichen Einfluss auf die abhängige Variable haben. Zu diesem Zweck werden Tukey-korrigierte Mehrfachvergleiche berechnet.
Bei der Berechnung von Post-hoc-Tests wird im Prinzip für jede Kombination von zwei Mittelwerten ein t-Test durchgeführt. Im aktuellen Beispiel der Alkoholgehalt mit drei Gruppen, bzw. zwei Gruppen sind dies 15 Tests. Multiple Tests sind jedoch problematisch, da der Alpha-Fehler (die fälschliche Ablehnung der Nullhypothese) mit der Anzahl der Vergleiche steigt. Wird nur ein t-Test mit einem Signifikanzlevel von .05 durchgeführt, so beträgt die Wahrscheinlichkeit des Nicht-Eintreffens des Alpha-Fehlers 95%. Werden jedoch 15 solcher Paarvergleiche vorgenommen, so beträgt die Nicht-Eintreffens-Wahrscheinlichkeit des Alpha-Fehlers (.95)15 = .4632. Um die Wahrscheinlichkeit des Eintreffens des Alpha-Fehlers zu bestimmen, wird 1 -.4632 = .5367 gerechnet. Die Wahrscheinlichkeit des Eintreffens des Alpha-Fehlers liegt somit bei 53.67%. Diese Fehlerwahrscheinlichkeit wird als “Familywise Error Rate” bezeichnet.
Um dieses Problem zu beheben, kann zum Beispiel die Tukey-Korrektur angewendet werden. Hierbei wird α durch die Anzahl der Paarvergleiche dividiert. Im hier aufgeführten Fall ist dies .05/15 = .00333. Bei diesem Kozept handelt es sich um eine allgemeine Information.
Die Tukey berücksichtigt die Korrektur, daher kann weiter gegen 0.05 getestet werden.
PostHoc <- aov(Songs ~ Geschlecht*Alkohol, data=mehranova)
#Alternativ auch der Name des Zwischenspeichers "mehr" - PostHoc <- aov(mehr)
TukeyHSD(PostHoc)
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = Songs ~ Geschlecht * Alkohol, data = mehranova)
$Geschlecht
diff lwr upr p adj
w-m 0.1466667 -0.3604403 0.6537736 0.568437
$Alkohol
diff lwr upr p adj
mittel-gering 3.22 2.475868 3.964132 0
hoch-gering 8.34 7.595868 9.084132 0
hoch-mittel 5.12 4.375868 5.864132 0
$`Geschlecht:Alkohol`
diff lwr upr p adj
w:gering-m:gering -1.16 -2.4435564 0.1235564 0.1013365
m:mittel-m:gering 3.56 2.2764436 4.8435564 0.0000000
w:mittel-m:gering 1.72 0.4364436 3.0035564 0.0022313
m:hoch-m:gering 6.04 4.7564436 7.3235564 0.0000000
w:hoch-m:gering 9.48 8.1964436 10.7635564 0.0000000
m:mittel-w:gering 4.72 3.4364436 6.0035564 0.0000000
w:mittel-w:gering 2.88 1.5964436 4.1635564 0.0000000
m:hoch-w:gering 7.20 5.9164436 8.4835564 0.0000000
w:hoch-w:gering 10.64 9.3564436 11.9235564 0.0000000
w:mittel-m:mittel -1.84 -3.1235564 -0.5564436 0.0008204
m:hoch-m:mittel 2.48 1.1964436 3.7635564 0.0000017
w:hoch-m:mittel 5.92 4.6364436 7.2035564 0.0000000
m:hoch-w:mittel 4.32 3.0364436 5.6035564 0.0000000
w:hoch-w:mittel 7.76 6.4764436 9.0435564 0.0000000
w:hoch-m:hoch 3.44 2.1564436 4.7235564 0.0000000
Wie vermutet, zeichnet sich bei Geschlecht keine signifikant ab. Die Alkoholgehaltskombinationen unterscheiden sich signifikant.
Für das vorliegende Beispiel wird ersichtlich, dass sich der Alkoholgehalt und das Geschlecht bezüglich der gesungenen Songs signifikant unterscheiden (p < .05). Jedoch kann kein Unterschied für das Geschlecht mit einer geringem Alkoholgehalt von 0.05 Prozent festgestellt werden (p < .05). Es können 5 Gruppen gebildet werden.
Was ist sig und was nicht? 14 von 15 Vergleichen sind sig. (p < .05). Nicht sig. ist w:gering-m:gering (p = .1013365)
Generalisierbarkeit /Unabhängigkeit - global?
- mittel weiblich
- mittel männlich
- hoch weiblich
- hoch männlich
Vier Gruppen sind unabhängige / generalisierbar.
- Gruppenbildung?
Es können 5 Gruppen gebildet werden.
- Interaktion?
Bei geringerem Alkoholgehalt lag Männer (M = 3.24, SD = 1.164) über jenem der Frauen (M = 2.08, SD = .81), allerdings konnte der Unterschied im Post-Hoc nicht bestätigt werden. Bei mittlerer Alkoholgehalt (Männer: M = 6.8, SD = 1.75; Frauen: M = 4.96, SD = .1.64) konnte der Mittelwertsunterschied bestätigt werden. Bei hohem Alkoholgehalt verhält es sich genau andersrum - Frauen sangen (M = 12.72, SD = 2.03) deutlich mehr Songs als die Männer (M = 12.72, SD = 2.03). Das Ergebnis konnte bestätigt werden.
Alternativ
Bonferroni und Tukey: sehr strenge Kontrolle des Fehlers 1. Art, zu geringe Teststärke, deshalb zu konservativ. Bei wenigen Paarvergleichen hat Bonferroni mehr Teststärke, bei vielen Paarvergleichen hat Tukey mehr Teststärke.
pairwise.t.test(mehranova$Songs, mehranova$Geschlecht, data=mehranova, pool.sd=T,var.equal=FALSE)
Pairwise comparisons using t tests with pooled SD
data: mehranova$Songs and mehranova$Geschlecht
m
w 0.82
P value adjustment method: holm
pairwise.t.test(mehranova$Songs, mehranova$Alkohol, data=mehranova, pool.sd=T,var.equal=F)
Pairwise comparisons using t tests with pooled SD
data: mehranova$Songs and mehranova$Alkohol
gering mittel
mittel 9.2e-14 -
hoch < 2e-16 < 2e-16
P value adjustment method: holm
Bei diesem Testverfahren muss der aplhawert korrigiert werden.
newalpha<- 0.05/15
newalpha
[1] 0.003333333
interaktion=paste(mehranova$Geschlecht, mehranova$Alkohol, sep=".")
pairwise.t.test(mehranova$Songs, interaktion, data=mehranova, var.equal=FALSE)
Pairwise comparisons using t tests with pooled SD
data: mehranova$Songs and interaktion
m.gering m.hoch m.mittel w.gering w.hoch
m.hoch < 2e-16 - - - -
m.mittel 2.5e-12 4.6e-07 - - -
w.gering 0.01000 < 2e-16 < 2e-16 - -
w.hoch < 2e-16 9.5e-12 < 2e-16 < 2e-16 -
w.mittel 0.00033 < 2e-16 0.00018 6.8e-09 < 2e-16
P value adjustment method: holm
Games - Howell
interaktion=paste(mehranova$Geschlecht, mehranova$Alkohol, sep=".")
mehranova["interaktion"] <- interaktion
View(mehranova)
#Faktor A
mehranova$Geschlecht <- as.factor(mehranova$Geschlecht)
ANOVA <- aov(Songs~Geschlecht, mehranova)
erg <- PMCMRplus::gamesHowellTest(ANOVA)
summary (erg)
Pairwise comparisons using Games-Howell test
data: Songs by Geschlecht
alternative hypothesis: two.sided
P value adjustment method: none
H0
---
Signif. codes: 0 㤼㸱***㤼㸲 0.001 㤼㸱**㤼㸲 0.01 㤼㸱*㤼㸲 0.05 㤼㸱.㤼㸲 0.1 㤼㸱 㤼㸲 1
# Faktor B
mehranova$Alkohol <- as.factor(mehranova$Alkohol)
ANOVA <- aov(Songs~Alkohol, mehranova)
erg <- PMCMRplus::gamesHowellTest(ANOVA)
summary (erg)
Pairwise comparisons using Games-Howell test
data: Songs by Alkohol
alternative hypothesis: two.sided
P value adjustment method: none
H0
---
Signif. codes: 0 㤼㸱***㤼㸲 0.001 㤼㸱**㤼㸲 0.01 㤼㸱*㤼㸲 0.05 㤼㸱.㤼㸲 0.1 㤼㸱 㤼㸲 1
#Interaktion
mehranova$interaktion <- as.factor(mehranova$interaktion)
ANOVA <- aov(Songs~interaktion, mehranova)
erg <- PMCMRplus::gamesHowellTest(ANOVA)
summary (erg)
Pairwise comparisons using Games-Howell test
data: Songs by interaktion
alternative hypothesis: two.sided
P value adjustment method: none
H0
---
Signif. codes: 0 㤼㸱***㤼㸲 0.001 㤼㸱**㤼㸲 0.01 㤼㸱*㤼㸲 0.05 㤼㸱.㤼㸲 0.1 㤼㸱 㤼㸲 1
Das par. Eta-Quadrat
Das partielle Eta-Quadrat (partielles η2) ist in Abbildung ausgegeben.
\[\eta^2_{partial A}= \frac {QS_A}{QS_A+QS_{inn}}\]
\[\eta^2_{partial B}= \frac {QS_B}{QS_B+QS_{inn}}\]
\[\eta^2_{partial AxB}= \frac {QS_{AxB}}{QS_{AxB}+QS_{inn}}\]
\[\eta_A= \frac {QS_A}{QS_{total}}\] \[\eta_B= \frac {QS_B}{QS_{total}}\] \[\eta_{AxB}= \frac {QS_{AxB}}{QS_{total}}\]
eta <- effectsize::eta_squared(mehrAnova1, partial = TRUE)
eta
Parameter | Eta2 (partial) | 90% CI
--------------------------------------------------
Geschlecht | 2.26e-03 | [0.00, 0.03]
Alkohol | 0.83 | [0.80, 0.86]
Geschlecht:Alkohol | 0.37 | [0.26, 0.45]
Im vorliegenden Beispiel ist der Effekt des Geschlechts nicht signifikant. Daher wird dessen partielles Eta-Quadrat nicht betrachtet. Für die Alkoholgehalt beträgt das partielle Eta-Quadrat .833. Das heisst, die Alkoholgehalt erklärt 83% derjenigen Fehlervariation, die das Modell hätte, wäre Alkoholgehalt nicht im Modell. Das partielle Eta-Quadrat der Interaktion beträgt .367 und erklärt daher 3% der ohne die Interaktion ungeklärten Variation.
Berechnung der Effektstärke
\[f=\sqrt\frac{\eta^{2}}{1-\eta^{2}}=\sqrt\frac{eta^{2}}{1-eta^{2}}\]
Effektstärke fürs Geschlecht
effgender <- sqrt(eta$Eta2_partial[1]/(1-eta$Eta2_partial[1]))
sprintf("Effektstärke fürs Geschlecht: f= %.3f", effgender)
[1] "Effektstärke fürs Geschlecht: f= 0.048"
Effektstärke fürs Alkoholgehalt
effalk <- sqrt(eta$Eta2_partial[2]/(1-eta$Eta2_partial[2]))
sprintf("Effektstärke fürs Alkoholgehalt: f= %.3f",effalk)
[1] "Effektstärke fürs Alkoholgehalt: f= 2.231"
Effektstärke für die Interaktion
effAxB <- sqrt(eta$Eta2_partial[3]/(1-eta$Eta2_partial[3]))
sprintf("Effektstärke für die Interaktion: f= %.3f",effAxB)
[1] "Effektstärke für die Interaktion: f= 0.762"
Um zu beurteilen, wie gross dieser Effekt ist, kann man sich an der Einteilung von Cohen (1988) orientieren:
\[
\begin{align}
\text{Schwacher Effekt: } 0.10 &< ||f|| < 0.25 \\
\text{Schwacher bis mittlerer Effekt: } 0.25 &= ||f|| \\
\text{Mittlerer Effekt: } 0.25 &< ||f|| < 0.40 \\
\text{Mittlerer bis starker Effekt: }0.40 &= ||f|| \\
\text{Starker Effekt: } 0.40 &< ||f||
\end{align}
\]
Damit entsprechen die Effektstärken von 2.23 und 0.76 einem starken Effekt. Für Geschlecht liegt natürlich kein Effekt vor - es sei nur der Vollständigkeit erwähnt.
Eine Aussage
Hypothesen
Es zeigt sich, dass es keinen Unterschied zwichen dem Geschlecht und der Anzahl an gesungenen Songs allein gibt (F(1,122.72) = .0512, p = .8213). H0 für den Haupteffekt A wird angenommen.
Allerdings je nach Alkoholgehalt des ersten Getränkes gibt es einen Unterschied zwischen den gesungenen Songs (F(2,88.419) = 238.45, p = .000). H0 für den Haupteffekt B wird verworfen.
Der Interaktionsterm von Alkoholgehalt und Geschlecht auf die Anzahl der gesungenen Songs ist signifikant (F(5,65.716) = 173.72, p = .000). Der Effekt von Alkoholgehalt hängt demnach zu einem gewissen Teil vom Geschlecht ab. H0 für den Interaktion AxB wird verworfen.
Post- Hoc - Test
Der PostHoc wurde mit Tukey durchgeführt. Für Geschlecht zeigte sich keine signifikant ab (p = 0.101). Es zeigt, dass sich alle Gruppen für Alkoholgehalt signifikant unterscheiden: Gering (M = 2.66 ,SD = 1.15, N=50), mittlere Alkoholniveau (M = 5.88, SD = 1.92, n=50) und hohe Alkoholniveau (M = 11, SD = 2.54, n=50).
Zudem zeigt sich eine signifikante Interaktion von Geschlecht und Alkoholgehalt auf die Anzahl der gesungenen Songs.Dies weist darauf hin, dass sich Alkoholgehalt je nach Geschlecht unterschiedlich auswirkt.
Bei geringerem Alkoholgehalt lag Männer (M = 3.24, SD = 1.164) über jenem der Frauen (M = 2.08, SD = .81), allerdings konnte der Unterschied im Post-Hoc nicht bestätigt werden. Bei mittlerer Alkoholgehalt (Männer: M = 6.8, SD = 1.75; Frauen: M = 4.96, SD = .1.64) konnte der Mittelwertsunterschied bestätigt werden.
Bei hohem Alkoholgehalt verhält es sich genau andersrum - Frauen sangen (M = 12.72, SD = 2.03) deutlich mehr Songs als die Männer (M = 12.72, SD = 2.03). Das Ergebnis konnte bestätigt werden.
Effektstärke
Die Effektstärken sind sowohl für den Haupteffekt der Alkoholgehalt (f = 2.23) als auch für die Interaktion (f = 0,76) nach Cohen (1988) ein starker Effekt
