Von A nach B

Ein Arbeitnehmer will untersuchen, ob die Strecke A und der Zeitpunkt B der Abfahrt einen Einfluss auf die Fahrzeit zur Arbeit haben.

A: Strecke zur Arbeit: Bahnhof Ost (-)| Hauptbahnhof (+)
B: Zeitpunkt früh(-)|später(+)

2²-Versuchsaufbau

A B AXB Fahrzeit
- - + 40
+ - - 46
- + - 42
+ + + 50
Fahrzeit <-  c(40,46,42, 50)
A <- Strecke <-  c("Bahnhof Ost","Hauptbahnhof","Bahnhof Ost", "Hauptbahnhof")
B <- Zeitpunkt <-   c("früh","früh","später", "später")
aufgabe <- data.frame(Strecke, Zeitpunkt, Fahrzeit)
head(aufgabe)
##        Strecke Zeitpunkt Fahrzeit
## 1  Bahnhof Ost      früh       40
## 2 Hauptbahnhof      früh       46
## 3  Bahnhof Ost    später       42
## 4 Hauptbahnhof    später       50

Deskriptive Statistik

# Hauptfaktor A
negA <- (40+42)/2
posA <- (46+50)/2
DIFA <- posA-negA

# Hauptfaktor B
negB <- (40+46)/2
posB <- (42+50)/2
DIFB <- posB-negB

# Interaktion
Interaktion <- (40-46-42+50)/2

sprintf("negA: %f",negA)
## [1] "negA: 41.000000"
sprintf("posA: %f",posA)
## [1] "posA: 48.000000"
sprintf("DIFA: %f",DIFA)
## [1] "DIFA: 7.000000"
sprintf("negB: %f",negB)
## [1] "negB: 43.000000"
sprintf("posB: %f",posB)
## [1] "posB: 46.000000"
sprintf("DIFB: %f",DIFB)
## [1] "DIFB: 3.000000"
sprintf("Interaktion: %f",Interaktion)
## [1] "Interaktion: 1.000000"
disA <- psych::describeBy(aufgabe$Fahrzeit, group = aufgabe$Strecke, mat =T)
disA
##     item       group1 vars n mean       sd median trimmed    mad min max range
## X11    1  Bahnhof Ost    1 2   41 1.414214     41      41 1.4826  40  42     2
## X12    2 Hauptbahnhof    1 2   48 2.828427     48      48 2.9652  46  50     4
##     skew kurtosis se
## X11    0    -2.75  1
## X12    0    -2.75  2
sprintf("Die Diff liegt bei : %.2f", (disA$mean[1]-disA$mean[2]))
## [1] "Die Diff liegt bei : -7.00"
disB <- psych::describeBy(aufgabe$Fahrzeit, group = aufgabe$Zeitpunkt, mat =T)
disB
##     item group1 vars n mean       sd median trimmed    mad min max range skew
## X11    1   früh    1 2   43 4.242641     43      43 4.4478  40  46     6    0
## X12    2 später    1 2   46 5.656854     46      46 5.9304  42  50     8    0
##     kurtosis se
## X11    -2.75  3
## X12    -2.75  4
sprintf("Die Diff liegt bei : %.2f", (disB$mean[1]-disB$mean[2]))
## [1] "Die Diff liegt bei : -3.00"

Ergebnis

erg <- aov(aufgabe$Fahrzeit~ aufgabe$Strecke+aufgabe$Zeitpunkt)

summary(erg)
##                   Df Sum Sq Mean Sq F value Pr(>F)  
## aufgabe$Strecke    1     49      49      49 0.0903 .
## aufgabe$Zeitpunkt  1      9       9       9 0.2048  
## Residuals          1      1       1                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Es zeigt sich ein Trend, dass die Fahrzeit kürzer ausfällt, wenn Mann oder Frau vom Bahnhof Ost abfährt (F(1,1)=49,p = .09). Der Zeitpunkt der Abfahrt zeigt wiederum einen etwas geringeren Einfluss mit p= .2 (F(1,1)= 9, p = .2).

Interaktionsplots

# Additional options to change
# xlab = "Label für x"
# ylab = "Label für y"
# main = "Titel"
# ylim = "y-Achsen-Range in diesem Beispiel von 4- 10"
# trace.label = "Label für Legende"
# type = Können sein ->"l", "p", "b", "o", "c"
# pch = "Kreise, Dreiecke... einfach mal die Zahlen ändern"
# col = "Farbe"
interaction.plot(aufgabe$Strecke, aufgabe$Zeitpunkt, aufgabe$Fahrzeit,
                 main = "Interaktionsplot", 
                 ylab= "Fahrzeit in Min.",
                 xlab="Strecke", 
                 trace.label = "Zeitpunkt", 
                 type = "b", 
                 col = c("green","blue"), 
                 pch = c(5,9))

Der Haupteffekt B ist global interpretierbar. Die Graphen der beiden Faktorstufen “Bahnhof Ost” und “Hauptbahnhof” weisen in die gleiche Richtung. Die Fahrzeit ist immer kürzer, wenn Mann oder Frau früher losfährt als später.

interaction.plot(aufgabe$Zeitpunkt, aufgabe$Strecke, aufgabe$Fahrzeit,
                 main = "Interaktionsplot", 
                 ylab= "Fahrzeit in Min.",
                 xlab="Strecke", 
                 trace.label = "Strecke", 
                 type = "b", 
                 col = c("green","blue"), 
                 pch = c(5,9), 
                 ylim=c(38,52))

Der Haupteffekt A ist global interpretierbar. Die Graphen der beiden Faktorstufen “früh” oder “spät” weisen in die gleiche Richtung. Der Ostbahnhof hat immer die kürzere Fahrtzeit als der Hauptbahnhof.

Aussage

Vom Bahnhof Ost benötigt Mann oder Frau 41 min. zum Ziel, während von Hauptbahnhof 48 min. benötigt werden.

Die Fahrtzeit mit dem Zeitpunkt “spät” führt zu einer Fahrtdauer von 46 min., während der Abfahrtzeit “früh” zu einer Fahrdauer von 43 min im Schnitt führt. Die Ersparnis bei der Strecke liegt bei 7 min - bei dem Zeitpunkt 3 min.

Es zeigt sich ein Trend, dass die Fahrzeit kürzer ausfällt, wenn Mann oder Frau vom Bahnhof Ost abfährt (F(1,1)=49,p = .09). Der Zeitpunkt der Abfahrt zeigt wiederum einen etwas geringeren Einfluss mit p = 0.2 (F(1,1)= 9,p = .2).

Zusammenfassung: Der Bahnhof Ost verkürzt die Fahrzeit mit einer Wahrscheinlichkeit von über 90 %.

kurz: Beide Hauptfaktoren können interpretiert werden (siehe Interationsplot). Es zeigt sich ein Trend, dass die Fahrzeit kürzer ausfällt, wenn Mann oder Frau vom Bahnhof Ost abfährt (F(1,1)=49,p = .09, n=4). Der Zeitpunkt der Abfahrt zeigt wiederum einen etwas geringeren Einfluss (F(1,1) = 9, p =.2, n= 4). Es können 7 Min. eingespart werden, wenn Mann oder Frau vom “Ost Bahnhof” statt vom “Hauptbahnhof” losfährt. Während nur 3 Min eingespart werden können mit dem jeweiligen Zeitpunkt (“Früh” vs. “Spät”).

Wer erinnert sich?

Es soll untersucht werden, von welchen Faktoren das Erinnerungsvermögen abhängt. Hierzu wurde Personen eine Liste mit 20 dreisilbigen Wörtern vorgelegt oder vorgelesen. Danach hatten die Personen drei Minuten Zeit, alle Wörter aufzuschreiben, die sie sich gemerkt hatten. Es werden die folgenden drei Faktoren betrachte

A: Geschlecht: Männlein (-)| Weiblein (+) B: Alter: jung(-)| älter(+) C: Darstellung: vorgelesen(-)| selber lesen(+)

2³-Versuchsaufbau

A B C AxB AxC BxC AxBxC Anzahl
- - - + + + - 9
+ - - - - + + 9
- + - - + - + 5
+ + - + - - - 7
- - + + - - + 10
+ - + - + - - 14
- + + - - + - 12
+ + + + + + + 10
Anzahl<-c(9,9,5,7,10,14,12,10)
A<-Geschlecht<-factor(c(-1,1,-1,1,-1,1,-1,1)) 
B<-Alter <-factor(c(-1,-1,1,1,-1,-1,1,1))
C<-Darstellung <-factor(c(-1,-1,-1,-1,1,1,1,1))
Aufgabe <- data.frame(Geschlecht, Alter, Darstellung, Anzahl)
head(Aufgabe, 8)
##   Geschlecht Alter Darstellung Anzahl
## 1         -1    -1          -1      9
## 2          1    -1          -1      9
## 3         -1     1          -1      5
## 4          1     1          -1      7
## 5         -1    -1           1     10
## 6          1    -1           1     14
## 7         -1     1           1     12
## 8          1     1           1     10
Anzahl<-c(9,9,5,7,10,14,12,10)
A<-Geschlecht<-factor(c("Männlein","Weiblein","Männlein","Weiblein","Männlein","Weiblein","Männlein","Weiblein"))
B<-Alter <-factor(c("jung","jung","älter","älter","jung","jung","älter","älter"))
C<-Darstellung <-factor(c("vorgelesen","vorgelesen","vorgelesen","vorgelesen","selber lesen","selber lesen","selber lesen","selber lesen"))
# AxB, AxC, BxC, AXBXC
Aufgabe <- data.frame(Geschlecht, Alter, Darstellung,Anzahl)
head(Aufgabe,8)
##   Geschlecht Alter  Darstellung Anzahl
## 1   Männlein  jung   vorgelesen      9
## 2   Weiblein  jung   vorgelesen      9
## 3   Männlein älter   vorgelesen      5
## 4   Weiblein älter   vorgelesen      7
## 5   Männlein  jung selber lesen     10
## 6   Weiblein  jung selber lesen     14
## 7   Männlein älter selber lesen     12
## 8   Weiblein älter selber lesen     10

Deskriptive Statistiken

Geschlecht

library(dplyr)
## Warning: package 'dplyr' was built under R version 3.6.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
Aufgabe %>%
group_by(Geschlecht) %>%
  summarise(n(), Mittelwert = mean(Anzahl)) %>%
  mutate_if(is.numeric, round, 2)
## `summarise()` ungrouping output (override with `.groups` argument)
## Warning: `...` is not empty.
## 
## We detected these problematic arguments:
## * `needs_dots`
## 
## These dots only exist to allow future extensions and should be empty.
## Did you misspecify an argument?
## # A tibble: 2 x 3
##   Geschlecht `n()` Mittelwert
##   <fct>      <dbl>      <dbl>
## 1 Männlein       4          9
## 2 Weiblein       4         10

Männer und Frauen unterscheiden sich nicht sehr im Mittel (9 vs. 10 Wörter)

Alter

library(dplyr)
Aufgabe %>%
group_by(Alter) %>%
  summarize( n(), Mittelwert = mean(Anzahl)) %>%
  mutate_if(is.numeric, round, 2)
## `summarise()` ungrouping output (override with `.groups` argument)
## Warning: `...` is not empty.
## 
## We detected these problematic arguments:
## * `needs_dots`
## 
## These dots only exist to allow future extensions and should be empty.
## Did you misspecify an argument?
## # A tibble: 2 x 3
##   Alter `n()` Mittelwert
##   <fct> <dbl>      <dbl>
## 1 älter     4        8.5
## 2 jung      4       10.5

Jüngere und Ältere unterscheiden sich “etwas” im Mittel (10.5 vs. 8.5 Wörter). Die Differenz beträgt 2 Wörter. Daher ist eine Überprüfung notwendig.

Darstellung

library(dplyr)
Aufgabe %>%
group_by(Darstellung) %>%
  summarize( n(), Mittelwert = mean(Anzahl)) %>%
  mutate_if(is.numeric, round, 2)
## `summarise()` ungrouping output (override with `.groups` argument)
## Warning: `...` is not empty.
## 
## We detected these problematic arguments:
## * `needs_dots`
## 
## These dots only exist to allow future extensions and should be empty.
## Did you misspecify an argument?
## # A tibble: 2 x 3
##   Darstellung  `n()` Mittelwert
##   <fct>        <dbl>      <dbl>
## 1 selber lesen     4       11.5
## 2 vorgelesen       4        7.5

Selber lesen oder vorgelesen unterscheiden sich im Mittel (7.5 vs. 11.5 Wörter)

Interaktionen

Geschlecht x Alter ~ AxB

library(dplyr)
Aufgabe %>%
group_by(Geschlecht,Alter) %>%
  summarize(n(), Mittelwert = mean(Anzahl)) %>%
  mutate_if(is.numeric, round, 2)
## `summarise()` regrouping output by 'Geschlecht' (override with `.groups` argument)
## `mutate_if()` ignored the following grouping variables:
## Column `Geschlecht`
## Warning: `...` is not empty.
## 
## We detected these problematic arguments:
## * `needs_dots`
## 
## These dots only exist to allow future extensions and should be empty.
## Did you misspecify an argument?
## # A tibble: 4 x 4
## # Groups:   Geschlecht [2]
##   Geschlecht Alter `n()` Mittelwert
##   <fct>      <fct> <dbl>      <dbl>
## 1 Männlein   älter     2        8.5
## 2 Männlein   jung      2        9.5
## 3 Weiblein   älter     2        8.5
## 4 Weiblein   jung      2       11.5

Männer und Frauen unterscheiden sich nicht sehr im Mittel (8.5|9.5 vs. 8.5|11.5 Wörter) Jüngere und Ältere unterscheiden sich “etwas” im Mittel (9.5|11.5 vs. 8.5|8.5 Wörter). Es gibt eher keinen Unterschied in der Interaktion.

Alter x Darstellung BxC

library(dplyr)
Aufgabe %>%
group_by(Alter, Darstellung) %>%
  summarize( n(), Mittelwert = mean(Anzahl)) %>%
  mutate_if(is.numeric, round, 2)
## `summarise()` regrouping output by 'Alter' (override with `.groups` argument)
## `mutate_if()` ignored the following grouping variables:
## Column `Alter`
## Warning: `...` is not empty.
## 
## We detected these problematic arguments:
## * `needs_dots`
## 
## These dots only exist to allow future extensions and should be empty.
## Did you misspecify an argument?
## # A tibble: 4 x 4
## # Groups:   Alter [2]
##   Alter Darstellung  `n()` Mittelwert
##   <fct> <fct>        <dbl>      <dbl>
## 1 älter selber lesen     2         11
## 2 älter vorgelesen       2          6
## 3 jung  selber lesen     2         12
## 4 jung  vorgelesen       2          9

Jüngere und Ältere unterscheiden sich “eher” nicht im Mittel (12|9 vs. 11|6 Wörter). Selber lesen oder Vorgelesen unterscheiden sich im Mittel (11|12 vs. 6|9 Wörter). Es könnte einen Unterschied in der Interaktion geben, ist jedoch nicht deutlich zu erkennen.

Geschlecht x Darstellung AxC

library(dplyr)
Aufgabe %>%
group_by(Geschlecht, Darstellung) %>%
  summarize( n(), Mittelwert = mean(Anzahl)) %>%
  mutate_if(is.numeric, round, 2)
## `summarise()` regrouping output by 'Geschlecht' (override with `.groups` argument)
## `mutate_if()` ignored the following grouping variables:
## Column `Geschlecht`
## Warning: `...` is not empty.
## 
## We detected these problematic arguments:
## * `needs_dots`
## 
## These dots only exist to allow future extensions and should be empty.
## Did you misspecify an argument?
## # A tibble: 4 x 4
## # Groups:   Geschlecht [2]
##   Geschlecht Darstellung  `n()` Mittelwert
##   <fct>      <fct>        <dbl>      <dbl>
## 1 Männlein   selber lesen     2         11
## 2 Männlein   vorgelesen       2          7
## 3 Weiblein   selber lesen     2         12
## 4 Weiblein   vorgelesen       2          8

Männer und Frauen unterscheiden sich nicht sehr im Mittel (11|7 vs. 12|8 Wörter) Selber lesen oder Vorgelesen unterscheiden sich im Mittel (11|12 vs. 7|8 Wörter). Es könnte einen Unterschied in der Interaktion geben, ist jedoch nicht deutlich zu erkennen.

Geschlecht x Alter x Darstellung ~ AxBxC

library(dplyr)
Aufgabe %>%
group_by(Geschlecht, Alter, Darstellung) %>%
  summarize( n(), Mittelwert = mean(Anzahl)) %>%
  mutate_if(is.numeric, round, 2)
## `summarise()` regrouping output by 'Geschlecht', 'Alter' (override with `.groups` argument)
## `mutate_if()` ignored the following grouping variables:
## Columns `Geschlecht`, `Alter`
## Warning: `...` is not empty.
## 
## We detected these problematic arguments:
## * `needs_dots`
## 
## These dots only exist to allow future extensions and should be empty.
## Did you misspecify an argument?
## # A tibble: 8 x 5
## # Groups:   Geschlecht, Alter [4]
##   Geschlecht Alter Darstellung  `n()` Mittelwert
##   <fct>      <fct> <fct>        <dbl>      <dbl>
## 1 Männlein   älter selber lesen     1         12
## 2 Männlein   älter vorgelesen       1          5
## 3 Männlein   jung  selber lesen     1         10
## 4 Männlein   jung  vorgelesen       1          9
## 5 Weiblein   älter selber lesen     1         10
## 6 Weiblein   älter vorgelesen       1          7
## 7 Weiblein   jung  selber lesen     1         14
## 8 Weiblein   jung  vorgelesen       1          9

Ergebnis

ohne Interaktion

##summary(aov(Anzahl~A+B+C)) ## oder
##summary(aov(Aufgabe$Anzahl~Aufgabe$Geschlecht+Aufgabe$Alter+Aufgabe$Darstellung)) ## oder
summary(aov(Anzahl~Geschlecht+Alter+Darstellung))
##             Df Sum Sq Mean Sq F value Pr(>F)  
## Geschlecht   1      2       2   0.667 0.4601  
## Alter        1      8       8   2.667 0.1778  
## Darstellung  1     32      32  10.667 0.0309 *
## Residuals    4     12       3                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Es zeigt sich ein deutlicher Unterschied in der Erinnerungsfähigkeit der Teilnehmer, wenn die Begriffe vorgelesen oder selber gelesen werden konnten (F(1,4) = 10.667, p= 0.03). Das Alter scheint wiederum auch von Bedeutung zu sein, da sich hier eine leichte Entwicklung abzeichnet (F(1,4) = 2.667, p = 0.17). Das Geschlecht spielt augenscheinlich keine Rolle (F(1,4) = 0.667, p = 0.46).

Mit Interaktion

##summary(aov(Anzahl~A+B+C+A*B+A*C+B*C)) oder
summary(aov(Anzahl~Geschlecht+Alter+Darstellung+Geschlecht*Alter+ Geschlecht*Darstellung+Alter*Darstellung+Geschlecht*Alter*Darstellung))
##                              Df Sum Sq Mean Sq
## Geschlecht                    1      2       2
## Alter                         1      8       8
## Darstellung                   1     32      32
## Geschlecht:Alter              1      2       2
## Geschlecht:Darstellung        1      0       0
## Alter:Darstellung             1      2       2
## Geschlecht:Alter:Darstellung  1      8       8

Die Interaktionen führen zu keinem eindeutigen Trend.

Dreifach Interaktion

summary(aov(Anzahl~Geschlecht+Alter+Darstellung+Geschlecht*Alter+ Geschlecht*Darstellung+Alter*Darstellung+Geschlecht*Alter*Darstellung))
##                              Df Sum Sq Mean Sq
## Geschlecht                    1      2       2
## Alter                         1      8       8
## Darstellung                   1     32      32
## Geschlecht:Alter              1      2       2
## Geschlecht:Darstellung        1      0       0
## Alter:Darstellung             1      2       2
## Geschlecht:Alter:Darstellung  1      8       8

nicht interpretierbar

Aussage

Es zeigt sich ein deutlicher Unterschied in der Erinnerungsfähigkeit der Teilnehmer, wenn die Begriffe vorgelesen oder selber gelesen werden konnten (F(1,4) = 10.667, p= 0.03). Das Alter scheint wiederum auch von Bedeutung zu sein, da sich hier eine leichte Entwicklung abzeichnet (F(1,4) = 2.667, p = 0.17). Das Geschlecht spielt augenscheinlich keine Rolle (F(1,4) = 0.667, p = 0.46).

Männer und Frauen unterscheiden sich nicht sehr im Mittel (9 vs. 10 Wörter) Jüngere und Ältere unterscheiden sich “etwas” im Mittel (10.5 vs. 8.5 Wörter). Die Differenz beträgt 2 Wörter. Selberlesen oder Vorgelesen unterscheiden sich im Mittel (7.5 vs. 11.5 Wörter)

Die Interaktionen bieten keine weiterführenden Informationen, die im Rahmen dieses Design sinnvoll interpretierbar wären.