Überblick
head(wilcoxen, 6) # Ersten sechs Zeilen
summary(wilcoxen)
ID Vorher Nachher Differenz
Min. : 1.00 Min. :17.00 Min. :23.00 Min. :-14.00
1st Qu.: 9.25 1st Qu.:30.00 1st Qu.:31.25 1st Qu.: -7.75
Median :17.50 Median :31.00 Median :34.00 Median : -3.50
Mean :17.50 Mean :30.68 Mean :34.18 Mean : -3.50
3rd Qu.:25.75 3rd Qu.:32.00 3rd Qu.:37.75 3rd Qu.: 0.75
Max. :34.00 Max. :39.00 Max. :44.00 Max. : 5.00
str(wilcoxen)
'data.frame': 34 obs. of 4 variables:
$ ID : num 1 2 3 4 5 6 7 8 9 10 ...
$ Vorher : num 30 31 32 31 29 39 32 31 29 30 ...
$ Nachher : num 40 30 33 33 33 35 37 34 32 40 ...
$ Differenz: num -10 1 -1 -2 -4 4 -5 -3 -3 -10 ...
#Spalte Differenz anlegen
differenz <- wilcoxen$Vorher -wilcoxen$Nachher
wilcoxen <- cbind(wilcoxen, "Differenz" = differenz)
View(wilcoxen)
# Eine Spalte löschen
#wilcoxen$Differenz <- NULL
#View(Wilcoxon)
Hypothese
H1: Es gibt einen Unterschied in den Verkaufszahlen für die Aktionfigur “Held2000”vor dem Rabatt und nach dem Rabatt. \(M_{vorher} \ne M_{nacher}\)
H01: Es gibt keinen Unterschied in den Verkaufszahlen für die Aktionfigur “Held2000” vor dem Rabatt und nach dem Rabatt. \(M_{vorher} = M_{nachher}\)
Voraussetzungen für den Wilcoxon-Test
Die abhängige Variable ist mindestens ordinalskaliert -> Die Variable ist eigentlich metrisch.
Es liegen zwei verbundene Stichproben oder Gruppen vor, aber die verschiedenen Messwertpaare sind voneinander unabhängig - 1) Verbunden, weil wir den gleichen Store pro Zeile vergleichen 2) z.B Store A und Store B sind unabhängig
Boxplots zur Darstellung der Werte
boxplot(wilcoxen$Vorher , main = "Boxplot vor dem Rabatt", xlab = "Vorher", col = "hotpink3")

Vor dem Rabatt zeigt sich, dass drei Ausreißer auftraten (Median = 31). Jedoch da ein Wicoxen-Test für abhängige Stichproben durch geführt wird, können diese vernachlässigt werden.
boxplot(wilcoxen$Nachher , main = "Boxplot nach dem Rabatt", xlab = "Nach", col = "deepskyblue")

Der Median der Variable „Nachher“ liegt bei 34. Auf den ersten Blick könnte der Boxplot nahelegen, dass ein t-Test für abhängige Stichproben geeignet wäre. Bei genauerer Betrachtung zeigt sich jedoch, dass dies keine sinnvolle Wahl ist: Die Varianzen unterscheiden sich deutlich, und es sind sowohl große als auch kleine Stores vertreten. Aus diesem Grund ist der Wilcoxon-Test die passendere Methode.
ALTERNATIV - Vor und Vach dem Rabatt
boxplot(wilcoxen$Vorher, wilcoxen$Nachher, main = "Boxplots zu den Verkaufszahlen",col = c("hotpink3", "deepskyblue"), names = c("(links) vorher", "(rechts) nachher"), ylab = "Anzahl der verkauften Aktionfiguren ")

ALTERNATIV
#Median der Var. Vorher und Nachher
sprintf("Median für Vor dem Rabatt : %.2f", median(wilcoxen$Vorher))
[1] "Median für Vor dem Rabatt : 31.00"
sprintf("Median für Nach dem Rabatt : %.2f", median(wilcoxen$Nachher))
[1] "Median für Nach dem Rabatt : 34.00"
sprintf("Anzahl der Daten: %.f", nrow(wilcoxen))
[1] "Anzahl der Daten: 34"
Es gibt einen Unterschied in der zentralen Tendenz zwischen zwei Messzeitpunkten. Vorher dem Rabatt wurden 31 Artikel gekauft (n=34); nach dem Rabatt wurden 34 Artikel verkauft (n=34).
Ergebnisse des Wilcoxon-Tests
Ist die Stichprobe hinreichend gross (n > 20), so ist der kritische Wert asymptotisch normalverteilt.
test<- wilcox.test(wilcoxen$Vorher, wilcoxen$Nachher,alternative = "two.sided",paired = TRUE, exact = FALSE)
test
Wilcoxon signed rank test with continuity correction
data: wilcoxen$Vorher and wilcoxen$Nachher
V = 69.5, p-value = 0.000817
alternative hypothesis: true location shift is not equal to 0
Ist dies nicht der Fall, so wird die exakte Signifikanz verwendet.
test<- wilcox.test(wilcoxen$Vorher, wilcoxen$Nachher,alternative = "two.sided",paired = TRUE, exact = TRUE)
Warning in wilcox.test.default(wilcoxen$Vorher, wilcoxen$Nachher, alternative = "two.sided", :
cannot compute exact p-value with ties
Warning in wilcox.test.default(wilcoxen$Vorher, wilcoxen$Nachher, alternative = "two.sided", :
cannot compute exact p-value with zeroes
test
Wilcoxon signed rank test with continuity correction
data: wilcoxen$Vorher and wilcoxen$Nachher
V = 69.5, p-value = 0.000817
alternative hypothesis: true location shift is not equal to 0
doppelt vorkommende Daten
" cannot compute exact p-value with zeroes"- Da in diesem Datensatz doppelte Messwerte vorkommen, kann kein exakter p-Wert berechnet werden. Folgende zwei Funktionen können herangezogen werden zur Berechnung des p-Wertes.
Var 1: mit der Funktion:wilcox.exact
#library(coin)
#library(exactRankTests)
var1test<- wilcox.exact(wilcoxen$Vorher, wilcoxen$Nachher ,alternative = "two.sided",paired = TRUE, exact = TRUE)
var1test
Exact Wilcoxon signed rank test
data: wilcoxen$Vorher and wilcoxen$Nachher
V = 69.5, p-value = 0.0004196
alternative hypothesis: true mu is not equal to 0
Var 2: mit der Funktion:wilcoxsign_test
#library(coin)
var2test<- coin::wilcoxsign_test(wilcoxen$Vorher~ wilcoxen$Nachher ,distribution = "exact",alternative = "two.sided", paired = T)
var2test
Exact Wilcoxon-Pratt Signed-Rank Test
data: y by x (pos, neg)
stratified by block
Z = -3.2036, p-value = 0.0008935
alternative hypothesis: true mu is not equal to 0
Die Teststatistik beträgt V = 69.5 und der zugehörige Signifikanzwert p = .000. Damit ist der Unterschied signifikant: Die zentralen Tendenzen der beiden Messzeitpunkte unterscheiden sich (Wilcoxon-Test: V = 69.5, Z = -3.20, p = .000, n = 34).
Berechnung der Effektstärke
\[r=\left| \frac{z}{\sqrt{n}} \right|\]
Der z - Wert
#var 1: Zstat1<-qnorm(var1test$p.value /2)
#var 2: Zstat1<-var2test@statistic@teststatistic
Zstat1<-var2test@statistic@teststatistic
sprintf("Z-Wert für den WSR: %.2f", Zstat1)
[1] "Z-Wert für den WSR: -3.20"
Anzahl der Daten aus dem Datensatz
nk<-nrow(wilcoxen[wilcoxen$Vorher!=wilcoxen$Nachher,])
sprintf("Anzahl ohne Null: %.f", nk)
[1] "Anzahl ohne Null: 30"
Die Anzahl kann auch unter Datenmartix ausgelesen werden. In dem vorliegenden Beispiel sind es 30 Datensätze.
eff <-round(abs(Zstat1)/sqrt(nk),1)
sprintf("Effektstärke: %.1f", eff)
[1] "Effektstärke: 0.6"
Zur Beurteilung der Grösse des Effektes dient die Einteilung von Cohen (1988):
\[
\begin{align}
\text{Schwacher Effekt: } 0.10 &< ||r|| < 0.25 \\
\text{Schwacher bis mittlerer Effekt: } 0.25 &= ||r|| \\
\text{Mittlerer Effekt: } 0.25 &< ||r|| < 0.40 \\
\text{Mittlerer bis starker Effekt: }0.40 &= ||r|| \\
\text{Starker Effekt: } 0.40 &< ||r||
\end{align}
\]
Damit entspricht die Effektstärke von .6 einem starken Effekt.
Eine Aussage
Die Verkaufszahlen der Aktionfigur “Held2000” sind nach der Gewährung eines Rabattes signifikant höher (Median = 34.00) als davor (Median = 31.00; Wilcoxon-Test: z-Wert: -3.2036, p = .000, n = 34). Die Effektstärke nach Cohen (1988) liegt bei r = .6 und entspricht einem starken Effekt. H0 kann verworfen werden.
