Berechnung der Teststatistik

Um festzustellen, ob sich die Mittelwerte zweier Gruppen signifikant unterscheiden, wird zunächst die entsprechende Teststatistik berechnet. Diese Teststatistik folgt der theoretischen t-Verteilung, deren Form vom jeweiligen Freiheitsgrad abhängt. Aufgrund dieser zugrunde liegenden Verteilung wird das Verfahren als t-Test bezeichnet.

Die Teststatistik \(t\) berechnet sich wie folgt:

\[ t = \frac{\bar x_d}{\hat \sigma_{\bar x_d}} = \frac{\bar x_d}{\sqrt{\frac{\sum^n_{i=1}(d_i-\bar x_d)^2}{(n-1)n}}} \]

mit:

Und der Berechnung der Freiheitsgrade mit \[df = n-1\].

\[df = 29-1 =28\] t-empirsch

\[ t = \frac{\bar x_d}{\hat \sigma_{\bar x_d}} =\frac{-4.724}{\sqrt{\frac{(-5-(-4.724))^2+(-6-(-4.724))^2+..+(-2-(-4.724))^2}{(29-1)29}}}= \frac{-4.724}{\sqrt{\frac{347.79}{812}}}=-7.21 \]

t-kritsch

qt(.975, df=28)
[1] 2.048407

Signifikanz der Teststatistik

Um zu beurteilen, ob der berechnete Wert **statistisch signifikant** ist, wird er mit einem Um zu beurteilen, ob der berechnete Wert statistisch signifikant ist, wird er mit einem kritischen Wert aus der t-Verteilung verglichen, der anhand der Freiheitsgrade bestimmt wird. Diese kritischen Werte sind in sogenannten t-Tabellen zu finden. Der Code zeigt einen Auszug aus einer solchen Tabelle mit den kritischen Werten für die Signifikanzniveaus α = .05 und α = .01. Im vorliegenden Fall beträgt der kritische Wert 2.04 bei 28 Freiheitsgraden und einem Signifikanzniveau von α = .05. Der Betrag der Teststatistik liegt mit |–7.21| deutlich über dem kritischen Wert (7.21 > 2.04), sodass das Ergebnis als statistisch signifikant gilt.

Hypothese

H1: Es gibt einen Unterschied zwischen der Selbsteinschätzung und der Fremdeinschätzung durch den Ehepartner bei der Extraversion.

H0: Es gibt keinen Unterschied zwischen der Selbsteinschätzung und der Fremdeinschätzung durch den Ehepartner bei der Extraversion.

Voraussetzungen des t-Tests für abhängige Stichproben

Die abhängige Variable ist min. intervallskaliert -> Ja, Extraversion ist metrisch.

Es liegen zwei verbundene Stichproben oder Gruppen vor, aber die verschiedenen Messwertpaare sind voneinander unabhängig. 1) Sie sind verbundenen durch die Ehe, 2) aber unabhängige, weil es zwei verschiedene Messpaare (A und B) sind.

Die Unterschiede zwischen den verbundenen Testwerten sind in der Grundgesamtheit normalverteilt (bei Stichproben > 30 sind Verletzungen unproblematisch)

Erzeuge neue Variable

# Differenz erstellen
zwischen <- ttestVER$Fremdeinschaetzung - ttestVER$Selbsteinschaetzung 
zwischen
 [1]  -5  -6  -3  -6   0   3  -8  -3  -3  -3  -7   0  -5  -9  -3  -3  -8  -6  -5  -8 -11  -4 -10  -2
[25]  -1  -1 -12  -6  -2
# Die Spalte "Differenz" wird zum Datensatz hinzugefügt
ttestVER <- cbind(ttestVER, "Differenz" = zwischen)
View(ttestVER)
# Eine Spalte löschen

ttestVER$Differenz <- NULL
#View(ttestVER)

Falls es Probleme gibt

ttestVER$Differenz <- as.numeric(ttestVER$Differenz)

Pruefung der Verteilung

Histogramm zur Prüfung des Normalverteilung

hist(ttestVER$Differenz, xlab = "Differenz zwischen Selbst- und Fremdeinschätzung der Extraversion", ylab= "Anzahl", main ="Histogramm der Differenz", breaks =6,  col = "hotpink3")

ALTERNATIVE

QQ-Diagramm zur Prüfung des Normalverteilung

Deine Werte müssen entlang einer aufsteigenden Gerade liegen, so dass Du eine ähnliche Verteilung vermuten kannst.


library(car)
Paket 㤼㸱car㤼㸲 wurde unter R Version 3.6.3 erstelltLade n昼㸶tiges Paket: carData
Paket 㤼㸱carData㤼㸲 wurde unter R Version 3.6.3 erstelltRegistered S3 method overwritten by 'data.table':
  method           from
  print.data.table     
qqPlot(ttestVER$Differenz, main = "QQPlot für die Var. Differenz")
[1]  6 27

Es gibt eine Normalverteilung.

Deskriptive Statistiken und Korrelation

Korrelation


#library(car)
scatterplot(ttestVER$Fremdeinschaetzung ~ ttestVER$Selbsteinschaetzung , main = "Streudiagramm zwischen Selbst- und Fremdeinschätzung", xlab = "Selbsteinschätzung", ylab= "Fremdeinschätzung durch den Ehepartner")

test <- cor.test(ttestVER$Selbsteinschaetzung, ttestVER$Fremdeinschaetzung)
test

    Pearson's product-moment correlation

data:  ttestVER$Selbsteinschaetzung and ttestVER$Fremdeinschaetzung
t = 6.1783, df = 27, p-value = 1.324e-06
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.5542825 0.8838955
sample estimates:
     cor 
0.765316 

Die Fremdeinschätzung durch den Ehepartner und die Selbsteinschätzung korrelieren positiv-linear signifikant (r = .77, p = .000, n = 29).

Bei Messwiederholungen ist es möglich, dass die Daten der ersten und zweiten Erhebung (respektive eines Messwertpaars) miteinander korrelieren. Es ist plausibel, dass zwei verbundene Messungen sich ähnlich sind und dass innerhalb eines Messwertpaares eher geringere Unterschiede auftreten als zwischen den Paaren.

Im R-Output wird daher eine Pearson Korrelation der beiden Messzeitpunkte ausgegeben. Für das Beispiel ergibt sich eine sehr hohe Korrelation von r = .77 (p = .000, n = 29).

Deskriptive Statistiken

library(psych)
Paket 㤼㸱psych㤼㸲 wurde unter R Version 3.6.3 erstellt
Attache Paket: 㤼㸱psych㤼㸲

The following object is masked from 㤼㸱package:car㤼㸲:

    logit
g <- describe(ttestVER)
g
NA

Es zeigt sich, dass es einen Mittelwertsunterschied zwischen Fremdeinschätzung durch den Ehepartner und der Selbsteinschätzung in Punkto Extraversion gibt. Die Mittelwerte unterscheiden sich dahingehend, das die Fremdeinschätzung bei 21.79 (SD = 4.55, n= 29), wohingegen die Selbsteinschätzung bei 26.51 (SD = 5.44 ,n=29) liegt.

Ergebnisse des t-Tests für abhängige Stichproben

testVER<- t.test(ttestVER$Selbsteinschaetzung, ttestVER$Fremdeinschaetzung, alternative = "two.sided", paired = TRUE, conf.level = .95)

testVER

    Paired t-test

data:  ttestVER$Selbsteinschaetzung and ttestVER$Fremdeinschaetzung
t = 7.2184, df = 28, p-value = 7.402e-08
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 3.383539 6.064736
sample estimates:
mean of the differences 
               4.724138 

Die Teststatistik beträgt t = 7.218 und der zugehörige Signifikanzwert p = 7.402e-08. Damit ist der Unterschied signifikant: Die Mittelwerte der beiden Messzeitpunkte (Fremdeinschätzung und Selbsteinschätzung) unterscheiden sich (t(28) = 7.218, p = 7.402e-08, n= 29).

Berechnung der Effektstärke

Cohen und Pearson

\[r= \sqrt {\frac{t^2}{t^2+df}} \]


eff1 <- sqrt(testVER$statistic^2 / (testVER$statistic^2 + testVER$parameter))

sprintf("Effektstärke: %.4f",eff1)
[1] "Effektstärke: 0.8065"

Zur Beurteilung der Groesse des Effektes dient die Einteilung von Cohen (1992):

\[ \begin{align} \text{Schwacher Effekt: } 0.10 &< ||r|| < 0.30 \\ \text{Schwacher bis mittlerer Effekt: } 0.30 &= ||r|| \\ \text{Mittlerer Effekt: } 0.30 &< ||r|| < 0.50 \\ \text{Mittlerer bis starker Effekt: }0.50 &= ||r|| \\ \text{Starker Effekt: } 0.50 &< ||r|| \end{align} \]

Damit entspricht eine Effektstärke von 0.8 einem starken Effekt

ALTERNATIV

Hedges g

\[\rm{Hedges}\ \hat{g}=\left|\frac{\hat{\mu_1}-\hat{\mu_2}}{\hat{\sigma_{d}}}\right|\]

diff <- testVER$estimate

sed <- sd(ttestVER$Fremdeinschaetzung - ttestVER$Selbsteinschaetzung)

g <- diff/sed

sprintf("Effektstärke: %.4f",g)
[1] "Effektstärke: 1.3404"

Zur Beurteilung der Größe des Effektes:

\[\begin{align} \text{Schwacher Effekt: } 0.20 &< ||g|| < 0.50 \\ \text{Schwacher bis mittlerer Effekt: } 0.50 &= ||g|| \\ \text{Mittlerer Effekt: } 0.50 &< ||g|| < 0.80 \\ \text{Mittlerer bis starker Effekt: }0.80 &= ||g|| \\ \text{Starker Effekt: } 0.80 &< ||g|| \end{align} \]

Damit entspricht eine Effektstärke von 1.3 einem starken Effekt.

Eine Aussage

Es zeigt sich, dass die Extraversionswerte sowohl von der Fremdeinschätzung als auch der Selbsteinschätzung statistisch signifikant sich unterscheiden (t(28) = 7.21, p = .000, n = 29). Die Selbsteinschätzung der Extraversion fällt höher aus (M = 26.51, SD = 5.44) als die Fremdeinschätzung durch den Ehepartner (M = 21.79, SD = 4.55). Die Effektstärke nach Cohen (1992) liegt bei r = 0.8 und entspricht damit einem starken Effekt. H0 kann verworfen werden.

