No-Go-Liste
+ keine Umlaute im Pfad
+ keine Umlaut in der Benennung der Datei
+ keine doppelte Benennung der Daten
Ich bin eine Überschrift
Ich bin eine Überschrift
Ich bin eine Überschrift
Ich bin eine Überschrift
Ich bin ein Haus!
Ich bin ein Haus!
Ausgabe
print("Hello world")
[1] "Hello world"
a <- 1
b <- 5
a<- 4
b<- 5
a+b
[1] 9
zahl <-sqrt (9)
sprintf("Wurzel aus 9 ist %d", zahl)
[1] "Wurzel aus 9 ist 3"
# install.packages("psych")
library(psych)
Paket 㤼㸱psych㤼㸲 wurde unter R Version 3.6.3 erstellt
Einlesen -> File->Import Dataset ->From Excel
optional
library(readxl)
pearson <- read_excel("D:/tests/pearson.xlsx",
sheet = "Tabelle1")
describe(pearson)
NA
NA
NA
NA
Der IQ liegt in dieser Studie bei 102,47(SD=11.39, n=104). Der Projekterfolg liegt bei 62,38% (SD= 11,52, n = 104).
describe.by(pearson$IQ)
describe.by is deprecated. Please use the describeBy functionno grouping variable requested
# Kommtar
hist(pearson$IQ, main='Histogramm des IQs', xlab="IQ"
, ylab = "Anzahl", col = "deepskyblue")

Anlegen eines Zufallsdatensätzes
data <- data.frame(
name=c( rep("A",50), rep("B",50), rep("C",50), rep("D",50), rep("E", 50)),
value=c( rnorm(50, 8, 5), rnorm(50, 10, 1), rnorm(50, 28, 1), rnorm(50, 31, 4), rnorm(50, 37, 1) )
)
View(data)
psych::describeBy(data$value, group = data$name)
Descriptive statistics by group
group: A
-------------------------------------------------------------------
group: B
-------------------------------------------------------------------
group: C
-------------------------------------------------------------------
group: D
-------------------------------------------------------------------
group: E
attach(data)
name[1]
[1] A
Levels: A B C D E
detach(data)
Datentypen
Vector
# Numeric
var1 = c(15,85.15,9999999)
print(var1)
[1] 15.00 85.15 9999999.00
# logical /boolean
var2 = c(TRUE, FALSE)
print(var2)
[1] TRUE FALSE
#Mischen
var3 = c("Maier", "Klein", 18, 18.14)
print(var3)
[1] "Maier" "Klein" "18" "18.14"
typeof(var3)
[1] "character"
Matrix
# matrix(data, nrow, ncol, byrow, dimnames)
arr = array(c(1:9), dim=c(3,3,4,2))
arr
Meine erste Liste
mylist <- list(var1, var2, var3)
mylist
Mein erster erzeugter Datensatz
var4 <- c("Haus2","Haus3","Haus4","Haus1")
var5 <- c(5,6,7,8)
var6 <- c(9,10,11,12)
Tab1 <- data.frame(var4,var5, var6)
View(Tab1)
Meine erste if- Bedingung
#Wie alt bist du?
alter <- 51
if( 20 > alter ) {
print("Du Teenager!!! ")
}else if (50 > alter && alter > 21 ) {
print("Du wirst auch nicht mehr jünger.")
}else{
print("Ich zähle die Tage bis zur Rente.")
}
Schleifen
# Es gibt drei Schleifenarten
# 1. repeat
revar1 = 1
repeat{
print(revar1)
revar1 = revar1 +2
if (revar1 > 9)
break
}
# 2. Schleife While
whilevar1=0
while(whilevar1 < 15)
{
print(whilevar1)
whilevar1 = whilevar1 +1;
}
anzahl <- 5
# 3. Schleife For
for (i in 10:anzahl)
{
#anzahl = anzahl +1;
print (i)
}
Finden und Löschen von Missing-Values (NA)
Titanic <- read.csv("C:/Users/Alfa-Dozent/Downloads/Titanic.csv")
View(Titanic)
# Finden der NA-Werte
is.na(Titanic$Age)
# wie viele NA-Werte
sum(is.na(Titanic))
# Auslassen der NA-Werte
Titanic <- na.omit(Titanic)
hist(Titanic$Age)
Welcher Datentyp hat mein Variable?
#Version 1
typeof(t_testUN$Selbststaendig)
#Version 2
class(t_testUN$Selbststaendig)
Erzeuge neue Variable
# Differenz erstellen
zwischen <- ttestVER$Fremdeinschaetzung -ttestVER$Selbsteinschaetzung
zwischen
# Die Spalte "Differenz" wird zum Datensatz hinzugefügt
ttestVER <- cbind(ttestVER, "Differenz" = zwischen)
View(ttestVER)
Eine Spalte löschen
# Eine Spalte löschen
ttestVER$Differenz <- NULL
View(ttestVER)
Zeilen löschen
attach(Levene)
# Diese Zeilen sollen entfernt werden
drops <- c(248,798,929,995,1207)
# Zeilen löschen
Levene <- Levene[-drops,]
View(Levene)
Type festlegen
NCBirth$Smoke <- as.factor(NCBirth$Smoke)
Fehler in is.factor(x) : Objekt 'NCBirth' nicht gefunden
Umbenennen
library(psych)
describeBy(NCbirths$BirthWeightGm,NCbirths$Smoke)
NCbirths <- rename(NCbirths, c(1 ="Ja",0 ="Nein"))
Datenstruktur ändern
library(reshape2)
ANOVA_mit_MW$Proband <- as.factor(ANOVA_mit_MW$Proband)
anovamituebung<- melt(ANOVA_mit_MW,
id.vars = c("Proband"),
measure.vars = c("Morgen","Mittag", "Abend"),
variable.name = "Zeit",
value.name = "Konz"
)
Datenauswahl
# select variables v1, v2, v3
myvars <- c("v1", "v2", "v3")
newdata <- mydata[myvars]
# another method
myvars <- paste("v", 1:3, sep="")
newdata <- mydata[myvars]
# select 1st and 5th thru 10th variables
newdata <- mydata[c(1,5:10)]
# exclude variables v1, v2, v3
myvars <- names(mydata) %in% c("v1", "v2", "v3")
newdata <- mydata[!myvars]
# exclude 3rd and 5th variable
newdata <- mydata[c(-3,-5)]
# delete variables v3 and v5
mydata$v3 <- mydata$v5 <- NULL
# first 5 observations
newdata <- mydata[1:5,]
# based on variable values
newdata <- mydata[ which(mydata$gender=='F'
& mydata$age > 65), ]
# or
attach(mydata)
newdata <- mydata[ which(gender=='F' & age > 65),]
detach(mydata)
# using subset function
newdata <- subset(mydata, age >= 20 | age < 10,
select=c(ID, Weight))
# using subset function (part 2)
newdata <- subset(mydata, sex=="m" & age > 25,
select=weight:income)
