No-Go-Liste

+ keine Umlaute im Pfad
+ keine Umlaut in der Benennung der Datei
+ keine doppelte Benennung der Daten

Ich bin eine Überschrift

Ich bin eine Überschrift

Ich bin eine Überschrift

Ich bin eine Überschrift

Ich bin ein Haus!
Ich bin ein Haus!

Ausgabe


print("Hello world")
[1] "Hello world"
a <- 1 
b <- 5

a<- 4
b<- 5

a+b
[1] 9
zahl <-sqrt (9)
sprintf("Wurzel aus 9 ist %d", zahl)
[1] "Wurzel aus 9 ist 3"

# install.packages("psych")

library(psych)
Paket 㤼㸱psych㤼㸲 wurde unter R Version 3.6.3 erstellt

Einlesen -> File->Import Dataset ->From Excel

optional

library(readxl)
pearson <- read_excel("D:/tests/pearson.xlsx", 
    sheet = "Tabelle1")

describe(pearson)
NA
NA
NA
NA

Der IQ liegt in dieser Studie bei 102,47(SD=11.39, n=104). Der Projekterfolg liegt bei 62,38% (SD= 11,52, n = 104).


describe.by(pearson$IQ)
describe.by is deprecated.  Please use the describeBy functionno grouping variable requested
# Kommtar 
hist(pearson$IQ, main='Histogramm des IQs', xlab="IQ"
  , ylab = "Anzahl", col = "deepskyblue")

Anlegen eines Zufallsdatensätzes

data <- data.frame(
  name=c( rep("A",50), rep("B",50), rep("C",50), rep("D",50), rep("E", 50)),
  value=c( rnorm(50, 8, 5), rnorm(50, 10, 1), rnorm(50, 28, 1), rnorm(50, 31, 4), rnorm(50, 37, 1) )
)
View(data)

psych::describeBy(data$value, group = data$name)

 Descriptive statistics by group 
group: A
------------------------------------------------------------------- 
group: B
------------------------------------------------------------------- 
group: C
------------------------------------------------------------------- 
group: D
------------------------------------------------------------------- 
group: E
attach(data)
name[1]
[1] A
Levels: A B C D E
detach(data)

Datentypen

Vector


# Numeric
var1 = c(15,85.15,9999999)

print(var1)
[1]      15.00      85.15 9999999.00
# logical /boolean

var2 = c(TRUE, FALSE)

print(var2)
[1]  TRUE FALSE
#Mischen


var3 = c("Maier", "Klein", 18, 18.14)

print(var3)
[1] "Maier" "Klein" "18"    "18.14"
typeof(var3)
[1] "character"

Matrix


# matrix(data, nrow, ncol, byrow, dimnames)


arr  = array(c(1:9), dim=c(3,3,4,2))
arr

Meine erste Liste


mylist <-  list(var1, var2, var3)

mylist

Mein erster erzeugter Datensatz


var4 <- c("Haus2","Haus3","Haus4","Haus1") 
var5 <- c(5,6,7,8) 
var6 <- c(9,10,11,12) 

Tab1 <- data.frame(var4,var5, var6)

View(Tab1)

Meine erste if- Bedingung


#Wie alt bist du? 
alter <-  51

if( 20 > alter ) {
           print("Du Teenager!!! ")
}else if (50 > alter && alter > 21 ) {
           print("Du wirst auch nicht mehr jünger.")
}else{ 
           print("Ich zähle die Tage bis zur Rente.")
  }

Schleifen

# Es gibt drei Schleifenarten

# 1. repeat
revar1 = 1


repeat{

          print(revar1)
          revar1 = revar1 +2
          
          if (revar1 > 9)
            break
          
  
}
# 2. Schleife While

whilevar1=0

while(whilevar1 < 15)
{
  
  print(whilevar1)
  whilevar1 = whilevar1 +1;
  
}
anzahl <- 5
# 3. Schleife For
for (i in 10:anzahl)
{
  
 #anzahl = anzahl +1;
  print (i)
  
}

Finden und Löschen von Missing-Values (NA)


Titanic <- read.csv("C:/Users/Alfa-Dozent/Downloads/Titanic.csv") 
View(Titanic)
# Finden der NA-Werte 
is.na(Titanic$Age)
# wie viele NA-Werte
sum(is.na(Titanic))
# Auslassen der NA-Werte 
Titanic <- na.omit(Titanic)
hist(Titanic$Age)

Welcher Datentyp hat mein Variable?

#Version 1
typeof(t_testUN$Selbststaendig)
#Version 2
class(t_testUN$Selbststaendig)

Erzeuge neue Variable

# Differenz erstellen
zwischen <- ttestVER$Fremdeinschaetzung -ttestVER$Selbsteinschaetzung 
zwischen

# Die Spalte "Differenz" wird zum Datensatz hinzugefügt
ttestVER <- cbind(ttestVER, "Differenz" = zwischen)
View(ttestVER)

Eine Spalte löschen

# Eine Spalte löschen
 
ttestVER$Differenz <- NULL
View(ttestVER)

Zeilen löschen


attach(Levene)

# Diese Zeilen sollen entfernt werden
drops <- c(248,798,929,995,1207)

# Zeilen löschen
Levene <- Levene[-drops,]
View(Levene)

Type festlegen


NCBirth$Smoke <- as.factor(NCBirth$Smoke)
Fehler in is.factor(x) : Objekt 'NCBirth' nicht gefunden

Umbenennen

library(psych)
describeBy(NCbirths$BirthWeightGm,NCbirths$Smoke)
NCbirths <- rename(NCbirths, c(1 ="Ja",0 ="Nein"))

Datenstruktur ändern

library(reshape2)
ANOVA_mit_MW$Proband <- as.factor(ANOVA_mit_MW$Proband)
anovamituebung<- melt(ANOVA_mit_MW, 
                      id.vars = c("Proband"), 
                      measure.vars = c("Morgen","Mittag", "Abend"), 
                      variable.name = "Zeit",
                      value.name = "Konz"
                  
                      )

Datenauswahl

# select variables v1, v2, v3
myvars <- c("v1", "v2", "v3")
newdata <- mydata[myvars]

# another method
myvars <- paste("v", 1:3, sep="")
newdata <- mydata[myvars]

# select 1st and 5th thru 10th variables
newdata <- mydata[c(1,5:10)] 

# exclude variables v1, v2, v3
myvars <- names(mydata) %in% c("v1", "v2", "v3")
newdata <- mydata[!myvars]

# exclude 3rd and 5th variable
newdata <- mydata[c(-3,-5)]

# delete variables v3 and v5
mydata$v3 <- mydata$v5 <- NULL 


# first 5 observations
newdata <- mydata[1:5,]

# based on variable values
newdata <- mydata[ which(mydata$gender=='F'
& mydata$age > 65), ]

# or
attach(mydata)
newdata <- mydata[ which(gender=='F' & age > 65),]
detach(mydata) 

 

# using subset function
newdata <- subset(mydata, age >= 20 | age < 10,
select=c(ID, Weight)) 



# using subset function (part 2)
newdata <- subset(mydata, sex=="m" & age > 25,
select=weight:income) 
---
title: "Einführung"
output: html_notebook
---



# No-Go-Liste
    + keine Umlaute im Pfad
    + keine Umlaut in der Benennung der Datei
    + keine doppelte Benennung der Daten


# Ich bin eine Überschrift
## Ich bin eine Überschrift
### Ich bin eine Überschrift
#### Ich bin eine Überschrift

Ich bin *ein Haus*!<br>
Ich bin **ein Haus**!

# Ausgabe 
```{r}

print("Hello world")

a <- 1 
b <- 5

```

```{r}

a<- 4
b<- 5

a+b

```


```{r}
zahl <-sqrt (9)
sprintf("Wurzel aus 9 ist %d", zahl)

```




```{r}

# install.packages("psych")

library(psych)
```

Einlesen -> File->Import Dataset ->From Excel


### optional
```{r}
library(readxl)
pearson <- read_excel("D:/tests/pearson.xlsx", 
    sheet = "Tabelle1")
```


```{r}
chi$vorher = as.factor(chi$vorher)
chi$nachher = as.factor(chi$nachher)
describe(pearson)
```


Der IQ liegt in dieser Studie bei 102,47(SD=11.39, n=104). Der Projekterfolg liegt bei 62,38% (SD= 11,52, n = 104).


```{r}

describe.by(pearson$IQ)
```


```{r}

hist(pearson$IQ, main='Histogramm des IQs', xlab="IQ" , ylab = "Anzahl", col = "deepskyblue")

```


# Anlegen eines Zufallsdatensätzes
```{r}
data <- data.frame(
  name=c( rep("A",50), rep("B",50), rep("C",50), rep("D",50), rep("E", 30)),
  value=c( rnorm(50, 8, 5), rnorm(50, 10, 1), rnorm(50, 28, 1), rnorm(50, 31, 4), rnorm(30, 37, 1) )
)

```




```{r}
View(data)
```

```{r}
psych::describeBy(data$value, group = data$name)
```



```{r}
attach(data)
```

```{r}
name[1]
```



```{r}
detach(data)
```


# Datentypen


### Vector

```{r}

# Numeric
var1 = c(15,85.15,9999999)

print(var1)


# logical /boolean

var2 = c(TRUE, FALSE)

print(var2)

#Mischen


var3 = c("Maier", "Klein", 18, 18.14)

print(var3)


```
```{r}
typeof(var3)
```






### Matrix 

```{r}

# matrix(data, nrow, ncol, byrow, dimnames)


arr  = array(c(1:9), dim=c(3,3,4,2))
arr


```
### Meine erste Liste

```{r}

mylist <-  list(var1, var2, var3)

mylist


```
### Mein erster erzeugter Datensatz

```{r}

var4 <- c("Haus2","Haus3","Haus4","Haus1") 
var5 <- c(5,6,7,8) 
var6 <- c(9,10,11,12) 

Tab1 <- data.frame(var4,var5, var6)

View(Tab1)

```
 
###  Meine erste if- Bedingung  
 
```{r}

#Wie alt bist du? 
alter <-  51

if( 20 > alter ) {
           print("Du Teenager!!! ")
}else if (50 > alter && alter > 21 ) {
           print("Du wirst auch nicht mehr jünger.")
}else{ 
           print("Ich zähle die Tage bis zur Rente.")
  }


```


### Schleifen

```{r}
# Es gibt drei Schleifenarten

# 1. repeat
revar1 = 1


repeat{

          print(revar1)
          revar1 = revar1 +2
          
          if (revar1 > 9)
            break
          
  
}




```

```{r}
# 2. Schleife While

whilevar1=0

while(whilevar1 < 15)
{
  
  print(whilevar1)
  whilevar1 = whilevar1 +1;
  
}


```

```{r}
anzahl <- 5
# 3. Schleife For
for (i in 10:anzahl)
{
  
 #anzahl = anzahl +1;
  print (i)
  
}




```




# Finden und Löschen von Missing-Values (NA)

```{r}

Titanic <- read.csv("C:/Users/Alfa-Dozent/Downloads/Titanic.csv") 
```


```{r}
View(Titanic)
```


```{r}
# Finden der NA-Werte 
is.na(Titanic$Age)
```

```{r}
# wie viele NA-Werte
sum(is.na(Titanic))
```

```{r}
# Auslassen der NA-Werte 
Titanic <- na.omit(Titanic)
```
```{r}
hist(Titanic$Age)
```


### Welcher Datentyp hat mein Variable?

```{r}
#Version 1
typeof(t_testUN$Selbststaendig)
#Version 2
class(t_testUN$Selbststaendig)
```




### Erzeuge neue Variable

```{r}
# Differenz erstellen
zwischen <- ttestVER$Fremdeinschaetzung -ttestVER$Selbsteinschaetzung 
zwischen

# Die Spalte "Differenz" wird zum Datensatz hinzugefügt
ttestVER <- cbind(ttestVER, "Differenz" = zwischen)
View(ttestVER)

```

# Eine Spalte löschen

```{r}
# Eine Spalte löschen
 
ttestVER$Differenz <- NULL
View(ttestVER)

```

# Zeilen löschen
```{r}

attach(Levene)

# Diese Zeilen sollen entfernt werden
drops <- c(248,798,929,995,1207)

# Zeilen löschen
Levene <- Levene[-drops,]
View(Levene)


```



# Type festlegen
```{r}

NCBirth$Smoke <- as.factor(NCBirth$Smoke)
NCBirth$Birthgm <- as.numeric(NCBirth$Birthgm)
```

# Umbenennen

```{r}
library(psych)
describeBy(NCbirths$BirthWeightGm,NCbirths$Smoke)
```


```{r}
NCbirths <- rename(NCbirths, c(1 ="Ja",0 ="Nein"))
```


# Datenstruktur ändern


```{r}
library(reshape2)
```


```{r}
ANOVA_mit_MW$Proband <- as.factor(ANOVA_mit_MW$Proband)
```

```{r}
anovamituebung<- melt(ANOVA_mit_MW, 
                      id.vars = c("Proband"), 
                      measure.vars = c("Morgen","Mittag", "Abend"), 
                      variable.name = "Zeit",
                      value.name = "Konz"
                  
                      )
```

# Datenauswahl 

```{r}
# select variables v1, v2, v3
myvars <- c("v1", "v2", "v3")
newdata <- mydata[myvars]

# another method
myvars <- paste("v", 1:3, sep="")
newdata <- mydata[myvars]

# select 1st and 5th thru 10th variables
newdata <- mydata[c(1,5:10)] 

# exclude variables v1, v2, v3
myvars <- names(mydata) %in% c("v1", "v2", "v3")
newdata <- mydata[!myvars]

# exclude 3rd and 5th variable
newdata <- mydata[c(-3,-5)]

# delete variables v3 and v5
mydata$v3 <- mydata$v5 <- NULL 


# first 5 observations
newdata <- mydata[1:5,]

# based on variable values
newdata <- mydata[ which(mydata$gender=='F'
& mydata$age > 65), ]

# or
attach(mydata)
newdata <- mydata[ which(gender=='F' & age > 65),]
detach(mydata) 

 

# using subset function
newdata <- subset(mydata, age >= 20 | age < 10,
select=c(ID, Weight)) 



# using subset function (part 2)
newdata <- subset(mydata, sex=="m" & age > 25,
select=weight:income) 
```




