+ - 0:00:00
Notes for current slide
Notes for next slide

Analyse

Einführung in die moderne Datenanalyse mit R
The R Bootcamp

August 2020

1 / 16

Analyse

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken


from xkcd.com

2 / 16

Statistiken

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken
# Lese Daten in ein Objekt ein
daten <- read.csv('1_Data/Tourismus.csv')
# Mittlere Dauer
mean(daten$Dauer)
## [1] 2.428
# Median Dauer
median(daten$Dauer)
## [1] 2.28
# Standardabweichung Dauer
sd(daten$Dauer)
## [1] 1.017
3 / 16

Statistiken

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken
# Lese Daten in ein Objekt ein
daten <- read.csv('1_Data/Tourismus.csv')
# Zusammenfassung Dauer
summary(daten$Dauer)
## Min. 1st Qu. Median Mean 3rd Qu.
## 1.50 1.87 2.28 2.43 2.63
## Max.
## 9.53
4 / 16

Statistiken

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken
# Lese Daten in ein Objekt ein
daten <- read.csv('1_Data/Tourismus.csv')
# Zusammenhang Dauer und Besucher
cor(daten$Dauer, daten$Besucher)
## [1] -0.1524
5 / 16

Statistiken

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken
# Lese Daten in ein Objekt ein
daten <- read.csv('1_Data/Tourismus.csv')
# Dauer nach Region
aggregate(daten$Dauer, list(daten$Region), mean)
## Group.1
## 1 Afrika
## 2 Amerika
## 3 Asien
## 4 Australien, Neuseeland, Ozeanien
## 5 Europa
## x
## 1 2.809
## 2 2.680
## 3 2.860
## 4 2.483
## 5 2.095
6 / 16

Statistiken

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken
# Lese Daten in ein Objekt ein
daten <- read.csv('1_Data/Tourismus.csv')
# Vergleich der Dauer nach Region
anova(lm(daten$Dauer ~ daten$Region))
## Analysis of Variance Table
##
## Response: daten$Dauer
## Df Sum Sq Mean Sq F value
## daten$Region 4 8.9 2.229 2.32
## Residuals 66 63.5 0.962
## Pr(>F)
## daten$Region 0.066 .
## Residuals
## ---
## Signif. codes:
## 0 '***' 0.001 '**' 0.01 '*' 0.05
## '.' 0.1 ' ' 1
7 / 16

Statistiken

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken
# Lese Daten in ein Objekt ein
daten <- read.csv('1_Data/Tourismus.csv')
# Vergleich der Dauer nach Region
anova(lm(daten$Besucher ~ daten$Region))
## Analysis of Variance Table
##
## Response: daten$Besucher
## Df Sum Sq Mean Sq
## daten$Region 4 7.15e+06 1787339
## Residuals 66 1.61e+08 2437029
## F value Pr(>F)
## daten$Region 0.73 0.57
## Residuals
8 / 16

Graphiken

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken
# Histogramm Dauer
hist(daten$Dauer)

9 / 16

Graphiken

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken
# Histogramm Besucher
hist(daten$Besucher)

10 / 16

Graphiken

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken
# Streudiagram Besucher x Dauer
plot(daten$Besucher, daten$Dauer)

11 / 16

Graphiken

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken
# Streudiagram Besucher x Dauer
plot(daten$Besucher, daten$Dauer,
log = "xy")

12 / 16

Graphiken

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken
# Streudiagram Besucher x Dauer
plot(daten$Besucher, daten$Dauer,
log = "xy", col = 'red', pch = 16,
xlab = 'Besucher', ylab = 'Dauer')

13 / 16

Graphiken

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken
# Boxplot Dauer nach Region
boxplot(daten$Dauer ~ daten$Region,
log="y")

14 / 16

Graphiken

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken
# Boxplot Besucher nach Region
boxplot(daten$Besucher ~ daten$Region,
log="y")

15 / 16

Analyse

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
  • Analyse
    • Einfache Statistiken
    • Einfache Graphiken


from xkcd.com

2 / 16
Paused

Help

Keyboard shortcuts

, , Pg Up, k Go to previous slide
, , Pg Dn, Space, j Go to next slide
Home Go to first slide
End Go to last slide
Number + Return Go to specific slide
b / m / f Toggle blackout / mirrored / fullscreen mode
c Clone slideshow
p Toggle presenter mode
t Restart the presentation timer
?, h Toggle this help
Esc Back to slideshow