+ - 0:00:00
Notes for current slide
Notes for next slide

Data IO

Einführung in die moderne Datenanalyse mit R
The R Bootcamp

März 2021

1 / 16

Agenda

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse


from xkcd.com

2 / 16

Daten von Festplatte lesen

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse
# Lese Daten ein
read.csv('1_Data/Tourismus.csv')
## Land Region Jahr Besucher Dauer
## 1 Belgien Europa 2018 920 1.727
## 2 Bulgarien Europa 2018 138 2.101
## 3 Dänemark Europa 2018 301 1.827
## 4 Deutschland Europa 2018 10564 1.709
## 5 Estland Europa 2018 24 2.125
## 6 Finnland Europa 2018 130 2.008
## 7 Frankreich Europa 2018 3401 1.555
## 8 Griechenland Europa 2018 195 2.651
## 9 Irland Europa 2018 374 2.332
## 10 Island Europa 2018 32 1.781
## [ reached 'max' / getOption("max.print") -- omitted 61 rows ]
3 / 16

Daten von Festplatte lesen

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse
# Lese Daten in ein Objekt ein
daten <- read.csv('1_Data/Tourismus.csv')
# Printe Daten
daten
## Land Region Jahr Besucher Dauer
## 1 Belgien Europa 2018 920 1.727
## 2 Bulgarien Europa 2018 138 2.101
## 3 Dänemark Europa 2018 301 1.827
## 4 Deutschland Europa 2018 10564 1.709
## 5 Estland Europa 2018 24 2.125
## 6 Finnland Europa 2018 130 2.008
## 7 Frankreich Europa 2018 3401 1.555
## 8 Griechenland Europa 2018 195 2.651
## 9 Irland Europa 2018 374 2.332
## 10 Island Europa 2018 32 1.781
## [ reached 'max' / getOption("max.print") -- omitted 61 rows ]
4 / 16

Daten von Festplatte lesen

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse

5 / 16

Daten von Festplatte lesen

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse

6 / 16

Daten von Festplatte lesen

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse

7 / 16

Daten leben in data.frames

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse
# Lese Daten in ein Objekt ein
daten <- read.csv('1_Data/Tourismus.csv')
# Klasse der Daten
class(daten)
## [1] "data.frame"
dim(daten) # Dimensionen
## [1] 71 5
names(daten) # Variablennamen
## [1] "Land" "Region" "Jahr"
## [4] "Besucher" "Dauer"
8 / 16

3 + 1 Datentypen

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse


9 / 16

3 + 1 Datentypen

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse
# Lese Daten in ein Objekt ein
daten <- read.csv('1_Data/Tourismus.csv')
# Extrahiere Land mit $
daten$Land
## [1] "Belgien" "Bulgarien"
## [3] "Dänemark" "Deutschland"
## [5] "Estland" "Finnland"
## [7] "Frankreich" "Griechenland"
## [9] "Irland" "Island"
## [11] "Italien" "Kroatien"
## [13] "Lettland" "Liechtenstein"
## [15] "Litauen" "Luxemburg"
## [17] "Malta" "Niederlande"
## [19] "Norwegen" "Österreich"
## [ reached getOption("max.print") -- omitted 51 entries ]
10 / 16

3 + 1 Datentypen

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse
# Lese Daten in ein Objekt ein
daten <- read.csv('1_Data/Tourismus.csv')
# Klasse der Land Variable
class(daten$Land)
## [1] "character"
11 / 16

3 + 1 Datentypen

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse
# Lese Daten in ein Objekt ein
daten <- read.csv('1_Data/Tourismus.csv',
stringsAsFactors = FALSE)
# Klasse der Land Variable
class(daten$Land)
## [1] "character"
# Extrahiere Land mit $
daten$Land
## [1] "Belgien" "Bulgarien"
## [3] "Dänemark" "Deutschland"
## [5] "Estland" "Finnland"
## [7] "Frankreich" "Griechenland"
## [ reached getOption("max.print") -- omitted 63 entries ]
12 / 16

3 + 1 Datentypen

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse
# Lese Daten in ein Objekt ein
daten <- read.csv('1_Data/Tourismus.csv')
# Extrahiere Dauer mit $
daten$Dauer
## [1] 1.727 2.101 1.827 1.709 2.125 2.008
## [7] 1.555 2.651 2.332 1.781 1.815 1.764
## [13] 2.154 1.618 1.710 1.497 1.727 1.692
## [19] 2.585 1.887 2.235 1.816 2.020 2.297
## [25] 1.753 2.568 3.034 2.283 1.834 2.280
## [31] 2.116 2.602 2.368 2.006 3.417 2.591
## [37] 2.046 2.384 2.582 2.564 2.934 2.479
## [43] 3.220 2.722 2.556 2.585 2.174 3.149
## [49] 3.329 2.000 2.058 1.957 3.565 1.845
## [55] 2.721 2.497 9.533 1.638 1.571 2.392
## [61] 2.250 2.690 2.678 3.620 1.934 2.397
## [67] 3.063 2.679 4.109 2.216 2.750
13 / 16

3 + 1 Datentypen

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse
# Lese Daten in ein Objekt ein
daten <- read.csv('1_Data/Tourismus.csv')
# Extrahiere Dauer mit $
class(daten$Dauer)
## [1] "numeric"
14 / 16

Daten auf die Festplatte schreiben

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse
# Schreibe Daten auf die Festplatte als csv
write.csv(daten, '1_Data/Tourismus_neu.csv')
# Schreibe Daten auf die Festplatte als RDS
saveRDS(daten, '1_Data/Tourismus_neu.RDS')
15 / 16

Agenda

  • R(Studio)
  • Assignments
  • Funktionen
  • Data I/O
    • Daten von Festplatte lesen
    • Daten leben in data.frames
    • 3 + 1 Datentypen
    • Daten auf die Festplatte schreiben

  • Analyse


from xkcd.com

2 / 16
Paused

Help

Keyboard shortcuts

, , Pg Up, k Go to previous slide
, , Pg Dn, Space, j Go to next slide
Home Go to first slide
End Go to last slide
Number + Return Go to specific slide
b / m / f Toggle blackout / mirrored / fullscreen mode
c Clone slideshow
p Toggle presenter mode
t Restart the presentation timer
?, h Toggle this help
Esc Back to slideshow