Reporting<br> </font> ] .pull-right5[ <p align="center"><img border="0" alt="W3Schools" src="" width="400px"></p> ] --- # `tidyverse` Kern Das [`tidyverse`]( ist im Kern eine Sammlung hoch-performanter, nutzerfreundlicher Pakete, die speziell für eine effizientere Datenanalyse entwickelt wurden. 1. `ggplot2` für Grafiken. 2. `dplyr` für Datenverarbeitung. 3. `tidyr` für Datenverarbeitung. 4. `readr` für Daten I/O. 5. `purrr` für funktionales Programmieren. 6. `tibble` für moderne `data.frame`s. <br><br> <img src="" height="200px" /><img src="" height="200px" /><img src="" height="200px" /><img src="" height="200px" /><img src="" height="200px" /><img src="" height="200px" /> --- # `ggplot2` .pull-left45[ ```r library(tidyverse) ; library(ggrepel) # Lade Tourismus Daten tour <- read_csv('1_Data/Tourismus.csv') # Erstelle Plot mit ggplot2 ggplot(data = tour, mapping = aes(x = Besucher, y = Dauer, label = Land)) + scale_x_continuous(trans = 'log2') + geom_point(size=2) ``` ] .pull-right45[ <!-- --> ] --- # `ggplot2` .pull-left45[ ```r library(tidyverse) ; library(ggrepel) # Lade Tourismus Daten tour <- read_csv('1_Data/Tourismus_18.csv') # Plotte Dauer gegen Besucher ggplot(data = tour, mapping = aes(x = Besucher, y = Dauer, label = Land)) + scale_x_continuous(trans = 'log2') + geom_point(size=2) + geom_label_repel(size = 2, label.padding = 0.1) + theme_bw() ``` ] .pull-right45[ <!-- --> ] --- # `ggplot2` .pull-left45[ ```r library(tidyverse) ; library(ggrepel) # Lade Tourismus Daten tour <- read_csv('1_Data/Tourismus.csv') # Plotte Dauer gegen Besucher ggplot(data = tour, mapping = aes(x = Besucher, y = Dauer, label = Land)) + scale_x_continuous(trans = 'log2') + geom_point(size=2) + geom_label_repel(size = 2, label.padding = 0.1) + theme_bw() + facet_grid(Region ~ .) ``` ] .pull-right45[ <!-- --> ] --- # `dplyr` .pull-left45[ ```r library(tidyverse) # Lade Tourismus Daten tour <- read_csv('1_Data/Tourismus.csv') # Zeige Top 10 Länder tour %>% mutate(Nächte = Besucher * Dauer) %>% arrange(desc(Nächte)) %>% select(Land, Nächte) %>% top_n(10) ``` ] .pull-right45[ ``` ## # A tibble: 10 × 2 ## Land Nächte ## <chr> <dbl> ## 1 Deutschland 18059 ## 2 Vereinigte Staaten 15353 ## 3 Vereinigtes Königreich 7981 ## 4 Frankreich 5288 ## 5 Italien 3224 ## 6 Spanien 2294 ## 7 Niederlande 2069 ## 8 Kanada 2006 ## 9 Österreich 1683 ## 10 Indien 1622 ``` ] --- # `dplyr` .pull-left45[ ```r library(tidyverse) # Lade Tourismus Daten tour <- read_csv('1_Data/Tourismus.csv') # Berechne Nächte per Region tour %>% mutate(Nächte = Besucher * Dauer) %>% group_by(Region) %>% summarize( Nächte_mittel = mean(Nächte), Nächte_summe = sum(Nächte), ) ``` ] .pull-right45[ ``` ## # A tibble: 5 × 3 ## Region Nächte_mittel Nächte_summe ## <chr> <dbl> <dbl> ## 1 Afrika 259 1036 ## 2 Amerika 2435. 19479 ## 3 Asien 464. 9278 ## 4 Australien 580 1160 ## 5 Europa 1415. 52353 ``` ] --- # `dplyr` .pull-left45[ ```r library(tidyverse) ; library(ggrepel) # Lade Tourismus Daten tour <- read_csv('1_Data/Tourismus.csv') europa <- read_csv('1_Data/Europa.csv') # Verbinde Nächte mit Äquivalenzeinkommen tour %>% mutate(Nächte = Besucher * Dauer) %>% left_join(europa) %>% ggplot(aes(x = Äquivalenzeinkommen, y = Nächte, label = Land)) + scale_y_continuous(trans = 'log2') + geom_point() + geom_label_repel(size = 2) + theme_bw() ``` ] .pull-right45[ <!-- --> ] --- # `tidyverse` erweitert Das Umfeld des [`tidyverse`]( beinhaltet eine Sammlung weiterer hoch-performanter, nutzerfreundlicher Pakete, die den tidyverse Kern ergänzen. 1. `xlm2` für die Verarbeitung von XML und HTML Dateien. 2. `rvest` für Web Scraping. 3. `haven` für SPSS, SAS, und Stata Dateien. 4. `readxl` für Excel Dateien. 5. `lubridate` für Zeitvariablen. 6. `tidytext` für Textverarbeitung. <br><br> <img src="" height="200px" /><img src="" height="200px" /><img src="" height="200px" /><img src="" height="200px" /><img src="" height="200px" /> --- # Web Scraping ```r # Tabelle laden von Wikipedia (Pakete nicht vergessen) read_html("") %>% html_node(xpath = '//*[@id="mw-content-text"]/div[1]/table[2]') %>% html_table() %>% as_tibble() ``` ``` ## # A tibble: 22 × 3 ## Release Date Description ## <chr> <chr> <chr> ## 1 0.16 "" "This is the last alpha version developed primarily by Ihaka and G… ## 2 0.49 "1997-04-2… "This is the oldest source release which is currently available on… ## 3 0.60 "1997-12-0… "R becomes an official part of the GNU Project. The code is hosted… ## 4 0.65.1 "1999-10-0… "First versions of update.packages and install.packages functions … ## 5 1.0 "2000-02-2… "Considered by its developers stable enough for production use.[57… ## 6 1.4 "2001-12-1… "S4 methods are introduced and the first version for Mac OS X is m… ## 7 1.8 "2003-10-0… "Introduced a flexible condition handling mechanism for signalling… ## 8 2.0 "2004-10-0… "Introduced lazy loading, which enables fast loading of data with … ## 9 2.1 "2005-04-1… "Support for UTF-8 encoding, and the beginnings of internationaliz… ## 10 2.6.2 "2008-02-0… "Last version to support Windows 95, 98, Me and NT 4.0[58]" ## # … with 12 more rows ``` --- # Textanalyse .pull-left5[ ```r library(tidytext) ; library(wordcloud) library(dplyr) ; library(stringr) # Wörter zählen counts <- read_html(".../R_(programming_language)") %>% html_text() %>% tibble() %>% unnest_tokens(w, ".") %>% filter(!str_detect(w, '[:digit:]')) %>% anti_join(stop_words) %>% count(word, sort = TRUE) %>% top_n(100) # Wordwolke wordcloud(counts$word, counts$n) ``` ] .pull-right4[ <!-- --> ] --- # Statistik .pull-left45[ ```r library(tidyverse) # Lade Tourismus Daten tour <- read_csv('1_Data/Tourismus.csv') länd <- read_csv('1_Data/Länder.csv') # verbinde Daten data <- tour %>% inner_join(länd) %>% mutate(Nächte = Besucher * Dauer) # Regressionsanalyse model = lm(Nächte ~ Bevölkerung + Dichte + BIP, data = data) ``` ] .pull-right45[ ```r # Bestimmtheitsmass summary(model)$r.squared ``` ``` ## [1] 0.05719 ``` ```r # Koeffizienten summary(model)$coef[,-2] ``` ``` ## Estimate t value Pr(>|t|) ## (Intercept) 1.213e+01 0.01294 0.9897 ## Bevölkerung 2.379e-06 1.36594 0.1775 ## Dichte -3.381e-01 -0.82598 0.4124 ## BIP 2.988e+01 1.50779 0.1373 ``` ] --- .pull-left45[ # Maschinelles Lernen ```r library(tidyverse) ; library(rpart) # Lade Tourismus Daten tour <- read_csv('1_Data/Tourismus.csv') länd <- read_csv('1_Data/Länder.csv') # verbinde Daten data <- tour %>% inner_join(länd) %>% mutate(Nächte = Besucher * Dauer) # Regressionsanalyse rpart( formula = Besucher ~ Bevölkerung + Dichte + BIP, data = data) ``` ] .pull-right45[ <br><br> <!-- --> ] --- # Reporting Werkzeuge R und RStudio bieten auch exzellente Werkzeuge zum erstellen von <high>Berichten</high>, <high>Slides</high>, und sogar <high>Webseiten</high>. 1. `rmarkdown` für dynamische PDF Dokumente. 2. `xaringan` für Slides. 3. `shiny` für Webseiten und Cockpits. <br><br> <img src="" height="200px" /><img src="" height="200px" /><img src="" height="200px" /> --- .pull-left45[ # `rmarkdown` <p align="left"><img style="height:440px" src="image/markdown.png"></p> ] .pull-right5[ <br><br> <p align="center"><img style="height:510px;box-shadow: 0 4px 8px 0 rgba(0, 0, 0, 0.2), 0 6px 20px 0 rgba(0, 0, 0, 0.19);" src="image/markdown2.png"></p> ] --- <iframe width="1000" height="600" src="" frameborder="0" allowfullscreen></iframe> --- # Nächste Schritte .pull-left5[ <font size = 4><i> <font size = 6> 1. Anwenden<br> 2. Bücher<br> 3. Webseiten<br> 4. Hilfe & Consulting<br> 5. # Bücher

Hier ist eine unvollständige Liste guter Bücher über R lose geordnet nach vorausgesetzter Erfahrung.<br><br>

<table width="80%" style="cellspacing:0; cellpadding:0; border:none;">
  <tr>
    <td> <a href=""><img border="0" alt="W3Schools" src="" height="180"></a> </td>
    <td> <a href=""><img border="0" alt="W3Schools" src="" height="180"></a> </td>
    <td> <a href=""><img border="0" alt="W3Schools" src=",204,203,200_.jpg" height="180"></a> </td>
    <td> <a href=""><img border="0" alt="W3Schools" src="" height="180" ></a> </td>
    <td> <a href=""><img border="0" alt="W3Schools" src="" height="180" ></a> </td>
    <td> <a href=""><img border="0" alt="W3Schools" src="" height="180" ></a> </td>
  </tr>
  <tr style="background-color:#ffffff">
    <td> <a href=""><img border="0" alt="W3Schools" src="" height="180" ></a> </td>
    <td> <a href=""><img border="0" alt="W3Schools" src=",204,203,200_.jpg" height="180" ></a> </td>
    <td> <a href=""><img border="0" alt="W3Schools" src=",204,203,200_.jpg" height="180" ></a> </td>
    <td> <a href=""><img border="0" alt="W3Schools" src="" height="180" ></a> </td>
    <td> <a href=""><img border="0" alt="W3Schools" src=",204,203,200_.jpg" height="180" ></a> </td>
    <td> <a href=""><img border="0" alt="W3Schools" src=",204,203,200_.jpg" height="180" ></a> </td>
  </tr>
</table>
<br>

---

.pull-left4[

# Webseiten

Das Netz ist vll. der beste Ort für Informationen über R.

<font size = 4><i>Beginnt eure Suche mit:</i></font>

[Google]( Stellt sicher, dass ihr *R* oder *Rproject* mit in eurer Suche habt.

<br>

<font size = 4><i>Meistens werdet ihr dann weitergeleitet zu:</i></font>

[R-bloggers]( informiert euch über die neusten R Entwicklungen. [Stackoverflow]( ist eine Seite für R Probleme und Lösungen. Versucht selbst mal ein Problem zu posten. Oft bekommt ihr erstaunlich schnell Antwort. ] .pull-right5[ <p align="left" style="padding: 0 0px"><br><br><br><br><br><br><br><br><br> <a href=""><img border="0" alt="W3Schools" src="" height="100"></a><br><br><br2> <a href=""><img border="0" alt="W3Schools" src="" height="105" style="margin-bottom:10px"></a><br> <a href=""><img border="0" alt="W3Schools" src="" height="105"></a> </p> ] --- # Hilfe & Consulting <table class="tg" style="cellspacing:0; cellpadding:0; border:none"> <col width="22%"> <col width="22%"> <col width="22%"> <tr> <th class="tg-yw4l" valign='top'> <p align="center"><br> <a href=""><img border="0" alt="W3Schools" src="" height="230" style="border-radius:50%"></a><br> <p align="center"> <font size = 5>Dr. Dirk Wulff</font><br><br> <a href=""><b></b></a><br> <a href=""><b></b></a><br> <font size=4><i>packages: </i></font> <a href=""><b>cstab</b></a>, <a href=""><b>text2sdg</b></a>, <br> <a href=""><b>mousetrap</b></a>, <a href=""><b>memnet</b>, <a href=""><b>choicepp</b> </p> </th> <th class="tg-yw4l" valign='top'><p align="center"><br> <a href=""><img border="0" alt="W3Schools" src="" height="230" style="border-radius:50%"></a><br> <p align="center"> <font size = 5>Markus Steiner</font><br><br> <a href=""><b></b></a><br> <font size=4><i>packages: </i></font> <a href=""><b>ShinyPsych</b></a>, <br> <a href=""><b>EFAdiff</b></a> <br><br> </p> </th> <th class="tg-yw4l" valign='top'> <p align="center"> <p align="center"><br> <a href=""><img border="0" alt="W3Schools" src="" height="230" style="border-radius:50%"></a><br> <p align="center"> <font size = 5>Dr. Michael Schulte-<br>Mecklenbeck</font><br><br> <a href=""><b></b></a><br> <a href=""><b></b></a><br><br> </p> </th> </tr> </table> --- # Weiterführende Kurse <table class="tg" style="cellspacing:0; cellpadding:0; border:none;"> <tr valign="top"> <col width="20%"> <col width="20%"> <col width="20%"> <col width="20%"> <col width="20%"> <td> <p align="center"> <a class="project-link" href="" align="center"> <font style="font-size:20px;weight:700"><br>Einführung in die moderne Datenanalyse mit R</font><br> <br> <img src="" height="180px" style="border-radius:50%;border:10px solid #E9ECEF"></img><br><br> <high>Okt 15,<br>2020</high><br><br><br><br> </p> </td> <td> <p align="center"> <a class="project-link" href="" align="center"> <font style="font-size:20px;weight:700"><br>Explorative Datenanalyse mit R<br></font><br> <br> <img src="" height="180px" style="border-radius:50%;border:10px solid #E9ECEF"></img><br><br> <high>Sep 24-25,<br>2020</high><br><br><br><br> </p> </td> <td> <p align="center"> <a class="project-link" href="" align="center"> <font style="font-size:20px;weight:700"><br>Statistik mit R<br><br></font><br> <br> <img src="" height="180px" style="border-radius:50%;border:10px solid #E9ECEF"></img><br><br> <high>Oct 22-23,<br>2021</high><br><br><br><br> </a> </p> </td> <td> <p align="center"> <a class="project-link" href="" align="center"> <font style="font-size:20px;weight:700"><br>Maschinelles Lernen mit R<br></font><br> <br> <img src="" height="180px" style="border-radius:50%;border:10px solid #E9ECEF"></img><br><br> <high>Nov 19-20,<br>2021</high><br><br><br><br> </a> </p> </td> <td> <p align="center"> <a class="project-link" href="" align="center"> <font style="font-size:20px;weight:700"><br>Reporting mit R<br><br></font><br> <br> <img src="" height="180px" style="border-radius:50%;border:10px solid #E9ECEF"></img><br><br> <high>tba<br>2021</high><br><br><br><br> </a> </p> </td> </tr> --- .pull-left45[ # Bitte gebt uns Feedback <br><br> <p align = "center"> <img src="image/feedback.png" height=350px></img><br> <font style="font-size:10px">from <a href="*5OZNYAfzDZfM1lwJBZEuHQ.png"></a></font> </p> ] .pull-right45[ <p align="center"><br><br> <iframe src="" width="430" height="550" frameborder="0" marginheight="0" marginwidth="0">Loading…</iframe></p> ] --- class: center, middle # Thank you!