class: center, middle, inverse, title-slide .title[ # Analyse ] .author[ ### Introduction à l’analyse de données avec R
The R Bootcamp
] .date[ ### Juin 2023 ] --- layout: true <div class="my-footer"> <span style="text-align:center"> <span> <img src="https://raw.githubusercontent.com/therbootcamp/therbootcamp.github.io/master/_sessions/_image/by-sa.png" height=14 style="vertical-align: middle"/> </span> <a href="https://therbootcamp.github.io/"> <span style="padding-left:82px"> <font color="#7E7E7E"> www.therbootcamp.com </font> </span> </a> <a href="https://therbootcamp.github.io/"> <font color="#7E7E7E"> Introduction à l'analyse de données avec R | Juin 2023 </font> </a> </span> </div> --- # Analyse .pull-left4[ <ul> <li class="m1g"><span>R(Studio)<br></span></li> <li class="m2g"><span>Assignations</span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4g"><span>Données I/O</a></span></li> <li class="m5"><span><high>Analyse</high></span></li> <ul class="level"> <li><span>Statistiques simples</span></li> <li><span>Graphiques simples</span></li> </ul> </ul> ] .pull-right5[ <p align = "center"> <img src="image/artifacts.png" height=420px><br> <font style="font-size:10px">from <a href="https://xkcd.com//">xkcd.com</a></font> </p> ] --- # Statistiques .pull-left4[ <ul> <li class="m1g"><span>R(Studio)<br></span></li> <li class="m2g"><span>Assignations</span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4g"><span>Données I/O</a></span></li> <li class="m5"><span>Analyse</span></li> <ul class="level"> <li><span><high>Statistiques simples</high></span></li> <li><span>Graphiques simples</span></li> </ul> </ul> ] .pull-right5[ ```r # Charger des données dans un objet tourisme <- read.csv("1_Data/tourisme.csv", fileEncoding = "UTF-8") # Moyenne de Durée mean(tourisme$Durée) ``` ``` ## [1] 2.428 ``` ```r # Mediane de Durée median(tourisme$Durée) ``` ``` ## [1] 2.28 ``` ```r # Ecart type de Durée sd(tourisme$Durée) ``` ``` ## [1] 1.017 ``` ] --- # Statistiques .pull-left4[ <ul> <li class="m1g"><span>R(Studio)<br></span></li> <li class="m2g"><span>Assignations</span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4g"><span>Données I/O</a></span></li> <li class="m5"><span>Analyse</span></li> <ul class="level"> <li><span><high>Statistiques simples</high></span></li> <li><span>Graphiques simples</span></li> </ul> </ul> ] .pull-right5[ ```r # Charger des données dans un objet tourisme <- read.csv("1_Data/tourisme.csv", fileEncoding = "UTF-8") # Sommaire de Durée summary(tourisme$Durée) ``` ``` ## Min. 1st Qu. Median Mean 3rd Qu. ## 1.50 1.87 2.28 2.43 2.63 ## Max. ## 9.53 ``` ] --- # Statistiques .pull-left4[ <ul> <li class="m1g"><span>R(Studio)<br></span></li> <li class="m2g"><span>Assignations</span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4g"><span>Données I/O</a></span></li> <li class="m5"><span>Analyse</span></li> <ul class="level"> <li><span><high>Statistiques simples</high></span></li> <li><span>Graphiques simples</span></li> </ul> </ul> ] .pull-right5[ ```r # Charger des données dans un objet tourisme <- read.csv("1_Data/tourisme.csv", fileEncoding = "UTF-8") # Correlation entre Durée et Visiteurs cor(tourisme$Durée, tourisme$Visiteurs) ``` ``` ## [1] -0.1524 ``` ] --- # Statistiques .pull-left4[ <ul> <li class="m1g"><span>R(Studio)<br></span></li> <li class="m2g"><span>Assignations</span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4g"><span>Données I/O</a></span></li> <li class="m5"><span>Analyse</span></li> <ul class="level"> <li><span><high>Statistiques simples</high></span></li> <li><span>Graphiques simples</span></li> </ul> </ul> ] .pull-right5[ ```r # Charger des données dans un objet tourisme <- read.csv("1_Data/tourisme.csv", fileEncoding = "UTF-8") # Moyenne de Durée par Region aggregate( tourisme$Durée ~ tourisme$Pays, FUN = mean) |> head() ``` ``` ## tourisme$Pays tourisme$Durée ## 1 Ägypten 2.585 ## 2 Argentinien 2.479 ## 3 Australien 2.216 ## 4 Bahrain 2.000 ## 5 Belgien 1.727 ## 6 Brasilien 3.220 ``` ] --- # Statistiques .pull-left4[ <ul> <li class="m1g"><span>R(Studio)<br></span></li> <li class="m2g"><span>Assignations</span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4g"><span>Données I/O</a></span></li> <li class="m5"><span>Analyse</span></li> <ul class="level"> <li><span><high>Statistiques simples</high></span></li> <li><span>Graphiques simples</span></li> </ul> </ul> ] .pull-right5[ ```r # Charger des données dans un objet tourisme <- read.csv("1_Data/tourisme.csv", fileEncoding = "UTF-8") # Comparaison de Durée par Pays anova(lm(tourisme$Durée ~ tourisme$Pays)) ``` ``` ## Warning in anova.lm(lm(tourisme$Durée ## ~ tourisme$Pays)): ANOVA F-tests on an ## essentially perfect fit are unreliable ``` ``` ## Analysis of Variance Table ## ## Response: tourisme$Durée ## Df Sum Sq Mean Sq F value ## tourisme$Pays 70 72.4 1.03 NaN ## Residuals 0 0.0 NaN ## Pr(>F) ## tourisme$Pays NaN ## Residuals ``` ] --- # Statistiques .pull-left4[ <ul> <li class="m1g"><span>R(Studio)<br></span></li> <li class="m2g"><span>Assignations</span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4g"><span>Données I/O</a></span></li> <li class="m5"><span>Analyse</span></li> <ul class="level"> <li><span><high>Statistiques simples</high></span></li> <li><span>Graphiques simples</span></li> </ul> </ul> ] .pull-right5[ ```r # Charger des données dans un objet tourisme <- read.csv("1_Data/tourisme.csv", fileEncoding = "UTF-8") # Comparaison de Visiteurs par Region anova(lm(tourisme$Visiteurs ~ tourisme$Region)) ``` ``` ## Analysis of Variance Table ## ## Response: tourisme$Visiteurs ## Df Sum Sq Mean Sq ## tourisme$Region 4 7.15e+06 1787339 ## Residuals 66 1.61e+08 2437029 ## F value Pr(>F) ## tourisme$Region 0.73 0.57 ## Residuals ``` ] --- # Graphiques .pull-left4[ <ul> <li class="m1g"><span>R(Studio)<br></span></li> <li class="m2g"><span>Assignations</span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4g"><span>Données I/O</a></span></li> <li class="m5"><span>Analyse</span></li> <ul class="level"> <li><span>Statistiques simples</span></li> <li><span><high>Graphiques simples</high></span></li> </ul> </ul> ] .pull-right5[ ```r # Histogramme Durée hist(tourisme$Durée) ``` ![](Analyse_files/figure-html/unnamed-chunk-14-1.png)<!-- --> ] --- # Graphiques .pull-left4[ <ul> <li class="m1g"><span>R(Studio)<br></span></li> <li class="m2g"><span>Assignations</span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4g"><span>Données I/O</a></span></li> <li class="m5"><span>Analyse</span></li> <ul class="level"> <li><span>Statistiques simples</span></li> <li><span><high>Graphiques simples</high></span></li> </ul> </ul> ] .pull-right5[ ```r # Histogramme Visiteurs hist(tourisme$Visiteurs) ``` ![](Analyse_files/figure-html/unnamed-chunk-16-1.png)<!-- --> ] --- # Graphiques .pull-left4[ <ul> <li class="m1g"><span>R(Studio)<br></span></li> <li class="m2g"><span>Assignations</span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4g"><span>Données I/O</a></span></li> <li class="m5"><span>Analyse</span></li> <ul class="level"> <li><span>Statistiques simples</span></li> <li><span><high>Graphiques simples</high></span></li> </ul> </ul> ] .pull-right5[ ```r # Diagramme de correlation Visiteurs x Durée plot(tourisme$Visiteurs, tourisme$Durée) ``` ![](Analyse_files/figure-html/unnamed-chunk-18-1.png)<!-- --> ] --- # Graphiques .pull-left4[ <ul> <li class="m1g"><span>R(Studio)<br></span></li> <li class="m2g"><span>Assignations</span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4g"><span>Données I/O</a></span></li> <li class="m5"><span>Analyse</span></li> <ul class="level"> <li><span>Statistiques simples</span></li> <li><span><high>Graphiques simples</high></span></li> </ul> </ul> ] .pull-right5[ ```r # Diagramme de correlation # Visiteurs (log) x Durée (log) plot(tourisme$Visiteurs, tourisme$Durée, log = "xy") ``` ![](Analyse_files/figure-html/unnamed-chunk-20-1.png)<!-- --> ] --- # Graphiques .pull-left4[ <ul> <li class="m1g"><span>R(Studio)<br></span></li> <li class="m2g"><span>Assignations</span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4g"><span>Données I/O</a></span></li> <li class="m5"><span>Analyse</span></li> <ul class="level"> <li><span>Statistiques simples</span></li> <li><span><high>Graphiques simples</high></span></li> </ul> </ul> ] .pull-right5[ ```r # Diagramme de correlation # Visiteurs (log) x Durée (log) plot(tourisme$Visiteurs, tourisme$Durée, log = "xy", col = 'red', pch = 16, xlab = 'Visiteurs', ylab = 'Durée') ``` ![](Analyse_files/figure-html/unnamed-chunk-22-1.png)<!-- --> ] --- # Graphiques .pull-left4[ <ul> <li class="m1g"><span>R(Studio)<br></span></li> <li class="m2g"><span>Assignations</span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4g"><span>Données I/O</a></span></li> <li class="m5"><span>Analyse</span></li> <ul class="level"> <li><span>Statistiques simples</span></li> <li><span><high>Graphiques simples</high></span></li> </ul> </ul> ] .pull-right5[ ```r # Boite à moustaches Durée (log) par Region boxplot(tourisme$Durée ~ tourisme$Region, log="y") ``` ![](Analyse_files/figure-html/unnamed-chunk-24-1.png)<!-- --> ] --- # Graphiques .pull-left4[ <ul> <li class="m1g"><span>R(Studio)<br></span></li> <li class="m2g"><span>Assignations</span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4g"><span>Données I/O</a></span></li> <li class="m5"><span>Analyse</span></li> <ul class="level"> <li><span>Statistiques simples</span></li> <li><span><high>Graphiques simples</high></span></li> </ul> </ul> ] .pull-right5[ ```r # Boite à moustaches Visiteurs (log) par Region boxplot(tourisme$Visiteurs ~ tourisme$Region, log="y") ``` ![](Analyse_files/figure-html/unnamed-chunk-26-1.png)<!-- --> ] --- class: middle, center <h1><high>Exercices</high></h1>