class: center, middle, inverse, title-slide .title[ # Données ] .author[ ### Introduction à l’analyse de données avec R
The R Bootcamp
] .date[ ### Juin 2023 ] --- layout: true <div class="my-footer"> <span style="text-align:center"> <span> <img src="https://raw.githubusercontent.com/therbootcamp/therbootcamp.github.io/master/_sessions/_image/by-sa.png" height=14 style="vertical-align: middle"/> </span> <a href="https://therbootcamp.github.io/"> <span style="padding-left:82px"> <font color="#7E7E7E"> www.therbootcamp.com </font> </span> </a> <a href="https://therbootcamp.github.io/"> <font color="#7E7E7E"> Introduction à l'analyse de données avec R | Juin 2023 </font> </a> </span> </div> --- # Agenda .pull-left4[ <ul> <li class="m1g"><span>R(Studio)</span></li> <li class="m2g"><span>Assignations<br></span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4"><span><high>Données I/O</high></a></span></li> <ul class="level"> <li><span>Charger des données</span></li> <li><span>Les données "vivent" dans les <mono>data.frames</span></li> <li><span>3 + 1 types de données</span></li> <li><span>Enrégistrer des données dans des fichiers</span></li> </ul><br> <li class="m5g"><span>Analyse</span></li> </ul> ] .pull-right5[ <p align = "center"> <img src="image/fixing.png"><br> <font style="font-size:10px">from <a href="https://xkcd.com//">xkcd.com</a></font> </p> ] --- # Charger des données .pull-left4[ <ul> <li class="m1g"><span>R(Studio)</span></li> <li class="m2g"><span>Assignations<br></span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4"><span>Données I/O</a></span></li> <ul class="level"> <li><span><high>Charger des données</high></span></li> <li><span>Les données "vivent" dans les <mono>data.frames</span></li> <li><span>3 + 1 types de données</span></li> <li><span>Enrégistrer des données dans des fichiers</span></li> </ul><br> <li class="m5g"><span>Analyse</span></li> </ul> ] .pull-right5[ ```r # Charger des données read.csv('1_Data/tourisme.csv') ``` ``` ## Pays RÃ.gion AnnÃ.e Visiteurs DurÃ.e ## 1 Belgique Europe 2018 920 1.727 ## 2 Bulgarie Europe 2018 138 2.101 ## 3 Danemark Europe 2018 301 1.827 ## 4 Allemagne Europe 2018 10564 1.709 ## 5 Estonie Europe 2018 24 2.125 ## 6 Finlande Europe 2018 130 2.008 ## 7 France Europe 2018 3401 1.555 ## 8 Grèce Europe 2018 195 2.651 ## 9 Irlande Europe 2018 374 2.332 ## 10 Islande Europe 2018 32 1.781 ## [ reached 'max' / getOption("max.print") -- omitted 61 rows ] ``` ] --- # Charger des données .pull-left4[ <ul> <li class="m1g"><span>R(Studio)</span></li> <li class="m2g"><span>Assignations<br></span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4"><span>Données I/O</a></span></li> <ul class="level"> <li><span><high>Charger des données</high></span></li> <li><span>Les données "vivent" dans les <mono>data.frames</span></li> <li><span>3 + 1 types de données</span></li> <li><span>Enrégistrer des données dans des fichiers</span></li> </ul><br> <li class="m5g"><span>Analyse</span></li> </ul> ] .pull-right5[ ```r # Charger des données et assigner à un objet tourisme <- read.csv('1_Data/tourisme.csv', fileEncoding = "UTF-8") # Voir les données head(tourisme) ``` ``` ## Pays Région Année Visiteurs Durée ## 1 Belgique Europe 2018 920 1.727 ## 2 Bulgarie Europe 2018 138 2.101 ## 3 Danemark Europe 2018 301 1.827 ## 4 Allemagne Europe 2018 10564 1.709 ## 5 Estonie Europe 2018 24 2.125 ## 6 Finlande Europe 2018 130 2.008 ``` ] --- # Charger des données .pull-left4[ <ul> <li class="m1g"><span>R(Studio)</span></li> <li class="m2g"><span>Assignations<br></span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4"><span>Données I/O</a></span></li> <ul class="level"> <li><span><high>Charger des données</high></span></li> <li><span>Les données "vivent" dans les <mono>data.frames</span></li> <li><span>3 + 1 types de données</span></li> <li><span>Enrégistrer des données dans des fichiers</span></li> </ul><br> <li class="m5g"><span>Analyse</span></li> </ul> ] .pull-right5[ <p align = "center"> <img src="image/autocompl1_fr.png"> </p> ] --- # Charger des données .pull-left4[ <ul> <li class="m1g"><span>R(Studio)</span></li> <li class="m2g"><span>Assignations<br></span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4"><span>Données I/O</a></span></li> <ul class="level"> <li><span><high>Charger des données</high></span></li> <li><span>Les données "vivent" dans les <mono>data.frames</span></li> <li><span>3 + 1 types de données</span></li> <li><span>Enrégistrer des données dans des fichiers</span></li> </ul><br> <li class="m5g"><span>Analyse</span></li> </ul> ] .pull-right5[ <p align = "center"> <img src="image/autocompl2_fr.png"> </p> ] --- # Charger des données .pull-left4[ <ul> <li class="m1g"><span>R(Studio)</span></li> <li class="m2g"><span>Assignations<br></span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4"><span>Données I/O</a></span></li> <ul class="level"> <li><span><high>Charger des données</high></span></li> <li><span>Les données "vivent" dans les <mono>data.frames</span></li> <li><span>3 + 1 types de données</span></li> <li><span>Enrégistrer des données dans des fichiers</span></li> </ul><br> <li class="m5g"><span>Analyse</span></li> </ul> ] .pull-right5[ <p align = "center"> <img src="image/autocompl3_fr.png"> </p> ] --- # Les données "vivent" dans les <mono>data.frames</mono> .pull-left4[ <ul> <li class="m1g"><span>R(Studio)</span></li> <li class="m2g"><span>Assignations<br></span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4"><span>Données I/O</a></span></li> <ul class="level"> <li><span>Charger des données</span></li> <li><span><high>Les données "vivent" dans les <mono>data.frames</span></high></li> <li><span>3 + 1 types de données</span></li> <li><span>Enrégistrer des données dans des fichiers</span></li> </ul><br> <li class="m5g"><span>Analyse</span></li> </ul> ] .pull-right5[ ```r # Charger des données dans un objet tourisme <- read.csv('1_Data/tourisme.csv', fileEncoding = "UTF-8") # Classe des données class(tourisme) ``` ``` ## [1] "data.frame" ``` ```r dim(tourisme) # Dimensions ``` ``` ## [1] 71 5 ``` ```r names(tourisme) # Noms des variables ``` ``` ## [1] "Pays" "Région" "Année" ## [4] "Visiteurs" "Durée" ``` ] --- # 3 + 1 types de données .pull-left4[ <ul> <li class="m1g"><span>R(Studio)</span></li> <li class="m2g"><span>Assignations<br></span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4"><span>Données I/O</a></span></li> <ul class="level"> <li><span>Charger des données</span></li> <li><span>Les données "vivent" dans les <mono>data.frames</span></li> <li><span><high>3 + 1 types de données</high></span></li> <li><span>Enrégistrer des données dans des fichiers</span></li> </ul><br> <li class="m5g"><span>Analyse</span></li> </ul> ] .pull-right5[ <p align = "center"> <img src="image/types.png"><br> </p> ] --- # 3 + 1 types de données .pull-left4[ <ul> <li class="m1g"><span>R(Studio)</span></li> <li class="m2g"><span>Assignations<br></span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4"><span>Données I/O</a></span></li> <ul class="level"> <li><span>Charger des données</span></li> <li><span>Les données "vivent" dans les <mono>data.frames</span></li> <li><span><high>3 + 1 types de données</high></span></li> <li><span>Enrégistrer des données dans des fichiers</span></li> </ul><br> <li class="m5g"><span>Analyse</span></li> </ul> ] .pull-right5[ ```r # Charger des données dans un objet tourisme <- read.csv('1_Data/tourisme.csv', fileEncoding = "UTF-8") # Extraire une variable avec $ tourisme$Durée ``` ``` ## [1] 1.727 2.101 1.827 1.709 2.125 2.008 ## [7] 1.555 2.651 2.332 1.781 1.815 1.764 ## [13] 2.154 1.618 1.710 1.497 1.727 1.692 ## [19] 2.585 1.887 2.235 1.816 2.020 2.297 ## [25] 1.753 2.568 3.034 2.283 1.834 2.280 ## [31] 2.116 2.602 2.368 2.006 3.417 2.591 ## [37] 2.046 2.384 2.582 2.564 2.934 2.479 ## [43] 3.220 2.722 2.556 2.585 2.174 3.149 ## [49] 3.329 2.000 2.058 1.957 3.565 1.845 ## [55] 2.721 2.497 9.533 1.638 1.571 2.392 ## [61] 2.250 2.690 2.678 3.620 1.934 2.397 ## [67] 3.063 2.679 4.109 2.216 2.750 ``` ] --- # 3 + 1 types de données .pull-left4[ <ul> <li class="m1g"><span>R(Studio)</span></li> <li class="m2g"><span>Assignations<br></span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4"><span>Données I/O</a></span></li> <ul class="level"> <li><span>Charger des données</span></li> <li><span>Les données "vivent" dans les <mono>data.frames</span></li> <li><span><high>3 + 1 types de données</high></span></li> <li><span>Enrégistrer des données dans des fichiers</span></li> </ul><br> <li class="m5g"><span>Analyse</span></li> </ul> ] .pull-right5[ ```r # Charger des données dans un objet tourisme <- read.csv('1_Data/tourisme.csv', fileEncoding = "UTF-8") # Extraire une variable avec $ class(tourisme$Durée) ``` ``` ## [1] "numeric" ``` ] --- # 3 + 1 types de données .pull-left4[ <ul> <li class="m1g"><span>R(Studio)</span></li> <li class="m2g"><span>Assignations<br></span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4"><span>Données I/O</a></span></li> <ul class="level"> <li><span>Charger des données</span></li> <li><span>Les données "vivent" dans les <mono>data.frames</span></li> <li><span><high>3 + 1 types de données</high></span></li> <li><span>Enrégistrer des données dans des fichiers</span></li> </ul><br> <li class="m5g"><span>Analyse</span></li> </ul> ] .pull-right5[ ```r # Charger des données dans un objet tourisme <- read.csv('1_Data/tourisme.csv', fileEncoding = "UTF-8") # Extraire une variable avec $ tourisme$Pays ``` ``` ## [1] "Belgique" "Bulgarie" ## [3] "Danemark" "Allemagne" ## [5] "Estonie" "Finlande" ## [7] "France" "Grèce" ## [9] "Irlande" "Islande" ## [11] "Italie" "Croatie" ## [13] "Lettonie" "Liechtenstein" ## [15] "Lituanie" "Luxembourg" ## [17] "Malte" "Pays-Bas" ## [19] "Norvège" "Autriche" ## [ reached getOption("max.print") -- omitted 51 entries ] ``` ] --- # 3 + 1 types de données .pull-left4[ <ul> <li class="m1g"><span>R(Studio)</span></li> <li class="m2g"><span>Assignations<br></span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4"><span>Données I/O</a></span></li> <ul class="level"> <li><span>Charger des données</span></li> <li><span>Les données "vivent" dans les <mono>data.frames</span></li> <li><span><high>3 + 1 types de données</high></span></li> <li><span>Enrégistrer des données dans des fichiers</span></li> </ul><br> <li class="m5g"><span>Analyse</span></li> </ul> ] .pull-right5[ ```r # Charger des données dans un objet tourisme <- read.csv('1_Data/tourisme.csv', fileEncoding = "UTF-8") # Classe de la variable class(tourisme$Pays) ``` ``` ## [1] "character" ``` ] --- # Enrégistrer des données dans des fichiers .pull-left4[ <ul> <li class="m1g"><span>R(Studio)</span></li> <li class="m2g"><span>Assignations<br></span></li> <li class="m3g"><span>Fonctions</span></li> <li class="m4"><span>Données I/O</a></span></li> <ul class="level"> <li><span>Charger des données</span></li> <li><span>Les données "vivent" dans les <mono>data.frames</span></li> <li><span>3 + 1 types de données</span></li> <li><span><high>Enrégistrer des données dans des fichiers</high></span></li> </ul><br> <li class="m5g"><span>Analyse</span></li> </ul> ] .pull-right5[ ```r # Enrégistrer des données # dans un fichier au format csv write.csv(tourisme, '1_Data/tourisme_2.csv') # Enrégistrer des données # dans un fichier au format RDS saveRDS(tourisme, '1_Data/tourisme_2.RDS') ``` ] --- class: middle, center <h1><high>Exercices</high></h1>