#SÉANCE PRATIQUE DE R*********************************************************** #Si le texte n'est pas bien affiche allez-sur File>Reopen With Encoding et #choissisez UTF-8 ou Windows-1252 #Partie 1_______________________________________________________________________ #1.0. Importer le jeu de données "FDAdata.csv" avec: #File>Import Dataset>From text(base) #1.1. Affecter les valeurs de la colonne Conc.As à l'objet conc.as #1.2. Sélectionner les données des échantillons de l'Arkansas #1.3. Pour créer un nouveau tableau de données avec les données de la Californie #1.4. Pour réinitialiser la numérotation des lignes #1.4b. Façons alternatives de sélectionner les données data.ca.df <- subset(FDAdata,Origin=="California") data.ca.tx.df <- subset(FDAdata,Origin!="Arkansas") #1.5. Créer une fonction en R #1.6. Pour executer la fonction calcul #1.7. Créer un tableau de données #1.8. Fonction d'aide. Aide sur la fonction "mean" #1.9. Sommaire de statistiques descriptives #EXERCICE 1 ****************************************************************** #1. Créez les vecteurs as.ca et as.tx pour stocker, respectivement, les données de #concentration d’arsenique dans les échantillons de riz provenant de la Californie #et le Texas. #2. Créez une fonction p.etr pour déterminer le pourcentage écart-type relatif #des concentrations d’arsenique des échantillons. #3. Créez un tableau de données tab.riz.df avec les moyennes, médianes et #écart-type des données de l’Arkansas, Texas et Californie. #****************************************************************************** #1.10. Création d'un histogramme #1.11. Histogramme amélioré hist(conc.as, ylim = c(0,20), xlim = c(0, 12), main="", xlab = paste("Concentration d'arsenic (ug/portion de 45 g)"), ylab = paste("Fréquence"), col = "grey") #1.12 Pour converir une colonne en facteur #1.13 Boîtes à moustache avec ggplot2 #1.13b Boîtes à moustache avec ggplot2 améliorées ggplot(FDAdata, aes(x=Origin, y=Conc.As, fill=Origin)) + geom_boxplot(notchwidth = 0.5, outlier.size=3) + labs(x="Origine", y="Concentration d'arsenic (ug/portion de 45 g)") + theme_classic() #1.14 Création d'un tableau de données pour le graphique à barres bardata.df<-data.frame(Origine=c("Arkansas", "Californie", "Texas"), Moyenne=c(mean(as.ak),mean(as.ca), mean(as.tx)), EcartType=c(sd(as.ak),sd(as.ca), sd(as.tx))) #1.15 Création d'un graphique à barres avec ggplot2 #1.16 Création d'un graphique à barres avec ggplot2 amélioré ggplot(bardata.df, aes(x=Origine, y=Moyenne, fill=Origine)) + geom_col() + geom_errorbar(aes(ymin=Moyenne-EcartType,ymax=Moyenne+EcartType), width=0.2, size=1) + labs(x="Origine", y = "Moyenne", size=16) + theme_classic()+ theme(text = element_text(size=20)) #EXERCICE 2****************************************************************** #1. Faites trois histogrammes, chacun avec les données de l’Arkansas, Californie #et Texas, respectivement. Utilisez des couleurs différentes pour les barres de #chaque histogramme.