R (langage) — wikipédia la gas prices

#####

Depuis 1997, une vingtaine de développeurs forment l’équipe de développement de R ( R Development Core team). Les membres de cette équipe ont les droits d’écriture sur le code source [13 ]. Le 23 avril 1997 débute le Comprehensive R Archive Network (CRAN) puis le 5 décembre 1997, R est intégré au Projet GNU.

En 2003, l’équipe de développement crée la R Foundation for Statistical Computing pour soutenir le projet R et devenir un point de contact de référence pour ceux qui veulent prendre contact avec la communauté R [11 ] , [15 ]. A ce moment, le langage compte plus de 200 bibliothèques développées par la communauté scientifique qui utilise R [12 ].

En 2015, plusieurs acteurs économiques importants comme IBM, Microsoft ou encore la société RStudio créent le R Consortium pour soutenir la communauté R et financer des projets autour de ce langage [18 ]. Distributions [ modifier | modifier le code ]

La distribution la plus connue du langage R est celle du R Project et du Comprehensive R Archive Network (CRAN). Il existe d’autres distributions comme la distribution proposée par Microsoft [19 ] ou encore celle de l’entreprise Oracle, Oracle R Distribution [20 ] , [21 ]. Implémentations [ modifier | modifier le code ]

R dispose d’un très grand nombre de bibliothèques développées par une communauté de contributeurs. À titre d’exemple, le site RDocumentation.org recense plus de 12 000 bibliothèques sur le Comprehensive R Archive Network (CRAN), GitHub et Bioconductor (en) en février 2017 [25 ].

Une enquête menée par Rexer Analytics auprès de 1 300 analystes retrouve que R est le logiciel le plus souvent utilisé lorsqu’il s’agit d’un travail en entreprise, dans le monde académique, au sein d’organismes publics ou d’ONG et chez les analystes travaillant comme consultants [26 ].

La réunion officielle des utilisateurs de R a lieu chaque année et se nomme "useR" [30 ]. La première édition a eu lieu à Vienne (Autriche) [31 ]. Alternant traditionnellement Europe et Amérique chaque année, elle a lieu pour la première fois en Australie en 2018.

The R Journal est un journal en accès libre dédié à R. On y trouve des articles courts à moyens sur l’utilisation et le développement de R, y compris des librairies, des conseils sur la programmation, des nouvelles du CRAN et des nouvelles de la fondation [33 ]. Fonctionnalités [ modifier | modifier le code ]

R est un langage interprété où les utilisateurs utilisent une interface en ligne de commande. R permet la programmation procédurale et avec certaines fonctions la programmation orientée objet. Bibliothèques logicielles [ modifier | modifier le code ]

• ReadR fournit un moyen rapide et convivial de lire les données rectangulaires (comme csv, tsv et fwf). Il est conçu pour analyser avec souplesse de nombreux types de données tout en continuant d’échouer lorsque les données changent de façon inattendue [35 ].

• Tidyr fournit un ensemble de fonctions qui vous aident à obtenir des données bien rangées. Les données ordonnées "tidy" sont des données avec une forme cohérente: en bref, chaque variable va dans une colonne et chaque colonne est une variable [41 ].

• ReadR fournit un moyen rapide et convivial de lire les données rectangulaires (comme csv, tsv et fwf). Il est conçu pour analyser avec souplesse de nombreux types de données tout en continuant d’échouer lorsque les données changent de façon inattendue [35 ].

• Purrr fournit un ensemble complet et cohérent d’outils pour travailler avec des fonctions et des vecteurs. Une fois que vous maîtrisez les concepts de base, purrr vous permet de remplacer beaucoup de boucles avec du code qui est plus facile à écrire et plus expressif. [42 ]

Data.table est une alternative fournissant une version performante des data.frame avec des améliorations syntaxiques et des fonctionnalités pour une facilité d’utilisation, une commodité et une rapidité de programmation [46 ]. Text mining ou fouille de textes [ modifier | modifier le code ]

Lubridate appartient à Tidyverse et améliore la gestion des dates et heures [49 ]. Il existe aussi la librairie Xts [50 ] , ou encore Zoo pour les séries temporelles irrégulières [51 ]. Visualisation des données [ modifier | modifier le code ]

Ggplot2 appartient à Tidyverse et définit une grammaire des graphiques permettant de combiner différentes couches graphiques [52 ]. La libraires Scales permet de gérer la mise en forme (étiquettes, échelle, etc.) d’un graphique [53 ] Reproductibilité [ modifier | modifier le code ]

La librairie Rmarkdown permet de combiner des sections de texte mises en forme en markdown et des sections de code en R [54 ] pour réaliser des rapports au format Microsoft Word ou PDF, des présentations au format Beamer ou HTML5 ( slidy.js ou reveal.js), des pages web, des sites web complets, des blogs [55 ] ou même des ouvrages entiers [56 ].