Menu
Coddy logo textTech

Aide-mémoire R

Dernière mise à jour

Hello World et affectation

L'opérateur d'affectation idiomatique de R est <- (l'opérateur = fonctionne aussi).

OpérationSyntaxe
Afficher une valeurprint("Hello, World!")
Affichage automatique (console)"Hello, World!"
Concaténer et affichercat("Hi", name, "\n")
Affecter (idiomatique)x <- 5
Affecter (également valide)x = 5
Affectation à droite5 -> x
Commentaire# this is a comment
Exécuter un scriptRscript app.R

Types de données et vecteurs

Le vecteur est la structure de données fondamentale de R ; même une valeur unique est un vecteur de longueur 1.

OpérationSyntaxe
Vecteur numériquev <- c(1, 2, 3)
Vecteur de caractèress <- c("a", "b")
Vecteur logiqueb <- c(TRUE, FALSE)
Séquence d'entiers1:10
Séquence avec passeq(0, 1, by = 0.1)
Répéter des valeursrep(0, times = 5)
Types de basenumeric, character, logical, integer, complex
Vérifier / convertir le typeclass(x), as.numeric("42")

Opérations sur les vecteurs

Les opérations sont vectorisées et s'appliquent élément par élément ; l'indexation commence à 1.

OpérationSyntaxe
Accéder à un élément (commence à 1)v[1]
Extraire une plagev[2:4]
Filtrage logiquev[v > 2]
Retirer un élémentv[-1]
Maths élément par élémentv * 2, v1 + v2
Longueurlength(v)
Réducteurs courantssum(v), mean(v), max(v)
Trier / inversersort(v), rev(v)
Vecteur nomméc(a = 1, b = 2)

Data frames

Un data frame est un tableau de colonnes, chacune étant un vecteur de longueur égale.

OpérationSyntaxe
Créer un data framedf <- data.frame(name = c("Ada"), age = c(30))
Premières / dernières ligneshead(df), tail(df)
Dimensionsnrow(df), ncol(df), dim(df)
Noms de colonnesnames(df), colnames(df)
Sélectionner une colonnedf$age ou df[["age"]]
Sélectionner lignes / colonnesdf[1, ], df[, "age"]
Filtrer les lignesdf[df$age > 18, ]
Ajouter une colonnedf$adult <- df$age >= 18
Statistiques de synthèsesummary(df)
Aperçu de la structurestr(df)

Facteurs et listes

Les facteurs stockent des données catégorielles ; les listes contiennent des éléments de types variés.

OpérationSyntaxe
Créer un facteurf <- factor(c("low", "high"))
Niveaux du facteurlevels(f)
Facteur ordonnéfactor(x, ordered = TRUE)
Compter par niveautable(f)
Créer une listel <- list(name = "Ada", scores = c(1, 2))
Accéder par noml$name ou l[["name"]]
Accéder par positionl[[1]]
Sous-liste (reste une liste)l[1]
Longueur / nomslength(l), names(l)

Contrôle de flux

Les conditions vont entre parenthèses et les blocs entre accolades.

OpérationSyntaxe
If / else if / elseif (x > 0) { ... } else if (x < 0) { ... } else { ... }
If-else vectoriséifelse(v > 0, "pos", "neg")
Boucle forfor (i in 1:10) { ... }
For sur un vecteurfor (x in v) { ... }
Boucle whilewhile (x < 100) { ... }
Repeat avec breakrepeat { if (done) break }
Switchswitch(key, a = 1, b = 2)
Opérateurs logiques&&, ||, ! (scalaire) ; &, | (vecteur)

Fonctions

Les fonctions sont de première classe ; la dernière expression évaluée est renvoyée.

OpérationSyntaxe
Définir une fonctionadd <- function(a, b) { a + b }
Retour explicitereturn(a + b)
Argument par défautgreet <- function(name = "World") { ... }
Argument variadiquef <- function(...) { sum(...) }
Appel par nombox(w = 2, h = 3)
Fonction anonymefunction(x) x * 2
Anonyme (forme abrégée)\(x) x * 2
Passer à une fonction d'ordre supérieursapply(1:3, function(x) x^2)

La famille apply

Appliquer une fonction sur des données sans écrire de boucles explicites.

FonctionCe qu'elle fait
apply(m, 1, sum)Appliquer sur les lignes (1) ou colonnes (2) d'une matrice
sapply(v, f)Appliquer sur un vecteur, simplifier en vecteur/matrice
lapply(v, f)Appliquer sur un vecteur, renvoie toujours une liste
vapply(v, f, numeric(1))Comme sapply mais avec un type de retour vérifié
mapply(f, a, b)Appliquer sur plusieurs vecteurs en parallèle
tapply(x, group, mean)Appliquer une fonction par groupe
Map(f, a, b)Apply multivarié renvoyant une liste
Reduce(+, v)Replier un vecteur avec une fonction binaire

Fonctions courantes de manipulation et de statistiques

Fonctions de base fréquemment utilisées pour résumer et remodeler les données.

FonctionCe qu'elle fait
mean(v) / median(v)Moyenne / valeur médiane
sd(v) / var(v)Écart-type / variance
min(v) / max(v) / range(v)Plus petit / plus grand / les deux
quantile(v)Quantiles (ex. quartiles)
table(x)Décomptes de fréquence des valeurs
unique(v) / duplicated(v)Valeurs distinctes / indicateurs de doublons
is.na(v) / na.omit(df)Trouver / supprimer les valeurs manquantes
aggregate(y ~ g, df, mean)Résumer y par groupe g
order(v)Ordre des indices pour le tri
cor(x, y)Corrélation entre deux vecteurs

La syntaxe R que vous utilisez le plus, sur une seule page. Cet aide-mémoire R est une référence rapide pour le cœur du langage - affectation et types de données, vecteurs et opérations vectorielles, data frames, facteurs et listes, contrôle de flux, fonctions, ainsi que la famille apply employée dans toute l'analyse de données rstats.

Tout ce qui figure ici est du R de base et s'exécute sur une installation standard - aucun paquet supplémentaire requis. Copiez ce dont vous avez besoin, ou essayez chaque extrait en direct dans le playground R - aucune configuration nécessaire.

FAQ de l'aide-mémoire R

Cet aide-mémoire R est-il gratuit ?
Oui. Cet aide-mémoire R est entièrement gratuit, sans inscription. Mettez-le en favori et revenez dès que vous devez retrouver une opération vectorielle, une méthode de data frame ou une fonction statistique.
Les vecteurs R sont-ils vraiment indexés à partir de 1 ?
Oui. Contrairement à la plupart des langages de programmation, l'indexation en R commence à 1, donc v[1] renvoie le premier élément et v[length(v)] renvoie le dernier. Les indices négatifs ont une signification particulière - v[-1] retire le premier élément au lieu de compter depuis la fin. Cette convention basée sur 1 s'applique aux vecteurs, aux listes et aux data frames de la même manière.
Qu'est-ce qu'un data frame en R ?
Un data frame est le type tableau de R : une collection de colonnes où chaque colonne est un vecteur de même longueur, et où différentes colonnes peuvent contenir différents types (nombres, texte, facteurs). C'est la structure standard pour les jeux de données - les lignes sont des observations et les colonnes des variables - et vous l'indexez comme df[rows, columns], sélectionnez une colonne avec df$name, et l'inspectez avec str(df) ou summary(df).
Puis-je m'entraîner à R en ligne ?
Oui. Ouvrez le playground R pour exécuter n'importe quel extrait de cet aide-mémoire dans votre navigateur - aucun R ni RStudio à installer. Quand vous voulez de la structure, le cours R interactif gratuit de Coddy vous emmène des vecteurs et des data frames jusqu'à la famille apply et aux statistiques, étape par étape.
Cet aide-mémoire convient-il aux débutants ?
Oui. Il est organisé des sujets les plus courants (affectation, vecteurs, data frames) jusqu'aux plus avancés (la famille apply et les fonctions statistiques), pour que vous puissiez utiliser les premières sections dès le premier jour et progresser vers le reste.
Coddy programming languages illustration

Apprenez R avec Coddy

COMMENCER