# Générer des variables aléatoires

## runif
La fonction `runif` permet de générer des pseudo-variables aléatoires indépendantes entre deux bornes
`runif(n=combien, min, max)`

In [40]:
runif(1,0,10)

In [41]:
runif(10,0,1)

On peut insérer maintenant les valeurs générées à l'intérieur d'un vecteur

In [3]:
x<-runif(100,0,1)

Ou les insérer à l'intérieur d'une matrice

In [45]:
x<-matrix(x, 10)
x

0,1,2,3,4,5,6,7,8,9
0.539611001,0.43703539,0.85709912,0.4599631,0.9746683,0.9150659,0.1251427,0.1800253,0.63296958,0.127779
0.969200172,0.98869122,0.4587888,0.272586,0.58830241,0.7808764,0.2056756,0.6443141,0.82069732,0.199427
0.161860105,0.44683774,0.05306833,0.3773334,0.75579931,0.1784268,0.3055089,0.4147207,0.43887943,0.604085
0.446521448,0.54748316,0.92775225,0.9982479,0.54972412,0.6394982,0.686443,0.9867912,0.03091283,0.5808925
0.007107472,0.02445618,0.3534589,0.4459476,0.77903144,0.4392217,0.8644656,0.3406485,0.56053496,0.4633779
0.963198963,0.40298549,0.56838054,0.8158883,0.03108763,0.797969,0.6087287,0.5747714,0.07915931,0.4372559
0.5790666,0.34913192,0.2306677,0.2059267,0.41230033,0.70821,0.2880309,0.9337467,0.77597654,0.8853603
0.16570529,0.74011543,0.33763606,0.1456844,0.56672791,0.2197435,0.1583491,0.2270206,0.06134143,0.2939507
0.594905792,0.27719153,0.37522597,0.829737,0.49838097,0.3884056,0.3239845,0.1054112,0.80395329,0.1680158
0.375249445,0.84355537,0.387821,0.863745,0.70958528,0.3343178,0.3899539,0.6956865,0.90822088,0.8057296


Nous avons maintenant obtenu une matrice de dimension 10X10

## Seed

Comme dans SAS, nous avons appris comment générer les mêmes variables aléatoires dans un contexte de cumulation par exemple, avec la fonction seed

In [151]:
set.seed(2)

In [152]:
runif(2,0,1) 

In [153]:
runif(2,0,1) 

In [154]:
runif(2,0,1) 

Si on remet le seed=2, on obtient alors les mêmes valeurs que nous avons obtenues auparavant

In [159]:
set.seed(2)

In [160]:
runif(2,0,1) 

In [161]:
runif(2,0,1) 

In [162]:
runif(2,0,1) 

## Sample (échantillonage)

La fonction `sample` tire un échantillon aléatoire de $n$ variables à partir d'un ensemble de données allant de $\left\{1, \dots ,N\right\}$

In [168]:
sample(1:10,5)

In [169]:
sample(x,5)

In [170]:
sample(x,5)

$n\leq N$

In [172]:
sample(x,length(x)+1)

ERROR: Error in sample.int(length(x), size, replace, prob): cannot take a sample larger than the population when 'replace = FALSE'


Lorsque notre échantillon tiré est plus grand que notre ensemble de données, on peut utiliser un tirage avec remise:

In [2]:
# sample(0:1, 100, replace = T)

Cette fonction fonctionne aussi sur un tirage de variable de type caractères

In [176]:
sample(state.name, 5)

La fonction `sample` donne des probabilités égales à tous les éléments tirés d'un ensemble de données. Toutesfois, il est possible de préciser la probabilité de chaque élément tiré.

In [1]:
s<-sample(1:5, 1000, replace=T, prob=c(.2,.2,.2,.2,.2))

Si on utilise la fonction `table` afin de compter l'occurrence de chaque élément

In [7]:
tableau <- table(s)
tableau

s
  1   2   3   4   5 
222 187 203 183 205 

on remarque que chaque élément à été tiré à un taux d'environ 20%

In [18]:
tableau[[1]]/sum(tableau)

Si on change les probabilités maintenant, mais **attention** la somme des probabilités doit être égale à 1

In [188]:
s<-sample(1:5, 1000, replace=T, prob=c(.2,.5,.1,.1,.1))
table(s)

s
  1   2   3   4   5 
197 509 101  87 106 

## rnorm
La moyenne par défaut est égale à 0 et l'écart-type=1

In [190]:
rnorm(1)

In [191]:
rnorm(1, 0, 100)

Créons un vecteur de 100 valeurs avec moyenne=100 et écart-type=100

In [192]:
x<-rnorm(100, 0, 100)

Si on calcule la moyenne de ce vecteur;

In [193]:
mean(x)

Nous avons obtenu une moyenne proche de la moyenne de nos variables aléatoires générées par la fonction `rnorm`

La même chose maintenant pour l'écart-type

In [195]:
sd(x)

Toutefois, si nous augmentons le nombre de variables aléatoires généré, nous sommes alors plus proches des arguments de la fonction `rnorm` que nous avons saisie

In [197]:
x<-rnorm(10000, 0, 100)
mean(x)

In [198]:
sd(x)