# Blocs de codes

Pour ex√©cuter du code dans un document R Markdown, vous devez ins√©rer un bloc de code (_chunk_). Il y a trois fa√ßons de le faire :

1. Le raccourci clavier option/alt-Cmd/ctrl-I
2. L'ic√¥ne du bouton "Ins√©rer" dans la barre d'outils de l'√©diteur.
3. En tapant manuellement les d√©limiteurs de chunk ```{r} et ```.

vous connaissez :<kbd>Cmd/Ctrl</kbd> + <kbd>Enter</kbd> Cependant, les chunks ont un nouveau raccourci clavier : <kbd>Cmd/Ctrl</kbd> + <kbd>Shift/Option</kbd> + <kbd>Enter</kbd> qui ex√©cute tout le code du chunk. Pensez √† un chunk comme √† une fonction. Un chunk doit √™tre relativement autonome et concentr√© sur une seule t√¢che.

## nom du bloc code

On peut donner un nom facultatif aux morceaux : ```r by-name```. Cela pr√©sente trois avantages :

- Vous pouvez plus facilement naviguer vers des chunks sp√©cifiques en utilisant le navigateur de code d√©roulant en bas √† gauche de l'√©diteur de script :

![chunk_option](chunk_option.png)

- Les graphiques produits par les chunks auront des noms utiles qui les rendront plus faciles √† utiliser ailleurs.

- Vous pouvez mettre en place des r√©seaux de morceaux mis en cache pour √©viter de refaire des calculs co√ªteux √† chaque ex√©cution. Nous y reviendrons dans un instant.

Il y a un nom de chunk qui donne un comportement sp√©cial : setup. Lorsque vous √™tes en mode notebook, le chunk nomm√© setup sera ex√©cut√© automatiquement une fois, avant tout autre code.

## Options du bloc code

La sortie du chunk peut √™tre personnalis√©e avec des options, des arguments fournis √† l'en-t√™te du chunk. knitr fournit presque 60 options que vous pouvez utiliser pour personnaliser vos chunks de code. Nous allons couvrir ici les options les plus importantes que vous utiliserez fr√©quemment. Vous pouvez consulter [la liste compl√®te](http://yihui.name/knitr/options/).

- `eval = FALSE` emp√™che le code d'√™tre √©valu√©. (Et √©videmment, si le code n'est pas ex√©cut√©, aucun r√©sultat ne sera g√©n√©r√©). Ceci est utile pour afficher un exemple de code, ou pour d√©sactiver un grand bloc de code sans commenter chaque ligne.
- `include = FALSE` ex√©cute le code, mais ne montre pas le code ou les r√©sultats dans le document final. Utilisez ceci pour le code de configuration que vous ne voulez pas encombrer votre rapport.
- `echo = FALSE` emp√™che le code, mais pas les r√©sultats d'appara√Ætre dans le fichier final. Utilisez ceci lorsque vous √©crivez des rapports destin√©s √† des personnes qui ne veulent pas voir le code R sous-jacent.
- `message = FALSE` ou `warning = FALSE` emp√™che les messages ou les avertissements d'appara√Ætre dans le fichier fini.
- `results = 'hide'` cache la sortie imprim√©e ; `fig.show = 'hide'` cache les graphiques.
- `error = TRUE` permet au rendu de continuer m√™me si le code renvoie une erreur. C'est rarement quelque chose que vous voudrez inclure dans la version finale de votre rapport, mais cela peut √™tre tr√®s utile si vous avez besoin de d√©boguer exactement ce qui se passe dans votre .Rmd. C'est √©galement utile si vous enseignez R et que vous souhaitez inclure d√©lib√©r√©ment une erreur. La valeur par d√©faut, error = FALSE, fait √©chouer le tricotage s'il y a une seule erreur dans le document.


## Les tableaux

Si vous pr√©f√©rez que les donn√©es soient affich√©es avec un formatage suppl√©mentaire, vous pouvez utiliser la fonction `knitr::kable`. Le code suivant g√©n√®re

In [1]:
knitr::kable(
      mtcars[1:5, ],
      caption = "A knitr kable."
)



Table: A knitr kable.

|                  |  mpg| cyl| disp|  hp| drat|    wt|  qsec| vs| am| gear| carb|
|:-----------------|----:|---:|----:|---:|----:|-----:|-----:|--:|--:|----:|----:|
|Mazda RX4         | 21.0|   6|  160| 110| 3.90| 2.620| 16.46|  0|  1|    4|    4|
|Mazda RX4 Wag     | 21.0|   6|  160| 110| 3.90| 2.875| 17.02|  0|  1|    4|    4|
|Datsun 710        | 22.8|   4|  108|  93| 3.85| 2.320| 18.61|  1|  1|    4|    1|
|Hornet 4 Drive    | 21.4|   6|  258| 110| 3.08| 3.215| 19.44|  1|  0|    3|    1|
|Hornet Sportabout | 18.7|   8|  360| 175| 3.15| 3.440| 17.02|  0|  0|    3|    2|

## Mise en cache

Normalement, chaque knitr d'un document commence √† partir d'une page compl√®tement propre. C'est une bonne chose pour la reproductibilit√©, car cela garantit que vous avez captur√© chaque calcul important dans le code. Cependant, cela peut √™tre p√©nible si vous avez des calculs qui prennent beaucoup de temps. 

La solution est `cache = TRUE`. Lorsque cette option est activ√©e, la sortie du chunk est enregistr√©e dans un fichier sp√©cialement nomm√© sur le disque. Lors des ex√©cutions suivantes, knitr v√©rifiera si le code a chang√©, et s'il n'a pas chang√©, il r√©utilisera les r√©sultats mis en cache.

Le syst√®me de cache doit √™tre utilis√© avec pr√©caution, car par d√©faut il se base uniquement sur le code, et non sur ses d√©pendances. Par exemple, ici le chunk processed_data d√©pend du chunk raw_data :

     ```{r raw_data}
        rawdata <- readr::read_csv("a_very_large_file.csv")
     ```

    ```{r processed_data, cached = TRUE}
    processed_data <- rawdata %>%
      filter(!is.na(import_var)) %>%
      mutate(new_variable = complicated_transformation(x, y, z))
    ```

Mettre en cache le chunk processed_data signifie qu'il sera r√©ex√©cut√© si le pipeline dplyr est modifi√©, mais il ne sera pas r√©ex√©cut√© si l'appel `read_csv()` change. Vous pouvez √©viter ce probl√®me avec l'option `dependson` chunk :


    ```{r processed_data, cached = TRUE, dependson = "raw_data"}
    processed_data <- rawdata %>%
      filter(!is.na(import_var)) %>%
      mutate(new_variable = complicated_transformation(x, y, z))
    ```

`dependson` doit contenir un vecteur de caract√®res de chaque chunk dont d√©pend le chunk mis en cache. knitr mettra √† jour les r√©sultats pour le chunk mis en cache chaque fois qu'il d√©tectera que l'une de ses d√©pendances a chang√©.

Notez que les chunks ne seront pas mis √† jour si `a_very_large_file.csv` change, car la mise en cache de knitr ne suit que les changements dans le fichier `.Rmd`. Si vous voulez aussi suivre les changements dans ce fichier, vous pouvez utiliser l'option `cache.extra`. Il s'agit d'une expression R arbitraire qui invalidera le cache √† chaque fois qu'il sera modifi√©. 

Une bonne fonction √† utiliser est `file.info()` : elle retourne un tas d'informations sur le fichier, y compris la date de sa derni√®re modification. Vous pouvez alors √©crire :

    ```{r raw_data, cache.extra = file.info("a_very_large_file.csv")}
    rawdata <- readr::read_csv("a_very_large_file.csv")
    ```

## Options globales

Au fur et √† mesure que vous travaillez avec knitr, vous d√©couvrirez que certaines des options par d√©faut du chunk ne correspondent pas √† vos besoins, et vous voudrez les changer. Vous pouvez le faire en appelant `knitr::opts_chunk$set()` dans un chunk de code.



In [6]:
knitr::opts_chunk$set( echo = FALSE
)

Cela cachera le code par d√©faut, ne montrant que les parties que vous avez d√©lib√©r√©ment choisi de montrer (avec `echo = TRUE`). Vous pourriez envisager de d√©finir message `= FALSE` et `warning = FALSE`, mais cela rendrait plus difficile le d√©bogage des probl√®mes car vous ne verriez aucun message dans le document final.

## Code en ligne

Il existe une autre fa√ßon d'int√©grer du code R dans un document R Markdown : directement dans le texte, avec : `r `. Cela peut √™tre tr√®s utile si vous mentionnez des propri√©t√©s de vos donn√©es dans le texte. Par exemple, dans le document d'exemple que j'ai utilis√© au d√©but du chapitre, j'avais :

On sait que $\pi$ est √©gale √† `r pi`, alors que le nombre de ligne de la bd `cars` est `r nrow(cars)` 

donnerait ceci:

On sait que ùúã est √©gale √† 3.1415927, alors que le nombre de ligne de la bd cars est 50