-
Notifications
You must be signed in to change notification settings - Fork 8
/
introducao.Rmd
99 lines (78 loc) · 4.94 KB
/
introducao.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
# Introdução {#introducao}
O *Zen do R* tem o objetivo de ser um livro sobre programação para
quem não programa. Atualmente muitas pessoas de diferentes áreas do conhecimento
acabam precisando usar a linguagem R por causa do seu grande potencial para
programação estatística, mas ficam perdidas depois que aprendem o básico sobre a
linguagem. Nesse sentido, este é um livro para pessoas "não-programadoras" no que se
refere a treinamento formal; isto não é uma introdução ao R, mas sim um guia
sobre como usar o R de forma eficiente no dia-a-dia. O *Zen do R* também
pretende destoar dos manuais mais secos e técnicos sobre programação, utilizando
uma linguagem leve e acessível justamente porque parte-se do princípio de que
ele será utilizado em conjunto com algum outro texto (seco e técnico) sobre como
de fato programar em R.
A escolha do R é parcialmente arbitrária. Nada impede de você usar Python para
a análise de dados, mas ao longo de alguns anos de experiência notou-se
que o fato de o R ter sido feito com análise de dados em mente acaba
sendo uma vantagem muito difícil de ignorar. Fora isso, o `tidyverse`, as
infinitas ferramentas do RStudio e o engajamento da comunidade fazem com que
nós achemos o R a verdadeira linguagem do *data science*.
Por isso, o *Zen do R* é um guia para acalmar os nervos de quem se
aventura pela primeira vez em um grande projeto em R.
## Sobre o livro
A grande piada do título é que o caminho para o fluxo ideal de programação é
análogo ao caminho descrito pelo Budismo para a libertação do espírito.
Parece muito estranho que essas duas coisas tenham alguma relação, mas a vida
é uma boa metáfora para muitos processos que encontramos no dia-a-dia!
### O que você vai aprender
Essencialmente você vai aprender a usar alguns pacotes e como trabalhar com
quatro aspectos do processo de análise de dados: ambiente, versões, dados e
arquivos. Não é necessário ler o livro em ordem porque cada uma dessas quatro
sessões são completamente independentes.
Sinta-se livre para pular todos os tópicos sobre os quais você sentir que já
sabe o suficiente. Mas não se iluda, porque nenhum dos tópicos é inútil ou pode
ser simplesmente ignorado; quanto maior for um projeto (seja uma tese de
mestrado ou uma análise de dados médicos), mais necessários serão os tópicos
mais avançados.
### O que você não vai aprender
Primeiramente, você não vai aprender a programar R. Esse assunto é extremamente
extenso e já existem livros o suficiente para ajudar com isso (vide [o livro da
Curso-R](https://livro.curso-r.com/) ou [R for Data
Science](https://r4ds.had.co.nz/)), então não vou me preocupar com os detalhes
do código ou com qual guia de estilo seguir.
Se você gosta de fazer códigos longos e velozes usando o `base-r`, se você ama
as pipelines do `tidyverse`, se você paraleliza todos os seus loops... Nada
disso importa aqui; não vou dizer qual é o melhor jeito de programar^[E também
não tenho paciência para entrar em mais nenhum debate "base vs. tidyverse"].
Aqui você vai conhecer somente as melhores ferramentas para **organizar o seu
fluxo de programação**.
Apesar de terem nomes parecidos, *O Zen do R* e *O Zen do Python* são diferentes
justamente por causa disso. O livro do Python pretende dar sugestões de como
organizar e escrever o seu código, o que não será feito aqui.
## Pré-requisitos
Como talvez já tenha ficado claro, um dos principais pré-requisitos deste livro
é saber programar pelo menos um pouco de R. Você não precisa ser especialista, mas, para ter a necessidade de melhorar o seu fluxo de análise,
você antes precisa estar fazendo alguma análise.
Fora isso, o segundo principal pré-requisito é um ambiente de desenvolvimento.
Grande parte das dicas do livro são baseadas em funcionalidades integradas ao
RStudio, então se você quiser tirar o maior proveito possível dos ensinamentos
talvez valha à pena
[instalar a IDE](https://www.rstudio.com/products/rstudio/download/). Ainda
no tocante ao R, você precisará ter instalado pelo menos os três pacotes a
seguir:
```{r, eval=FALSE, echo=TRUE}
# Conteúdo principal do livro
install.packages(c("usethis", "renv", "tidyverse"))
# Se você quiser reproduzir os exemplos
install.packages("devtools")
```
Você também precisa de um computador funcionando com um sistema operacional
razoavelmente moderno. E uma conexão à internet.
## Principais referências
O *Zen do R* se baseia em inúmeras referências que normalmente serão citadas
juntamente com o próprio conteúdo. Mas algumas mais gerais acabariam sendo
citadas o tempo todo e portanto acabarão ficando aqui:
- [R for Data Science](https://r4ds.had.co.nz/);
- [bookdown: Authoring Books and Technical Documents with R Markdown](https://bookdown.org/yihui/bookdown/);
- [usethis](https://usethis.r-lib.org/);
- [Packrat: Reproducible package management for R](https://rstudio.github.io/packrat/) e
- [O blog da Curso-R](https://www.curso-r.com/blog/).