Introdução ao Software R e R Studio
Objetivos com o texto:
- Entender o que é o R e o RStudio
- Compreender as vantagens de utilizar o R e o RStudio
- Aprender a baixar e instalar o R e o RStudio
- Se familiarizar com o ambiente do RStudio
- Aprender funções básicas do R
O que é o R?
O R é um ambiente de desenvolvimento integrado para realizar cálculos estatísticos e a construção de gráficos. O R é considerado uma linguagem de programação que cientistas de dados e estatísticos utilizam para manipular dados de diversas formas.
As vantagens de utilizarmos o R ao invés de outros programas são:
- É um software Livre e Colaborativo
- Possibilita a manipulação de dados de forma eficaz e de fácil armazenamento
- Possuí ampla variedade de técnicas estatísticas já desenvolvidas
- Compila e roda em Windows, Linux e MacOS
Para instalar o R basta:
- Acessar a página r-project.org
2. Clicar em ‘download R’ ou em ‘CRAN’
3. Você será direcionado para a página cran.r-project.org/mirrors.html
4. Escolha o espelho de sua preferência
5. Clique no sistema operacional do seu computador
6. Clique em ‘base’
7. Clique em ‘Download R …’
8. Após finalizar o download é só executar o arquivo
O que é o RStudio?
O RStudio é somente uma interface para o R.
Ele tem um ambiente mais simples em comparação ao R, pois possui diversas ferramentas, como os painéis que o tornam mais prático.
Para utilizar o RStudio basta fazer download na página https://rstudio.com/products/rstudio/download/ e instalar, ele possui versões gratuitas e pagas.
Primeiros Passos no R Studio
1. Início do R Studio
Quando você inicia o R Studio você tem a seguinte visão:
2. Novo Script
Para realizar as análises é interessante criar um novo script, local onde você escreve os códigos de comando das análises e que posteriormente você pode salvar. Para criar vá em:
File > New File > R script ou
CRTL + SHIFT + N
3. Preferências
Você pode alterar as preferências, como a localização dos painéis (script, console, files, …), as cores, fontes, etc. Em ferramentas e opções globais:
Tools > Global Options…
4. Script / Console
O script e o console é que mais você vai utilizar nas suas análises, vamos ver o que eles são:
- Script = local onde escrevemos e salvamos os comandos das análises;
- Console = é saída, local onde visualizamos os resultados.
Em ferramentas e opções globais podemos alterar as posições desses dois painéis eu gosto de deixar eles lado à lado, eu acho que fica mais fácil de visualizar, porém é uma questão de preferência.
5. Limpar Console
Para limpar o console basta clicar em CTRL + L.
6. Executar
Para executar um código basta clicar na linha que você quer executar e clicar em CTRL + ENTER ou então pode selecionar várias linhas e clicar em CTRL + ENTER (Atenção se estiver no R e não no R Studio deve clicar em CTRL +R).
Ou apertar o botão Run, no script.
7. Comandos de Ajuda
Se tiver alguma dúvida sobre algum comando ou algum pacote, existem três comandos de ajuda que são os seguintes:
help.start()help(‘o que você quer pesquisar’)?(‘o que você quer pesquisar’)
Após executar o comando vai abrir uma página com a possível resposta.
8. Limpar Dados Armazenados
Quando você faz uma análise o R armazena os resultados,então sempre ao iniciar uma nova análise é interessante que você limpe os dados armazenados para não gerar confusão, o comando para isso é:
rm(list=ls())
9. Comentários
É importante utilizar comentários para identificar a análise que você está realizando, identificar abreviações ou documentar o seu código, no R você utiliza o simbolo # no início da linha de comentário.
10. Instalando Pacotes — Extensões
Os pacotes, são extensões para realizar algumas análises que não estão no padrão R. Como o R é colaborativo existe um grande número de pacotes (extensão) para nos auxiliar nas análises.
install.packages(‘pacote’, dep=T)
11. Carregando os Pacotes
Quando formos utilizar um pacote não basta ter ele instalado, precisamos ativá-lo e para isso você pode usar dois comandos:
library(pacote) #ourequire(pacote)
12. Conjunto de Dados
A entrada de dados para realizarmos as análises estatísticas é importante, podemos entrar com eles de várias maneiras.
A seguir temos uma tabela (conjunto de dados), vamos ver quatro formas diferentes de entrar com ela no R.
- Entrando com os dados por meio de Vetores
Para entrar com os vetores utilize o comando c, como descrito a seguir:
#Vetores:resposta <- c(35,19,31,15,30,40,35,46,41,33)croqui <- expand.grid(rep=1:5, trat=LETTERS[1:2])dados_1 <- data.frame(croqui, resposta)
- Acesso Fácil aos Dados
Para ter acesso fácil aos dados utilize o seguinte comando:
attach(dados_1)
- Tabela no R
Uma outra forma de entrar com os dados é por meio de uma tabela e o comando é seguinte:
dados_2 <- edit(data.frame())attach(dados_2)
- Utilizando Google Planilha
Eu gosto muito de entrar com os dados por meio de uma planilha do Google Drive.
Passo 1 - Criar uma planilha no Google Drive.
Passo 2 - Copiar o link da planilha em COMPARTILHAR.
Passo 3 - Instalar e carregar o pacote gsheet, e utilizar o comando a seguir:
install.packages(‘gsheet’, dep=T)
library(gsheet)
dados_3<-gsheet2tbl('link')
attach(dados_3)
13. Salvar Script
Para salvar um script basta ir em:
File > Save ou
File > Save As… ou
CTRL + S
14. Abrir Script
Para abrir um script basta ir em:
File > Open File… ou
CTRL + O
Conclusão
O que aprendemos hoje:
- O que é o ‘R’
- As vantagens de utilizar o ‘R’
- Baixar e instalar o ‘R’ e o ‘R Studio’
- Como é o ambiente do ‘R Studio’
- Aprendemos funções básicas do ‘R’
Agora você já é capaz de utilizar o R e o RStudio.