Upload
camila-andrade
View
217
Download
0
Embed Size (px)
Citation preview
1
Introdução ao R
Washington Junger
2016
Aula 1: Básico I
Universidade do Estado do Rio de Janeiro
Instituto de Medicina Social
Departamento de Epidemiologia
2
Apresentação
R é um ambiente de análise e programação estatística gratuito e open source
R é desenvolvido por estatísticos e está disponível para Windows, Mac e Linux
R é um projeto colaborativo com voluntários em todas as partes do mundo
Desenvolvimento do núcleo (programa principal)
Desenvolvedores de bibliotecas (pacotes)
Em 02/03/2016 havia 8006 pacotes no CRAN –há ainda repositórios de terceiros
O R está maduro e amplamente difundido
3
Sumário
Interface gráfica
Obtendo ajuda
Instalando bibliotecas
Uma calculadora
Ambiente de trabalho e objetos
Atribuição
Tipos de dados
Estrutura de dados
Tipos especiais de vetores
Edição de dados
Indexação de dados
4
Interface gráfica
Modo SDI ou MDI (à preferência do usuário)
SDI – cada janela tem seu próprio menu
MDI – o menu é contextual para a janela ativa
Menus principais
Arquivo
Editar
Misc
Pacotes
Ajuda
Pode ser diferente em outros sistemas operacionais
8
Obtendo ajuda
Ajuda embutida / on-line
Clique no menu Ajuda
Digite help(nome_comando) ou ?nome_comando no sinal de pronto do console (>), por examplo,
> help(help)
Seção de documentação no site do R emwww.r-project.org
Listas de discussão R-help e SIG (SpecialInterest Group)
Listas de discussão e sítios de terceiros, i.e.,
http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/
9
Instalando bibliotecas
Localize-a no sítio do R
Instale!
Instalação pelo menu
Pacotes → Instalar pacotes
Selecione um ou mais pacotes
Instalação via linha de comando
install.packages('nome_pacote',dep=TRUE)
> install.packages('epicalc',dep=TRUE)
Instalação de pacotes em arquivos ‘zip’
10
Uma calculadora
R é uma calculadora avançada gigante
Entra expressão / comando → sai resultados
Operação aritméticas básicas
> 2 + 2
[1] 4
Uma operação mais elaborada
> exp(-2)
[1] 0.1353353
O número dentro dos colchetes é o índice do primeiro valor de cada linha
Vamos tentar rnorm(20)
11
Ambiente de trabalho e objetos
O console é uma representação física da área de trabalho
A área de trabalho é um repositório para os objetos
Objetos armazenam todos os tipos de dados (números, vetores, planilhas, funções, listas etc.)
Gerenciamento da área de trabalho
Criar objetos: por meio de atribuição
Listar objetos: objects() ou ls()
Verificar a existência de um objeto: exists('object')
Remover objetos: rm(obj1,obj2,...)
R é orientado a objeto → classes e métodos
12
Atribuição
Atribuição pode ser realizada por meio de:
Função assign('object',value), por exemplo,
> assign('s1',2+2)
Operadores de atribuição: = ou <-
> s2 = 3 + 5
Algumas regras para nomear os objetos:
R difere maiúsculas e minúsculas, i.e., b ≠ B
Não pode iniciar por número, mas pode conter números
Não pode conter espaços ou traços
Nomes compostos podem ser separados por “.” ou “_”
Objetos cujos nomes iniciam com “.” estarão ocultos
13
Tipos de dados
R pode processar diferentes tipos de dados
Tipos de dado primitivos como “integer”, “double”, “logical”, “character” etc.
> d = 3
> e = 4.51
> f = TRUE
> g = 'f'
Para obter o tipo de dado de um objeto use mode
> mode(f)
> mode(g)
Os modos “integer” e “double” são “numeric”
14
Estrutura de dados
Objetos de dados primitivos podem ser combinados para formar novas estrutura de dados
Vetores
Matrizes
Listas
Planilhas (data frames)
Vetor é uma estrutura de dados muito comum
A função c cria vetores
> peso= c(60,72,57,90,95,72)
> altura= c(1.75,1.80,1.65,1.90,1.74,1.91)
Tarefa: Calcule o IMC. imc=peso/altura^2
15
Tipos especiais de vetores
Vetores podem armazenar mais que números
> cores= c('yellow','blue','white')
> crianca= c(TRUE,TRUE,FALSE,TRUE)
Sequências regulares: seq(from,to,by)
> 1:10
> seq(1,10)
> seq(1,10,2)
Repetições: rep(x,times,each)
> rep(1,2)
> rep(1:4,2)
> rep(1:4,each=2)
16
Edição de dados
Dados podem ser armazenados em matrizes ou planilhas (data frames)
> estatura= cbind(peso,altura,imc)
Dados podem ser editados usando o editor interno
> fix(estatura)
Convertendo matrizes para planilha
> estatura= as.data.frame(estatura)
Planilhas armazenam diferentes tipos de dados
> estatura$sexo = c('F','M','M','F','F','M')
Palnilhas têm atributos, i.e., nomes de linhas e colunas
> names(estatura)
17
Indexação de dados
Valores podem ser extraídos de estruturas de dados usando o operador [ ]
vetor[i] extrai o i-ésimo elemento de vetor
> imc[5]
planilha[i,j] extrai o elemento da i-ésima linha e j-
ésima coluna de planilha
> estatura[5,3]
> estatura[,-3]
Pode-se usar também o nome da variável
> estatura['imc']
Um vetor de índices permite extração múltipla