17
Introdução ao R Washington Junger 2016 Aula 1: Básico I Universidade do Estado do Rio de Janeiro Instituto de Medicina Social Departamento de Epidemiologia

aula-1.pdf

Embed Size (px)

Citation preview

1

Introdução ao R

Washington Junger

2016

Aula 1: Básico I

Universidade do Estado do Rio de Janeiro

Instituto de Medicina Social

Departamento de Epidemiologia

2

Apresentação

R é um ambiente de análise e programação estatística gratuito e open source

R é desenvolvido por estatísticos e está disponível para Windows, Mac e Linux

R é um projeto colaborativo com voluntários em todas as partes do mundo

Desenvolvimento do núcleo (programa principal)

Desenvolvedores de bibliotecas (pacotes)

Em 02/03/2016 havia 8006 pacotes no CRAN –há ainda repositórios de terceiros

O R está maduro e amplamente difundido

3

Sumário

Interface gráfica

Obtendo ajuda

Instalando bibliotecas

Uma calculadora

Ambiente de trabalho e objetos

Atribuição

Tipos de dados

Estrutura de dados

Tipos especiais de vetores

Edição de dados

Indexação de dados

4

Interface gráfica

Modo SDI ou MDI (à preferência do usuário)

SDI – cada janela tem seu próprio menu

MDI – o menu é contextual para a janela ativa

Menus principais

Arquivo

Editar

Misc

Pacotes

Ajuda

Pode ser diferente em outros sistemas operacionais

5

Interface SDI

6

Interface MDI

7

RStudio

8

Obtendo ajuda

Ajuda embutida / on-line

Clique no menu Ajuda

Digite help(nome_comando) ou ?nome_comando no sinal de pronto do console (>), por examplo,

> help(help)

Seção de documentação no site do R emwww.r-project.org

Listas de discussão R-help e SIG (SpecialInterest Group)

Listas de discussão e sítios de terceiros, i.e.,

http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/

9

Instalando bibliotecas

Localize-a no sítio do R

Instale!

Instalação pelo menu

Pacotes → Instalar pacotes

Selecione um ou mais pacotes

Instalação via linha de comando

install.packages('nome_pacote',dep=TRUE)

> install.packages('epicalc',dep=TRUE)

Instalação de pacotes em arquivos ‘zip’

10

Uma calculadora

R é uma calculadora avançada gigante

Entra expressão / comando → sai resultados

Operação aritméticas básicas

> 2 + 2

[1] 4

Uma operação mais elaborada

> exp(-2)

[1] 0.1353353

O número dentro dos colchetes é o índice do primeiro valor de cada linha

Vamos tentar rnorm(20)

11

Ambiente de trabalho e objetos

O console é uma representação física da área de trabalho

A área de trabalho é um repositório para os objetos

Objetos armazenam todos os tipos de dados (números, vetores, planilhas, funções, listas etc.)

Gerenciamento da área de trabalho

Criar objetos: por meio de atribuição

Listar objetos: objects() ou ls()

Verificar a existência de um objeto: exists('object')

Remover objetos: rm(obj1,obj2,...)

R é orientado a objeto → classes e métodos

12

Atribuição

Atribuição pode ser realizada por meio de:

Função assign('object',value), por exemplo,

> assign('s1',2+2)

Operadores de atribuição: = ou <-

> s2 = 3 + 5

Algumas regras para nomear os objetos:

R difere maiúsculas e minúsculas, i.e., b ≠ B

Não pode iniciar por número, mas pode conter números

Não pode conter espaços ou traços

Nomes compostos podem ser separados por “.” ou “_”

Objetos cujos nomes iniciam com “.” estarão ocultos

13

Tipos de dados

R pode processar diferentes tipos de dados

Tipos de dado primitivos como “integer”, “double”, “logical”, “character” etc.

> d = 3

> e = 4.51

> f = TRUE

> g = 'f'

Para obter o tipo de dado de um objeto use mode

> mode(f)

> mode(g)

Os modos “integer” e “double” são “numeric”

14

Estrutura de dados

Objetos de dados primitivos podem ser combinados para formar novas estrutura de dados

Vetores

Matrizes

Listas

Planilhas (data frames)

Vetor é uma estrutura de dados muito comum

A função c cria vetores

> peso= c(60,72,57,90,95,72)

> altura= c(1.75,1.80,1.65,1.90,1.74,1.91)

Tarefa: Calcule o IMC. imc=peso/altura^2

15

Tipos especiais de vetores

Vetores podem armazenar mais que números

> cores= c('yellow','blue','white')

> crianca= c(TRUE,TRUE,FALSE,TRUE)

Sequências regulares: seq(from,to,by)

> 1:10

> seq(1,10)

> seq(1,10,2)

Repetições: rep(x,times,each)

> rep(1,2)

> rep(1:4,2)

> rep(1:4,each=2)

16

Edição de dados

Dados podem ser armazenados em matrizes ou planilhas (data frames)

> estatura= cbind(peso,altura,imc)

Dados podem ser editados usando o editor interno

> fix(estatura)

Convertendo matrizes para planilha

> estatura= as.data.frame(estatura)

Planilhas armazenam diferentes tipos de dados

> estatura$sexo = c('F','M','M','F','F','M')

Palnilhas têm atributos, i.e., nomes de linhas e colunas

> names(estatura)

17

Indexação de dados

Valores podem ser extraídos de estruturas de dados usando o operador [ ]

vetor[i] extrai o i-ésimo elemento de vetor

> imc[5]

planilha[i,j] extrai o elemento da i-ésima linha e j-

ésima coluna de planilha

> estatura[5,3]

> estatura[,-3]

Pode-se usar também o nome da variável

> estatura['imc']

Um vetor de índices permite extração múltipla