44
Vari´ aveis Frequˆ encias Gr´ aficos Medidas de Posi¸c˜ ao Medidas de Dispers˜ ao Medidas Complementares Inferˆ encia Tipos de Vari´ aveis Problema Motivador: Um pesquisador est´ a interessado em fazer um levantamento sobre aspectos s´ ocio-econˆ omicos dos empregados da se¸c˜ ao de or¸ camentos de uma companhia (vide tabela). Algumas vari´ aveis como sexo, escolaridade e estado civil, tˆ em como poss´ ıveis respostas uma descri¸ ao ou qualidade do indiv´ ıduo, e portanto ao chamadas de vari´ aveis qualitativas. J´ a vari´ aveis como n´ umero de filhos e sal´ ario tˆ em como poss´ ıveis respostas um n´ umero, um valor, uma quantidade, e portanto s˜ ao chamadas de vari´ aveis quantitativas. Notas de Aula da Professora Ver´onica Gonz´ alez-L´opez,digitadasporBeatrizCuyabano,P´os-Gradua¸c˜ ao IMECC/UNICAMP

Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Tipos de Variaveis

Problema Motivador:

Um pesquisador esta interessado em fazer um levantamento sobre

aspectos socio-economicos dos empregados da secao de orcamentos de

uma companhia (vide tabela).

Algumas variaveis como sexo, escolaridade e estado civil, tem como

possıveis respostas uma descricao ou qualidade do indivıduo, e portanto

sao chamadas de variaveis qualitativas. Ja variaveis como numero de

filhos e salario tem como possıveis respostas um numero, um valor, uma

quantidade, e portanto sao chamadas de variaveis quantitativas.

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 2: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Variaveis

Qualitativa

Nominal

Nao existe ordenacao nas possıveis respostas (ex: sexo, estado civil)

Ordinal

Existe uma certa ordem nas possıveis respostas (ex: escolaridade)

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 3: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Tipos de Variaveis

Quantitativa

Discreta

Os possıveis valores formam um conjunto finito ou enumeravel de

numeros, sao variaveis de contagem (ex: numero de filhos)

Contınua

Os possıveis valores estao dentro de um intervalo, aberto ou

fechado, dos numeros reais (ex: peso de um indivıduo)

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 4: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Distribuicao de Frequencias

Objeto de estudo: variavel (ex: peso)

Elemento para montar o estudo: realizacoes (valores observados) da

variavel

Objetivo conhecer a distribuicao dessa variavel aleatoria

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 5: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Distribuicao de Frequencias

Exemplo: Grau de escolaridade (variavel qualitativa ordinal)

# total de empregados = 36

# empregados com Ensino Fundamental = 12

# empregados com Ensino Medio = 18

# empregados com Ensino Superior = 6

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 6: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Distribuicao de Frequencias

Grau de Instrucao Frequencia (ni ) Proporcao (fi ) % (100× fi )

Ensino Fundamental 12 0.3333 33.33

Ensino Medio 18 0.5000 50.00

Ensino Superior 6 0.1667 16.67

Total 36 1.0000 100.00

fi = ni36

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 7: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Distribuicao de Frequencias

Exemplo: Salario (variavel quantitativa contınua)

Agrupar os dados por faixas de valores

# total de empregados = 36

# empregados com salario na faixa 4.00-8.00 = 10

# empregados com salario na faixa 8.00-12.00 = 12

# empregados com salario na faixa 12.00-16.00 = 8

# empregados com salario na faixa 16.00-20.00 = 5

# empregados com salario na faixa 20.00-24.00 = 1

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 8: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Distribuicao de Frequencias

Faixa salarial Frequencia (ni ) Proporcao (fi ) % (100× fi )

4.00-8.00 10 0.2778 27.78

8.00-12.00 12 0.3333 33.33

12.00-16.00 8 0.2222 22.22

16.00-20.00 5 0.1389 13.89

20.00-24.00 1 0.0278 2.78

Total 36 1.0000 100.00

fi = ni36

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 9: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Distribuicao de Frequencias

Escolha dos intervalos: arbitraria seguindo os indicadores

um numero pequeno de classes → perda de informacao

um numero grande de classes → perda da visao geral dos dados

como um conjunto

sugestao: 5 a 15 classes com a mesma amplitude

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 10: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Representacao Grafica das Variaveis Quantitativas

Objetivo: estudar a distribuicao de frequencias de uma variavel

Exemplo: numero de filhos dos empregados casados

Numero de filhos (xi ) Frequencia (ni ) Proporcao (fi ) % (100× fi )

0 4 0.20 20

1 5 0.25 25

2 7 0.35 35

3 3 0.15 15

5 1 0.05 5

Total 20 1.0000 100.00

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 11: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Representacao Grafica de Variaveis Quantitativas

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 12: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Representacao Grafica de Variaveis Quantitativas

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 13: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Representacao Grafica de Variaveis Contınuas

Dados de salario: sao utilizados os pontos medios das faixas salariais

Salario medio Frequencia (ni ) Proporcao (fi ) % (100× fi )

6.00 10 0.2778 27.78

10.00 12 0.3333 33.33

14.00 8 0.2222 22.22

18.00 5 0.1389 13.89

22.00 1 0.0278 2.78

Total 36 1.0000 100.00

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 14: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Representacao Grafica de Variaveis Contınuas

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 15: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Representacao Grafica de Variaveis Contınuas

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 16: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Representacao Grafica de Variaveis Contınuas

Melhor representacao dos dados: Histograma

Associa a frequencia aos intervalos de valores, e nao mais ao ponto

medio

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 17: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Representacao Grafica de Variaveis Contınuas

Ramo e Folhas

Objetivo: obter informacao da distribuicao dos dados

Caracterıstica: Nao perde informacao sobre os dados

Cada informacao e dividida em duas partes: a primeira (ramo) e

colocada a esquerda da linha vertical, e a segunda (folhas) a direita

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 18: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Representacao Grafica de Variaveis Contınuas

4 00 56

5 25 73

6 26 66 86

7 39 44 59

8 12 46 74 95

9 13 35 77 80

10 53 76

11 06 59

12 00 79

13 23 60 85

14 69 71

15 99

16 22 61

17 26

18 75

19 40

20

21

22

23 30

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 19: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Posicao

Proposito: resumir os dados, atraves de valores que representam o

conjunto

Medidas de posicao central

Media aritmetica (Me)

Mediana (Md)

Moda (Mo)

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 20: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Posicao

Moda

Resultado mais frequente, obtido em um conjunto de dados

observados

No exemplo do numero de filhos, Mo = 2

E interessante notar que qualquer conjunto de dados pode

apresentar mais de uma moda, sendo entao bimodal, trimodal, etc.

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 21: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Posicao

Mediana

Resultado que ocupa a posicao central em um conjunto de dados

ordenados de forma crescente

Numero ımpar de observacoes: utiliza-se a observacao central

ex: 3, 4, 7, 8, 8

Md = 7

Numero par de observacoes: utiliza-se a media aritmetica das duas

observacoes centrais

ex: 3, 4, 7, 8, 8, 9

Md = 7+82

= 7.5

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 22: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Posicao

Media

Soma dos valores observados dividida pelo numero total de

observacoes

ex: 3, 4, 7, 8, 8 → Me = 3+4+7+8+85 = 30

5 = 6

No exemplo do numero de filhos Me = 1.65

Expressao geral

Me (X ) =x1 + ... + xk

k=

1

k

k∑i=1

xi

x1, ..., xk sao os valores observados para uma variavel de estudo X

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 23: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Posicao

Caso particular:

n1 observacoes sao iguais a x1

n2 observacoes sao iguais a x2...

nk observacoes sao iguais a xk

tal que: n1 + n2 + ... + nk =∑k

i=1 ni = n

Me(X ) =n1x1 + n2x2 + ... + nkxk

n=

1

n

k∑i=1

nixi =k∑

i=1

ninxi =

k∑i=1

fixi

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 24: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Posicao

No exemplo do numero de filhos

n1 = 4, x1 = 0

n2 = 5, x2 = 1

n3 = 7, x3 = 2

n4 = 3, x4 = 3

n5 = 1, x5 = 5

n1 + n2 + ... + nk =

∑ki=1 ni = n

entao,

Me(X ) =4× 0 + 5× 1 + 7× 2 + 3× 3 + 1× 5

20= 1.65

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 25: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Posicao

Analise 1

Conjunto de dados D1 = {2, 2.5, 3, 4.3, 2.9}

Ordenando de forma crescente D′

1 = {2, 2.5, 2.9, 3, 4.3}

Md = 2.9

Me = 2+2.5+2.9+3+4.35 = 2.94

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 26: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Posicao

Analise 2

Conjunto de dados D2 = {2, 7, 3, 4.3, 2, 9}

Ordenando de forma crescente D′

2 = {2, 2.8, 3, 4.3, 7}

Md = 3

Me = 2+2.8+3+4.3+75 = 3.84

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 27: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Posicao

Observacao

Na primeira e segunda analise a mediana tem valores proximos (2.9 e 3),

no entanto, a media tem uma diferenca de quase 1 unidade (2.94 e

3,84). Com isso em vista, podemos definir a propriedade de robustez da

mediana.

A mediana e uma medida mais robusta que a media, quando submetida a

mudancas nos valores observados, ou a incorporacao de mais observacoes

no conjunto de dados original.

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 28: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Posicao

Analise 3

Conjunto de dados D3 = {2, 2.5, 3, 4.3, 2.9, 7}

Ordenando de forma crescente D′

3 = {2, 2.5, 2.9, 3, 4.3, 7}

Md = 2.9+32

Me = 2+2.5+2.9+3+4.3+76 = 3.62

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 29: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Posicao

Comparacao entre as Analise dos Conjuntos de dados

Dados Md Me

D1 2.9 2.94

D2 3 3.84

D3 2.95 3.62

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 30: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Dispersao

Proposito: obter uma medida que sumarize a variabilidade, uma vez

que conjuntos de dados diferentes podem apresentar uma mesma

medida de posicao.

Por exemplo, A = {3, 4, 5, 6, 7} e B = {5, 5, 5, 5, 5} tem a mesma

media: Me = 5

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 31: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Dispersao

Desvio: afastamento de uma observacao de uma determinada

medida de posicao

ex: A = {3, 4, 5, 6, 7}

Me = 5

Desvios = {3− 5, 4− 5, 5− 5, 6− 5, 7− 5} = {−2,−1, 0, 1, 2}

ex: B = {5, 5, 5, 5, 5}

Me = x5

Desvios = {5− 5, 5− 5, 5− 5, 5− 5, 5− 5} = {0, 0, 0, 0, 0}

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 32: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Dispersao

Medidas ”globais”de desvio na amostra de dados:∑5i=1 |xi − x |∑5i=1 (xi − x)2

Ambas as medidas evitam que desvios iguais em modulo, mas com

sinais opostos se anulem

Desvio Medio

DM(X ) =∑n

i=1|xi−x|

n

Variancia

Var(X ) =∑n

i=1(xi−x)2

n

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 33: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Dispersao

ex: A = {3, 4, 5, 6, 7}

DM(A) = |−2|+|−1|+|0|+|1|+|2|5 = 6

5 = 1.2

Var(A) = (−2)2+(−1)2+02+12+22

5 = 105 = 2

ex: B = {5, 5, 5, 5, 5}

DM(A) = |0|+|0|+|0|+|0|+|0|5 = 0

5 = 0

Var(A) = 02+02+02+02+02

5 = 05 = 0

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 34: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas de Dispersao

Desvio Padrao

DP(X ) =√

Var(X )

ex: DP(A) =√

2 = 1.41

ex: DP(B) =√

0 = 0

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 35: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas Complementares para Analise de Dados

Extremos

O menor e o maior valor do conjunto de dados

Quartis (Q) ou Juntas (J)

1o Quartil: deixa um quarto dos valores abaixo, e tres quartos acima

dele

2o Quartil = Mediana: deixa metade dos valores abaixo, e metade

acima dele

3o Quartil: deixa tres quartos dos valores abaixo, e um quarto acima

dele

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 36: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas Complementares para Analise de Dados

Exemplo: Variavel Salario

Md = 9.8+10.532

= 10.17

Q1 = J1 = 7.44+7.592

= 7.52

Q3 = J3 = 13.85+14.692

= 14.27

Ei = 4.00 (menor valor)

Es = 23.30 (maior valor)

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 37: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas Complementares para Analise de Dados

Esquema dos Cinco Numeros

36

Md 10.17

J 7.52 14.27

E 4.00 23.30

Cada uma das componentes do esquema dos cinco numeros e uma

medida robusta de dados, e e tambem uma estatıstica de ordem.

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 38: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Medidas Complementares para Analise de Dados

Intervalo Interquartil: A medida de dispersao ”intervalo

interquartil”pode ser considerada uma medida robusta de dispersao.

dJ = J3 − J1 = Q3 − Q1

No exemplo do salario: dJ = 14.27− 7.52 = 6.75

Dispersao Inferior: J2 − Ei

Dispersao Superior: Es − J2

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 39: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Inferencia

Se a distribuicao dos dados que estudamos e simetrica, esperamos que:

a distribuicao inferior seja aproximadamente igual a superior

J2 − Ei ≈ Es − J2

J2 − J1 ≈ J3 − J2

J1 − Ei ≈ Es − J3

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 40: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Inferencia

Box Plot

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 41: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Inferencia

Os valores que estao muito distantes de J1 e J3 sao chamados

outliers (observacoes discrepantes)

observacoes menores que J1 − 32dJ

observacoes maiores que J3 + 32dJ

A partir do retangulo, para cima e para baixo, seguem linhas ate o

ponto de observacao mais remoto, que nao seja outlier

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 42: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Inferencia

O desenho da uma ideia de:

posicao: J1, J2, J3

dispersao: dJ

assimetria: J3 − J2; J2 − J1

caudas: comprimento das linhas que seguem desde o retangulo

dados discrepantes:

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 43: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Inferencia

Exemplo

J1 = 7.52 Ei = 4.00

J2 = 10.17 Es = 23.30

J3 = 14.27 dJ = 6.75

J2 − J1 = 2.65

J3 − J2 = 4.1

J1 − 32dJ = −2.605

J3 + 32dJ = 24.395

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP

Page 44: Tipos de Vari aveis - Unicampveronica/Coordenadas1s/aula1.pdf · Vari aveisFrequ^enciasGr a cosMedidas de Posi˘c~aoMedidas de Dispers~aoMedidas ComplementaresInfer^encia Vari aveis

Variaveis Frequencias Graficos Medidas de Posicao Medidas de Dispersao Medidas Complementares Inferencia

Inferencia

Notas de Aula da Professora Veronica Gonzalez-Lopez, digitadas por Beatriz Cuyabano, Pos-Graduacao IMECC/UNICAMP