57
1 Análise de Dados 5 1 7 Análise de Dados Análise de Dados Apresentação Apresentação de Dados de Dados

Aula 2 - Organizacao de Dados

Embed Size (px)

Citation preview

Page 1: Aula 2 - Organizacao de Dados

11Análise de Dados

5

1

7

Análise de DadosAnálise de Dados

Apresentação Apresentação

de Dadosde Dados

Page 2: Aula 2 - Organizacao de Dados

22Análise de Dados

5

1

7

• Tabelas de Frequências;• Diagramas de Barras;• Diagramas Circulares;• Histogramas;• Polígonos de Frequências;• Polígonos de Frequências Acumuladas.

APRESENTAÇÃO DE DADOS

Page 3: Aula 2 - Organizacao de Dados

33Análise de Dados

5

1

7

Modalidade

Frequência Absoluta

(fi)

Freq. Absoluta

Acumulada

(Fi)

Freq. Relativa

Acumulada

(Fri)

Frequência Relativa

(fri)

TABELAS DE FREQUÊNCIAS

Page 4: Aula 2 - Organizacao de Dados

44Análise de Dados

5

1

7

• ffii – Frequência Absoluta duma modalidade é o número de ocorrências dessa modalidade

• ffriri – Frequência Relativa é o quociente entre o número de ocorrências e a dimensão da amostra

• FFii – Frequência Absoluta Acumulada duma modalidade é a soma das frequências absolutas dessa modalidade e de todas as que lhe forem anteriores

• FFriri - Frequência Relativa Acumulada duma modalidade é a soma das frequências relativas dessa modalidade e de todas as que lhe forem anteriores

TABELAS DE FREQUÊNCIAS

Page 5: Aula 2 - Organizacao de Dados

55Análise de Dados

5

1

7

Dados Qualitativos

TABELAS DE FREQUÊNCIAS

Curso fi fri Fi Fri

PM 46 0,27

CE 42 0,25

Jorn 43 0,26

AM 37 0,22

Total 168 1,00

Page 6: Aula 2 - Organizacao de Dados

66Análise de Dados

5

1

7

Diagrama de Barras

Diagrama Circular

REPRESENTAÇÃO GRÁFICA

Número de alunos por curso

0

10

20

30

40

50

PM CE Jorn AM

PM27%

CE25%

Jorn26%

AM22%

Page 7: Aula 2 - Organizacao de Dados

77Análise de Dados

5

1

7

Dados Quantitativos Discretos

Num inquérito realizado a 17 pessoas uma das questões era:“Quantos irmãos tem?”. Obteve-se a seguinte amostra:

1 3 0 2 3 2 2 1 1 1 2 0 2 1 4 0 2

TABELAS DE FREQUÊNCIAS

Page 8: Aula 2 - Organizacao de Dados

88Análise de Dados

5

1

7

Nº de Irmãos

Frequência Absoluta

(fi)

Freq. Absoluta

Acumulada

(Fi)

Freq. Relativa

Acumulada

(Fri)

0 3 3/17 0,1765 3 0,176470591 5 5/17 0,2941 8 0,470588242 6 6/17 0,3529 14 0,823529413 2 2/17 0,1176 16 0,941176474 1 1/17 0,0588 17 1

TOTAL 17 1

Frequência Relativa

(fri)

TABELAS DE FREQUÊNCIAS

Page 9: Aula 2 - Organizacao de Dados

99Análise de Dados

5

1

7

Dados Quantitativos ContínuosTABELAS DE FREQUÊNCIAS

xi fi fri Fi Fri

125 1 0,007 1 0,007

128 1 0,007 2 0,014

129 1 0,007 3 0,022

130 2 0,014 5 0,036

135 1 0,007 6 0,043

138 1 0,007 7 0,050

139 1 0,007 8 0,058

140 6 0,043 14 0,101

141 1 0,007 15 0,108

142 1 0,007 16 0,115

147 5 0,036 21 0,151

148 3 0,022 24 0,173

149 1 0,007 25 0,180

150 11 0,079 36 0,259

151 2 0,014 38 0,273

152 5 0,036 43 0,309

153 8 0,058 51 0,367

154 9 0,065 60 0,432

155 10 0,072 70 0,504

159 4 0,029 91 0,655

160 6 0,043 97 0,698

161 3 0,022 100 0,719

162 3 0,022 103 0,741

163 5 0,036 108 0,777

164 3 0,022 111 0,799

165 2 0,014 113 0,813

166 5 0,036 118 0,849

167 2 0,014 120 0,863

168 5 0,036 125 0,899

169 1 0,007 126 0,906

170 2 0,014 128 0,921

171 1 0,007 129 0,928

173 1 0,007 130 0,935

174 1 0,007 131 0,942

175 2 0,014 133 0,957

176 1 0,007 134 0,964

180 2 0,014 136 0,978

185 1 0,007 137 0,986

Page 10: Aula 2 - Organizacao de Dados

1010Análise de Dados

5

1

7

1. Amplitude da Amostra;2. Número de classes;3. Amplitude de cada classe;4. Limites.

TABELAS DE FREQUÊNCIAS

Dados Quantitativos Contínuos

Agrupamento em classes:

Page 11: Aula 2 - Organizacao de Dados

1111Análise de Dados

5

1

7

Dados Quantitativos Contínuos

Amplitude da Amostra

A = xmax – xmin

No exemplo:

A = 185 – 125 = 60

TABELAS DE FREQUÊNCIAS

Page 12: Aula 2 - Organizacao de Dados

1212Análise de Dados

5

1

7

Número de Classes

K = n

No exemplo:

= 137 = 11,7 12

Dados Quantitativos ContínuosTABELAS DE FREQUÊNCIAS

Page 13: Aula 2 - Organizacao de Dados

1313Análise de Dados

5

1

7

Amplitude de cada classe

a = A / K

No exemplo:

A = 60 ; K = 12a = 60/12 = 5

Dados Quantitativos ContínuosTABELAS DE FREQUÊNCIAS

Page 14: Aula 2 - Organizacao de Dados

1414Análise de Dados

5

1

7

Limites

1. [125, 130]: compreende todos os valores entre 125 e 1302. [125,130[: compreende todos os valores entre 125 e 130,

excluindo o 1303. ]125,130]: compreende todos os valores entre 125 e 130,

excluindo o 125

Dados Quantitativos Contínuos

O ponto médio da classe é a média aritmética entre o limite superior e inferior da classe. Neste caso: (125 + 130)/2 = 127,5

TABELAS DE FREQUÊNCIAS

Page 15: Aula 2 - Organizacao de Dados

1515Análise de Dados

5

1

7

Dados Quantitativos ContínuosTABELAS DE FREQUÊNCIAS

xi fi fri Fi Fri

[125;130[ 3 0,022 3 0,022

[130;135[ 2 0,014 5 0,036

[135;140[ 3 0,022 8 0,058

[140;145[ 8 0,058 16 0,115

[145;150[ 9 0,065 25 0,180

[150;155[ 35 0,252 60 0,432

[155;160[ 31 0,223 91 0,655

[160;165[ 20 0,144 111 0,799

[165;170[ 15 0,108 126 0,906

[170;175[ 5 0,036 131 0,942

[175;180[ 3 0,022 134 0,964

[180;185] 3 0,036 137 1,000

Total 137 1,000    

Page 16: Aula 2 - Organizacao de Dados

1616Análise de Dados

5

1

7

Histograma de Frequências Polígono de Frequências

REPRESENTAÇÃO GRÁFICA

125 130 135 140 145 150 155 160 165 170 175 180 185

Classificação de entrada na ESCS

0

10

20

30

40

Fre

qu

enci

a

Mean = 156,23Std. Dev. = 10,882N = 139

05

10152025303540

Freq

uênc

ia

Page 17: Aula 2 - Organizacao de Dados

1717Análise de Dados

5

1

7

Polígono de Frequências Acumuladas

REPRESENTAÇÃO GRÁFICA

00,20,40,60,8

11,2

Fre

qu

ên

cia

Re

lati

va

Ac

um

ula

da

Page 18: Aula 2 - Organizacao de Dados

1818Análise de Dados

5

1

7

Tabelas de Tabelas de ContingênciaContingência

Análise de DadosAnálise de Dados

Page 19: Aula 2 - Organizacao de Dados

1919Análise de Dados

5

1

7

Castanhos Azuis

Morena 14 4Loira 9 17

Olhos

Tipo

Valores Observados

Relacionam a frequência de duas grandezas

TABELAS DE CONTINGÊNCIA

Page 20: Aula 2 - Organizacao de Dados

2020Análise de Dados

5

1

7

Castanhos Azuis

Morena 14 4Loira 9 17

Olhos

Tipo

Valores Observados

Total

1826

Marginal Tipo

Total 23 21

Marginal Cor Olhos

44

NN

TABELAS DE CONTINGÊNCIA

Page 21: Aula 2 - Organizacao de Dados

2121Análise de Dados

5

1

7

A tabela seguinte resultou de uma investigação para estudar como três tipos de materiais reagiram a um tratamento térmico:

TABELAS DE CONTINGÊNCIA

DestruídosPeq.

DefeitosPerfeitos Total

A 20 40 40 100B 90 70 40 200C 80 70 50 200

Total 190 180 130 500

Page 22: Aula 2 - Organizacao de Dados

2222Análise de Dados

5

1

7

• Havia 100 unidades do material A das quais 20 foram destruídas, 40 ficaram com pequenos defeitos e outros 40 ficaram em bom estado;

• De todos os tipos de material, 190 foram destruídas, 180 ficaram com pequenos defeitos e 130 ficaram perfeitos;

• Ficaram perfeitos 40 unidades do material A, 40 do material B e 50 do C;

• ....

TABELAS DE CONTINGÊNCIA

Page 23: Aula 2 - Organizacao de Dados

2323Análise de Dados

5

1

7

DestruídosPeq.

DefeitosPerfeitos Total

A 0,04 0,08 0,08 0,2B 0,18 0,14 0,08 0,4C 0,16 0,14 0,10 0,4

Total 0,38 0,36 0,26 1,0

Tabela de frequências relativas:

• O material A representava 20% do total dos materiais, o B 40% e o C, também 40%;

• 38% do total do material foi destruído, 36% ficou com pequenos defeitos e 26% ficou em boas condições.

TABELAS DE CONTINGÊNCIA

Page 24: Aula 2 - Organizacao de Dados

2424Análise de Dados

5

1

7

DestruídosPeq.

DefeitosPerfeitos Total

A 0,04 0,08 0,08 0,2B 0,18 0,14 0,08 0,4C 0,16 0,14 0,10 0,4

Total 0,38 0,36 0,26 1,0

• Qual percentagem de material A que ficou destruído?

• Qual a percentagem de material tipo C que não ficou perfeito?

• Quantas unidades do material do tipo B foram utilizadas no teste?

• Considerando só o material do tipo A, qual a percentagem do que ficou destruído, com pequenos defeitos e perfeito?

• Do material que ficou perfeito, qual a percentagem de cada tipo?

TABELAS DE CONTINGÊNCIA

Page 25: Aula 2 - Organizacao de Dados

2525Análise de Dados

5

1

7

Medidas Medidas DescritivasDescritivas

Análise de DadosAnálise de Dados

Page 26: Aula 2 - Organizacao de Dados

2626Análise de Dados

5

1

7

Medidas de Posição;

Medidas de Dispersão;

Medidas de Associação.

MEDIDAS DESCRITIVAS

Page 27: Aula 2 - Organizacao de Dados

2727Análise de Dados

5

1

7

Medidas de Posição

Medidas de Tendência Central:

Média, Mediana, Moda (identificam o centro

da distribuição)

Quantis:

Quartis, Decis, Percentis (indicam outras

posições)

MEDIDAS DESCRITIVAS

Page 28: Aula 2 - Organizacao de Dados

2828Análise de Dados

5

1

7

Medidas de Tendência Central

Média

x = xi

n OU xi . fi

nx =

xi – Valores Observadosfi – Frequência Absolutan – Dimensão da Amostra

Dados desagrupados

Dados Agrupados

MEDIDAS DESCRITIVAS

Page 29: Aula 2 - Organizacao de Dados

2929Análise de Dados

5

1

7

Calcular a média para o conjunto de valores:17, 18, 19, 20, 21, 22, 57

x = xi

n= 24,9

MEDIDAS DESCRITIVASMedidas de Tendência Central

Média

Page 30: Aula 2 - Organizacao de Dados

3030Análise de Dados

5

1

7

MEDIDAS DESCRITIVASMedidas de Tendência Central

Média

AnosTaxas de

JuroFactor de

Crescimento1 7% 1,072 8% 1,083 10% 1,14 12% 1,125 18% 1,18

11,15

18,112,11,108,107,1

x

Média aritmética dos factores de crescimento

Page 31: Aula 2 - Organizacao de Dados

3131Análise de Dados

5

1

7

MEDIDAS DESCRITIVASMedidas de Tendência Central

Média (dados em tabela de frequências)

Nº de Irmãos

Frequência Absoluta

(fi)

Freq. Absoluta

Acumulada

(Fi)

Freq. Relativa

Acumulada

(Fri)

0 3 3/17 0,1765 3 0,176470591 5 5/17 0,2941 8 0,470588242 6 6/17 0,3529 14 0,823529413 2 2/17 0,1176 16 0,941176474 1 1/17 0,0588 17 1

TOTAL 17 1

Frequência Relativa

(fri)

x = xifi

n= 6,1

17

4x13x22x61x50x3

Page 32: Aula 2 - Organizacao de Dados

3232Análise de Dados

5

1

7

MEDIDAS DESCRITIVASMedidas de Tendência Central

Média Geométrica

1093,1

679965,1

18,112,11,108,107,1

5

521

xxxx...x.xxMG nn

Média Geométrica do factor de crescimento

Page 33: Aula 2 - Organizacao de Dados

3333Análise de Dados

5

1

7

1. É a observação que fica a meio da distribuição ordenada (conjunto ímpar de dados);

2. É a média entre as observações que ficam a meio da distribuição (num conjunto par de dados)

3. Na tabela de frequências, é o valor onde a distribuição atinge os 50% dos dados.

MEDIDAS DESCRITIVASMedidas de Tendência Central

Mediana

Page 34: Aula 2 - Organizacao de Dados

3434Análise de Dados

5

1

7

P(Me) =N + 1

2

1) Se N Ímpar:

MEDIDAS DESCRITIVASMedidas de Tendência Central

Posição da Mediana

EXEMPLO:

17, 18, 19, 20, 21, 22, 57N=7

P(Me) =7 + 1

2= 4

Me= 20

Page 35: Aula 2 - Organizacao de Dados

3535Análise de Dados

5

1

7

MEDIDAS DESCRITIVASMedidas de Tendência Central

Posição da Mediana

2) Se N Par:

P1 =N2

e P2 =N + 2

2EXEMPLO

17, 18, 19, 20, 21, 22, 35, 57N=8

Me =20 + 21

2= 20,5

Me =xP1 + xP2

2

Page 36: Aula 2 - Organizacao de Dados

3636Análise de Dados

5

1

7

MEDIDAS DESCRITIVASMedidas de Tendência Central

Posição da Mediana

3) Na Tabela de Frequências:

Notas fi Fi

1 1 12 3 43 10 144 8 225 4 26

Total 26

Me = (x13 + x14)/2Me = (3 + 3)/2 = 3

Page 37: Aula 2 - Organizacao de Dados

3737Análise de Dados

5

1

7

1. É o valor mais frequente da distribuição;2. Para variáveis qualitativas nominais é a única

calculável.

MEDIDAS DESCRITIVASMedidas de Tendência Central

Moda

Page 38: Aula 2 - Organizacao de Dados

3838Análise de Dados

5

1

7

12 13 14 13 15 13 12 14 12 13 10 15 13 14 12Grupo 1 Grupo 2 Grupo 3

Mo = 13 Mo = 12 Mo = 13Bimodal

Amodal

MEDIDAS DESCRITIVASMedidas de Tendência Central

Moda

Page 39: Aula 2 - Organizacao de Dados

3939Análise de Dados

5

1

7

MEDIDAS DESCRITIVASMedidas de Tendência Central

Moda

Notas fi Fi

1 1 12 3 43 10 144 8 225 4 26

Total 26

Moda=3

Page 40: Aula 2 - Organizacao de Dados

4040Análise de Dados

5

1

7

É uma medida influenciada por todos os valores observados;

Pode ser enviesada apenas por alguns valores extremos.

MEDIDAS DESCRITIVASMedidas de Tendência Central - Características

Média:

Page 41: Aula 2 - Organizacao de Dados

4141Análise de Dados

5

1

7

MEDIDAS DESCRITIVASMedidas de Tendência Central - Características

Mediana:

É determinada pelo número de observações e não pelo seu valor;

É usada em distribuições fortemente assimétricas por não ser afectada por valores extremos.

Page 42: Aula 2 - Organizacao de Dados

4242Análise de Dados

5

1

7

MEDIDAS DESCRITIVASMedidas de Tendência Central - Características

Moda:

É, em geral, menos usada que a média e que a mediana;

Pode não existir em algumas distribuições e, noutras existir mais que uma moda;

Pode ser determinada em qualquer situação, independentemente do tipo de variável;

O valor da moda não sofre a influência de valores extremos.

Page 43: Aula 2 - Organizacao de Dados

4343Análise de Dados

5

1

7

Quantis

Quartis

Dividem a distribuição em 4 partes iguais; 1º Q => 25%, corresponde ao valor para o qual ¼

das observações lhe são iguais ou inferiores; 2º Q => 50% = Me, corresponde ao valor para o

qual 2/4 das observações lhe são iguais ou inferiores;

3º Q = > 75%, corresponde ao valor para o qual ¾ das observações lhe são iguais ou inferiores.

MEDIDAS DESCRITIVAS

Page 44: Aula 2 - Organizacao de Dados

4444Análise de Dados

5

1

7

Quantis

Quartis

n par n ímpar

n + 2 n + 14 4

3n + 2 n + 14

Pos

ição

de

Q1

Pos

ição

de

Q3 3 X

4

MEDIDAS DESCRITIVAS

Page 45: Aula 2 - Organizacao de Dados

4545Análise de Dados

5

1

7

Quantis

Quartis

Idades fi fri Fi Fri

17 1 0,071429 1 0,07142918 4 0,285714 5 0,35714319 4 0,285714 9 0,64285720 2 0,142857 11 0,78571421 1 0,071429 12 0,85714322 2 0,142857 14 1

14 1

Calcular o 1º e o 3º Quartis para o conjunto de valores:

Q1 = 18 Q3 = 20

MEDIDAS DESCRITIVAS

Page 46: Aula 2 - Organizacao de Dados

4646Análise de Dados

5

1

7

Quantis

Percentis

1º P = > 1% 10º P = > 10% 50º P = 2º Q = Me = > 50% 99º P = > 99%

Posição do percentil K (k.n)/100 n = nº de observações

MEDIDAS DESCRITIVAS

Page 47: Aula 2 - Organizacao de Dados

4747Análise de Dados

5

1

7

Quantis

Percentis

Idades fi fri Fi Fri

17 1 0,071429 1 0,07142918 4 0,285714 5 0,35714319 4 0,285714 9 0,64285720 2 0,142857 11 0,78571421 1 0,071429 12 0,85714322 2 0,142857 14 1

14 1

Calcular o P10 e o P90 para o conjunto de valores:

P10 = 18 P90 = 22

MEDIDAS DESCRITIVAS

Page 48: Aula 2 - Organizacao de Dados

4848Análise de Dados

5

1

7

Medidas de Dispersão

Amplitude: Diferença entre o maior e o menor valor da

distribuição; A = Xmax - Xmin

Amplitude Inter-Quartil: Deixa de fora valores muito diferentes da

maioria: AIQ = Q3 – Q1

MEDIDAS DESCRITIVAS

Page 49: Aula 2 - Organizacao de Dados

4949Análise de Dados

5

1

7

Medidas de Dispersão

Variância:

Mede o afastamento dos valores em relação à média:

Desvio Padrão:

S2 = fi(xi – x)2

n - 1

S = S2

MEDIDAS DESCRITIVAS

S2 = (xi – x)2

n - 1

Page 50: Aula 2 - Organizacao de Dados

5050Análise de Dados

5

1

7

Medidas de Dispersão

Coeficiente de Variação:

Medida de dispersão relativa:

CV =Sx

MEDIDAS DESCRITIVAS

Page 51: Aula 2 - Organizacao de Dados

5151Análise de Dados

5

1

7

MEDIDAS DESCRITIVAS

Medidas de Dispersão

Calcule as medidas de dispersão aprendidas relativamente aos dados que se seguem e verifique as diferenças entre si:

17, 18, 19, 20, 21, 22

Page 52: Aula 2 - Organizacao de Dados

5252Análise de Dados

5

1

7

A amplitude considera dois valores ignorando valores típicos da distribuição;

A amplitude interquartil considera 50% dos valores centrais, ignorando os 50% dos extremos;

Desvio padrão é a medida de dispersão mais utilizada. É afectado por todos os valores observados.

MEDIDAS DESCRITIVASMedidas de Dispersão - Características

Page 53: Aula 2 - Organizacao de Dados

5353Análise de Dados

5

1

7

Medidas de Associação

Coeficientes de Associação:

Medidas que servem para estudar as relações estatísticas entre variáveis.

MEDIDAS DESCRITIVAS

Page 54: Aula 2 - Organizacao de Dados

5454Análise de Dados

5

1

7

Os valores seguintes são notas obtidas por alunos em determinada disciplina:

14 15 11 11 10 12 7 10 8 8 9 2 4 11 1213 18 2 4 7 10 18 10 12 8 13 7 12 11 13

MEDIDAS DESCRITIVAS

Page 55: Aula 2 - Organizacao de Dados

5555Análise de Dados

5

1

7

a) Organize os dados numa tabela de frequências.b) Qual o valor mais frequente?c) Quantos alunos têm nota negativa?d) Qual a percentagem de alunos com nota 10?e) Qual a percentagem de alunos com nota menor ou

igual a 12?f) Quantos alunos tiveram nota superior a 15? A que

percentagem corresponde esse valor?g) Qual a média das notas desta turma?h) Qual a mediana da distribuição?i) Indique o 1º Quartil e diga qual o seu significado.j) Indique o percentil 75.k) Calcule a Amplitude, a Amplitude interquartil e o CV,

sabendo que o desvio padrão é de 3,96.

MEDIDAS DESCRITIVAS

Page 56: Aula 2 - Organizacao de Dados

5656Análise de Dados

5

1

7

MEDIDAS DESCRITIVAS

x f fr F Fr

2 2 0,067 2 0,067

4 2 0,067 4 0,133

7 3 0,100 7 0,233

8 3 0,100 10 0,333

9 1 0,033 11 0,367

10 4 0,133 15 0,500

11 4 0,133 19 0,633

12 4 0,133 23 0,767

13 3 0,100 26 0,867

14 1 0,033 27 0,900

15 1 0,033 28 0,933

18 2 0,067 30 1,000

Total 30 1,000    

a)

Page 57: Aula 2 - Organizacao de Dados

5757Análise de Dados

5

1

7

MEDIDAS DESCRITIVAS

b) 10, 11 e 12

c) 11

d) 13,3%

e) 76,7%

f) 2 alunos - 6,7%

g) 10,0 67

h) 10,5

i) 8 - as 25% notas mais baixas são 8 ou menos

j) 12

k) A=18-2=16; AIQ=12-8=4; CV=3,96/10,067=0,39