11Análise de Dados
5
1
7
Análise de DadosAnálise de Dados
Apresentação Apresentação
de Dadosde Dados
22Análise de Dados
5
1
7
• Tabelas de Frequências;• Diagramas de Barras;• Diagramas Circulares;• Histogramas;• Polígonos de Frequências;• Polígonos de Frequências Acumuladas.
APRESENTAÇÃO DE DADOS
33Análise de Dados
5
1
7
Modalidade
Frequência Absoluta
(fi)
Freq. Absoluta
Acumulada
(Fi)
Freq. Relativa
Acumulada
(Fri)
Frequência Relativa
(fri)
TABELAS DE FREQUÊNCIAS
44Análise de Dados
5
1
7
• ffii – Frequência Absoluta duma modalidade é o número de ocorrências dessa modalidade
• ffriri – Frequência Relativa é o quociente entre o número de ocorrências e a dimensão da amostra
• FFii – Frequência Absoluta Acumulada duma modalidade é a soma das frequências absolutas dessa modalidade e de todas as que lhe forem anteriores
• FFriri - Frequência Relativa Acumulada duma modalidade é a soma das frequências relativas dessa modalidade e de todas as que lhe forem anteriores
TABELAS DE FREQUÊNCIAS
55Análise de Dados
5
1
7
Dados Qualitativos
TABELAS DE FREQUÊNCIAS
Curso fi fri Fi Fri
PM 46 0,27
CE 42 0,25
Jorn 43 0,26
AM 37 0,22
Total 168 1,00
66Análise de Dados
5
1
7
Diagrama de Barras
Diagrama Circular
REPRESENTAÇÃO GRÁFICA
Número de alunos por curso
0
10
20
30
40
50
PM CE Jorn AM
PM27%
CE25%
Jorn26%
AM22%
77Análise de Dados
5
1
7
Dados Quantitativos Discretos
Num inquérito realizado a 17 pessoas uma das questões era:“Quantos irmãos tem?”. Obteve-se a seguinte amostra:
1 3 0 2 3 2 2 1 1 1 2 0 2 1 4 0 2
TABELAS DE FREQUÊNCIAS
88Análise de Dados
5
1
7
Nº de Irmãos
Frequência Absoluta
(fi)
Freq. Absoluta
Acumulada
(Fi)
Freq. Relativa
Acumulada
(Fri)
0 3 3/17 0,1765 3 0,176470591 5 5/17 0,2941 8 0,470588242 6 6/17 0,3529 14 0,823529413 2 2/17 0,1176 16 0,941176474 1 1/17 0,0588 17 1
TOTAL 17 1
Frequência Relativa
(fri)
TABELAS DE FREQUÊNCIAS
99Análise de Dados
5
1
7
Dados Quantitativos ContínuosTABELAS DE FREQUÊNCIAS
xi fi fri Fi Fri
125 1 0,007 1 0,007
128 1 0,007 2 0,014
129 1 0,007 3 0,022
130 2 0,014 5 0,036
135 1 0,007 6 0,043
138 1 0,007 7 0,050
139 1 0,007 8 0,058
140 6 0,043 14 0,101
141 1 0,007 15 0,108
142 1 0,007 16 0,115
147 5 0,036 21 0,151
148 3 0,022 24 0,173
149 1 0,007 25 0,180
150 11 0,079 36 0,259
151 2 0,014 38 0,273
152 5 0,036 43 0,309
153 8 0,058 51 0,367
154 9 0,065 60 0,432
155 10 0,072 70 0,504
159 4 0,029 91 0,655
160 6 0,043 97 0,698
161 3 0,022 100 0,719
162 3 0,022 103 0,741
163 5 0,036 108 0,777
164 3 0,022 111 0,799
165 2 0,014 113 0,813
166 5 0,036 118 0,849
167 2 0,014 120 0,863
168 5 0,036 125 0,899
169 1 0,007 126 0,906
170 2 0,014 128 0,921
171 1 0,007 129 0,928
173 1 0,007 130 0,935
174 1 0,007 131 0,942
175 2 0,014 133 0,957
176 1 0,007 134 0,964
180 2 0,014 136 0,978
185 1 0,007 137 0,986
1010Análise de Dados
5
1
7
1. Amplitude da Amostra;2. Número de classes;3. Amplitude de cada classe;4. Limites.
TABELAS DE FREQUÊNCIAS
Dados Quantitativos Contínuos
Agrupamento em classes:
1111Análise de Dados
5
1
7
Dados Quantitativos Contínuos
Amplitude da Amostra
A = xmax – xmin
No exemplo:
A = 185 – 125 = 60
TABELAS DE FREQUÊNCIAS
1212Análise de Dados
5
1
7
Número de Classes
K = n
No exemplo:
= 137 = 11,7 12
Dados Quantitativos ContínuosTABELAS DE FREQUÊNCIAS
1313Análise de Dados
5
1
7
Amplitude de cada classe
a = A / K
No exemplo:
A = 60 ; K = 12a = 60/12 = 5
Dados Quantitativos ContínuosTABELAS DE FREQUÊNCIAS
1414Análise de Dados
5
1
7
Limites
1. [125, 130]: compreende todos os valores entre 125 e 1302. [125,130[: compreende todos os valores entre 125 e 130,
excluindo o 1303. ]125,130]: compreende todos os valores entre 125 e 130,
excluindo o 125
Dados Quantitativos Contínuos
O ponto médio da classe é a média aritmética entre o limite superior e inferior da classe. Neste caso: (125 + 130)/2 = 127,5
TABELAS DE FREQUÊNCIAS
1515Análise de Dados
5
1
7
Dados Quantitativos ContínuosTABELAS DE FREQUÊNCIAS
xi fi fri Fi Fri
[125;130[ 3 0,022 3 0,022
[130;135[ 2 0,014 5 0,036
[135;140[ 3 0,022 8 0,058
[140;145[ 8 0,058 16 0,115
[145;150[ 9 0,065 25 0,180
[150;155[ 35 0,252 60 0,432
[155;160[ 31 0,223 91 0,655
[160;165[ 20 0,144 111 0,799
[165;170[ 15 0,108 126 0,906
[170;175[ 5 0,036 131 0,942
[175;180[ 3 0,022 134 0,964
[180;185] 3 0,036 137 1,000
Total 137 1,000
1616Análise de Dados
5
1
7
Histograma de Frequências Polígono de Frequências
REPRESENTAÇÃO GRÁFICA
125 130 135 140 145 150 155 160 165 170 175 180 185
Classificação de entrada na ESCS
0
10
20
30
40
Fre
qu
enci
a
Mean = 156,23Std. Dev. = 10,882N = 139
05
10152025303540
Freq
uênc
ia
1717Análise de Dados
5
1
7
Polígono de Frequências Acumuladas
REPRESENTAÇÃO GRÁFICA
00,20,40,60,8
11,2
Fre
qu
ên
cia
Re
lati
va
Ac
um
ula
da
1818Análise de Dados
5
1
7
Tabelas de Tabelas de ContingênciaContingência
Análise de DadosAnálise de Dados
1919Análise de Dados
5
1
7
Castanhos Azuis
Morena 14 4Loira 9 17
Olhos
Tipo
Valores Observados
Relacionam a frequência de duas grandezas
TABELAS DE CONTINGÊNCIA
2020Análise de Dados
5
1
7
Castanhos Azuis
Morena 14 4Loira 9 17
Olhos
Tipo
Valores Observados
Total
1826
Marginal Tipo
Total 23 21
Marginal Cor Olhos
44
NN
TABELAS DE CONTINGÊNCIA
2121Análise de Dados
5
1
7
A tabela seguinte resultou de uma investigação para estudar como três tipos de materiais reagiram a um tratamento térmico:
TABELAS DE CONTINGÊNCIA
DestruídosPeq.
DefeitosPerfeitos Total
A 20 40 40 100B 90 70 40 200C 80 70 50 200
Total 190 180 130 500
2222Análise de Dados
5
1
7
• Havia 100 unidades do material A das quais 20 foram destruídas, 40 ficaram com pequenos defeitos e outros 40 ficaram em bom estado;
• De todos os tipos de material, 190 foram destruídas, 180 ficaram com pequenos defeitos e 130 ficaram perfeitos;
• Ficaram perfeitos 40 unidades do material A, 40 do material B e 50 do C;
• ....
TABELAS DE CONTINGÊNCIA
2323Análise de Dados
5
1
7
DestruídosPeq.
DefeitosPerfeitos Total
A 0,04 0,08 0,08 0,2B 0,18 0,14 0,08 0,4C 0,16 0,14 0,10 0,4
Total 0,38 0,36 0,26 1,0
Tabela de frequências relativas:
• O material A representava 20% do total dos materiais, o B 40% e o C, também 40%;
• 38% do total do material foi destruído, 36% ficou com pequenos defeitos e 26% ficou em boas condições.
TABELAS DE CONTINGÊNCIA
2424Análise de Dados
5
1
7
DestruídosPeq.
DefeitosPerfeitos Total
A 0,04 0,08 0,08 0,2B 0,18 0,14 0,08 0,4C 0,16 0,14 0,10 0,4
Total 0,38 0,36 0,26 1,0
• Qual percentagem de material A que ficou destruído?
• Qual a percentagem de material tipo C que não ficou perfeito?
• Quantas unidades do material do tipo B foram utilizadas no teste?
• Considerando só o material do tipo A, qual a percentagem do que ficou destruído, com pequenos defeitos e perfeito?
• Do material que ficou perfeito, qual a percentagem de cada tipo?
TABELAS DE CONTINGÊNCIA
2525Análise de Dados
5
1
7
Medidas Medidas DescritivasDescritivas
Análise de DadosAnálise de Dados
2626Análise de Dados
5
1
7
Medidas de Posição;
Medidas de Dispersão;
Medidas de Associação.
MEDIDAS DESCRITIVAS
2727Análise de Dados
5
1
7
Medidas de Posição
Medidas de Tendência Central:
Média, Mediana, Moda (identificam o centro
da distribuição)
Quantis:
Quartis, Decis, Percentis (indicam outras
posições)
MEDIDAS DESCRITIVAS
2828Análise de Dados
5
1
7
Medidas de Tendência Central
Média
x = xi
n OU xi . fi
nx =
xi – Valores Observadosfi – Frequência Absolutan – Dimensão da Amostra
Dados desagrupados
Dados Agrupados
MEDIDAS DESCRITIVAS
2929Análise de Dados
5
1
7
Calcular a média para o conjunto de valores:17, 18, 19, 20, 21, 22, 57
x = xi
n= 24,9
MEDIDAS DESCRITIVASMedidas de Tendência Central
Média
3030Análise de Dados
5
1
7
MEDIDAS DESCRITIVASMedidas de Tendência Central
Média
AnosTaxas de
JuroFactor de
Crescimento1 7% 1,072 8% 1,083 10% 1,14 12% 1,125 18% 1,18
11,15
18,112,11,108,107,1
x
Média aritmética dos factores de crescimento
3131Análise de Dados
5
1
7
MEDIDAS DESCRITIVASMedidas de Tendência Central
Média (dados em tabela de frequências)
Nº de Irmãos
Frequência Absoluta
(fi)
Freq. Absoluta
Acumulada
(Fi)
Freq. Relativa
Acumulada
(Fri)
0 3 3/17 0,1765 3 0,176470591 5 5/17 0,2941 8 0,470588242 6 6/17 0,3529 14 0,823529413 2 2/17 0,1176 16 0,941176474 1 1/17 0,0588 17 1
TOTAL 17 1
Frequência Relativa
(fri)
x = xifi
n= 6,1
17
4x13x22x61x50x3
3232Análise de Dados
5
1
7
MEDIDAS DESCRITIVASMedidas de Tendência Central
Média Geométrica
1093,1
679965,1
18,112,11,108,107,1
5
521
xxxx...x.xxMG nn
Média Geométrica do factor de crescimento
3333Análise de Dados
5
1
7
1. É a observação que fica a meio da distribuição ordenada (conjunto ímpar de dados);
2. É a média entre as observações que ficam a meio da distribuição (num conjunto par de dados)
3. Na tabela de frequências, é o valor onde a distribuição atinge os 50% dos dados.
MEDIDAS DESCRITIVASMedidas de Tendência Central
Mediana
3434Análise de Dados
5
1
7
P(Me) =N + 1
2
1) Se N Ímpar:
MEDIDAS DESCRITIVASMedidas de Tendência Central
Posição da Mediana
EXEMPLO:
17, 18, 19, 20, 21, 22, 57N=7
P(Me) =7 + 1
2= 4
Me= 20
3535Análise de Dados
5
1
7
MEDIDAS DESCRITIVASMedidas de Tendência Central
Posição da Mediana
2) Se N Par:
P1 =N2
e P2 =N + 2
2EXEMPLO
17, 18, 19, 20, 21, 22, 35, 57N=8
Me =20 + 21
2= 20,5
Me =xP1 + xP2
2
3636Análise de Dados
5
1
7
MEDIDAS DESCRITIVASMedidas de Tendência Central
Posição da Mediana
3) Na Tabela de Frequências:
Notas fi Fi
1 1 12 3 43 10 144 8 225 4 26
Total 26
Me = (x13 + x14)/2Me = (3 + 3)/2 = 3
3737Análise de Dados
5
1
7
1. É o valor mais frequente da distribuição;2. Para variáveis qualitativas nominais é a única
calculável.
MEDIDAS DESCRITIVASMedidas de Tendência Central
Moda
3838Análise de Dados
5
1
7
12 13 14 13 15 13 12 14 12 13 10 15 13 14 12Grupo 1 Grupo 2 Grupo 3
Mo = 13 Mo = 12 Mo = 13Bimodal
Amodal
MEDIDAS DESCRITIVASMedidas de Tendência Central
Moda
3939Análise de Dados
5
1
7
MEDIDAS DESCRITIVASMedidas de Tendência Central
Moda
Notas fi Fi
1 1 12 3 43 10 144 8 225 4 26
Total 26
Moda=3
4040Análise de Dados
5
1
7
É uma medida influenciada por todos os valores observados;
Pode ser enviesada apenas por alguns valores extremos.
MEDIDAS DESCRITIVASMedidas de Tendência Central - Características
Média:
4141Análise de Dados
5
1
7
MEDIDAS DESCRITIVASMedidas de Tendência Central - Características
Mediana:
É determinada pelo número de observações e não pelo seu valor;
É usada em distribuições fortemente assimétricas por não ser afectada por valores extremos.
4242Análise de Dados
5
1
7
MEDIDAS DESCRITIVASMedidas de Tendência Central - Características
Moda:
É, em geral, menos usada que a média e que a mediana;
Pode não existir em algumas distribuições e, noutras existir mais que uma moda;
Pode ser determinada em qualquer situação, independentemente do tipo de variável;
O valor da moda não sofre a influência de valores extremos.
4343Análise de Dados
5
1
7
Quantis
Quartis
Dividem a distribuição em 4 partes iguais; 1º Q => 25%, corresponde ao valor para o qual ¼
das observações lhe são iguais ou inferiores; 2º Q => 50% = Me, corresponde ao valor para o
qual 2/4 das observações lhe são iguais ou inferiores;
3º Q = > 75%, corresponde ao valor para o qual ¾ das observações lhe são iguais ou inferiores.
MEDIDAS DESCRITIVAS
4444Análise de Dados
5
1
7
Quantis
Quartis
n par n ímpar
n + 2 n + 14 4
3n + 2 n + 14
Pos
ição
de
Q1
Pos
ição
de
Q3 3 X
4
MEDIDAS DESCRITIVAS
4545Análise de Dados
5
1
7
Quantis
Quartis
Idades fi fri Fi Fri
17 1 0,071429 1 0,07142918 4 0,285714 5 0,35714319 4 0,285714 9 0,64285720 2 0,142857 11 0,78571421 1 0,071429 12 0,85714322 2 0,142857 14 1
14 1
Calcular o 1º e o 3º Quartis para o conjunto de valores:
Q1 = 18 Q3 = 20
MEDIDAS DESCRITIVAS
4646Análise de Dados
5
1
7
Quantis
Percentis
1º P = > 1% 10º P = > 10% 50º P = 2º Q = Me = > 50% 99º P = > 99%
Posição do percentil K (k.n)/100 n = nº de observações
MEDIDAS DESCRITIVAS
4747Análise de Dados
5
1
7
Quantis
Percentis
Idades fi fri Fi Fri
17 1 0,071429 1 0,07142918 4 0,285714 5 0,35714319 4 0,285714 9 0,64285720 2 0,142857 11 0,78571421 1 0,071429 12 0,85714322 2 0,142857 14 1
14 1
Calcular o P10 e o P90 para o conjunto de valores:
P10 = 18 P90 = 22
MEDIDAS DESCRITIVAS
4848Análise de Dados
5
1
7
Medidas de Dispersão
Amplitude: Diferença entre o maior e o menor valor da
distribuição; A = Xmax - Xmin
Amplitude Inter-Quartil: Deixa de fora valores muito diferentes da
maioria: AIQ = Q3 – Q1
MEDIDAS DESCRITIVAS
4949Análise de Dados
5
1
7
Medidas de Dispersão
Variância:
Mede o afastamento dos valores em relação à média:
Desvio Padrão:
S2 = fi(xi – x)2
n - 1
S = S2
MEDIDAS DESCRITIVAS
S2 = (xi – x)2
n - 1
5050Análise de Dados
5
1
7
Medidas de Dispersão
Coeficiente de Variação:
Medida de dispersão relativa:
CV =Sx
MEDIDAS DESCRITIVAS
5151Análise de Dados
5
1
7
MEDIDAS DESCRITIVAS
Medidas de Dispersão
Calcule as medidas de dispersão aprendidas relativamente aos dados que se seguem e verifique as diferenças entre si:
17, 18, 19, 20, 21, 22
5252Análise de Dados
5
1
7
A amplitude considera dois valores ignorando valores típicos da distribuição;
A amplitude interquartil considera 50% dos valores centrais, ignorando os 50% dos extremos;
Desvio padrão é a medida de dispersão mais utilizada. É afectado por todos os valores observados.
MEDIDAS DESCRITIVASMedidas de Dispersão - Características
5353Análise de Dados
5
1
7
Medidas de Associação
Coeficientes de Associação:
Medidas que servem para estudar as relações estatísticas entre variáveis.
MEDIDAS DESCRITIVAS
5454Análise de Dados
5
1
7
Os valores seguintes são notas obtidas por alunos em determinada disciplina:
14 15 11 11 10 12 7 10 8 8 9 2 4 11 1213 18 2 4 7 10 18 10 12 8 13 7 12 11 13
MEDIDAS DESCRITIVAS
5555Análise de Dados
5
1
7
a) Organize os dados numa tabela de frequências.b) Qual o valor mais frequente?c) Quantos alunos têm nota negativa?d) Qual a percentagem de alunos com nota 10?e) Qual a percentagem de alunos com nota menor ou
igual a 12?f) Quantos alunos tiveram nota superior a 15? A que
percentagem corresponde esse valor?g) Qual a média das notas desta turma?h) Qual a mediana da distribuição?i) Indique o 1º Quartil e diga qual o seu significado.j) Indique o percentil 75.k) Calcule a Amplitude, a Amplitude interquartil e o CV,
sabendo que o desvio padrão é de 3,96.
MEDIDAS DESCRITIVAS
5656Análise de Dados
5
1
7
MEDIDAS DESCRITIVAS
x f fr F Fr
2 2 0,067 2 0,067
4 2 0,067 4 0,133
7 3 0,100 7 0,233
8 3 0,100 10 0,333
9 1 0,033 11 0,367
10 4 0,133 15 0,500
11 4 0,133 19 0,633
12 4 0,133 23 0,767
13 3 0,100 26 0,867
14 1 0,033 27 0,900
15 1 0,033 28 0,933
18 2 0,067 30 1,000
Total 30 1,000
a)
5757Análise de Dados
5
1
7
MEDIDAS DESCRITIVAS
b) 10, 11 e 12
c) 11
d) 13,3%
e) 76,7%
f) 2 alunos - 6,7%
g) 10,0 67
h) 10,5
i) 8 - as 25% notas mais baixas são 8 ou menos
j) 12
k) A=18-2=16; AIQ=12-8=4; CV=3,96/10,067=0,39
Recommended