View
222
Download
0
Category
Preview:
Citation preview
Estatística
Disciplina de Estatística – 2012/2 Curso Superior de tecnólogo em Gestão Ambiental
Profª. Me. Valéria Espíndola Lessa
e-mail: lessavaleria@gmail.com
1
Medidas de Dispersão
• Indicam se os dados estão, ou não, próximos uns dos outros;
• Auxilia as medidas de centralização;
• Exemplo 1: Ao aplicar uma prova a dois grupos de 4 alunos, tem-se as notas:
2
• Ao se calcular a média, moda e mediana, temos:
3
Quanto mais os dados variam, menos representativa é a média.
• Exemplo 2: Observe as notas de três competidores em uma prova: Competidor A: 7,0 – 5,0 – 3,0 Competidor B: 5,0 – 4,0 – 6,0 Competidor C: 4,0 – 4,0 – 7,0
• Ao calcular a média das notas dos três competidores iremos obter média 5 para todos, impossibilitando a nossa análise sobre a regularidade dos competidores;
• Partindo dessa ideia, precisamos adotar medidas que apresente a variação das notas para realizar a análise;
• O Competidor com menor variabilidade é o que se aproxima mais da média;
4
Tipos de Medidas de Dispersão
• Amplitude Total;
• Desvio Médio;
• Variância;
• Desvio Padrão;
• Coeficiente de Variação.
5
Amplitude Total (At)
• Já vimos que a At é a diferença entre o maior valor e o menor da amostra;
• Se os dados estão agrupados em classes se faz a diferença entre o limite superior da última classe e o limite inferior da primeira classe;
6
mínmáx xxAt
• A amplitude total tem a desvantagem de só levar em conta os dois valores extremos, por isso é apenas uma indicação aproximada da dispersão;
• Outra desvantagem é que a amplitude total apresenta muita variação de uma amostra para outra, mesmo que ambas sejam extraídas da mesma população.
7
... No Excel
8
Desvio Médio (dm)
• É uma média realizada com o somatório das diferenças entre cada dado da amostra e a média aritmética.
9
n
xx
d
n
1i
i
m
n
Fxx
d
n
1i
ii
m
Para dados em distribuição de
frequências
Para dados agrupados em classes, usar no lugar do xi o
ponto médio da classe.
• Exemplo 3: Numa prova, 5 alunos obtiveram as seguintes notas: 5, 6, 9, 10, 10. Calcular o desvio médio.
1º)
2º)
10
25
10
5
22123
5
810810898685dm
85
40
5
1010965X
Conclusão: Em média, a nota dos alunos foi desviada da média em 2 pontos.
... no Excel
11
• Exemplo 4: A partir das informações do exemplo 2 sobre as notas de três competidores, vamos calcular seus desvios médios.
Competidor A: 7,0 – 5,0 – 3,0 Competidor B: 5,0 – 4,0 – 6,0 Competidor C: 4,0 – 4,0 – 7,0
12
5X
33,13
211
3
575454d
66,03
110
3
565455d
33,13
202
3
535557d
)C(m
)B(m
)A(m
Conclusão:
o Competidor mais regular , ou
seja, o que menos se desviou da
média foi o Competidor B.
Mas temos um “empate” entre A e C. Como saber o que foi mais regular nas suas notas?
... no Excel
• Faça você agora...
13
• O desvio médio, apesar de representar bem a variabilidade dos dados, não oferece muitos detalhes, e portanto, não é muito utilizado nas pesquisas estatísticas;
• Em alguns casos, há “empate” no valor do desvio médio e não conseguimos calcular a variabilidade;
• Geralmente utiliza-se a fórmula do desvio médio para encontrar a variância e o desvio padrão, que são mais utilizados e dão mais informações;
14
Variância (σ2 ou s2)
• Eleva-se a diferença entre os dados e a média ao quadrado.
• Há uma diferenciação nas notações e nas fórmulas quando estamos lidando com dados de toda uma população ou com dados de uma amostra;
–Variância Populacional: σ2 e N
–Variância Amostral: s2 e n
15
Letra grega “sigma”
minúscula
16
Populacional(σ2) Amostral (s2 )
Dados não agrupados
Dados agrupados
N
Fxxn
1i
i
2
i2
N
xxn
1i
2
i2
1n
xx
s
n
1i
2
i2
1n
Fxx
s
n
1i
i
2
i2
Fórmulas mais Práticas sem a Média
17
Populacional(σ2) Amostral (s2 )
Dados não agrupados
Dados agrupados
N
xx
N
12
i2
i
2
n
xx
1n
1s
2
i2
i
2
N
FxFx
N
12
iii
2
i
2
n
FxFx
1n
1s
2
iii
2
i
2
• A variância dá a informação referente a posição que os dados estão da média;
• No momento que elevamos as diferenças ao quadrado, deixamos de ter a mesma unidade de medida anterior, no caso “notas”;
• Assim, o resultado da variância não será mais “nota” e sim um número que informa uma posição da média.
• Para compreender melhor, vamos retomar o exemplo dos competidores A, B e C;
• Exemplo 5: Calcular a variância do exemplo 2. Como estamos lidando com toda a população, usaremos a fórmula do σ2
18
19
2
3
411
3
575454
66,03
110
3
565455
66,23
404
3
535557
222
)C(2
222
)B(2
222
)A(2
Usando a Fórmula com Médias:
Usando a Fórmula Prática sem Médias: (uma tabela ajuda)
Xi Σ Xi Xi2 Σ Xi2
A 7, 5, 3 15 49, 25, 9 83
B 5, 4, 6 15 25, 16, 36 77
C 4, 4, 7 15 16, 16, 49 81
N
xx
N
12
i2
i
2
Primeiro eleva-se os termos ao quadrado e depois soma-se
Primeiro soma-se os termos e depois eleva-se ao quadrado
20
Competidores
Média Amplitude Desvio Médio
Variância
A 5 4 1,33 2,66
B 5 2 0,66 0,66
C 5 3 1,33 2
Conclusão: Comparando A e C, vemos que o Competidor C está mais “próximo” da regularidade do que o Competidor A.
23
66
3
17581
3
1
3
1581
3
1
66,03
22
3
17577
3
1
3
1577
3
1
66,23
88
3
17583
3
1
3
1583
3
1
2
)C(2
2
)B(2
2
)A(2
... no Excel
• Faça você mesmo...
21
• Entretanto, ao calcular a variância observa-se que o resultado será dado em unidades quadráticas, o que dificulta a sua interpretação.
• O problema é resolvido extraindo-se a raiz quadrada da variância, definindo-se, assim, o desvio padrão.
22
Desvio Padrão (σ ou s)
• Então, para calcular o desvio padrão é necessário primeiro calcular a variância e depois extrair a raiz quadrada do resultado.
• Assim, o desvio padrão tem a mesma unidade de medida dos dados originais, e portanto, facilita a interpretação.
23
22 ssou
• Exemplo 6: Calcular o desvio padrão do exemplo 2, dos competidores:
24
41,12
82,066,0
63,166,2
)C(2
)C(
)B(2
)B(
)A(2
)A(
Competidores
Média Amplitude Desvio Médio
Variância Desvio Padrão
A 5 4 1,33 2,66 1,63
B 5 2 0,66 0,66 0,82
C 5 3 1,33 2 1,41
Conclusão: O desvio padrão é a medida que melhor informa a regularidade dos dados. Se fossemos ordenar os competidores teríamos: 1º lugar – B 2º lugar – C 3º lugar – A
... No Excel
• Faça você mesmo...
25
Importante!
Usar o Desvio Padrão para comparar a variabilidade, quando:
• mesmo número de observações (mesmo n)
• mesma unidade; (mesmo tipo de elementos)
• mesma média aritmética.
26
• Se quisermos comparar duas ou mais amostras de valores expressas em unidades diferentes, (ex. peso e altura) não poderemos fazer a comparação por meio do desvio-padrão.
Daí usa-se o Coeficiente de Variação
27
Coeficiente de Variação (CV)
• É uma medida de dispersão expressa em Porcentagem (medida relativa);
• Pode ser usado para comparar amostras em mesma unidade ou unidades diferentes;
• E pode ser usado para comparar a variabilidade dos dados tendo médias diferentes.
28
100x
sCV
• Exemplo 7 (variáveis com unidades diferentes) : Um exame físico examinou 6 indivíduos cujos pesos (kg) foram: 68; 70; 86; 55; 75 e 90. No mesmo exame, foram também tomadas medidas de altura (cm), com os seguintes valores: 170; 160; 164; 164; 170 e 180. Os indivíduos apresentam maior variabilidade no peso ou altura?
29
Conclusão: Os indivíduos possuem maior variabilidade
no peso, analisando o CV.
Média Desvio Padrão
Coeficiente de Variação
Peso (kg) 74 11,65 (11,65/74) . 100 = 15,75%
Altura (cm) 168 6,43 (6,43/168) .100 = 3,83%
Não podemos comparar os desvios padrão, pois, os dados têm unidades e
médias diferentes.
... no Excel
• Faça você...
30
• Exemplo 8 (Variáveis com mesma unidade, mas com médias diferentes): Em uma empresa o salário médio dos homens é de R$ 4.000,00, com desvio padrão de R$ 1.500,00; e o salário médio das mulheres é de R$ 3.000,00, com desvio padrão de R$ 1.200,00. A dispersão relativa dos salários é maior para homens?
31
Média (R$)
Desvio Padrão
Coeficiente de Variação
Homens 4.000 1.500 (1.500 / 4.000) x 100 = 37,5%
Mulheres 3.000 1.200 (1.200 / 3.000 ) x 100 = 40%
Conclusão: Não, a dispersão relativa dos salários é maior para mulheres.
• Exemplo 9 (Medidas de Dispersão em Tabela de Frequência)
Calcular a variância, o desvio padrão e o coeficiente de variação.
32
Xi 2 3 5 6 7
Fi 1 4 5 3 2
1º) Calcular a Média:
7,415
71
15
2736554312x
33
2º) Calcular a Variância:
N
FxFx
N
12
iii
2
i
2
Xi 2 3 5 6 7 Σ
Fi 1 4 5 3 2 15
Xi . Fi 2 12 25 18 14 71
Xi2 . Fi 4 36 125 108 98 371
33,29,3415
107,336371
15
1
15
71371
15
12
2
34
4º) Calcular o CV:
3º) Calcular o desvio padrão:
53,133,22
%55,32100.7,4
53,1100.
xCV
35
• Exemplo 10 (Medidas de Dispersão em Tabela de Frequência Agrupadas por Classes)
Calcular a variância, o desvio padrão e o coeficiente de variação, na distribuição amostral abaixo:
Classes 2|--4 4|--6 6|--8 8|--10 10|--12
Fi 2 4 7 4 3
1º) Organizar a tabela e calcular a média
Classes Xi Fi Xi . Fi
2|--4 3 2 6
4|--6 5 4 20
6|--8 7 7 49
8|--10 9 4 36
10|--12 11 3 33
Σ 20 144
2,720
144x
36
2º) Inserir mais uma coluna na tabela e calcular a Variância.
n
FxFx
1n
1s
2
iii
2
i
2Classes Xi Fi Xi . Fi Xi2.Fi
2|--4 3 2 6 18
4|--6 5 4 20 100
6|--8 7 7 49 343
8|--10 9 4 36 324
10|--12 11 3 33 363
Σ 20 144 1148
85,52,111
19
1
20
1441148
120
1s
2
2
37
3º) Calcular o desvio padrão.
4º) Calcular o Coeficiente de Variação
42,285,52
%6,33100.2,7
42,2100.
xCV
Exemplo de relação entre Média e Desvio Padrão
• O resultado de uma prova (vestibular), normalmente, é conhecido através da: média, desvio padrão e distribuição de frequências do número de acertos dos candidatos;
• Numa distribuição de frequências, há três medidas importantes: a moda, a mediana e a média;
• MODA => é o "pico", isto é, o ponto no eixo das abscissas de maior freqüência
38
• MEDIANA => é o ponto que divide as ocorrências em duas frações iguais;
• MÉDIA => é o ponto que faria com que o gráfico ficasse equilibrado, não inclinando nem para a esquerda nem para a direita (centro de gravidade da figura)
39
• Após a realização de uma prova e a análise dos acertos, é possível calcular a média e o desvio padrão da prova.
• Com isso, o candidato pode saber sua nota.
• Vamos supor que numa prova de 25 questões, a média tenha sido 8 e o desvio 2,5. Isso significa que a maior parte dos candidatos acertaram entre 5,5 e 10,5.
• Se o candidato conseguiu acertar mais do que a média e um desvio, terá uma nota bastante satisfatória.
40
• O gráfico mostra uma distribuição normal rigorosamente simétrica. No centro da distribuição, coincidem média, mediana e moda. Uma curva de distribuição normal (ou Curva de Gauss) tem como característica englobar 99,73% das ocorrências no intervalo compreendido entre a média e ± 3 desvios padrão.
41
• O desvio padrão de uma prova mede o quanto o conjunto de candidatos se distanciou da média, tanto além como aquém do centro de distribuição.
42
Aqui temos Média de 12,5 e desvio padrão de 4
• Espera-se que o resultado da aplicação de uma prova gere uma "curva de distribuição normal", isto é, essa prova deve gerar uma média de 15 acertos e os candidatos devem estar distribuídos simetricamente entre zero e 30 acertos.
• Mas isso é muito difícil de acontecer em virtude de outros fatores: nível de dificuldade da prova e preparação dos estudantes.
• Gerando curvas, na maioria das vezes, assimétricas.
43
- Lista de Exercícios –
- Fazer no Excel-
44
Recommended