A apresentação faz parte de um conjunto de aulas ministradas nos cursos de pós graduação da Fundação Universa,´módulo Métodos Quatitativos - estatística.
- 1. Mtodos Quantitativos Parte IAnlise de Dados Maurcio T.
Damasceno [email_address]
2. Como analisar dados? ESTATSTICA Maurcio T. Damasceno 3.
Maurcio T. Damasceno Estatstica Estatstica Descritiva Estatstica
Inferencial 4. Mas o que Estatstica?
- coleta, classificao e organizao
- anlise e interpretao de dados
Maurcio T. Damasceno 5.
- Qual o objetivo da Estatstica?
Extrairinformaesdos dados brutos que permitam processo posterior
detomada de deciso. Maurcio T. Damasceno 6. Informao Deciso Dados
Brutos Estatstica Maurcio T. Damasceno 7.
- Conjunto de dados podem ser:
Dados Brutos!! 1.Demonstrativos mensais de balanos; 2. Valores
dirios de taxas de juros; 3. Preos de fechamento de aes. Maurcio T.
Damasceno 8. Estatstica Descritiva
- Tcnicas que permitem REPRESENTAR, RESUMIR e ANALISARum conjunto
de dados.
Maurcio T. Damasceno 9. Estatstica Inferencial
-
- Tcnicas que permitem utilizar dados de uma amostra para
generalizaes sobre a populao.
Maurcio T. Damasceno 10. Definies e Conceitos Bsicos Conjunto de
todos os dados que contm a caracterstica que temos interesse.
um subconjunto da populao. Maurcio T. Damasceno 11. Definies e
Conceitos Bsicos
Conjunto de medies/identificaes da varivel de interesse. UE
VARIVEIS DADOS Maurcio T. Damasceno 12. Definies e Conceitos
Bsicos
A portadora da caracterstica ou propriedade que se deseja
investigar Ex: Funcionrios de uma empresa. Caracterstica,
propriedade ou atributo que se deseja investigar. Ex:Idade
Maurcio T. Damasceno 13. Tipos de Variveis Maurcio T. Damasceno
TIPOS DE VARIVEIS QUALITATIVAS QUANTITATIVAS NOMINAL ORDINAL
DISCRETOS CONTNUOS 14. Variveis Qualitativas (no numricas)
- Dados Nominais (sem hierarquia)
- Dados Ordinais (com hierarquia)
Maurcio T. Damasceno 15. Variveis Quantitativas (numricas)
- Dados Discretos (contagem)
-
- Ex: Quantidade de vendas dirias;
-
- Quantidade de transaes financeiras
- Dados Contnuos (nmeros reais)
-
- Ex: Valor das vendas dirias
-
- Valor das transaes financeiras do ms
Maurcio T. Damasceno 16. Relembrando... Maurcio T. Damasceno
TIPOS DE VARIVEIS QUALITATIVAS QUANTITATIVAS NOMINAL ORDINAL
DISCRETOS CONTNUOS 17. Analisando Dados Maurcio T. Damasceno
18.
- No faz sentido operaes algbricas
Dados Qualitativos Maurcio T. Damasceno 19. Ex: Dados de uma
amostra de 24 compras de refrigerantesDados Qualitativos Tabela 1
Distribuio de freqnciasdas compras de refrigerante Fonte Dados
fictcios Maurcio T. Damasceno 20.
Dados Qualitativos Maurcio T. Damasceno 21. Dados
Qualitativos
Maurcio T. Damasceno 22. Dados Qualitativos
Maurcio T. Damasceno 23. Como NO fazer grfico ! Maurcio T.
Damasceno 24. Forma Correta de Representao Grfica Maurcio T.
Damasceno 25. AnalisandoDados Quantitativos Maurcio T. Damasceno
26.
- Ex: Seja uma srie de dados de opes de aes negociadas por dia na
bolsa de valores.
17 negcios realizados nesse dia!! Dados Quantitativos Discretos
Maurcio T. Damasceno 27. Tabela de Freqncias Observaes mais
freqentes!! Maurcio T. Damasceno 28.
Dados Quantitativos Discretos Maurcio T. Damasceno 29. Dados
Quantitativos Contnuos Maurcio T. Damasceno 30. Dados Quantitativos
Contnuos
- Como representar graficamente dados quantitativos
contnuos?
Maurcio T. Damasceno 31.
- Condensa dados agrupando valores emclasses
- Alturas das barras refletem freqncias absolutas ou relativas
(percentuais)
- Representa uma tabela de Distribuio de Freqncias
Histograma Maurcio T. Damasceno 32. Histograma Maurcio T.
Damasceno 33. 0 0 Histograma Maurcio T. Damasceno Classes Freq. 15X
< 25 3 25X < 35 5 35X < 45 2 34. 0 Absolutaou Relativa 0
Freq Histograma Maurcio T. Damasceno Classes Freq. 15X < 25 3
25X < 35 5 35X < 45 2 35. 0 1 2 3 4 5 Absoluta ou Relativa 0
Freq Histograma Maurcio T. Damasceno Classes Freq. 15X < 25 3
25X < 35 5 35X < 45 2 36. 0 1 2 3 4 5 Absoluta ou Relativa 0
lim inferior Freq Histograma Maurcio T. Damasceno Classes Freq. 15X
< 25 3 25X < 35 5 35X < 45 2 37. 0 1 2 3 4 5 0 15 lim
inferior Freq Histograma Maurcio T. Damasceno Classes Freq. 15 X
< 25 3 25X < 35 5 35X < 45 2 38. 0 1 2 3 4 5 015 25 lim
inferior Freq Histograma Maurcio T. Damasceno Classes Freq. 15X
< 25 3 25 X < 35 5 35X < 45 2 39. 0 1 2 3 4 5 0152535 lim
inferior Freq Histograma Maurcio T. Damasceno Classes Freq. 15X
< 25 3 25X < 35 5 35 X < 45 2 40. 0 1 2 3 4 5 015253545 55
lim inferior Freq Histograma Maurcio T. Damasceno Classes Freq. 15X
< 25 3 25X < 35 5 35X 0 Indica comportamento de mesma
tendncia entre duas sries.
- COV = 0 Indica que no existe associao linear entre as
sries.
- COV < 0 Indica comportamento de tendncia contrria entre duas
sries.
Maurcio T. Damasceno 97. Covarincia
- Exerccio : Para as sries de retornos das aes X e Y abaixo,
verificar se existe associao entre elas. Interprete o
resultado.
Maurcio T. Damasceno 98. Covarincia
- Interpretando o resultado do exerccio:
O sinal negativo !!!! Maurcio T. Damasceno 99. Covarincia <
0
- COV(X,Y) < 0 indica associao inversa entre as aes;
- A COV(X,Y) < 0 indica que a tendncia esperada : o retorno de
uma das aes valoriza-se acima do seu retorno mdio quando o retorno
da outra ficar abaixo.
- A COV(X,Y) < 0 indica que as aes esto contrabalanadas,
reduzindo o risco (varincia) da carteira.
- A COV(X,Y) < 0 o que se chama deHeding .
Maurcio T. Damasceno 100. Covarincia < 0 Maurcio T. Damasceno
101. Covarincia > 0
- COV(X,Y) > 0 indica expectativa de retorno das aes no mesmo
sentido;
- A COV(X,Y) > 0 indica valorizaes ou desvalorizaes
conjuntas;
- A COV(X,Y) > 0 indica que as aesNOesto
contrabalanadas,aumentandoo risco (varincia) da carteira.
Maurcio T. Damasceno 102. Covarincia > 0 Maurcio T. Damasceno
103. Problema
- A covarincia mede se existe e como o relacionamento (tendncia)
entre duas sries de dados.
- Mas, existindo o relacionamento, como saber o grau desse
relacionamento?
- Como saber se o grau desse relacionamento Baixo, Mdio ou
Alto?
COEFICIENTE DE CORRELAO= Maurcio T. Damasceno 104. Coeficiente
de Correlao
- Calculando o coeficiente de correlao:
Maurcio T. Damasceno 105. Coeficiente de Correlao
- Interpretando o resultado:
- Indica que possuem tendncias opostas;
- Indica que as tendncias so fortemente opostas.
Maurcio T. Damasceno 106. Coeficiente de Correlao
- Mede o grau de associaolinearentre duas variveis;
- O coeficiente de correlao varia entre 1 e +1;
- Indica a fora de associao entre duas variveis;
- Quanto mais prxima de 1 maisinversaa associao;
- Quanto mais prxima de +1 maisdiretaa associao;
- Quanto mais prxima de 0 a associao indica que as variveis
solinearmenteindependentes.
Maurcio T. Damasceno 107. Coeficiente de Correlao
- Exerccio 1: Para as sries abaixo verifique o grau de associao
das variveis. Interprete graficamente.
Maurcio T. Damasceno 108. Coeficiente de Correlao
- Exerccio 1:Grfico de Disperso
Maurcio T. Damasceno 109. Coeficiente de Correlao
- Exerccio 1:Grfico de Linha das variveis X e Y.
Maurcio T. Damasceno 110. Coeficiente de Correlao
- Forte correlao positiva : a maioria dos pares das observaes
esto sob a reta com declividade positiva.
- Os acrscimos e decrscimos so iguais e na mesma direo.
- As duas sries de observaes so paralelas.
Maurcio T. Damasceno 111. Coeficiente de Correlao
- Exerccio 2:Para as sries abaixo verifique o grau de associao
das variveis. Interprete graficamente.
Maurcio T. Damasceno 112. Coeficiente de Correlao
- Exerccio 2:Grfico de Disperso
Maurcio T. Damasceno 113. Coeficiente de Correlao
- Exerccio 2:Grfico de Linha das variveis X e Y.
Maurcio T. Damasceno 114. Coeficiente de Correlao
- Forte correlao negativa : a maioria dos pares das observaes
esto sob a reta com declividade negativa.
- Os acrscimos e decrscimos so iguais mas em direes opostas.
- As duas sries de observaes no so paralelas.
Maurcio T. Damasceno 115. Coeficiente de Correlao
- Cuidado com as correlaes esprias!!!
- Existncia de correlaes no implica necessariamente em
causalidade!
- Podem existir correlaes sem relao de causa e efeito.
- Exemplo: Taxa de retorno e ndice Pluviomtrico.
- Terceiro Fator: Aumento de vendas do produto em estaes de
chuva.
Maurcio T. Damasceno 116. Aplicao prtica de Anlise de Dados
Maurcio T. Damasceno 117. 118. 119. Maurcio T. Damasceno 120. 121.
Analisando os dados Maurcio T. Damasceno 122. 123. Grfico de
Setores Maurcio T. Damasceno 124. 125. Grfico de Colunas Maurcio T.
Damasceno 126. 127. 1) Selecionar F41 a F 47 2) Digitar a frmula em
F41 * selecionar os dados* selecionar as classes D41 a D46 3)
Pressionar ao mesmo tempo: CTRL+SHIFT+ENTER 128. 129. Qual grfico
usamos para representar a distribuio de frequncias de dados
contnuos? Grfico Histograma Maurcio T. Damasceno Analisando os
dados 130. 131. Grfico Histograma Maurcio T. Damasceno 132. Grfico
Histograma Maurcio T. Damasceno 133. Medidas Estatsticas Maurcio T.
Damasceno Analisando os dados 134. Maurcio T. Damasceno 135. 136.
137. Grfico Histograma 138. Analisando os dados O que cruzamento de
dados? 139. 140. Grfico de Disperso e Correlao Maurcio T. Damasceno
141. 142. Anlise de Dados - II Maurcio T. Damasceno 143.
Relembrando...
- Variveis Quantitativas Apresentam valores numricos que fazem
algum sentido.
-
- Variveis Quantitativas Discretas valores inteiros que fazem
sentido; normalmente proveniente de contagens. Ex: n de perdas, n
de fraudes, n de erros.
-
- Variveis Quantitativas Contnuas valores fracionados que fazem
sentido. Ex: Fluxo de caixa, ndice de rentabilidade.
Maurcio T. Damasceno 144. Distribuio Contnua
- A rea sob a curva, entre dois pontos, informa a
probabilidade.
Mdia Alta frequncia Baixa Freqncia Distribuio Normal. Maurcio T.
Damasceno Freqncia Varivel X 145. Distribuio Normal Maurcio T.
Damasceno A rea total abaixo da curva considerada como 100%. Isto ,
a rea total abaixo da curva 1. 146. Distribuio Normal Maurcio T.
Damasceno 147. Distribuio Normal
- Parmetros da Distribuio Normal
Maurcio T. Damasceno 148. Distribuio Normal
- Conhecendo-se a mdia e o desvio-padro possvel calcular qualquer
valor de probabilidade.
- Exemplo: A mdia das taxas de retorno mensais de uma carteira de
40% e o seu desvio padro 10%.
Maurcio T. Damasceno Pergunta : Qual a probabilidade de se
observar uma taxa de retorno menor ou igual a 50%? 149. Distribuio
Normal
- Qual a probabilidade de se observar um retorno menor ou igual a
50%?
rea Maurcio T. Damasceno 150. Distribuio Normal
- Como calcular a rea sob a curva abaixo do ponto 50?
- A rea desejada obtida pelo clculo da integral da funo
f(x).
Maurcio T. Damasceno 151. Distribuio Normal
- rea sob a curva abaixo do ponto 50:
Maurcio T. Damasceno No Excel:= DIST.NORM(50;40;10;VERDADEIRO)
152. Distribuio Normal
- Exemplo: A mdia das taxas de retorno mensais de uma carteira de
12% e o seu desvio padro 4%.
Maurcio T. Damasceno Pergunta : Qual a probabilidade de se
observar uma taxa de retorno maior que a mdia e menor ou igual a
14,56%? 153. Distribuio Normal Padronizada 14,56 Maurcio T.
Damasceno Probabilidade Mdia= 12 desvio padro= 4 154. Distribuio
Normal Padronizada
- Existem vrias famlias de distribuies normais diferentes.
- Essa distribuio chamada de Distribuio Normal Padronizada. O
operador de transformao :
- Pode-se utilizar uma nica distribuio normal para calcular as
probabilidades.
Nmero de desvios de afastamento em relao mdia. Maurcio T.
Damasceno 155. Distribuio Normal Padronizada Probabilidade em
tabela Z Z Z = +0,64 0,64 0 Maurcio T. Damasceno Probabilidade 12 =
4 14,56 156. Para Z =0,64 0,2389 Maurcio T. Damasceno Z 0,00 0,01
0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,00 0 0,0040 0,0080 0,0120
0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,10 0,0398 0,0438 0,0478
0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,20 0,0793 0,0832
0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,30 0,1179
0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,40
0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844
0,1879 0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157
0,2190 0,2224 0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454
0,2486 0,2517 0,2549 0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734
0,2764 0,2794 0,2823 0,2852 0,80 0,2881 0,2910 0,2939 0,2967 0,2995
0,3023 0,3051 0,3078 0,3106 0,3133 0,90 0,3159 0,3186 0,3212 0,3238
0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,00 0,3413 0,3438 0,3461
0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,10 0,3643 0,3665
0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,20 0,3849
0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,30
0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162
0,4177 1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292
0,4306 0,4319 157.
- A mdia tem Distribuio Normal
Maurcio T. Damasceno Distribuio amostral da mdia 158. Inferncia
Estatstica Maurcio T. Damasceno
- Quando no possvel coletar todos os dados (populao) para
realizar anlises, pode-se retirar amostras de uma populao.
- Anlises realizadas a partir de amostras para se obter concluses
para uma populao so chamadas de Inferncias Estatsticas.
- De modo geral , os mtodos de inferncia estatstica so:
159. Inferncia Estatstica Maurcio T. Damasceno
- uma estimativa de um parmetro desconhecido da populao (ex:
mdia) sob a forma de intervalo.
- O intervalo apresenta uma valor mnimo e uma valor mximo.
- Ao intervalo est associado um grau de confiana.
160. Relembrando: Distribuio Normal Maurcio T. Damasceno 161.
Inferncia Estatstica Maurcio T. Damasceno
- Exemplos de Intervalos de Confiana
- O faturamento mdio mensal das micro empresas prestadoras de
servio, em Braslia, no ano de 2009, foi de R$30.000,00, com
intervalo de confiana ao nvel de 95% entre R$ 25.000,00 a
R$35.000,00.
- A quantidade mdia mensal de horas extras realizadas na empresa
X, no ano de 2009, por funcionrio, foi de 22 horas, com intervalo
de confiana ao nvel de 95% entre 18 a 32.
162. Inferncia Estatstica Maurcio T. Damasceno
- Construido Intervalos de Confiana para a mdia com varincia
populacional conhecida
- Retirar a amostra e calcular a Mdia
- Escolher o Grau de confiana: Exemplo, 95% gera
aproximadamentedoisdesvios padro (1,96).
163. Inferncia Estatstica Maurcio T. Damasceno
- Exemplos de Intervalos de Confiana
- O faturamento mdio mensal de 60 micro empresas prestadoras de
servio, em Braslia, no ano de 2009, foi de R$30.000,00. O desvio
padro foi de R$19.362,92
- IC 95% [30.000,00;35.000,00]
164. Maurcio T. Damasceno Inferncia Estatstica
- Para o resultado anterior, IC 95% [30.000,00;35.000,00],
significa que 95% das vezes em que se extrair amostras de tamanho
60 da mesma populao, espera-se que a mdia se encontre entre
R$30.000,00 e R$35.000,00.
165. Maurcio T. Damasceno Inferncia Estatstica
* Nmero de desvios aproximados de uma distribuio Normal. Grau de
Confiana Nmero de desvios (z)* 68% 1 95% 2 99% 3 166. Maurcio T.
Damasceno Inferncia Estatstica
- Exerccio 1: Para uma amostra de 60 empresas, determine o
Intervalo de confiana, ao nvel de 95%, considerando que a mdia a
mesma, mas o desvio padro de R$10.000,00, menos disperso.
- IC 95% [27.418,01;32.581,99]
=> Menor desvio=> Menor IC!!! 167. Maurcio T. Damasceno
Inferncia Estatstica
- Para o IC 95% [27.418,01;32.581,99], significa que 95% das
vezes em que se extrair amostras de tamanho 60 da mesma populao,
espera-se que a mdia se encontre entre R$27.418,01 e
R$32.581,99.
168. Maurcio T. Damasceno Inferncia Estatstica
- Exerccio 2: Retirada uma amostra de 40 funcionrios,
verificou-se que a quantidade mdia mensal de horas extras
realizadas na empresa X, no ano de 2009, por funcionrio, foi de 22
horas, e desvio padro de 1,5 horas. Construa um intervalo de
confiana ao nvel de 95%.
169. Maurcio T. Damasceno Inferncia Estatstica
- Para o resultado anterior, IC 95% [21,52 ; 22,47], significa
que 95% das vezes em que se extrair amostras de tamanho 40 da mesma
populao, espera-se que a mdia de horas extras se encontre entre
21,52 e 22,47 horas.
- Nesse caso o limite inferior do IC est muito prximo do limite
superior indicando que h pouca variao, ou seja, para os funcionrios
que realizam horas extras, essa quantidade praticamente igual entre
eles.
170. Maurcio T. Damasceno Inferncia Estatstica
- Consideraes a respeito do IC:
- Quando a varincia da populao conhecida, utiliza-se a distribuio
Normal.
- Quando a varincia da populao no conhecida, utiliza-se a
distribuio de Student.
- Quando a varincia da populao no conhecida, mas a distribuio no
pequena (n > 30), pode-se utilizar a distribuio Normal, pois os
resultados so muito prximos utilizao da distribuio de Student.
171. Inferncia Estatstica Maurcio T. Damasceno
- Qualquer afirmativa formulada sobre um valor de um parmetro da
populao, por exemplo, mdia.
- A hiptese no necessariamente verdadeira; pode ser verdadeira ou
falsa.
172. Inferncia Estatstica Maurcio T. Damasceno
- Conhecido tambm como Teste de Significncia
- Permite avaliar suposies feitas sobre uma caracterstica da
populao.
- Auxilia nas tomadas de decises.
173. Inferncia Estatstica Maurcio T. Damasceno
- Exemplo de Teste de Hiptese
- Contexto: Em uma empresa verificou-se a necessidade de um
treinamento para reduzir o tempo realizao de certo trabalho.
- Antes do treinamento o tempo mdio, por funcionrio, para a
realizao do trabalho era de 3 horas.
- Realizado o treinamento, como comprovar que o tempo mdio
diminuiu?
174. Inferncia Estatstica Maurcio T. Damasceno
- Exemplo de Teste de Hiptese
- Hiptese Nula (H0): o tempo mdio de 3 horas.
- Hiptese Alternativa (H1): o tempo mdio menor que 3 horas.
- Construir o Intervalo de Confiana
- Verificar se a afirmao feita em H0 est contida no IC
175. Inferncia Estatstica Maurcio T. Damasceno
- Exemplo de Teste de Hiptese
- Para o exemplo em questo, retirou-se uma amostra de 30
funcionrios, calculou-se o tempo mdio, 2,5 horas, e o desvio padro
0,9 horas. Para um IC de 95% para o tempo mdio, obteve-se:
176. Inferncia Estatstica Maurcio T. Damasceno
- Exemplo de Teste de Hiptese
- Qual a deciso? Aceitar a hiptese H0 (o treinamento no surtiu
efeito) ou rejeitar H0 (o treinamento surtiu efeito)?
- Pelo IC calculado, percebe-se que o tempo mdio de 3 horas no
faz parte do intervalo, logo rejeita-se a Hiptese Nula (H0) e
conclui-se que o treinamento surtiu efeito.
177. Inferncia Estatstica Maurcio T. Damasceno
- Exerccio de Teste de Hiptese
- Contexto: Em uma empresa observou-se um elevado tempo mdio de
dias de afastamentos do trabalho, por semana, relacionados a doenas
por Leses por Esforo Repetitivo.
- O departamento de gesto de pessoas decidiu trocar a empresa
responsvel pelo exerccio laboral e aps seis meses verificou o tempo
mdio de afastamentos.
- Ser que a nova empresa mais eficiente? O tempo mdio de
afastamentos diminuiu estatisticamente?
178. Inferncia Estatstica Maurcio T. Damasceno
- Exemplo de Teste de Hiptese
- Para uma amostra de 40 funcionrios, observou-se um nmero de
afastamentos nos ltimos seis meses de 197 dias. O desvio padro da
amostra de 2,8 dias. Se o tempo mdio anterior era de 7,4 dias,
construa um IC de 95% para o tempo mdio e verifique se houve uma
reduo.
179. Inferncia Estatstica Maurcio T. Damasceno
- Exemplo de Teste de Hiptese
- Qual a deciso? Aceitar a hiptese H0 (a nova empresa no
conseguiu reduzir o tempo mdio de afastamentos) ou rejeitar H0 (o
tempo mdio de afastamentos diminuiu)?
- Pelo IC calculado, percebe-se que o tempo mdio de 7,4 dias no
faz parte do intervalo, logo rejeita-se a Hiptese Nula (H0) e
conclui-se que o tempo mdio de afastamentos diminuiu.
180. Inferncia Estatstica Maurcio T. Damasceno
- Exerccio de Teste de Hiptese