51
Estatística básica Estatística básica Estatística é a ciência dos dados, envolvendo o Estatística é a ciência dos dados, envolvendo o desenvolvimento de processos, métodos e técnicas de coleta classificação organização resumo análise e coleta, classificação, organização, resumo, análise e interpretação de dados sobre uma população, e os é d d i l õ f di õ métodos detirar conclusões ou f azer predições com base nesses dados. Aulas de Matemática / Física / Química Contato: Horacimar (21) 81262831 [email protected]

Aula estatística descritiva básica

Embed Size (px)

DESCRIPTION

Aula básica de estatística descritiva. Contem organização de dados em tabelas, classes, médias, variância, desvio padrão, coeficiente de variação, covariância.

Citation preview

  • 1. Estatstica bsicaEstatsticabsica Estatstica a cincia dos dados, envolvendo oEstatstica a cincia dos dados, envolvendo o desenvolvimento de processos, mtodos e tcnicas de coleta classificao organizao resumo anlise ecoleta, classificao, organizao, resumo, anlise e interpretao de dados sobre uma populao, e os d d i l f di mtodos de tirar concluses ou fazer predies com base nesses dados. AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected]

2. Estatstica bsicaEstatsticabsica Organizaoe descrio Descritiva descrio dosdados Estatstica Clculodemdias, varincias,estudode grficos, tabelas, etc.Estatstica grficos,tabelas,etc. Indutiva EstimaodeIndutiva (Inferencial) parmetros,testede hipteses,etc. AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 3. Estatstica bsicaEstatsticabsica A estatstica tem a capacidade de sintetizar os dados;A estatstica tem a capacidade de sintetizar os dados; A amostragem o ponto de partida (na prtica) para A amostragem o ponto de partida (na prtica) para todo um Estudo Estatstico. atravs da amostragem b d d d di d d i dque obtemos os dados da medio de determinada caracterstica ou propriedade de um objeto, pessoa ou coisa; AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 4. Estatstica bsicaEstatsticabsica Populao: a coleo de todas as observaesPopulao: a coleo de todas as observaes potenciais sobre determinado fenmeno; Amostra: o conjunto de dados efetivamenteAmostra: o conjunto de dados efetivamente observados, ou extrados; Populao Amostras AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 5. Estatstica bsicaEstatsticabsica Cada observao individual ou item denominadaCada observao individual ou item denominada como unidade elementar, que pode estar composta por um ou mais itens medidos propriedadespor um ou mais itens medidos, propriedades, atributos, etc, denominados como variveis. Varivel uma caracterstica, propriedade ou, p p atributo de uma unidade da populao, cujo l d i t id d dvalor pode variar entre as unidades da populao. AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 6. Estatstica bsicaEstatsticabsica Exemplo:p Unidade elementar Variveis Nome Idade Cargo Sexo Peso Escolaridade Joo 27 Supervisor M 62kg 2 grau Alex 38 Chefe M 78kg 1 grau Ana 32 Secretria F 58kg 3 grau AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 7. Estatstica bsicaEstatsticabsica Tipos de variveisTipos de variveis N i l Qualitativa Nominal Varivel Ordinal Varivel Discreta Quantitativa Contnua AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 8. Estatstica bsicaEstatsticabsica Exemplo: Para uma populao de peas produzidos em umExemplo: Para uma populao de peas produzidos em um processo, poderamos ter: Varivel TipoVarivel Tipo Estado: Perfeitaoudefeituosa QualitativaNominal Qualidade:1, 2ou3categoria QualitativaOrdinal Nmerode peasdefeituosas Quantitativa Discreta Dimetrodaspeas QuantitativaContnua AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 9. Estatstica bsicaEstatsticabsica Agrupamentodedadosedistribuiodefrequncias Quando vamos fazer um levantamento de uma populao, um dos passos retirar uma amostra dessa populao e obter dados relativos varivel desejada nessa amostra; Cabe Estatstica sintetizar tais dados na forma de tabela e grficos que contenham alm dos valores das variveis o nmero deque contenham, alm dos valores das variveis, o nmero de elementos correspondentes a cada varivel; AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 10. Estatstica bsicaEstatsticabsica Agrupamentodedadosedistribuiodefrequncias A esse procedimento est associado o conceito de: Dados brutos: o conjunto de dados numricos obtidos que ainda f i dno foram organizados; Rol: o arranjo dos dados brutos em ordem crescente (ou decrescente);decrescente); Amplitude (H): a diferena entre o maior e o menor dos valores observados;; Frequncia absoluta (ni): o nmero de vezes que um elemento aparece na amostra; AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 11. Estatstica bsicaEstatsticabsica Agrupamentodedadosedistribuiodefrequncias n : nmero total de dados da amostra nn k i i =1 k : nmero de valores diferentes na amostra k i =1 Frequncia relativa (fi): n n f i i = 1 1 == k i if Frequncia absoluta acumulada (Ni): a soma da frequncia absoluta do valor da varivel i com todas as frequncias absolutas anteriores; Frequncia relativa acumulada (Fi): N F i n N F i i = AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 12. Estatsticabsica Agrupamentodedadosedistribuiodefrequncias Exemplo: Os seguintes dados foram amostrados do nmeros de negcios efetuados diariamente por um operador financeiro: Populao: Nmero de negcios efetuados diariamente Dados brutos: {14, 12, 13, 11, 12, 13, 16, 14, 14, 15, 17, 14, 11, 13, 14, 15, 13, 12, 14, 13, 14, 13, 15, 16, 12, 12}, , , , , , , , , , , , , , } Rol: {11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14,14, 15,15,15, 16,16, 17} Amplitude: 17 11 = 6Amplitude: 17 11 = 6 n = 26 observaes AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 13. Estatsticabsica Nmero de Operaes Freq. Freq. Freq. Absoluta Freq. fechadaspor dia Absoluta Relativa Absoluta Acumulada Acumulada 11 2 7,69% 2 7,69% 12 5 19,23% 7 26,92% 13 6 23,08% 13 50,00% 14 7 26,92% 20 76,92% 15 3 11,54% 23 88,46% 16 2 7,69% 25 96,15%, , 17 1 3,85% 26 100,00% Total 26 100 00%Total 26 100,00% AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 14. Estatsticabsica AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 15. Estatsticabsica Classes As classes so um artifcio para condensar o nmero de elementos diferentes de uma amostra. Imagine construir uma tabela para 200 l dif ld d bl ivalores diferentes, nos moldes do problema anterior. Os principais prrequisitos para uma boa definio de classes em um conjunto de dados so:conjunto de dados so: a) as classes devem abranger todas as observaes; b) o extremo superior de uma classe o extremo inferior da classe subsequente (simbologia: |, intervalo fechado esquerda e aberto di i )direita); c) cada valor absoluto deve enquadrarse em apenas uma classe; d) k 25 de modo geral sendo k o nmero de classes;d) k 25, de modo geral, sendo k o nmero de classes; e) As unidades das classes devem ser as mesmas dos dados. AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 16. Estatsticabsica Classes Clculo de k: Nk l1 (Frmula de Sturges)Nk 2log1 += Nk 2ln ln 22 n knn kk == Obs.: N o nmero de elementos diferentes da amostra e, muitas vezes, pode ser considerado N = n (no. de observaes). Intervalo da classe (h): h H/k Ponto mdio da classe (xi) : Ponto mdio entre o limite inferior e o limite superior de cada classe. AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 17. Estatsticabsica Exemplo: Utilizando os dados do exemplo anterior, temos: 37 k 6=H 3 2l ln 47log1 2 = += Nk k 2 3 6 ==h 3 2ln k 3 Freq Faixade negcios Xi Freq. Absoluta Freq. Relativa Freq.Absoluta Acumulada Freq. Acumulad a 11|13 12 7 26,92% 7 26,92% 13|15 14 13 50,00% 20 76,92% 15|17 16 6 23,08% 26 100,00%| , , Total 26 100,00% AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 18. Estatsticabsica MedidasdePosio Mostram o valor representativo em torno do qual os dados tendem a n p q agruparse com maior ou menor frequncia. x xxxxx x n i i n = = +++++ = 14321 ... Mdia aritmtica: nn x == = = ++++ = i n i i nn px pxpxpxpx x 1332211 . ....... Mdia aritmtica ponderada: = = ++++ = n i i n p pppp x 1 321 ... pi : peso da amostra xi AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 19. Estatsticabsica MedidasdePosio Exemplo: Os dados {11, 13, 15, 17, 19} apresenta a seguintep { , , , , } p g mdia (n=5, pois temos cinco nmeros) : 1917151311 ++++ 15 5 1917151311 = ++++ =x Se um aluno obteve as notas {7, 10, 6, 8} com pesos {1, 2, 2,{ } p { 3}, qual ser a nota final do aluno: 875,7 8 63 3221 3.82.62.101.7 == +++ +++ =x AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 20. Estatsticabsica MedidasdePosio P R O AsomadosdesviossempreO P R p igualazero R I E A soma dos quadrados dosE D A Asomadosquadradosdos desviosdasobservaesdeumaA D E sriesempreumvalormnimo AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] E 21. Estatsticabsica MedidasdePosio Mdia aritmtica ponderada para dados agrupados em classes: ++++ i n i i nx nxnxnxnx 1332211 . ....... = = ++++ ++++ = n i i i n nn n nnnn nxnxnxnx x 1 1 321 332211 ... ....... =i 1 = n inn n f i i = Sabendo que: =i i 1 n fi n i i inn fxfxfxfxfxx = =++++= 1 332211 ........ fi : Frequncia de ocorrncia da amostra xi AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 22. Estatsticabsica MedidasdePosio Exemplo: Qual a mdia do nmero de operaes fechadasp p por dia: AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 23. Estatsticabsica MedidasdePosio A mdia pela frequncia absoluta :p q 1237652 1.172.163.157.146.135.122.11 ++++++ ++++++ =x 5413 352 1237652 = ++++++ x A mdia pela frequncia relativa : 54,13 26 x p q %08,23.13%23,19.12%69,7.11 +++=x 5413 %85,3.17%69,7.16%54,11.15%92,26.14 +++ AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 54,13x 24. Estatsticabsica Valor MedidasdePosio Exemplo: Calcule a mdia da tabela abaixo: Valor mdioda classe p 3626161314712 ++ 92,13 26 362 6137 6.1613.147.12 = ++ ++ =x Observe que o resultado apresentou uma pequena diferena do anterior (2,8% maior que 13,54 ). A preciso dos dados na tabela em classes diminuiu pouco em relao aos dados originais. AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 25. Estatsticabsica MedidasdePosio Mediana: o valor do meio de um conjunto de dados, quando osj , q dados esto dispostos em ordem crescente ou decrescente, ou seja, o Rol de Dados. termo n x o + = 1~ Se n impar 2 Senimpar 1 22~ termo n termo n x oo ++ Senpar 2 x = p AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 26. Estatsticabsica MedidasdePosio Exemplo: Qual a mediana dos dados abaixo:p Dados brutos: {14, 12, 13, 11, 12, 13, 16, 14, 14, 15, 17, 14, 11, 13, 14, 15, 13, 12, 14, 13, 14, 13, 15, 16, 12, 12} Rol: {11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14,14, 15,15,15, 16,16, 17} n = 26 observaes (par) 513 14131413 1 2 26 2 26 ~ ++ ++ termotermo termotermo x oo oo 5,13 222 ====x A mediana dos dados 13,5. AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 27. Estatsticabsica MedidasdePosio Exemplo: Calcule a mediana dos dados abaixo:p A mediana estar na faixa de 13 a 15, pois temos no total 26 observaes e mediana i (13 ) ( i i l l di 13 14encontrase no meio (13 termo) (aqui no iremos calcular a mdia entre o 13 e o 14 Verique !). 71313 ~ ~ x AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 92,13 720 713 1315 13 13 13 = x x 28. Estatsticabsica MedidasdePosio Moda ou classe modal (mo): o valor que representa a maior( o) q p frequncia em um conjunto de observaes individuais. Em alguns casos, pode haver mais de uma moda. X Xi ni 0| 3 1,5 7 3| 6 4,5 13 Classe modal3| 6 , 6| 9 7,5 6 9| 12 10 5 2 Classemodal 9| 12 10,5 2 AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 29. Estatsticabsica MedidasdePosio S l l d j d b Mdia Sensvelavaloresextremosdeumconjuntodeobservaes Usatodososdadosdisponveis Robusta:Nosofremuitocomapresenadealgunsvalores Mediana muitoaltosoumuitobaixos Nousatodososdadosdisponveis Noafetadaporvaloresextremos Moda Nousatodososdadosdisponveis AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 30. Estatsticabsica MedidasdePosio Percentil: De forma geral, o percentil de um conjunto de valoresg , p j postos em ordem crescente um valor que contm p% das observaes abaixo dele. Os percentis de ordem 25, 50 e 75 so chamados de quartis. Os decis so os percentis de ordem 10, 20, ..., 90. 10 = xp p 10100 = n x1 n 1 1 .100 = n x p AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] x1 n 1n 31. Estatsticabsica MedidasdePosio Calcular o percentil de ordem 50 (2 Quartil).p ( ) Q50 = mediana (so 50 dados o Q50 est no 25 termo) X n AcumX ni Acum. 1,810| 1,822 7 7 2139 2125 83418461 834,1 ~ = x 1,822| 1,834 14 21 2139834,1846,1 48341 ~ 1,834| 1,846 18 39 18 4 012,0 834,1 = x 1,846| 1,858 7 46 1 858| 1 870 4 50 837,1 ~ =x1,858| 1,870 4 50 AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 32. Estatsticabsica As medidas de disperso possuem a finalidade de verificar quanto os MedidasdeDispersoouVariabilidade valores da srie esto distantes da mdia da srie. O principal meio de calcular a variabilidade atravs da varincia, que l l d l f l b icalculada pela frmula abaixo: ( )2 nn ( ) 2 1 2 1 2 2 xxx n i i n i i 112 x nn s ii == == Onde n o nmero de observaes, a mdia e xi so os valores individuais. Esta frmula valida para populao. Para amostra devese x individuais. Esta frmula valida para populao. Para amostra deve se considerar n1 ao invs de n. AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 33. Estatsticabsica MedidasdeDispersoouVariabilidade Exemplo: Os dados {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} apresentam qual mdia, varincia e desvio padro ? A i t 10 A di i l d lA sequncia apresenta n=10 nmeros. A mdia igual a soma dos valores dividido pelo nmero de elementos. A varincia e desvio padro so calculados na sequncia:calculados na sequncia: 5,5 10 55 ==x 385109...21 2222 1 2 =++++== x n n i i 25,85,5 10 385 22 1 2 2 === = x n x s n i i AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 87,225,82 == ss 34. Estatsticabsica Para calcular a varincia quando os dados estiverem dispostos em classes MedidasdeDispersoouVariabilidade devese utilizar a seguinte frmula: ( ) k 2 ( ) ( ) = = = k ii i ii fxx nxx s 2 1 2 2 . . k o nmero de classes, ni a frequncia absoluta, n o nmero de observaes e fi a frequncia relativa; ( )=in 1 relativa; Quando extramos a raiz quadrada da varincia, obtemos o desvio padro (s). Uma observao importante que a varincia possui as unidades dos dados individuais elevado ao quadrado enquanto que o desvio padro edados individuais elevado ao quadrado, enquanto que o desvio padro e mdia possuem mesma unidade. AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 35. Estatsticabsica MedidasdeDispersoouVariabilidade Exemplo: Calcular a varincia e desvio padro dos dados abaixo: X Freq. Absoluta Iremos realizar osAbsoluta 1,810|1,822 7 Iremos realizar os clculos na forma de tabela, porque os dados 1,822|1,834 14 1,834|1,846 18 , p q ficam mais organizados e os clculos mais fceis de 1,846|1,858 7 1,858|1,870 4 serem entendidos. 1,858| 1,870 4 ( ) nxx k 2 Verifique que as colunas sero organizadas de acordo com a frmula para calcular a varincia AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] ( ) n nxx s i ii= = 12 .calcular a varincia. 36. Estatsticabsica MedidasdeDispersoouVariabilidade x xi ni xixm (xixm)2 (xixm)2.nix xi ni xi xm (xi xm) (xi xm) .ni 1,810|1,822 1,816 7 0,0024 0,00058 0,0040 1 822| 1 834 1 828 14 0 012 0 00014 0 00201,822|1,834 1,828 14 0,012 0,00014 0,0020 1,834|1,846 1,840 18 0,000 0,00000 0,0000 1 846|1 858 1,852 7 0,012 0,00014 0,00101,846| 1,858 1,852 7 0,012 0,00014 0,0010 1,858|1,870 1,864 4 0,024 0,00058 0,0023 Soma 9,200 Soma 0,00936 Mdia(xm) 1,840 s2 0,00187m 0430 043,0 00187,02 = = s s AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] %4,2%100. 840,1 043,0%100. == x sCV 37. Estatsticabsica MedidasdeDispersoouVariabilidade Outra forma de expressar a disperso dos dados atravs do Coeficiente de Variao (CV), que dado pela frmula: %100. x s CV = onde s o desvio padro, e a mdia.x O Coeficiente de Variao d uma indicao de quanto os dados esto dispersos em torno da mdia. Quanto maior o valor de CV, maior a dispersodisperso. AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 38. Estatsticabsica MedidasdeDispersoouVariabilidade Exemplo: No exemplo de clculo de varincia e desvio padro, obtivemos os valores 8,25 e 2,87 respectivamente. A mdia tinha resultado em 5,5 O l d C fi i t d V i O valor do Coeficiente de Variao ser: 872s Um valor de 52% indica que os dados esto muito dispersos com relao %52%100. 5,5 87,2 %100. == x s CV a mdia. Por exemplo os dados {5 1; 5 2; 5 3; 5 4; 5 5; 5 6; 5 7; 5 8; 5 9; 6 0}Por exemplo, os dados {5,1; 5,2; 5,3; 5,4; 5,5; 5,6; 5,7; 5,8; 5,9; 6,0} apresentam mdia: 5,55; desviopadro: 0,29 e CV = 5% (Confira!) AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] 39. Estatsticabsica Covarincia: Mede a correlao (dependncia) linear entre duas variveis x e yvariveis x e y. calculada como: calculada como: n ( )( ) yxyx yyxx yxCov n i ii .. . ),( 1 = = = yy n y ),( A covarincia entre as mesmas variveis, isto , Cov(x, x) por exemplo, igual a prpria varincia Var(x) = s2. AulasdeMatemtica/Fsica/Qumica Contato:Horacimar (21)81262831 [email protected] exemplo, igual a prpria varincia Var(x) s . 40. Estatsticabsica ( )( ). xxxx n ii ( )( ) 21 )(),( sxVar n xxCov i === = Os seguintes valores de covarincia do uma indicao se osOs seguintes valores de covarincia do uma indicao se os valores so independentes, ou possuem correlao positiva ou negativa. 0),( =yxCov Variveisindependentes negativa. ),( y 0),( >yxCov Correlaolinearpositiva 0),( yxCov 0),(