apostilha estatística

Embed Size (px)

Citation preview

  • 8/6/2019 apostilha estatstica

    1/44

    Instit uto d e Ensi no Jos Rodrig ues da Silva Autorizado Pelo Parecer n. 1144/002 CEE/RJ

    INTRODUO ESTATSTICA

  • 8/6/2019 apostilha estatstica

    2/44

    2

    Sumrio1 Apresentao.......................................................................................................................4

    2 A Estatstica.........................................................................................................................5

    3 Populao e Amostra...........................................................................................................5

    4 Estatstica Descritiva e Indutiva ...........................................................................................6

    5 Tipos de Variveis ...............................................................................................................6

    5.1 Exerccios:....................................................................................................................7

    6 Amostragem ........................................................................................................................7

    6.1 Exerccios:....................................................................................................................8

    7 Tcnicas de descrio grfica..............................................................................................9

    7.1 Tabelas.........................................................................................................................9

    7.2 Grficos........................................................................................................................97.2.1 Diagramas.............................................................................................................9

    7.2.2 Cartogramas........................................................................................................11

    7.2.3 Pictogramas.........................................................................................................12

    7.3 Exerccios...................................................................................................................12

    8 Distribuio de frequncia..................................................................................................13

    8.1 Exemplo Resolvido:....................................................................................................13

    8.2 Exerccios:..................................................................................................................15

    9 Representao grfica de uma distribuio .......................................................................179.1 Exerccios...................................................................................................................17

    10 Medidas de posio .......................................................................................................18

    10.1 Medidas de tendncia central ....................................................................................18

    10.1.1 Mdia Aritmtica (x).............................................................................................18

    10.1.2 Moda (Mo) ...........................................................................................................19

    10.1.3 Mediana (Md).......................................................................................................19

    10.2 Exerccios...................................................................................................................20

    10.3 Medidas Separatrizes .................................................................................................2110.3.1 Quartis.................................................................................................................21

    10.3.2 Percentis..............................................................................................................21

    11 Medidas de Disperso....................................................................................................23

    11.1 Amplitude Total...........................................................................................................23

    11.2 Varincia.....................................................................................................................23

  • 8/6/2019 apostilha estatstica

    3/44

    3

    11.3 Desvio Padro ............................................................................................................24

    11.3.1 Propriedades:......................................................................................................24

    11.3.2 Exemplo resolvido:...............................................................................................25

    11.4 Coeficiente de variao (CV) ......................................................................................25

    11.5 Exerccios...................................................................................................................26

    12 Noes de assimetria.....................................................................................................27

    13 A distribuio Normal .....................................................................................................28

    13.1 Propriedades: .............................................................................................................28

    13.2 Exemplo Resolvido:....................................................................................................28

    14 Noes de Probabilidade ...............................................................................................30

    14.1 Exemplos resolvidos:..................................................................................................31

    14.2 Eventos complementares............................................................................................31

    14.3 Eventos independentes...............................................................................................31

    14.4 Eventos mutuamente exclusivos.................................................................................32

    14.5 Exerccios Resolvidos:................................................................................................32

    14.6 Exerccios:..................................................................................................................33

    15 Correlao e Regresso.................................................................................................34

    15.1 Correlao..................................................................................................................34

    15.1.1 Caractersticas de r..............................................................................................36

    15.1.2 Exemplo resolvido:...............................................................................................36

    15.2 Regresso ..................................................................................................................37

    15.2.1 Exemplo resolvido:...............................................................................................37

    15.3 Exerccios...................................................................................................................38

    16 Nmeros ndices............................................................................................................40

    16.1 Exemplo:.....................................................................................................................40

    16.2 Exerccio resolvido:.....................................................................................................41

    16.3 ndice Agregativo........................................................................................................41

    16.4 Exerccios:..................................................................................................................4217 Introduo aos testes de hipteses e significncia .........................................................43

    17.1 Erros do Tipo I e II ......................................................................................................43

    17.2 Nvel de significncia ..................................................................................................43

    17.3 Tipos de testes ...........................................................................................................43

    18 Literatura recomendada / Referncias bibliogrficas ......................................................44

  • 8/6/2019 apostilha estatstica

    4/44

    4

    1 ApresentaoOl!

    Esta apostila uma introduo a um dos mais importantes e vastos campos da matemticaaplicada: a Estatstica.

    O contedo est organizado sempre com introdues tericas, alguns exemplos resolvidos eexerccios para treinamento.

    Alguns tpicos bsicos de matemtica como funes, logaritmos e probabilidade soessenciais para a compreenso da estatstica. Sempre que achar necessrio, feche estaapostila e procure aprofundar a teoria em matemtica! Esse um esforo que compensa, poiscapacidade analtica sem dvida um dos diferenciais que as empresas procuram neste inciode sculo XXI.

    Sempre que possvel busque tambm na internet referncias atualizadas sobre os assuntosaqui tratados.

    Bom estudo, e boa sorte!

    Marco Fisbhen

  • 8/6/2019 apostilha estatstica

    5/44

    5

    2 A EstatsticaAntes de comearmos a estudar Estatstica, importante que saibamos o que estamosestudando.

    A estatstica, antes de mais nada, um ramo da matemtica aplicada. Seu objetivo fornecermtodos para coleta, organizao, resumo, apresentao e anlise dos dados, visandoobteno de concluses vlidas e, finalmente, tomada de decises.

    Assim, a estatstica serve de instrumento de apoio a vrios outros campos do conhecimento naverdade, a todos os ramos do conhecimento em que dados experimentais so manipulados.Podemos, apenas para citar alguns, falar da importncia da estatstica na Fsica, Qumica,Medicina, Engenharia, Cincias Socias, e, claro, na Administrao de Empresas. 3 Populao e AmostraAo coletarmos dados sobre um grupo de objetos ou indivduos, como por exemplo a cor dosolhos ou o peso de estudantes de ensino mdio ou at o nmero de peas defeituosasproduzidas em um dia, nem sempre poderemos observar todo o grupo, principalmente noscasos em que tal grupo for muito grande ou at mesmo inacessvel.

    Desse modo, em vez de examinarmos todo o grupo ou conjunto, chamado de populao,levantaremos os dados apenas de uma parte desta populao, chamada amostra.

    De maneira mais formal, populao (ou universo) um conjunto de elementos com pelomenos uma caracterstica comum.

    Os estudantes universitrios, por exemplo, constituem uma populao, pois no mnimoapresentam uma caracterstia em comum: so aqueles que estudam em universidades. Essacaracterstica em comum delimita de maneira inequvoca os elementos que pertencem populao, e os que no pertencem.

    No entanto, como j citei, muitas vezes no conveniente, e muitas vezes impossvellevantar os dados referentes a todos os elementos da populao. Devemos portanto limitarnossas observaes uma amostra. Formalizando a idia, amostra um subconjunto finito deuma populao.

    importante mencionar neste ponto que embora a amostra seja finita, a populao pode sertambm finita ou infinita.

    Para relembrar: conjunto finito aquele que contm um nmero limitado de elementos e

    conjunto infinito aquele que contm um nmero ilimitado de elementos.

  • 8/6/2019 apostilha estatstica

    6/44

    6

    4 Estatstica Descritiva e IndutivaOs mtodos da estatstica que buscam somente descrever e analisar certo grupo de dados,independentemente de serem dados extrados de uma amostra ou de toda a populao, sochamados de mtodos de estatstica descritiva.Por outro lado, se uma amostra representativa de uma populao, e tiramos concluses arespeito desta populao com os dados extrados da amostra, temos uma aplicao da estatstica indutiva. Raciocnio indutivo aquele que parte do conhecimento de uma partepara tirar concluses sobre a realidade do todo. Assim, estatstica indutiva a parte daestatstica que tira concluses sobre a populao partindo do conhecimento da amostra.

    claro que o processo de induo no exato, e a estatstica indutiva est sujeita a erros. Noentando, os mtodos de induo (ou inferncia) estatstica so capazes de definir at queponto, e com que probabilidade, estamos errando.5 Tipos de VariveisDentro de um estudo estatstico, precisamos definir quais caractersticas dos elementos(populao ou amostra) nos interessa estudar.

    Essa caracterstica pode ser, por exemplo, o peso ou a cor dos olhos de um certo nmero depessoas. Assim, peso e cor dos olhos so denominados variveis, cujos resultadosdependero dos elementos considerados. E fcil perceber que se tivermos n elementos (nocaso, n pessoas) em nosso estudo, teremos n valores para a varivel peso.Por conveno, definimos varivel como o conjunto de resultados possveis para umfenmeno.

    Dependendo do objetivo de nosso estudo, a caracterstica (varivel) em foco poder ser:

    a. Qualitativa quando for expressa por tipos ou atributos: sexo (masculino ou feminino),cor dos olhos (azuis, castanhos, etc.), qualidade de uma pea produzida (perfeita oudefeituosa).

    b. Quantitativa quando for expressa em nmeros. importante notar que as variveisquantitativas podem ser subdivididas em discretas e contnuas.Varivel contnua aquela que pode assumir qualquer valor entre dois limites. Poroutro lado, uma varivel discreta s pode asumir valores pertencentes a um conjuntoenumervel.Preste ateno nos exemplos:

    b.1 Variveis quantitativas discretas: nmero de alunos em uma turma, pontos obtidosem uma jogada de dados, nmero de peas produzidas em um dia de trabalhob.2 Variveis quantitativas contnuas: peso dos alunos em uma turma, dimetros depeas produzidas em um dia.

    Ao observarmos os exemplos, podemos perceber que, de maneira geral, os valores dasvariveis discretas so obtidos por contagens, enquanto que os valores das variveiscontnuas so obtidos pormedies.

  • 8/6/2019 apostilha estatstica

    7/44

    7

    Por ltimo, as variveis so designadas por letras latinas. Em geral: x, y ou z.

    5.1 Exerccios:1) Estabelea quais dos dados seguintes so discretos e quais so contnuos:

    a) Nmero de aes vendidas na bolsa de valoresb) Temperaturas registradas a cada meia hora em um posto de meteorologiac) Meia vida mdia das amostras de medicamentosd) Dimetros de 1000 parafusos produzidos por uma fbricae) Quantidade de pessoas no carnaval de olinda

    Respostas: Discretos, Contnuos, Contnuos, Contnuos, Discretos.

    2) Classifique as variveis em qualitativas ou quantitativas (contnuas ou discretas):

    a) Cor dos cabelosb) Nmero de filhosc) Comprimento de peas produzidas por certa mquina

    Respostas: Qualitativa, Quantitativa discreta, Quantitativa contnua.6 AmostragemVoc neste ponto j sabe que a estatstica indutiva busca tirar concluses sobre a populaobaseado em resultados retirados das amostras. Porm o processo no to simples, porqueprecisamos garantir que a amostras sejam representativas da populao, ou seja, a amostradeve ter as mesmas caractersticas bsicas da populao em relao varivel em estudo.

    Existem basicamente dois tipos de amostragem, a probabilstica e a no probabilstica . Aamostragem probabilstica aquela em que todos os elementos da amostra tem probabilidadeconhecida, e diferente de zero, de pertencer amostra. Caso contrrio, a amostragem serno probabilstica.

    Exemplificando, a amostragem probabilstica mais simples justamente denominadaamostragem casual simples, e equivalente a um sorteio lotrico, em que todos oselementos tm igual probabilidade de pertencer amostra.

    Numeramos a populao de 1 a n e sorteamos por meio de qualquer dispositivo k nmerosdesta sequncia.

    Podemos numerar alunos de 1 a 40 e colocar os nmeros dentro de uma caixa e retirar um aum, 10 nmeros. A amostra aleatria simples ter, neste caso, 25% da populao.

    Se o nmero de elementos da mostra for muito grande, o sorteio pode ser invivel. Neste casopodemos utilizar uma tabela de nmeros aleatrios para realizar a amostragem. Procure nainternet uma tabela de nmeros aleatrios. Se voc tiver acesso planilhas Excel, descubracomo gerar nelas as tabelas de nmeros aleatrios.

    Um outro tipo de amostragem probabilstica a amostragem sistemtica, em que oselementos da populao j se acham ordenados e a retirada de elementos para composio da

  • 8/6/2019 apostilha estatstica

    8/44

    8

    amostra feita periodicamente. Em uma linha de produo, se retirarmos um item a cada 10produzidos para controle de qualidade, estaremos utilizando a abordagem sistemtica.

    Poderamos utilizar o mesmo mtodo para retirar uma amostra de uma populao dedeterminada rua. Se a rua contm 500 prdios, e queremos que a amostra contenha 10% dapopulao (50 prdios), podemos escolher aleatoriamente o 1 prdio e ir pulando de 10 em

    10 prdios at chegar ao 50 elemento.Se por acaso nossa populao contiver subpopulaes ou estratos, importante utilizar umaamostragem estratificada, em que os elementos da amostra so proporcionais aos elementosdos estratos da populao. Um bom exemplo uma turma com 60 alunos, contendo 40meninos e 20 meninas. Temos uma proporo 2:1. importante que a amostra contenha estamesma proporo. Assim, se tivermos uma amostra com 15 elementos, 10 devero sermeninos e 5 meninas. Mantendo a proporo 2:1.Amostras no probabilsticas so tambm empregadas em trabalhos de estatstica porsimplicidade ou inviabilidade de fazermos amostras probabilsticas. Os casos mais importantesso:

    a) A inacessibilidade de toda a populao (e neste caso seremos forados a colher aamostra somente na parte da populao que est acessvel)

    b) Amostragem a esmo, em que o selecionador procura ser aleatrio na amostragem, masno utiliza nenhum mtodo confivel de sorteio

    c) Amostragens intencionais, em que o amostrador delibaradamente escolhe algunselementos para pertencer amostra, julgando os representativos

    d) Amostragens por voluntrios, no caso de por exemplo aplicaes experimentais denovos medicamentos.

    6.1 Exerccios:1) Pesquise o peso dos seus colegas de classe (incluindo voc), com uma amostra que

    corresponda a 30% da populao utilizando amostragem casual (ou aleatria) simples.No deixe de procurar na internet uma tabela de nmeros aleatrios!

    2) O diretor de uma escola, na qual esto matriculados 320 meninas e 280 meninos desejapassar um questionrio socio econmico para uma amostra correspondente a 10% daclientela. Qual o nmero de elementos componentes da amostra?Resposta: 64 meninas e 56 meninos.

    3) Uma populao encontra se dividida em 3 estratos, com tamanhos 40, 100 e 60.Sabendo se que 9 elementos foram retirados do 3 estrato em uma amostragemestratificada, determine o nmero total de elementos da amostra.Resposta: 30 elementos

  • 8/6/2019 apostilha estatstica

    9/44

  • 8/6/2019 apostilha estatstica

    10/44

    10

    Exemplo:

    Utilizando nossa tabela de alturas mdia em funo das escolas, temos:

    Outro tipo importante de representao o grfico em colunas ou barras, em que utilizamosretngulos verticais (colunas) ou horizontais (barras) para visualizar as sries.

    Exemplos:

    Finalmente, devemos conhecer o grfico circular ou em setores, em que um crculo divididocom reas proporcionais aos dados da srie.

  • 8/6/2019 apostilha estatstica

    11/44

    11

    Cada setor obtido por meio de regra de trs simples, com o total da srie valendo 360

    Exemplo:

    7.2.2 CartogramasSo empregados sobre uma carta geogrfica, com os dados diretamente relacionados aorecortes geogrficos ou polticos.

    Podemos representar dados em pontos (em nmero ou tamanho proporcional aos valores) ou

    cores.Exemplo:

  • 8/6/2019 apostilha estatstica

    12/44

    12

    7.2.3 PictogramasSo, de maneira resumida, uma representao grfica baseada em figuras.Exemplo:

    7.3 Exerccios1) Procure exemplos de sries estatsticas em jornais e revistas e copie os, classificando

    as sries.

    2) Procure em jornais e revistas especializados dois exemplos de cada um dos grficosestudados.

    3) Usando o grfico em barras, represente a tabela:

    Prod. de Veculos de Autopropulso 1993Tipo QuantidadeAutomveis 1.100.278Comerciais Leves 224.387Comerciais Pesados 66.771Fonte: Anfavea

  • 8/6/2019 apostilha estatstica

    13/44

    13

    8 Distribuio de frequnciaPara descrevermos grficamente os dados coletados, nosso primeiro passo a determinaodas frequncias dos valores existentes da varivel.

    Definimos frequncia simples (ou absoluta) como o nmero de vezes que um valor foiobservado, e podemos obter, a partir de dados brutos, uma tabela de distribuio defrequncias.8.1 Exemplo Resolvido:Imagine que tenhamos feito uma coleta de dados relativos quantidade de irmos de 10alunos, compondo uma amostra de uma turma da escola A, e ordenamos os dados de modocrescente (a tabela de dados ordenados chama se rol).Em nosso exemplo, a frequncia ser o nmero de alunos relacionados a um determinadovalor da varivel, ou seja, um determinado nmero de irmos.

    Tabela Nmero de irmos de alunos do curso deEstatsticaNmero de irmos Frequncia

    0 11 42 63 35 1Total 15Fonte: Autor

    Temos acima a construo de uma tabela de distribuio de freqncia pontual, equivalente construo de uma tabela simples, em que listamos os diferentes valores observados davarivel, com suas freqncias absolutas, denotadas por fi, onde o ndice i corresponde aonmero de linhas da tabela.

    Olhando para a tabela, vemos que esta varivel foi resumida em 5 linhas. Assim, i = 1,...,5, etemos 5 valores para as freqncias absolutas. A freqncia absoluta da segunda linha, f2 = 4,por exemplo, indica que quatro alunos tm um irmo, enquanto apenas um afirmou ter cincoirmos, ou seja, f5=1.

    A soma de todas as freqncias absolutas deve ser igual ao nmero total de observaes davarivel, neste caso, 15.

    Temos, portanto, que:Frequncias relativas (fri) so o resultado da razo entre as frequncias simples e afrequncia total:

  • 8/6/2019 apostilha estatstica

    14/44

    14

    fri = =

    Logo, a frequncia relativa da quarta linha em nosso exemplo :

    A frequncia relativa da quinta linha : , e assim por diante.

    Evidentemente temos que:Frequncia acumulada (Fi) o total das frequncias de todos os valores inferiores ao limitesuperior de uma dada classe:

    Fk = f1 + f2 + f3 + ... fk

    Temos portanto:

    F1 = f1,

    F2 = f1 + f2,

    F3 = f1 + f2 + f3

    E assim por diante.

    Podemos desenhar uma nova tabela, mais completa, com as frequncias relativas eacumuladas:

    Tabela Nmero de irmos de alunos do curso de EstatsticaNmero de

    irmos

    Frequncia Frequncia

    Relativa

    Frequncia

    Acumulada0 1 0.067 11 4 0.267 52 6 0.400 113 3 0.200 144 1 0.067 15Total 15 1 15Fonte: Autor

    Voc deve ter percebido que mencionei duas idias ainda no definidas: classe e limite de

    classe.Se estivermos lidando com variveis discretas e amostras com poucos elementos (como noexemplo anterior), temos uma distribuio sem intervalos de classe.

    Porm, se trabalhamos com variveis contnuas, ou at mesmo com variveis discretas, mascom muitos elementos, trabalharemos com classes de frequncia, que so simplesmenteintervalos de variao.

    As classes sero representadas por i = 1, 2, 3, ..., k, onde k o nmero total de classes.

  • 8/6/2019 apostilha estatstica

    15/44

    15

    Agora, precisamos de algumas outras definies:

    Os limites de classe so os extremos de cada classe, e teremos um limite inferior (li) e umlimite superior (Li).

    Alm disso tambm definimos a amplitude (hi), obtida pela simples subtrao dos limitessuperior e inferior da classe: hi = Li l iAmplitude total da distribuio (AT) a diferena entre o Limite superior mximo e o limiteinferior mnimo: AT = Lmax lmin

    Por ltimo, ponto mdio de uma classe a mdia aritmtica entre os limites superior e inferiorda classe:

    Xi =

    Obs: Na prtica, para a determinao do nmero de classes de uma distribuio, usamos aseguinte equao (regra de Sturges):

    i 1 + 3,3 . log n

    Essa regra nos d a seguinte tabela:

    N I3 5 36 11 412 22 523 46 647 90 7

    91 181 8182 362 9

    Definido o nmero de classes, precisamos determinar a amplitude do inervalo de classe:

    8.2 Exerccios:1) Complete a distribuio abaixo, determinando as frequncias simples:I xi fi Fi1 2 22 3 93 4 214 5 295 6 34

  • 8/6/2019 apostilha estatstica

    16/44

    16

    = 34

    2) Os resultados do lanamento de um dado 20 vezes foram:

    6 5 6 3 4 3 5 2 4 1

    4 5 6 1 3 1 2 4 1 5

    Forme uma distribuio de frequncia sem intervalos de classe.

    3) Observe a distribuio de frequncia

    Xi 3 4 5 6 7 8Fi 2 5 12 10 8 3

    Determine:

    a) As frequncias relativasb) As frequncias acumuladasc) As frequncias relativas acumuladas

    4) Complete os dados que faltam:i xi fi fri Fi1 0 1 0,05 2 1 0,15 43 2 4 4 3 0,25 13

    5 4 3 0,15 6 5 2 187 6 198 7

    = 20 =100

  • 8/6/2019 apostilha estatstica

    17/44

    17

    9 Representao grfica de uma distribuioUma distribuio pode ser representada de diversas maneiras. As principais so o histogramae o polgono de frequncia.

    O Histograma traado em um plano cartesiano (x,y), formado basicamente por uma srie deretngulos justapostos, em que os pontos mdios das bases dos retngulos so na verdade ospontos mdios dos intervalos de classe e as larguras dos retngulos so as larguras dosintervalos de classe

    Polgono de frequncia um grfico em linha, com as frequncias das classes marcadas noeixo y do plano cartesiano.

    9.1 Exerccios1) Construa o histograma relativo ao exerccio 4 do item anterior

  • 8/6/2019 apostilha estatstica

    18/44

    18

    2)10 Medidas de posioEstudando as distribuies de frequncia, percebemos que existem alguns elementos tpicosque precisam ser ressaltados.

    O primeiro destes elementos a posio de concentrao dos valores.

    Imagine a seguinte pergunta: Os dados esto mais concentrados no incio, no meio ou no finalda distribuio?

    Para que possamos respond la, precisamos conhecer as mais importantes medidas deposio, que so as medidas de tendncia central: a mdia, a mediana e a moda. 10.1 Medidas de tendncia centralAs medidas de tendncia central so assim chamadas por indicarem um ponto em torno doqual se concentram os dados. Este ponto tende a ser o centro da distribuio dos dados, ou o

    centro de gravidade dos dados.10.1.1 Mdia Aritmtica (x)Antes de mais nada, importante que voc saibda que ao lidarmos com um conjunto de dados,podemos calcular diversos tipo de mdias. Em nosso estudo focaremos a mdia maisimportante, a mdia aritmtica, mas no deixe de estudar posteriormente a mdia geomtrica,a mdia harmnica e a mdia ponderada.

    A mdia aritmtica (x) a soma de todos os valores observados da varivel dividida pelonmero total de observaes.

    A mdia aritmtica a medida de tendncia central mais utilizada para representar a massa dedados.Propriedades e observaes sobre a mdia:1. Depende de todos os dados coletados, sendo portanto afetada por valores extremos

    2. nica em um conjunto de dados e nem sempre tem existncia real, ou seja, nem sempre igual a um determinado valor observado. muito importante perceber que a mdia nonecessariamente um dado da srie de valores observados.

    3. Por depender de todos os valores observados, qualquer modificao nos dados far comque a mdia fique alterada.

    Isto quer dizer que somando se, subtraindo se, multiplicando se ou dividindo se uma constantea cada valor observado, a mdia ficar acrescida, diminuda, multiplicada ou dividida destemesmo valor. Exemplificando: se somarmos o nmero 2 a todos os valores observados, amdia ser acrescida do valor 2. Se multiplicarmos todos os dados por 3, a mdia serautomaticamente 3 vezes maior.

  • 8/6/2019 apostilha estatstica

    19/44

    19

    4. A soma dos desvios em relao mdia zero.

    (xi x) = 0

    A propriedade 4 de extrema importncia para a definio de varincia, uma medida dedisperso a ser definida posteriormente. Desvio em relao mdia a diferena entre cada

    elemento de um conjunto de dados e a mdia aritmtica.

    di = xi xObs: se precisarmos calcular a mdia de um conjunto de dados divididos em classes,convencionamos que todos os valores includos no intervalo coincidem com o ponto mdiodeste intervalo, e utilizamos a seguinte equaao:

    10.1.2 Moda (Mo)Moda simplesmente o valor que mais se repete em uma sequncia de dados.Considere a seguinte srie: 1, 3, 4, 4, 4, 6, 8, 32

    Como o valor que aparece com maior frequncia o 4, ele o valor modal, ou simplesmentea moda.

    O uso da moda mais indicado quando se deseja obter, rapidamente, uma medida detendncia central. Um outro aspecto que favorece a utilizao da moda que seu valor no afetado pelos valores extremos do conjunto de dados analisado.

    Uma srie numrica pode ser:

    Amodal: quando nenhum valor se repete

    Modal: quando um valor se repete

    Bimodal: quando dois valores se repetem

    Trimodal: quando trs valores se repetem

    Polimodal: quando mais do que trs valores se repetem.

    10.1.3 Mediana (Md)A mediana o valor que ocupa a posio central da srie de observaes de uma varivel,dividindo o conjunto em duas partes iguais. Assim, 50% dos valores so maiores ou iguais aovalor da mediana e 50% dos valores so menores ou iguais ao valor da mediana.

    Formalizando, a mediana o valor tal que separa o conjunto de dados em dois subconjuntosde mesmo nmero de elementos.

  • 8/6/2019 apostilha estatstica

    20/44

    20

    Se a quantidade de dados for mpar, a mediana simplesmente o valor central, e se aquantidade de dados forpar a mediana ser a mdia aritmtica dos dois valores centrais.Sendo n o nmero de elementos da srie, o valor mediano ser:

    O termo , se n for mparA mdia aritmtica dos termos e + 1, se n for par.Vamos comear com uma srie de 7 dados observados:

    1, 5, 8, 9, 12, 17, 20

    Como temos um nmero mpar de dados, a mediana o valor central, ou seja, o valor 9.

    E se tivssemos 8 valores observados?

    1, 5, 8, 9, 12, 17, 20, 22

    Nesse caso a mediana seria a mdia aritmtica dos dois dados centrais. Como os dados

    centrais so o 9 e o 12, a mediana seria .Obs: Empregamos a mediana sempre que h valores extremos que afetam muito a mdia.Veja a srie de dados sobre o valor dos salrios dos colaboradores em um escritrio:

    R$1.000,00, R$1.000,00, R$1.500,00, R$2.000,00, R$3.000,00

    A mediana dos dados R$1.500,00 (valor central) e a mdia R$1.700,00

    Imagine agora que um novo colaborador contratado, com salrio de R$10.000

    Repare que a nova srie :

    R$1.000,00, R$1.000,00, R$1.500,00, R$2.000,00, R$3.000,00, R$10.000,00

    e o novo valor da mediana R$1.750,00 e da mdia R$3.083,33

    Reparou com um valor extremo altera muito a mdia, mas sem alterar muito a mediana?Nesses casos a mediana uma medida de tendncia central mais estvel. 10.2 Exerccios

    1) Uma escola deseja verificar o aproveitamento de 6 de seus alunos da 5 srie. Calculea mdia, a mediana e a moda, e classifique a srie conforme a moda.Notas: 7,0 3,5 2,5 6,5 9,0 3,5Respostas: Mdia = 5,3, Mediana = 5,0, Moda = 3,5. Srie Modal.

    2) Classifique as srie de acordo com a caracterstica modal, indicando os valores.2.1) 12, 13, 13, 14, 15, 17, 17, 192.2) 56, 58, 60, 60, 60, 62, 65

  • 8/6/2019 apostilha estatstica

    21/44

    21

    2.3) 47, 45, 90, 90, 47, 90, 47, 45, 41, 4510.3 Medidas SeparatrizesExistem outras medidas de posio (alm das medidas de tendncia central), e aquiestudaremos mais duas delas: os quartis e os percentis.10.3.1 QuartisJ aprendemos que a mediana divide os dados coletados em dois grupos com o mesmonmero de elementos.

    Os quartis dividem o conjunto de valores em, como o nome j diz, quatro subconjuntos demesmo nmero de elementos

    Assim, temos trs quartis:

    a. O primeiro quartil (Q1) o valor situado de modo tal que um quarto (25%) dos dadosso menores que ele, e o restante (75%) maior que ele.

    b. O segundo quartil (Q2) evidentemente igual a mediana. Q2 = Md.c. O terceiro quartil (Q3) o valor situado de modo tal que trs quartos (75%) dos dadosso menores que ele, e o restante (25%) maior que ele.

    Resumo:Estatstica Notao Interpretao Posio1o Quartil Q1

    25% dos dados so menores ou iguais ao do 1oQuartil

    p = 0,25 (n +1)

    2o Quartil Q2 = Md50% dos dados so menores ou iguais ao do 2o

    Quartilp = 0,50 (n +

    1)

    3o Quartil Q375% dos dados so menores ou iguais ao do 3o

    Quartilp = 0,75 (n +

    1)10.3.2 PercentisPercentis so os noventa e nove valores que dividem uma srie de dados em 100 partes (ousubconjuntos) com o mesmo nmero de elementos.

    Indicamos o 1 percentil como P1, o 2 como P2 e assim por diante.

    importante notar que P25 = Q1, P50 = Md e P75 = Q3

    Resumo:Estatstica Notao Interpretao Posio5o Percentil P5

    5% dos dados so menores ouiguais ao do 5o Percentil

    p = 0,05 (n + 1)

    50o Percentil P50 = Q2 = Md50% dos dados so menores ou

    iguais ao do 50o Percentilp = 0,50 (n + 1)

  • 8/6/2019 apostilha estatstica

    22/44

    22

    95o Percentil P9595% dos dados so menores ou

    iguais ao do 95o Percentilp = 0,95 (n + 1)

  • 8/6/2019 apostilha estatstica

    23/44

    23

    11 Medidas de DispersoAs medidas de disperso auxiliam as medidas de tendncia central a descrever nosso conjuntode dados observados adequadamente. Indicam se os dados esto, ou no, prximos uns dosoutros.

    Observe os trs conjuntos de dados:

    X: 10, 10, 10

    Y: 5, 10, 15

    Z: 0, 10, 20

    fcil perceber que se calcularmos a mdia dos trs conjuntos, encontraremos o mesmo valor:10. Porm, igualmente fcil perceber que o conjunto X mais homogneo, enquanto oconjunto Z o que tem maior diversificao.

    Chamamos de disperso ou variabilidade a maior ou menor diversificao de valores emtorno de um valor de tendncia central. necessrio, portanto, ao menos uma medida detendncia central e uma medida de disperso para descrever um conjunto de dados.

    De todas as medidas de disperso, estudaremos a amplitude total, a varincia, o desvio padroe o coeficiente de variao11.1 Amplitude TotalA amplitude total simplesmente a diferena entre o maior e o menor valor coletado. Aamplitude total uma medida de disperso que no leva em considerao os valoresintermedirios, no dando nenhuma informao de como os dados esto distribudos (ou

    concentrados).

    AT = xmx xmn

    A amplitude total tem um clarssimo problema: s leva em considerao os valores extremos denosso conjunto de dados, sem contabilizar os valores intermedirios.

    vlido utilizarmos a amplitude total para comparamos temperaturas ao longo de um dia (ouano) ou como controle rpido de qualidade em uma linha de produo. 11.2 VarinciaA varincia uma medida baseada nos desvios em torno da mdia aritmtica.Formalizando a idia, na verdade a varincia a mdia aritmtica dos quadrados dos desvios(ou a mdia aritmtica dos desvios ao quadrado). Representamos a varincia por s2, e temos:

    ou

  • 8/6/2019 apostilha estatstica

    24/44

    24

    Obs: Se nosso interesse for a inferncia estatstica (tirar concluses sobre a populaopartindo de uma amostra) e no simplesmente a descrio dos dados, convm utilizarmos n 1 no lugar de n (no denominador).Podemos portanto dizer que quanto maior a varincia, mais heterogneos so os dados, ouseja, maior ser a variao entre os valores. Por outro lado, quanto menor a varincia, mais

    homogneos so os dados, ou seja, menor ser a variao entre os valores.11.3 Desvio PadroUma vez que a varincia obtida por meio dos quadrados dos desvios, a sua unidade demedida o quadrado da unidade de medida dos dados. Assim, por motivos prticos, utilizamoso desvio padro, que simplesmente a raiz quadrada da varincia.

    Observaes:

    1. Tanto o desvio padro quanto a varincia so medidas de disperso, o uso de uma ou

    outra medida depender da finalidade do estudo2. A utilizao da mdia aritmtica torna o clculo da varincia (e do desvio padro) poucoprticos, pois com frequncia a mdia um nmero fracinrio. mais frequenteutilizarmos uma simplificao da frmula:

    3. No caso de dados agrupados, teremos que levar em considerao as frequncias.Assim, a equao ser:

    4. No caso de dados agrupados com intervalos de classe, os valores de xi sero osvalores mdios (mdia aritmtica entre os limites inferior e superior) das classes.

    11.3.1 Propriedades:1) Se somarmos ou subtrairmos uma constante de todos os valores da srie, o desvio

    padro no se altera.2) Se multiplicarmos ou dividirmos uma constante por todos os valores da srie, o desvio

    padro ser multiplicado ou divido por esta mesma constante.

  • 8/6/2019 apostilha estatstica

    25/44

    25

    11.3.2 Exemplo resolvido:Observe como montar a tabela para uma determinada distribuio de frequncias e a utilizaoda equao para dados agrupados

    i Estaturas(cm) fi xi fixi fixi21 150 154 4 152 608 924162 154 158 9 156 1404 2190243 158 162 11 160 1760 2816004 162 166 8 164 1312 2151685 166 170 5 168 840 1411206 170 174 3 172 516 88752

    = 40 =

    6.440 =

    1.038.080

    s = 5,56711.4 Coeficiente de variao (CV)O coeficiente de variao resolve dois problemas do desvio padro:

    1) O desvio padro tem a mesma unidade dos dados coletados. Assim, se quisermoscomparar dados com unidades diferentes, o desvio padro no uma boa medida

    2) O desvio padro, como valor absoluto, no nos diz muita coisa, pois um desvio de 5com mdia 500 um desvio pequeno, mas um desvio de 5 com mdia 10 um desviogrande.Ou seja, o valor absoluto do desvio padro, no caso, 5, no nos diz nada.

    O coeficiente de variao calculado pela seguinte equao:

    Sendo portanto uma grandeza admensional (sem unidades) e ponderada pelo seu valor mdio.

  • 8/6/2019 apostilha estatstica

    26/44

    26

    11.5 Exerccios1) Complete o esquema abaixo e calcule o desvio padro para a seguinte sequncia de

    valores:

    8 10 11 15 16 18I xi xi21 8 642 10

    n = = =

    Resp: s = 3,559

    2) Comprove as propriedades do desvio padro somando 3 a cada nmero da srie edepois multiplicando cada nmero por 2.

    3) Calcule a amplitude total e o desvio padro da seguinte distribuio:xi 2 3 4 5 6 7 8fi 1 3 5 8 5 4 24) Para os dados de peso de 2 grupos de alunos, calcule a mdia e o desvio padro

    65 57 89 65 50 72 81Resp: Mdia =68,428kg, Desvio = 13,464kg80 78 67 56 90 101 66

    Resp: Mdia = 76,857kg, Desvio = 15,366kg

  • 8/6/2019 apostilha estatstica

    27/44

    27

    12 Noes de assimetriaA natureza bsica da assimetria simples.

    Se em uma distribuio em forma de sino (distribuio normal) temos x = Md = Mo, a curva considerada simtricaSe Mo < Md < x, a curva assimtrica positiva.Se x < Md < Mo, a curva assimtrica negativa.

    Assim, calculando o valor da diferena (x Mo), para valores nulos teremos uma curvasimtrica, para valores negativos teremos uma assimetria negativa (ou esquerda) e paravalores positivos teremos uma assimetria positiva (ou direita).

    Podemos tambm fazer uso do coeficiente de assimetria de Pearson, que tem a vantagem deser admensional:

    Se 0,15 < |As| < 1, a assimetria considerada moderada. Se |As| > 1 a assimetria considerada forte.

  • 8/6/2019 apostilha estatstica

    28/44

    28

    13 A distribuio NormalDe todas as distribuies tericas de varivel aleatria contnua, uma das mais importantes adistribuio normal.

    13.1 Propriedades:1) A varivel X pode assumir qualquer valor real

    2) Graficamente, a distribuio tem a forma de um sino, simtrico em torno da mdia. Acurva recebe o nome de Curva de Gauss o Curva Normal3) A rea total sob a curva tem valor 1 e a probabilidade da varivel X assumir qualquer

    valor real. Dada a simetria da vurva, a probabilidade vale 0,5 para cada lado da mdia

    O clculo da rea (probabilidade) para cada ponto da curva exige matemtica avanada,portanto usaremos um conceito simples para contornar esta restrio, o conceito dedistribuio normal reduzida

    A distribuio normal reduzida uma distribuio normal com mdia 0 e desvio padro 1. Asprobabilidades associadas (ou reas sob a curva) so encontradas em uma tabela, de modoque no precisamos calcul las. A frmula que usaremos :

    13.2 Exemplo Resolvido:Imagine um grupo de trabalhadores com mdia salarial R$400,00 e desvio padro R$50,00.Qual a probabilidade de encontrarmos um trabalhador que tenha salrio entre R$390,00 eR$450,00?

    Passo a passo:

    1) A distribuio original (X) tem mdia R$400,00 e desvio R$50,002) Podemos ento encontrar os valores de Z correspondentes a X = R$390,00 e X =

    R$450,00Z1 = (390 400)/50 = 0,2Z2 = (450 400)/50 = 1,0

    Assim, podemos dizer que a probabilidade do salrio (X) ficar entre R$390,00 e R$450,00 amesma de termos Z entre 0,2 e +1,0.

    Observando a tabela de distribuio normal de Z (pea ajuda de seu profesor para ler a tabela!Tabelas de probabilidade para Z (0,1) podem ser facilmente encontradas na internet), temos

  • 8/6/2019 apostilha estatstica

    29/44

    29

    0,0793 para 0,2 (no h diferena entre 0,2 e +0,2, uma vez que a curva simtrica) e0,3413 para 1,0.

    Como a distribuio Z tem mdia 0, temos 0 0,2 esquerda do zero e o +1,0 direita do zero.

    P (390 < X < 450) = P ( 0,2 < Z < 0) + P (0 < Z < 1,0) = 0,0793 + 0,3413 = 0,4206.

    Ou seja, temos que em mdia 42% dos trabalhadores ganham entre R$390,00 e R$450,00.

    Obs: Para ler a tabela de distribuio normal Z, procure os dois primeiros algarismos naprimeira coluna e depois o ltimo algarismo na primeira linha. Para achar o 1,00 fcil. Bastaacharmos o 1,0 na primeira coluna e depois o 0,00 na primeira linha. Ficamos com 0,3413. Sequisermos achar Z = 1,55, temos que achar o 1,5 na primeira coluna e depois o 0,05 naprimeira linha. Ficamos com 0,4395. Por ltimo, se quisermos achar Z = 3,38, procuraremos o3,3 na primeira coluna e o 0,08 na primeira linha. Acharemos o valor 0,4996.

  • 8/6/2019 apostilha estatstica

    30/44

    30

    14 Noes de ProbabilidadeVoc j deve ter percebido que para compreendermos bem a estatstica precisamos de umaboa noo de probabilidade, certo?

    Vamos agora fazer uma curta reviso dos principais conceitos desta importante parte damatemtica.

    O primeiro conceito o de experimento aleatrio, que aquele que, mesmo repetido sob asmesmas condies, apresenta resultado imprevisvel.

    Por exemplo, se jogarmos uma moeda no viciada para cima sempre sob as mesmascondies, no temos como prever se encontraremos como resposta cara ou coroa. Omesmo podemos dizer sobre um dado no viciado. Nunca saberemos se encontraremos comoresposta 1, 2, 3, 4, 5 ou 6.

    Com esses dois exemplos, voc j tem automaticamente condies de entender o que oespao amostral de um experimento. simplesmente o conjunto de resultados possveis,representado porS.Para os nossos exemplos, teremos:

    Lanamento da moeda: S = {Cara, Coroa}

    Lanamento do dado: S = {1, 2, 3, 4, 5, 6}

    Antes de comearmos a calcular probabilidades, temos mais um conceito, o evento, que qualquer subconjunto do espao amostral S, e sempre definido por uma sentena.

    Vamos a alguns exemplos de eventos para o experimento de lanar um dado:Obter um nmero par na face superior

    Obter um nmero maior que 3 na face superior

    Obter o nmero 4 na face superior

    Agora, com estes conceitos revisados, podemos comear a calcular probabilidades.

    De maneira simplificada, a probabilidade calculada pela quantidade de casos favorveisdividido pelo nmero total de casos, ou pelo nmero total de possibilidades.

    De maneira mais formal, chamamos de probabilidade de um evento A o nmero real P(A), demodo que:

  • 8/6/2019 apostilha estatstica

    31/44

    31

    Onde n (A) o nmero de elementoa de A (o evento) e n (S) o nmero de elementos de S (oespao amostral).14.1 Exemplos resolvidos:

    1) Em um lanamento de uma moeda, qual a probabilidade de obter cara?

    A = {Cara} , n (A) = 1S = {Cara, Coroa}, n (S) = 2

    P(A) = 1 / 2 = 0,5

    O resultado nos mostra que em uma moeda no viciada, a probabilidade de obtermos cara 0,5 ou 50%.

    2) Em um lanamento de um dado, qual a probabilidade de obter um nmero par?

    A = {2,4,6} , n (A) = 3

    S = {1,2,3,4,5,6}, n (S) = 6P(A) = 3 / 6 = 0,5

    Temos ento 50% de chance de obtermos um nmero par.

    Pelo que vimos at agora, podemos afirmar que:

    a. A probabilidade de um evento certo igual a 1b. A probabilidade de um evento impossvel igual a 0c. A probabilidade de um evento A qualquer um nmero real P(A) tal que 0 P(A) 1

    Para finalizarmos nossa curta reviso de probabilidade, importante que voc lembre de maistrs conceitos: eventos complementares, eventos independentes e eventos mutuamenteexclusivos.14.2 Eventos complementaresEventos complementares so aqueles cujas probabilidades somam 1. Sendo p a probabilidadede um evento e q a probabilidade de outro evento, eles so complementares se p + q = 1.Logo p = 1 q Qual a utilidade deste conceito? Simples. Se a probabilidade de obter 2 no lanamento de umdado 1/6, a probabilidade de no tirar 2 ( ou seja, tirar qualquer outro nmero ) :

    1 1/6 = 5/6

    14.3 Eventos independentesDois eventos so independentes se a realizao (ou no realizao) de um dos eventos noafeta a probabilidade de realizao do outro.

  • 8/6/2019 apostilha estatstica

    32/44

    32

    Se lanarmos por exemplo dois dados, o valor que obtivermos no 1 no afeta em nada o valorque obteremos no 2, de modo que a probabilidade de que eles se realizem simultneamente o produto das probabilidades individuais.

    p = p1 . p214.4 Eventos mutuamente exclusivosComo o nome j implica, eventos mutuamente exclusivos so aqueles em que a realizao doprimeiro exclui a realizao do segundo.

    Voltando ao caso clssico do lanamento de uma moeda, o evento cara automaticamenteexclui o evento coroa, uma vez que tiramos cara ou coroa. As duas faces no podem serobtidas no mesmo lanamento.

    Assim, a probabilidade de que um OU outro evento se realize a soma das probabilidades.p = p1 + p2

    A probabilidade de tirarmos cara OU coroa 0,5 + 0,5 = 1A probabilidade de tirarmos 2 OU 4 no lanamento de um dado 1/6 + 1/6 = 2/6 = 1/3. 14.5 Exerccios Resolvidos:

    1) Qual a probabilidade de obtermos um rei de espadas ao retirarmos uma carta de umbaralho de 52 cartas?Resposta: p = 1/52

    2) Qual a probabilidade de obtermos um rei de qualquer naipe ao retirarmos uma carta deum baralho de 52 cartas?Resposta: p = 4/52 = 1/13

    3) De dois baralhos de 52 cartas, qual a probabilidade de retirarmos um rei de cada

    baralho? Resposta: como os dois eventos so independentes, temos p = p1 . p2

    4) De um baralho de 52 cartas retiram se duas cartas sem reposio. Qual a probabilidadeda primeira ser o rei de espadas e a segunda o rei de paus?Resposta: mais uma vez como os eventos so independentes, temos p = p1 . p2. importante notar que como no ato de retirada da segunda carta, restam somente 51cartas no baralho.

    5) Dois dados so lanados conjuntamente. Determine a probabilidade da soma ser 11 oumaior.Resposta: A soma dever ser 11 ou 12.Para a soma 11 temos as possibilidades (5,6) ou (6,5), de modo que a probabilidade 2/36.Para a soma 12 s temos a possibilidade (6,6), de modo que a probabilidade 1/36Como queremos que a soma seja 11 ou 12 e os eventos so mutuamente exclusivos,temos

  • 8/6/2019 apostilha estatstica

    33/44

    33

    14.6 Exerccios:1) Um nmero inteiro entre 3 e 11 ser escolhido ao acaso.

    a. Qual a probabilidade de que este nmero seja mpar?b. Qual a probabilidade de que este nmero seja par?c. Qual a probabilidade de que este nmero seja par e divisvel por 4?

    2) Dois dados so lanados simultneamente. Determine a probabilidade de:a. A soma ser 10b. A soma ser maior que 10c. O primeiro resultado ser maior que o segundo.

    3) Uma moeda lanada 3 vezes. Calcule a probabilidade de:a. Obtermos 3 coroasb. Obtermos 2 coroas e 1 carac. Obtermos pelo menos 1 carad. Obtermos no mximo 1 cara.

  • 8/6/2019 apostilha estatstica

    34/44

    34

    15 Correlao e RegressoA correlao e a regresso so tcnicas bem relacionadas envolvendo estimao deparmetros. At agora, analisamos e descrevemos a distribuio de valores de uma varivel decada vez.

    Agora, ao analisarmos as observaes de duas ou mais variveis conjuntamente, temos umnovo problema: as relaes que podem existir entre as variveis estudadas. Assim,analisaremos dados amostrais para saber como duas ou mais variveis esto relacionadasentre si.

    Quando consideramos variveis como peso e altura, fcil notar que h um relacionamentoentre as grandezas. Intuitivamente percebemos que, na mdia, quando maior a altura, maior opeso.

    A correlao mede a fora, ou grau de relacionamento entre duas variveis. Quanto maior a

    correlao, maior a intensidade de relacionamento.Uma vez caracterizada a correlao, a regresso o instrumento que d uma equao quedescreve o relacionamento em termos matemticos.15.1 CorrelaoConsidere uma amostra aleatria de 10 dos 45 alunos de uma turma de e suas notas emmatemtica e estatstica:

    Aluno Nota em Matemtica Nota em Estatstica1 5 64 7.5 8

    7 6.5 613 8 915 9.5 1022 3 426 5.5 531 9 1033 7 7.540 2 2.5

    Repare como existe um forte relacionamento entre as notas. Existe uma tendncia forte nosentido de que quanto maior a nota em matemtica, maior tambm a nota em estatstica.

    Colocando em um grfico em que o eixo x o aluno e o eixo y a nota, fica fcil perceber esserelacionamento:

  • 8/6/2019 apostilha estatstica

    35/44

    35

    Um outro instrumento bem importante o diagrama de disperso, em que o eixo x e o eixo yso representados pelas notas em matemtica e estatstica, respectivamente:

    Os pontos obtidos claramente tem uma correlao linear, ou seja, tem como imagem umareta.

    Como temos neste caso uma reta ascendente, a correlao chamada correlao linearpositiva. Se os pontos tivessem como imagem uma reta descendente, teramos uma

  • 8/6/2019 apostilha estatstica

    36/44

    36

    correlao linear negativa. Se os pontos tivessem como imagem uma curva (e no umareta) teramos uma correlao no linear.O grau de intensidade da correlao medido pelo coeficiente de correlao. O coeficientede correlao de Pearson dado por:

    , onde n o nmero de observaes

    Lembre que existem vrios tipos de correlao: Pearson Spearman parcial mltipla, etc.Estudaremos somente a primeira.15.1.1 Caractersticas de r1) O valor de r varia de 1,00 a +1,00

    2) Um relacionamento positivo (r +) indica uma correlao positiva entre duas variveis. Osvalores altos (baixos) de uma das variveis, correspondem valores altos (baixos) da outra

    3) Um relacionamento negativo (r ) indica uma correlao negativa entre duas variveis. Osvalores altos (baixos) de uma das variveis, correspondem valores baixos (altos) da outra

    Logicamente se r = +1 temos uma correlao perfeita e positiva, se r = 1 temos umacorrelao perfeita e negativa e se r = 0 no temos correlao ou a relao no linear.

    Obs: se 0,3 |r| 0,6 temos uma correlao fraca, e se 0 |r| 0,3 a correlao muito fraca ena prtica no podemos afirmar nada sobre a relao entre as variveis.15.1.2 Exemplo resolvido:Vamos calcular o coeficiente de correlao relativo tabela de notas de matemtica eestatstica.

    A melhor maneira associar tabela os valores de xy, x2 e y2.Aluno Nota em Matemtica(x) Nota em Estatstica(y) xy x2 y

    1 5 6 30 25 36

    4 7.5 8 60 56.25 647 6.5 6 39 42.25 36

    13 8 9 72 64 8115 9.5 10 95 90.25 10022 3 4 12 9 16

    26 5.5 5 27.5 30.25 2531 9 10 90 81 10033 7 7.5 52.5 49 56.2540 2 2.5 5 4 6.25 63 68 483 451 520.5

  • 8/6/2019 apostilha estatstica

    37/44

    37

    Lembrando que n = 10 temos:

    O que indica uma correlao linear positiva forte entre as variveis, ou seja, quem estuda mais

    matemtica, sabe mais estatstica. Lembre se disso! 15.2 RegressoAps a anlise de correlao, temos indicao de forte relacionamento entre duas variveis.Agora o problema determinar uma funo matemtica que exprima este relacionamento.Esse o problema da regresso, ou seja, descrever a relao entre duas variveis de acordocom um modelo matemtico.

    Assim, se uma varivel explica o comportamento da outra, temos uma varivel dependente eoutra independente. Admitindo que a forma da linha de regresso seja uma reta, temos X comovarivel independente, Y como varivel dependente (aquela sobre a qual queremos fazer umaestimativa) e queremos obter uma funo definida por:

    Y = aX + b (funo de 1 grau, que voc com certeza j estudou em matemtica)

    Para calcular os parmetros a e b, usaremos as seguintes equaes:

    b = y ax

    onde n o nmero de observaes, x a mdia dos valores xi e y a mdia do valores yi .Uma observao importante: como estamos utilizando uma amostra para obtermos os valoresdos parmetros, a equao que encontraremos uma estimativa da verdadeira funo querelaciona nossas variveis.15.2.1 Exemplo resolvido:Vamos mais uma vez utilizar as notas de matemtica e estatstica e completar a tabela.

    AlunoNota em Matemtica

    (x)Nota em Estatstica

    (y) xy x21 5 6 30 25

    4 7.5 8 60 56.257 6.5 6 39 42.25

    13 8 9 72 6415 9.5 10 95 90.2522 3 4 12 9

  • 8/6/2019 apostilha estatstica

    38/44

  • 8/6/2019 apostilha estatstica

    39/44

    39

    2) Complete a tabela de clculo e defina a reta de ajustamento aos dados:xi 2 4 6 8 10 12 14yi 30 25 22 18 15 11 10

    xi yi xiyi xi22 30 60 4

    14 10 140 196

    = = = = Resposta: Yestimado = 1,69X + 32,28

    3) A partir da tabela abaixo:xi 1 2 3 4 5 6yi 70 50 40 30 20 10

    a. Calcule o coeficiente de correlaob. Determine os parmetros para ajuste da retac. Estime Y para X = 0d. Estime Y para X = 5,5

  • 8/6/2019 apostilha estatstica

    40/44

    40

    16 Nmeros ndicesNmeros ndices so usados para indicar variaes relativas em quantidades, preos, ouvalores de um artigo, durante um perodo de tempo ou em diferentes espaos.

    Como exemplo de utilizao, temos a medio de perda do poder aquisitivo da populao aolongo de um ano, ou o acompanhamento da inflao.

    O mais importante aqui perceber que em muitas situaes empregaremos nmeros relativos,em vez de nmeros absolutos, para facilitar comparaes.16.1 Exemplo:Temos a seguir uma tabela com quantiades e preos para um determinado item de acordo comos meses do ano.

    Meses Quantidade (Kg)Preo

    (R$/Kg) Valor totalJan 2 6 12Fev 2.5 7.2 18Mar 3 7.8 23.4Abr 2.6 9 23.4

    Agora, podemos calcular como evoluiram a quantidade comprada, o preo por Kg e o valortotal pago tendo como base o ms de janeiro. A idia simplesmente chamarmos nossa basede 1 e calcularmos a razo entre os valores das variveis no ms x e os valores das variveisno ms base.

    Meses Quantidade (Kg) Preo(R$/Kg) Valor totalJan 1 1 1Fev 1.25 1.2 1.5Mar 1.5 1.3 1.95Abr 1.3 1.5 1.95

    Desse modo, podemos perceber que a quantidade comprada em abril 30% maior que aquantidade comprada em janeiro, e o preo em fevereiro foi 20% maior que o preo de janeiro.

    Repare que todos os valores so relativos ao valores base de janeiro, ou seja, dividimos aquantidade, preo e valor total de cada ms pelas quantidades, preos e valores totais dejaneiro.

    Formalizando um pouco mais, representaremos por0 a poca base, e port a poca atual, demodo que teremos:

    P0 preo na poca base

    Pt preo na poca atual

  • 8/6/2019 apostilha estatstica

    41/44

    41

    Q0 quantidade na poca base

    Qt quantidade na poca atual

    V0 valor na poca base

    Vt valor na poca atual

    Atribuindo o valor 100 poca base, teremos as seguintes equaes (baseadas em regra detrs simples) para calcularmos os relativos:

    (relativo de preo)

    (relativo de quantidade)

    (relativo de valor)16.2 Exerccio resolvido:Sabendo que o preo de determinado produto era R$50 em 2004 e R$60 em 2005, calcule orelativo de preo em 2005, tomando como base o ano de 2004.

    Notao: P2004 = R$50 e P2005 = R$60

    P2004,2005 = (60 / 50) . 100 = 120, temos ento P2004,2005 = 120%

    O aumento de preo foi de 120 100 = 20% 16.3 ndice AgregativoO que estudamos at agora a caracterizao da evoluo de preo, quantidade ou valor totalpago para apenas um produto. Porm, para estudar variaes de preos no mercado,precisamos de um ndice que caracterize a variao de preos de um conjunto de bens(agregado). Assim, precisamos de um ndice agregativo.

    Existem algumas possibilidades de clculo de ndices agregativos. Aqui veremos apenas ondice de Laspeyres. Lembrando que 0 a poca base e t a poca atual, temos:

    Obs: Muitos ndices so utilizados em nossa vida cotidiana. Pesquise na internet alguns dosmais importantes como o ndice de custo de vida, o ndice de Preos ao Consumidor (IPC) e o

    ndice Geral de Preos (IGP).

  • 8/6/2019 apostilha estatstica

    42/44

    42

    16.4 Exerccios:1) Dada a tabela abaixo, calcule os ndices, tomando 1991 como ano base:

    Anos 1989 1990 1991 1992 1993 1994ndices (1989 =100) 100 152 203 321 415 5802) Observando a tabela abaixo, calcule o ndice ponderado de preos de acordo com a

    frmula de Laspeyres.1993 1994BENS p q p q

    A 20 4 28 3B 40 3 56 3

    C 15 8 30 12

  • 8/6/2019 apostilha estatstica

    43/44

    43

    17 Introduo aos testes de hipteses e significnciaEm situaes cotidianas, precisamos com alguma frequncia tomar decises sobre populaes

    com base apenas em amostras. Assim, conveniente a determinao de hipteses ousuposies, que podem ou no ser verdadeiras.

    Na prtica, formulamos uma hiptese com o propsito de validao ou rejeio. Tal hiptesecriada chamada de hiptese nula e representada por H0. Qualquer outra hiptese chamadade hiptese alternativa e denominada H1.

    Imagine que queremos descobrir se uma moeda viciada. Temos por hiptese que ela no o. Assim formulamos p = 0,5, em que p a probabilidade de obtermos cara em umlanamento. Essa nossa hiptese H0 (moeda no viciada) e p 0,5 nosso H1 (moedaviciada).

    Os processos que nos levam a definir se as hipteses so ou no so vlidas, ou seja, se osresultados das amostras diferem de modo significativo ou no dos resultados esperados, sochamados testes de hipteses. importante lembrar que em um teste de hiptese nosso foco aceitar ou rejeitar nossa hiptese nula, ou seja, aceitar ou rejeitar H 017.1 Erros do Tipo I e IISe uma hiptese rejeitada quando deveria ter sido aceita, temos um erro do tipo I. Se umahiptese aceita quando deveria ter sido rejeitada, temos um erro do tipo II.

    claro que deveremos sempre atuar no sentido de diminuir ambos, mas na prtica a tentativade diminuir um tipo de erro leva ao aumento na chance de erro do outro tipo. O caminho para

    reduo dos dois tipo de erro o aumento do tamanho da amostra, o que nem sempre possvel.17.2 Nvel de significnciaAo realizarmos os testes de hipteses, chamamos de nvel de significncia () a probabilidademxima que estamos sujeitos a correr para o erro do tipo I. Os nveis tradicionais so 0,01 (1%)ou 0,05 (5%).17.3 Tipos de testesOs principais tipo de testes so os que envolvem a distribuio normal e so testes de mdiase propores de populaes com base em amostras.

    Podemos testar se as mdias (ou propores) de determinada populao esto de acordo comnossas hipteses. Um exemplo seria testar se a mdia de notas de uma turma de 100 alunosde estatstica est dentro de uma meta estipulada. O teste seria feito com uma amostra de, porexemplo, 10% dos alunos.

    Tambm so comuns testes de diferenas nas mdias e nas propores, para comparaes deduas populaes diferentes. Podemos, utilizando estes mtodos, saber, com um nivel de

  • 8/6/2019 apostilha estatstica

    44/44

    significncia determinado, se duas turmas tem mesmo rendimento (mesma mdia), com baseem amostras.

    No deixe de procurar na internet e na literatura recomendada mais referncias aos testes dehipteses. Eles so de grande importncia para uma compreenso mais aprofundada daestatstica.18 Literatura recomendada / Referncias bibliogrficasNvel Bsico:

    Crespo, Antonio Arnot. Estatstica Fcil. 17 Edio. Saraiva, 2002.

    Pereira, Paulo Henrique. Noes de Estatstica. Papirus, 2004.

    Nvel aprofundado:

    Costa Neto, Pedro Luiz de Oliveira. Estatstica. 2 Edio. Blucher, 2002.