29
INTRODUÇÃO À ESTATÍSTICA

Apostila2012.pdf

Embed Size (px)

Citation preview

  • INTRODUO ESTATSTICA

    UsuarioTypewritten textProf. Mauricio Carias

    UsuarioTypewritten text2012

  • Sumrio

    1 Apresentao.......................................................................................................................42 A Estatstica.........................................................................................................................53 Populao e Amostra...........................................................................................................54 Estatstica Descritiva e Indutiva ...........................................................................................65 Tipos de Variveis ...............................................................................................................6

    5.1 Exerccios: ....................................................................................................................76 Amostragem ........................................................................................................................7

    6.1 Exerccios: ....................................................................................................................87 Tcnicas de descrio grfica..............................................................................................9

    7.1 Tabelas.........................................................................................................................97.2 Grficos ........................................................................................................................9

    7.2.1 Diagramas .............................................................................................................97.2.2 Cartogramas........................................................................................................117.2.3 Pictogramas.........................................................................................................12

    7.3 Exerccios...................................................................................................................128 Distribuio de frequncia..................................................................................................13

    8.1 Exemplo Resolvido: ....................................................................................................138.2 Exerccios: ..................................................................................................................15

    9 Representao grfica de uma distribuio .......................................................................179.1 Exerccios...................................................................................................................17

    10 Medidas de posio .......................................................................................................1810.1 Medidas de tendncia central ....................................................................................18

    10.1.1 Mdia Aritmtica (x) .............................................................................................1810.1.2 Moda (Mo) ...........................................................................................................1910.1.3 Mediana (Md).......................................................................................................19

    10.2 Exerccios...................................................................................................................2010.3 Medidas Separatrizes .................................................................................................21

    10.3.1 Quartis.................................................................................................................2110.3.2 Percentis..............................................................................................................21

    11 Medidas de Disperso....................................................................................................2311.1 Amplitude Total...........................................................................................................2311.2 Varincia.....................................................................................................................23

  • 311.3 Desvio Padro ............................................................................................................24

    11.3.1 Propriedades: ......................................................................................................24

    11.3.2 Exemplo resolvido:...............................................................................................25

    11.4 Coeficiente de variao (CV) ......................................................................................25

    11.5 Exerccios...................................................................................................................26

    12 Noes de assimetria.....................................................................................................27

    13 A distribuio Normal .....................................................................................................28

    13.1 Propriedades: .............................................................................................................28

    13.2 Exemplo Resolvido: ....................................................................................................28

    14 Noes de Probabilidade ...............................................................................................30

    14.1 Exemplos resolvidos:..................................................................................................31

    14.2 Eventos complementares............................................................................................31

    14.3 Eventos independentes...............................................................................................31

    14.4 Eventos mutuamente exclusivos.................................................................................32

    14.5 Exerccios Resolvidos:................................................................................................32

    14.6 Exerccios: ..................................................................................................................33

    15 Correlao e Regresso.................................................................................................34

    15.1 Correlao ..................................................................................................................34

    15.1.1 Caractersticas de r..............................................................................................36

    15.1.2 Exemplo resolvido:...............................................................................................36

    15.2 Regresso ..................................................................................................................37

    15.2.1 Exemplo resolvido:...............................................................................................37

    15.3 Exerccios...................................................................................................................38

    16 Nmeros-ndices ............................................................................................................40

    16.1 Exemplo:.....................................................................................................................40

    16.2 Exerccio resolvido:.....................................................................................................41

    16.3 ndice Agregativo ........................................................................................................41

    16.4 Exerccios: ..................................................................................................................42

    17 Introduo aos testes de hipteses e significncia .........................................................43

    17.1 Erros do Tipo I e II ......................................................................................................43

    17.2 Nvel de significncia ..................................................................................................43

    17.3 Tipos de testes ...........................................................................................................43

    18 Literatura recomendada / Referncias bibliogrficas......................................................44

  • matemtica como funes, logaritmos e probabilidade soessenciais para a compreenso da estatstica. Sempre que achar necessrio, feche estaapostila e procure aprofundar a teoria em matemtica! Esse um esforo que compensa, poiscapacidade analtica sem dvida um dos diferenciais que as empresas procuram neste inciode sculo XXI.

    Sempre que possvel busque tambm na internet referncias atualizadas sobre os assuntosaqui tratados.

    Bom estudo, e boa sorte!

    1 Apresentao

  • 2 A EstatsticaAntes de comearmos a estudar Estatstica, importante que saibamos o que estamosestudando.

    A estatstica, antes de mais nada, um ramo da matemtica aplicada. Seu objetivo fornecermtodos para coleta, organizao, resumo, apresentao e anlise dos dados, visandoobteno de concluses vlidas e, finalmente, tomada de decises.

    Assim, a estatstica serve de instrumento de apoio a vrios outros campos do conhecimento; naverdade, a todos os ramos do conhecimento em que dados experimentais so manipulados.Podemos, apenas para citar alguns, falar da importncia da estatstica na Fsica, Qumica,Medicina, Engenharia, Cincias Socias, e, claro, na Administrao de Empresas.

    3 Populao e AmostraAo coletarmos dados sobre um grupo de objetos ou indivduos, como por exemplo a cor dosolhos ou o peso de estudantes de ensino mdio ou at o nmero de peas defeituosasproduzidas em um dia, nem sempre poderemos observar todo o grupo, principalmente noscasos em que tal grupo for muito grande ou at mesmo inacessvel.

    Desse modo, em vez de examinarmos todo o grupo ou conjunto, chamado de populao,levantaremos os dados apenas de uma parte desta populao, chamada amostra.

    De maneira mais formal, populao (ou universo) um conjunto de elementos com pelomenos uma caracterstica comum.

    Os estudantes universitrios, por exemplo, constituem uma populao, pois no mnimoapresentam uma caracterstia em comum: so aqueles que estudam em universidades. Essacaracterstica em comum delimita de maneira inequvoca os elementos que pertencem populao, e os que no pertencem.

    No entanto, como j citei, muitas vezes no conveniente, e muitas vezes impossvellevantar os dados referentes a todos os elementos da populao. Devemos portanto limitarnossas observaes uma amostra. Formalizando a idia, amostra um subconjunto finito deuma populao.

    importante mencionar neste ponto que embora a amostra seja finita, a populao pode sertambm finita ou infinita.

    Para relembrar: conjunto finito aquele que contm um nmero limitado de elementos econjunto infinito aquele que contm um nmero ilimitado de elementos.

  • 4 Estatstica Descritiva e IndutivaOs mtodos da estatstica que buscam somente descrever e analisar certo grupo de dados,independentemente de serem dados extrados de uma amostra ou de toda a populao, sochamados de mtodos de estatstica descritiva.

    Por outro lado, se uma amostra representativa de uma populao, e tiramos concluses arespeito desta populao com os dados extrados da amostra, temos uma aplicao daestatstica indutiva. Raciocnio indutivo aquele que parte do conhecimento de uma partepara tirar concluses sobre a realidade do todo. Assim, estatstica indutiva a parte daestatstica que tira concluses sobre a populao partindo do conhecimento da amostra.

    claro que o processo de induo no exato, e a estatstica indutiva est sujeita a erros. Noentando, os mtodos de induo (ou inferncia) estatstica so capazes de definir at queponto, e com que probabilidade, estamos errando.

    5 Tipos de VariveisDentro de um estudo estatstico, precisamos definir quais caractersticas dos elementos(populao ou amostra) nos interessa estudar.Essa caracterstica pode ser, por exemplo, o peso ou a cor dos olhos de um certo nmero depessoas. Assim, peso e cor dos olhos so denominados variveis, cujos resultadosdependero dos elementos considerados. E fcil perceber que se tivermos n elementos (nocaso, n pessoas) em nosso estudo, teremos n valores para a varivel peso.Por conveno, definimos varivel como o conjunto de resultados possveis para umfenmeno.

    Dependendo do objetivo de nosso estudo, a caracterstica (varivel) em foco poder ser:a. Qualitativa quando for expressa por tipos ou atributos: sexo (masculino ou feminino),

    cor dos olhos (azuis, castanhos, etc.), qualidade de uma pea produzida (perfeita oudefeituosa).

    b. Quantitativa quando for expressa em nmeros. importante notar que as variveisquantitativas podem ser subdivididas em discretas e contnuas.Varivel contnua aquela que pode assumir qualquer valor entre dois limites. Poroutro lado, uma varivel discreta s pode asumir valores pertencentes a um conjuntoenumervel.Preste ateno nos exemplos:

    b.1 Variveis quantitativas discretas: nmero de alunos em uma turma, pontos obtidosem uma jogada de dados, nmero de peas produzidas em um dia de trabalho;b.2 Variveis quantitativas contnuas: peso dos alunos em uma turma, dimetros depeas produzidas em um dia.

    Ao observarmos os exemplos, podemos perceber que, de maneira geral, os valores dasvariveis discretas so obtidos por contagens , enquanto que os valores das variveiscontnuas so obtidos por medies .

  • Por ltimo, as variveis so designadas por letras latinas. Em geral: x, y ou z.

    5.1 Exerccios:1) Estabelea quais dos dados seguintes so discretos e quais so contnuos:a) Nmero de aes vendidas na bolsa de valoresb) Temperaturas registradas a cada meia hora em um posto de meteorologiac) Meia-vida mdia das amostras de medicamentosd) Dimetros de 1000 parafusos produzidos por uma fbricae) Quantidade de pessoas no carnaval de olinda

    Respostas: Discretos, Contnuos, Contnuos, Contnuos, Discretos.

    2) Classifique as variveis em qualitativas ou quantitativas (contnuas ou discretas):a) Cor dos cabelosb) Nmero de filhosc) Comprimento de peas produzidas por certa mquina

    Respostas: Qualitativa, Quantitativa discreta, Quantitativa contnua.

    6 AmostragemVoc neste ponto j sabe que a estatstica indutiva busca tirar concluses sobre a populaobaseado em resultados retirados das amostras. Porm o processo no to simples, porqueprecisamos garantir que a amostras sejam representativas da populao, ou seja, a amostradeve ter as mesmas caractersticas bsicas da populao em relao varivel em estudo.

    Existem basicamente dois tipos de amostragem , a probabilstica e a no-probabilstica . Aamostragem probabilstica aquela em que todos os elementos da amostra tem probabilidadeconhecida, e diferente de zero, de pertencer amostra. Caso contrrio, a amostragem serno-probabilstica.

    Exemplificando, a amostragem probabilstica mais simples justamente denominadaamostragem casual simples , e equivalente a um sorteio lotrico, em que todos oselementos tm igual probabilidade de pertencer amostra.

    Numeramos a populao de 1 a n e sorteamos por meio de qualquer dispositivo k nmerosdesta sequncia.

    Podemos numerar alunos de 1 a 40 e colocar os nmeros dentro de uma caixa e retirar um aum, 10 nmeros. A amostra aleatria simples ter, neste caso, 25% da populao.

    Se o nmero de elementos da mostra for muito grande, o sorteio pode ser invivel. Neste casopodemos utilizar uma tabela de nmeros aleatrios para realizar a amostragem. Procure nainternet uma tabela de nmeros aleatrios. Se voc tiver acesso planilhas Excel, descubracomo gerar nelas as tabelas de nmeros aleatrios.

    Um outro tipo de amostragem probabilstica a amostragem sistemtica, em que oselementos da populao j se acham ordenados e a retirada de elementos para composio da

  • amostra feita periodicamente. Em uma linha de produo, se retirarmos um item a cada 10produzidos para controle de qualidade, estaremos utilizando a abordagem sistemtica.

    Poderamos utilizar o mesmo mtodo para retirar uma amostra de uma populao dedeterminada rua. Se a rua contm 500 prdios, e queremos que a amostra contenha 10% dapopulao (50 prdios), podemos escolher aleatoriamente o 1 prdio e ir pulando de 10 em10 prdios at chegar ao 50 elemento.

    Se por acaso nossa populao contiver subpopulaes ou estratos, importante utilizar umaamostragem estratificada , em que os elementos da amostra so proporcionais aos elementosdos estratos da populao. Um bom exemplo uma turma com 60 alunos, contendo 40meninos e 20 meninas. Temos uma proporo 2:1. importante que a amostra contenha estamesma proporo. Assim, se tivermos uma amostra com 15 elementos, 10 devero sermeninos e 5 meninas. Mantendo a proporo 2:1.

    Amostras no-probabilsticas so tambm empregadas em trabalhos de estatstica porsimplicidade ou inviabilidade de fazermos amostras probabilsticas. Os casos mais importantesso:

    a) A inacessibilidade de toda a populao (e neste caso seremos forados a colher aamostra somente na parte da populao que est acessvel);

    b) Amostragem a esmo , em que o selecionador procura ser aleatrio na amostragem, masno utiliza nenhum mtodo confivel de sorteio;

    c) Amostragens intencionais , em que o amostrador delibaradamente escolhe algunselementos para pertencer amostra, julgando-os representativos;

    d) Amostragens por voluntrios, no caso de por exemplo aplicaes experimentais denovos medicamentos.

    6.1 Exerccios:1) Pesquise o peso dos seus colegas de classe (incluindo voc), com uma amostra que

    corresponda a 30% da populao utilizando amostragem casual (ou aleatria) simples.No deixe de procurar na internet uma tabela de nmeros aleatrios!

    2) O diretor de uma escola, na qual esto matriculados 320 meninas e 280 meninos desejapassar um questionrio socio-econmico para uma amostra correspondente a 10% daclientela. Qual o nmero de elementos componentes da amostra?Resposta: 64 meninas e 56 meninos.

    3) Uma populao encontra-se dividida em 3 estratos, com tamanhos 40, 100 e 60.Sabendo-se que 9 elementos foram retirados do 3 estrato em uma amostragemestratificada, determine o nmero total de elementos da amostra.Resposta: 30 elementos

  • 7 Tcnicas de descrio grficaLembrando que um dos objetivos das estatstica a apresentao dos dados, importante quesaibamos trabalhar com tabelas e grficos.

    7.1 TabelasMuitas vezes, para organizarmos melhor os dados, fazemos o uso de tabelas . De maneirasimplificada, uma tabela um quadro resumindo o nosso conjunto de observaes.Toda tabela deve conter, resumidamente, como no exemplo a seguir: Ttulo, Cabealho,Clulas e Fonte

    Altura mdia dos estudantes do Ensino Mdio deJaparabeEscola Altura (m)A 1.65B 1.71C 1.63D 1.67E 1.7F 1.69Mdia Geral 1.675Fonte: Censo Escolar do Municpio de Japarabe, 2006

    Ttulo

    Cabealho

    Clulas

    Fonte

    Obs: Se a tabela apresenta distribuio dos dados em funo da poca, do local ou de algumaespcie (ou categoria), ns a denominamos Srie Estatstica, podendo ser classificada emSrie Histrica, Srie Geogrfica ou Srie Especfica.

    7.2 GrficosA vantagem da apresentao grfica produzir uma rpida impresso visual.

    Para sermos realmente teis, nossas representaes grficas devem ser simples, claras edevem expressar a verdade sobre o fenmeno estudado.

    Os principais tipos de grficos so os diagramas, os cartogramas e os pictogramas.

    7.2.1 DiagramasDiagramas so grficos construdos, em geral, no plano cartesiano (x,y). O principal diagrama o grfico em linha ou em curva, que voc com certeza j estudou em suas aulas dematemtica.

  • Exemplo:

    Utilizando nossa tabela de alturas mdia em funo das escolas, temos:

    Outro tipo importante de representao o grfico em colunas ou barras , em que utilizamosretngulos verticais (colunas) ou horizontais (barras) para visualizar as sries.Exemplos:

    Finalmente, devemos conhecer o grfico circular ou em setores, em que um crculo divididocom reas proporcionais aos dados da srie.

  • Cada setor obtido por meio de regra de trs simples, com o total da srie valendo 360

    Exemplo:

    7.2.2 CartogramasSo empregados sobre uma carta geogrfica , com os dados diretamente relacionados aorecortes geogrficos ou polticos.

    Podemos representar dados em pontos (em nmero ou tamanho proporcional aos valores) oucores.

    Exemplo:

  • 7.2.3 PictogramasSo, de maneira resumida, uma representao grfica baseada em figuras .

    Exemplo:

    7.3 Exerccios1) Procure exemplos de sries estatsticas em jornais e revistas e copie-os, classificando

    as sries.2) Procure em jornais e revistas especializados dois exemplos de cada um dos grficos

    estudados.3) Usando o grfico em barras, represente a tabela:

    Prod. de Veculos de Autopropulso -1993Tipo QuantidadeAutomveis 1.100.278Comerciais Leves 224.387Comerciais Pesados 66.771Fonte: Anfavea

  • 8 Distribuio de frequnciaPara descrevermos grficamente os dados coletados, nosso primeiro passo a determinaodas frequncias dos valores existentes da varivel.

    Definimos frequncia simples (ou absoluta) como o nmero de vezes que um valor foiobservado, e podemos obter, a partir de dados brutos, uma tabela de distribuio defrequncias.

    8.1 Exemplo Resolvido:Imagine que tenhamos feito uma coleta de dados relativos quantidade de irmos de 10alunos, compondo uma amostra de uma turma da escola A, e ordenamos os dados de modocrescente (a tabela de dados ordenados chama-se rol ).Em nosso exemplo, a frequncia ser o nmero de alunos relacionados a um determinadovalor da varivel, ou seja, um determinado nmero de irmos.Tabela - Nmero de irmos de alunos do curso deEstatsticaNmero de irmos Frequncia0 11 42 63 35 1Total 15Fonte: Autor

    Temos acima a construo de uma tabela de distribuio de freqncia pontual, equivalente construo de uma tabela simples, em que listamos os diferentes valores observados davarivel, com suas freqncias absolutas, denotadas por fi, onde o ndice i corresponde aonmero de linhas da tabela.

    Olhando para a tabela, vemos que esta varivel foi resumida em 5 linhas. Assim, i = 1,...,5, etemos 5 valores para as freqncias absolutas. A freqncia absoluta da segunda linha, f = 4,por exemplo, indica que quatro alunos tm um irmo, enquanto apenas um afirmou ter cincoirmos, ou seja, f =1.A soma de todas as freqncias absolutas deve ser igual ao nmero total de observaes davarivel, neste caso, 15.

    2

    5

    Temos, portanto, que:

    Frequncias relativas (fr ) so o resultado da razo entre as frequncias simples e afrequncia total:

    i

  • classe.

    Se estivermos lidando com variveis discretas e amostras com poucos elementos (como noexemplo anterior), temos uma distribuio sem intervalos de classe.Porm, se trabalhamos com variveis contnuas, ou at mesmo com variveis discretas, mascom muitos elementos, trabalharemos com classes de frequncia , que so simplesmenteintervalos de variao.

    As classes sero representadas por i = 1, 2, 3, ..., k, onde k o nmero total de classes.

    14

    fr =i =

    Logo, a frequncia relativa da quarta linha em nosso exemplo :

    A frequncia relativa da quinta linha : , e assim por diante.

    Evidentemente temos que:

    Frequncia acumulada (F ) o total das frequncias de todos os valores inferiores ao limitesuperior de uma dada classe:

    F = f + f + f + ... fTemos portanto:

    F = f ,

    F = f + f ,

    F = f + f + f

    E assim por diante.

    Podemos desenhar uma nova tabela, mais completa, com as frequncias relativas eacumuladas:

    i

    k 1 2 3 k

    1 1

    2 1 2

    3 1 2 3

    Tabela - Nmero de irmos de alunos do curso de EstatsticaNmero de Frequncia Frequnciairmos Relativa AcumuladaFrequncia

    0 1 0.067 11 4 0.267 52 6 0.400 113 3 0.200 144 1 0.067 15Total 15 1 15Fonte: Autor

  • Agora, precisamos de algumas outras definies:

    Os limites de classe so os extremos de cada classe, e teremos um limite inferior (l ) e umlimite superior (L ).Alm disso tambm definimos a amplitude (h ), obtida pela simples subtrao dos limitessuperior e inferior da classe: h = L - l

    Amplitude total da distribuio (AT) a diferena entre o Limite superior mximo e o limiteinferior mnimo: AT = Lmax - lminPor ltimo, ponto mdio de uma classe a mdia aritmtica entre os limites superior e inferiorda classe:

    i

    i

    i

    i i i

    Xi =

    Obs: Na prtica, para a determinao do nmero de classes de uma distribuio, usamos aseguinte equao (regra de Sturges):i 1 + 3,3 . log n

    Essa regra nos d a seguinte tabela:

    N I3 5 36 11 412 22 523 46 647 90 791 181 8182 362 9

    Definido o nmero de classes, precisamos determinar a amplitude do inervalo de classe:

    8.2 Exerccios:1) Complete a distribuio abaixo, determinando as frequncias simples:

    I x i f i Fi1 2 22 3 93 4 214 5 295 6 34

  • = 34

    2) Os resultados do lanamento de um dado 20 vezes foram:6 5 6 3 4 3 5 2 4 14 5 6 1 3 1 2 4 1 5

    Forme uma distribuio de frequncia sem intervalos de classe.

    3) Observe a distribuio de frequnciaXi 3 4 5 6 7 8Fi 2 5 12 10 8 3

    Determine:

    a) As frequncias relativasb) As frequncias acumuladasc) As frequncias relativas acumuladas4) Complete os dados que faltam:

    i x i f i fr i Fi1 0 1 0,05 2 1 0,15 43 2 4 4 3 0,25 135 4 3 0,15 6 5 2 187 6 198 7

    =

    = 20 100

  • 9 Representao grfica de uma distribuioUma distribuio pode ser representada de diversas maneiras. As principais so o histogramae o polgono de frequncia.

    O Histograma traado em um plano cartesiano (x,y), formado basicamente por uma srie deretngulos justapostos, em que os pontos mdios das bases dos retngulos so na verdade ospontos mdios dos intervalos de classe e as larguras dos retngulos so as larguras dosintervalos de classe

    Polgono de frequncia um grfico em linha, com as frequncias das classes marcadas noeixo y do plano cartesiano.

    9.1 Exerccios1) Construa o histograma relativo ao exerccio 4 do item anterior

  • 2)

    10 Medidas de posioEstudando as distribuies de frequncia, percebemos que existem alguns elementos tpicosque precisam ser ressaltados.

    O primeiro destes elementos a posio de concentrao dos valores.

    Imagine a seguinte pergunta: Os dados esto mais concentrados no incio, no meio ou no finalda distribuio?

    Para que possamos respond-la, precisamos conhecer as mais importantes medidas deposio, que so as medidas de tendncia central: a mdia, a mediana e a moda.

    10.1 Medidas de tendncia centralAs medidas de tendncia central so assim chamadas por indicarem um ponto em torno doqual se concentram os dados. Este ponto tende a ser o centro da distribuio dos dados, ou ocentro de gravidade dos dados.

    10.1.1 Mdia Aritmtica (x)Antes de mais nada, importante que voc saibda que ao lidarmos com um conjunto de dados,podemos calcular diversos tipo de mdias. Em nosso estudo focaremos a mdia maisimportante, a mdia aritmtica, mas no deixe de estudar posteriormente a mdia geomtrica,a mdia harmnica e a mdia ponderada.

    A mdia aritmtica (x) a soma de todos os valores observados da varivel dividida pelonmero total de observaes.

    A mdia aritmtica a medida de tendncia central mais utilizada para representar a massa dedados.

    Propriedades e observaes sobre a mdia:

    1. Depende de todos os dados coletados, sendo portanto afetada por valores extremos;

    2. nica em um conjunto de dados e nem sempre tem existncia real, ou seja, nem sempre igual a um determinado valor observado. muito importante perceber que a mdia nonecessariamente um dado da srie de valores observados.

    3. Por depender de todos os valores observados, qualquer modificao nos dados far comque a mdia fique alterada.

    Isto quer dizer que somando-se, subtraindo-se, multiplicando-se ou dividindo-se uma constantea cada valor observado, a mdia ficar acrescida, diminuda, multiplicada ou dividida destemesmo valor. Exemplificando: se somarmos o nmero 2 a todos os valores observados, amdia ser acrescida do valor 2. Se multiplicarmos todos os dados por 3, a mdia serautomaticamente 3 vezes maior.

  • 4. A soma dos desvios em relao mdia zero.

    (x x) = 0iA propriedade 4 de extrema importncia para a definio de varincia, uma medida dedisperso a ser definida posteriormente. Desvio em relao mdia a diferena entre cadaelemento de um conjunto de dados e a mdia aritmtica.d = x xi iObs: se precisarmos calcular a mdia de um conjunto de dados divididos em classes,convencionamos que todos os valores includos no intervalo coincidem com o ponto mdiodeste intervalo, e utilizamos a seguinte equaao:

    10.1.2 Moda (Mo)Moda simplesmente o valor que mais se repete em uma sequncia de dados.

    Considere a seguinte srie: 1, 3, 4, 4, 4, 6, 8, 32

    Como o valor que aparece com maior frequncia o 4, ele o valor modal, ou simplesmentea moda.

    O uso da moda mais indicado quando se deseja obter, rapidamente, uma medida detendncia central. Um outro aspecto que favorece a utilizao da moda que seu valor no afetado pelos valores extremos do conjunto de dados analisado.Uma srie numrica pode ser:

    Amodal: quando nenhum valor se repete;

    Modal: quando um valor se repete;

    Bimodal: quando dois valores se repetem;

    Trimodal: quando trs valores se repetem;

    Polimodal: quando mais do que trs valores se repetem.

    10.1.3 Mediana (Md)A mediana o valor que ocupa a posio central da srie de observaes de uma varivel,dividindo o conjunto em duas partes iguais. Assim, 50% dos valores so maiores ou iguais aovalor da mediana e 50% dos valores so menores ou iguais ao valor da mediana.

    Formalizando, a mediana o valor tal que separa o conjunto de dados em dois subconjuntosde mesmo nmero de elementos.

  • Se a quantidade de dados for mpar , a mediana simplesmente o valor central, e se aquantidade de dados for par a mediana ser a mdia aritmtica dos dois valores centrais.

    Sendo n o nmero de elementos da srie, o valor mediano ser:

    - O termo , se n for mpar;

    - A mdia aritmtica dos termos e + 1, se n for par.

    Vamos comear com uma srie de 7 dados observados:

    1, 5, 8, 9, 12, 17, 20

    Como temos um nmero mpar de dados, a mediana o valor central, ou seja, o valor 9.E se tivssemos 8 valores observados?

    1, 5, 8, 9, 12, 17, 20, 22

    Nesse caso a mediana seria a mdia aritmtica dos dois dados centrais. Como os dadoscentrais so o 9 e o 12, a mediana seria .

    Obs: Empregamos a mediana sempre que h valores extremos que afetam muito a mdia.

    Veja a srie de dados sobre o valor dos salrios dos colaboradores em um escritrio:R$1.000,00, R$1.000,00, R$1.500,00, R$2.000,00, R$3.000,00A mediana dos dados R$1.500,00 (valor central) e a mdia R$1.700,00Imagine agora que um novo colaborador contratado, com salrio de R$10.000Repare que a nova srie :

    R$1.000,00, R$1.000,00, R$1.500,00, R$2.000,00, R$3.000,00, R$10.000,00e o novo valor da mediana R$1.750,00 e da mdia R$3.083,33Reparou com um valor extremo altera muito a mdia, mas sem alterar muito a mediana?Nesses casos a mediana uma medida de tendncia central mais estvel.

    10.2 Exerccios1) Uma escola deseja verificar o aproveitamento de 6 de seus alunos da 5 srie. Calcule

    a mdia, a mediana e a moda, e classifique a srie conforme a moda.Notas: 7,0 3,5 2,5 6,5 9,0 3,5Respostas: Mdia = 5,3, Mediana = 5,0, Moda = 3,5. Srie Modal.

    2) Classifique as srie de acordo com a caracterstica modal, indicando os valores.2.1) 12, 13, 13, 14, 15, 17, 17, 192.2) 56, 58, 60, 60, 60, 62, 65

  • 2.3) 47, 45, 90, 90, 47, 90, 47, 45, 41, 45

    10.3 Medidas SeparatrizesExistem outras medidas de posio (alm das medidas de tendncia central), e aquiestudaremos mais duas delas: os quartis e os percentis.

    10.3.1 QuartisJ aprendemos que a mediana divide os dados coletados em dois grupos com o mesmonmero de elementos.

    Os quartis dividem o conjunto de valores em, como o nome j diz, quatro subconjuntos demesmo nmero de elementos

    Assim, temos trs quartis:

    a. O primeiro quartil (Q1) o valor situado de modo tal que um quarto (25%) dos dadosso menores que ele, e o restante (75%) maior que ele.

    b. O segundo quartil (Q2) evidentemente igual a mediana. Q2 = Md.c. O terceiro quartil (Q3) o valor situado de modo tal que trs quartos (75%) dos dados

    so menores que ele, e o restante (25%) maior que ele.Resumo:

    Estatstica Notao Interpretao Posio

    1o Quartil Q125% dos dados so menores ou iguais ao do 1o

    Quartilp = 0,25 (n +

    1)2o Quartil Q2 = Md

    50% dos dados so menores ou iguais ao do 2oQuartil

    p = 0,50 (n +1)

    3o Quartil Q375% dos dados so menores ou iguais ao do 3o

    Quartilp = 0,75 (n +

    1)

    10.3.2 PercentisPercentis so os noventa e nove valores que dividem uma srie de dados em 100 partes (ousubconjuntos) com o mesmo nmero de elementos.Indicamos o 1 percentil como P , o 2 como P e assim por diante.

    importante notar que P = Q1, P = Md e P = Q3

    Resumo:

    1 2

    25 50 75

    Estatstica Notao Interpretao Posio

    5o Percentil P p = 0,05 (n + 1)5% dos dados so menores ou5 iguais ao do 5o Percentil

    50o Percentil P = Q2 = Md p = 0,50 (n + 1)50% dos dados so menores ou50 iguais ao do 50o Percentil

  • 95o Percentil P p = 0,95 (n + 1)95% dos dados so menores ou95 iguais ao do 95o Percentil

  • 11 Medidas de DispersoAs medidas de disperso auxiliam as medidas de tendncia central a descrever nosso conjuntode dados observados adequadamente. Indicam se os dados esto, ou no, prximos uns dosoutros.

    Observe os trs conjuntos de dados:X: 10, 10, 10

    Y: 5, 10, 15

    Z: 0, 10, 20

    fcil perceber que se calcularmos a mdia dos trs conjuntos, encontraremos o mesmo valor:10. Porm, igualmente fcil perceber que o conjunto X mais homogneo, enquanto oconjunto Z o que tem maior diversificao.Chamamos de disperso ou variabilidade a maior ou menor diversificao de valores emtorno de um valor de tendncia central. necessrio, portanto, ao menos uma medida detendncia central e uma medida de disperso para descrever um conjunto de dados.De todas as medidas de disperso, estudaremos a amplitude total, a varincia, o desvio padroe o coeficiente de variao

    11.1 Amplitude TotalA amplitude total simplesmente a diferena entre o maior e o menor valor coletado. Aamplitude total uma medida de disperso que no leva em considerao os valoresintermedirios, no dando nenhuma informao de como os dados esto distribudos (ouconcentrados).AT = xmx x mnA amplitude total tem um clarssimo problema: s leva em considerao os valores extremos denosso conjunto de dados, sem contabilizar os valores intermedirios. vlido utilizarmos a amplitude total para comparamos temperaturas ao longo de um dia (ouano) ou como controle rpido de qualidade em uma linha de produo.11.2 VarinciaA varincia uma medida baseada nos desvios em torno da mdia aritmtica.

    Formalizando a idia, na verdade a varincia a mdia aritmtica dos quadrados dos desvios2(ou a mdia aritmtica dos desvios ao quadrado). Representamos a varincia por s , e temos:

    ou

  • Obs: Se nosso interesse for a inferncia estatstica (tirar concluses sobre a populaopartindo de uma amostra) e no simplesmente a descrio dos dados, convm utilizarmos n-1no lugar de n (no denominador).Podemos portanto dizer que quanto maior a varincia, mais heterogneos so os dados, ouseja, maior ser a variao entre os valores. Por outro lado, quanto menor a varincia, maishomogneos so os dados, ou seja, menor ser a variao entre os valores.11.3 Desvio PadroUma vez que a varincia obtida por meio dos quadrados dos desvios, a sua unidade demedida o quadrado da unidade de medida dos dados. Assim, por motivos prticos, utilizamoso desvio padro , que simplesmente a raiz quadrada da varincia.

    Observaes:

    1. Tanto o desvio padro quanto a varincia so medidas de disperso, o uso de uma ououtra medida depender da finalidade do estudo

    2. A utilizao da mdia aritmtica torna o clculo da varincia (e do desvio padro) poucoprticos, pois com frequncia a mdia um nmero fracinrio. mais frequenteutilizarmos uma simplificao da frmula:

    3. No caso de dados agrupados, teremos que levar em considerao as frequncias.Assim, a equao ser:

    4. No caso de dados agrupados com intervalos de classe, os valores de x sero osivalores mdios (mdia aritmtica entre os limites inferior e superior) das classes.

    11.3.1 Propriedades:1) Se somarmos ou subtrairmos uma constante de todos os valores da srie, o desvio

    padro no se altera.2) Se multiplicarmos ou dividirmos uma constante por todos os valores da srie, o desvio

    padro ser multiplicado ou divido por esta mesma constante.

  • 11.3.2 Exemplo resolvido:Observe como montar a tabela para uma determinada distribuio de frequncias e a utilizaoda equao para dados agrupados

    i (cm) f x f x f xEstaturas

    i i i i i i2

    1 150 - 154 4 152 608 924162 154 - 158 9 156 1404 2190243 158 - 162 11 160 1760 2816004 162 - 166 8 164 1312 2151685 166 - 170 5 168 840 1411206 170 - 174 3 172 516 88752

    = =

    = 40 6.440 1.038.080

    s = 5,567

    11.4 Coeficiente de variao (CV)O coeficiente de variao resolve dois problemas do desvio padro:

    1) O desvio padro tem a mesma unidade dos dados coletados. Assim, se quisermoscomparar dados com unidades diferentes, o desvio padro no uma boa medida

    2) O desvio padro, como valor absoluto, no nos diz muita coisa, pois um desvio de 5com mdia 500 um desvio pequeno, mas um desvio de 5 com mdia 10 um desviogrande.Ou seja, o valor absoluto do desvio padro, no caso, 5, no nos diz nada.

    O coeficiente de variao calculado pela seguinte equao:

    Sendo portanto uma grandeza admensional (sem unidades) e ponderada pelo seu valor mdio.

  • 11.5 Exerccios1) Complete o esquema abaixo e calcule o desvio padro para a seguinte sequncia de

    valores:8 10 11 15 16 18

    I x i x 2i1 8 642 10

    n = = =

    Resp: s = 3,559

    2) Comprove as propriedades do desvio padro somando 3 a cada nmero da srie edepois multiplicando cada nmero por 2.

    3) Calcule a amplitude total e o desvio padro da seguinte distribuio:

    x 2 3 4 5 6 7 8if 1 3 5 8 5 4 2i

    4) Para os dados de peso de 2 grupos de alunos, calcule a mdia e o desvio padro65 57 89 65 50 72 81

    Resp: Mdia =68,428kg, Desvio = 13,464kg80 78 67 56 90 101 66

    Resp: Mdia = 76,857kg, Desvio = 15,366kg

  • 12 Noes de assimetriaA natureza bsica da assimetria simples.

    Se em uma distribuio em forma de sino (distribuio normal) temos x = Md = Mo, a curva considerada simtrica

    Se Mo < Md < x, a curva assimtrica positiva .

    Se x < Md < Mo, a curva assimtrica negativa.

    Assim, calculando o valor da diferena (x Mo), para valores nulos teremos uma curvasimtrica, para valores negativos teremos uma assimetria negativa (ou esquerda) e paravalores positivos teremos uma assimetria positiva (ou direita).Podemos tambm fazer uso do coeficiente de assimetria de Pearson, que tem a vantagem deser admensional:

    Se 0,15 < |As| < 1, a assimetria considerada moderada. Se |As| > 1 a assimetria considerada forte.

  • 13 A distribuio NormalDe todas as distribuies tericas de varivel aleatria contnua, uma das mais importantes adistribuio normal.

    13.1 Propriedades:1) A varivel X pode assumir qualquer valor real2) Graficamente, a distribuio tem a forma de um sino, simtrico em torno da mdia. A

    curva recebe o nome de Curva de Gauss o Curva Normal3) A rea total sob a curva tem valor 1 e a probabilidade da varivel X assumir qualquer

    valor real. Dada a simetria da vurva, a probabilidade vale 0,5 para cada lado da mdia

    O clculo da rea (probabilidade) para cada ponto da curva exige matemtica avanada,portanto usaremos um conceito simples para contornar esta restrio, o conceito dedistribuio normal reduzida

    A distribuio normal reduzida uma distribuio normal com mdia 0 e desvio padro 1. Asprobabilidades associadas (ou reas sob a curva) so encontradas em uma tabela, de modoque no precisamos calcul-las. A frmula que usaremos :

    13.2 Exemplo Resolvido:Imagine um grupo de trabalhadores com mdia salarial R$400,00 e desvio padro R$50,00.Qual a probabilidade de encontrarmos um trabalhador que tenha salrio entre R$390,00 eR$450,00?Passo-a-passo:

    1) A distribuio original (X) tem mdia R$400,00 e desvio R$50,002) Podemos ento encontrar os valores de Z correspondentes a X = R$390,00 e X =

    R$450,00Z1 = (390 400)/50 = -0,2Z2 = (450 400)/50 = 1,0

    Assim, podemos dizer que a probabilidade do salrio (X) ficar entre R$390,00 e R$450,00 amesma de termos Z entre -0,2 e + 1,0.

    Observando a tabela de distribuio normal de Z (pea ajuda de seu profesor para ler a tabela!Tabelas de probabilidade para Z (0,1) podem ser facilmente encontradas na internet), temos

  • 0,0793 para 0,2 (no h diferena entre -0,2 e + 0,2, uma vez que a curva simtrica) e0,3413 para 1,0.

    Como a distribuio Z tem mdia 0, temos 0 -0,2 esquerda do zero e o +1,0 direita do zero.

    P (390 < X < 450) = P (-0,2 < Z < 0) + P (0 < Z < 1,0) = 0,0793 + 0,3413 = 0,4206.Ou seja, temos que em mdia 42% dos trabalhadores ganham entre R$390,00 e R$450,00.Obs: Para ler a tabela de distribuio normal Z, procure os dois primeiros algarismos naprimeira coluna e depois o ltimo algarismo na primeira linha. Para achar o 1,00 fcil. Bastaacharmos o 1,0 na primeira coluna e depois o 0,00 na primeira linha. Ficamos com 0,3413. Sequisermos achar Z = 1,55, temos que achar o 1,5 na primeira coluna e depois o 0,05 naprimeira linha. Ficamos com 0,4395. Por ltimo, se quisermos achar Z = 3,38, procuraremos o3,3 na primeira coluna e o 0,08 na primeira linha. Acharemos o valor 0,4996.