17
ESTATÍSTICA – APOSTILA 1 CURSO DE ENGENHARIA DE PRODUÇÃO Prof. Jorge Santana Montes Claros Julho/2010

Unknown Parameter Value (1)

Embed Size (px)

Citation preview

ESTATSTICA APOSTILA 1CURSO DE ENGENHARIA DE PRODUOProf. Jorge Santana

Montes Claros

Julho/20101 OS MTODOS ESTATSTICOS: finalidade e aplicaes; conceitos bsicos de Estatstica.1.1 - O que Estatstica?

Todas as cincias tm suas razes na histria do homem.

A Matemtica, que considerada a cincia que une clareza do raciocnio a sntese da linguagem, originou-se do convvio social, das trocas, da contagem, com carter prtico, utilitrio, emprico.

A Estatstica, ramo da Matemtica Aplicada, teve origem semelhante.

Desde a antiguidade, vrios povos j registravam o nmero de habitantes, de nascimentos, de bitos, faziam estimativas das riquezas individual e social, distribuam equitativamente terras ao povo, cobravam impostos e realizavam inquritos quantitativos por processos que, hoje, chamaramos de estatsticas.

Na Idade Mdia colhiam-se informaes, geralmente com finalidades tributrias ou blicas.

A partir do sculo XVI comearam a surgir as primeiras anlises sistemticas de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tbuas e tabelas e os primeiros nmeros relativos.

No sculo XVIII o estudo de tais fatos foi adquirindo, aos poucos, feio verdadeiramente cientfica. Godofredo Achenwal batizou a nova cincia (ou mtodo) com o nome de Estatstica, determinando o seu objetivo e suas relaes com as cincias.

As tabelas tornaram-se mais completas, surgiram as representaes grficas e o clculo das probabilidades, e a Estatstica deixou de ser simples catalogao de dados numricos coletivos para se tornar o estudo de como chegar a concluses sobre o todo (populao), partindo da observao de partes desse todo (amostras).

Atualmente, o pblico leigo (leitor de jornais e revistas) posiciona-se em dois extremos divergentes e igualmente errneos quanto validade das concluses estatsticas: ou cr em sua infalibilidade ou afirma que elas nada provam. Os que assim pensam ignoram os objetivos, o campo e o rigor do mtodo estatstico; ignoram a Estatstica, quer terica quer prtica, ou a conhecem muito superficialmente.

Na era da energia nuclear, os estudos estatsticos tm avanado rapidamente e, com seus processos e tcnicas, tm contribudo para a organizao dos negcios e recursos do mundo moderno.

(...) Exprimindo por meio de nmeros as observaes que se fazem de elementos com pelo menos uma caracterstica comum (por exemplo: os alunos do sexo masculino de uma comunidade), obtemos os chamados dados referentes a esses elementos.

Podemos dizer, ento, que:

A Estatstica uma parte da Matemtica Aplicada que fornece mtodos para coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises.

A coleta, a organizao e a descrio dos dados esto a cargo da Estatstica Descritiva, enquanto a anlise e a interpretao desses dados ficam a cargo da Estatstica Indutiva ou Inferencial.

Em geral, as pessoas quando se referem ao termo estatstica, o fazem no sentido da organizao e descrio dos dados (estatstica do Ministrio da Educao, estatstica dos acidentes de trfego, etc.), desconhecendo que o aspecto essencial da Estatstica o de proporcionar mtodos inferenciais que permitam concluses que transcendam os dados obtidos inicialmente.

Assim, a anlise e a interpretao dos dados estatsticos tornam possvel o diagnstico de uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condies de funcionamento, produtividade), a formulao de solues apropriadas e um planejamento objetivo da ao. (CRESPO, 1997).

1.2 Conceitos bsicos de Estatstica

1.2.1 Populao

uma coleo completa de todos os elementos (valores, pessoas, medidas, etc.) a serem estudados.

1.2.2 Censo

uma coleo de dados relativos a todos os elementos da populao.

1.2.3 Amostra

um subconjunto da populao.

1.2.4 Um parmetro

uma medida numrica que descreve uma caracterstica da populao.

1.2.5 Uma estatstica

uma medida numrica que descreve uma caracterstica de uma amostra.

1.2.6 Estudo observacional

Tipo de estudo em que se verificam e se medem caractersticas especficas, mas no se manipulam nem se modificam os elementos a serem estudados.

1.2.7 Experimento

Tipo de estudo em que se aplica determinado tratamento e observa-se seu efeito sobre os elementos a serem pesquisados.

2 VARIVEIS: qualitativa (ou categrica) e quantitativa; nveis de mensurao de variveis.

2.1 Varivel qualitativa (ou categrica)

expressa por atributos e pode ser separada em diferentes categorias, como por exemplo: sexo (masculino, feminino); cor da pele (branca, preta, amarela, parda); religio (catlica, evanglica, esprita...); etc.

2.2 Varivel quantitativa

expressa por nmeros que representam contagens ou medidas, como por exemplo: salrios, altura, peso, idade, etc.

2.2.1 Varivel quantitativa discreta

Resulta de um conjunto finito de valores possveis, ou de um conjunto enumervel desses valores. (Ou seja, o nmero de valores possveis 0, ou 1, ou 2, etc.)

2.2.2 Varivel quantitativa contnua

Resulta de um nmero infinito de valores possveis que podem ser associados a pontos em uma escala contnua de tal maneira que no haja lacunas ou interrupes.

Exemplos: o nmero de operrios de uma grande construo uma varivel quantitativa discreta porque representa uma contagem; j o peso desses operrios uma varivel quantitativa contnua porque representa mensuraes que podem tomar qualquer valor em um intervalo contnuo.

2.3 Nveis de mensurao de variveis

uma forma adicional de se classificarem os dados. H quatro nveis de mensurao de variveis: nominal, ordinal, intervalar e razo.

2.3.1 Nvel nominal

Caracterizado por dados que consistem apenas de nomes, rtulos ou categorias. Os dados no podem ser dispostos segundo um esquema ordenado (como de baixo para cima).

Exemplos:

Respostas do tipo sim, no ou indeciso.

O sexo dos estudantes em uma turma de matemtica.

2.3.2 Nvel ordinal

Envolve dados que podem ser dispostos em alguma ordem, mas as diferenas entre os valores desses dados no podem ser determinadas, ou no tem sentido.

Exemplos:

Um editor classifica alguns originais como excelentes, alguns como bons e alguns como maus. (No podemos determinar uma diferena quantitativa entre bom e mau, por exemplo).

Nas olimpadas de matemtica, Joo foi classificado em 3; Carlos em 7 e Joana em 10 lugar. (Podemos determinar a diferena entre os 3 e 7 lugares, mas a diferena de 4 no tem qualquer significado).

2.3.3 Nvel intervalar

anlogo ao nvel ordinal, com a propriedade adicional de que podemos determinar diferenas significativas entre os dados. Todavia, no existe um ponto de partida zero inerente, ou natural (onde no haja qualquer quantidade presente). As temperaturas 98,2F e 98,6F so exemplos de dados nesse nvel intervalar de mensurao. Os valores se apresentam ordenados, e podemos determinar diferenas entre eles (em geral chamadas distancias entre os dois valores). Entretanto, no h ponto de partida natural. O valor 0F pode parecer um ponto de partida, mas inteiramente arbitrrio, e no representa ausncia de calor. um erro dizer que 50F duas vezes mais quente que 25F.

Exemplos:

Os anos 1000, 2000, 1776 e 1944. (O tempo no comeou no ano zero e, assim, o 0 arbitrrio, e no um ponto de partida zero natural).

As temperaturas anuais mdias (em graus Celsius) das capitais brasileiras.

2.3.4 Nvel razo

o nvel de intervalo modificado de modo a incluir o ponto de partida zero inerente (onde o zero significa nenhuma quantidade presente). Para valores nesse nvel, tantos as diferenas como as razes tm significado.

Exemplos:

Pesos dos artigos de material plstico descartado pelas residncias (0 kg indica que nenhum plstico foi descartado, e 10 kg representa duas vezes 5 kg).

Durao (em minutos) de filmes.

Distncias (em km) percorridas por carros em um teste de consumo de consumo de combustvel.

3 AMOSTRAGEMSo as tcnicas utilizadas para se extrair a amostra da populao. A amostragem pode ser probabilstica ou no probabilstica. Na amostragem probabilstica so realizados sorteios para alocao dos elementos da amostra, j na amostragem no probabilstica no se procede ao sorteio. O tamanho da populao , geralmente, designado por N e o tamanho da amostra por n.3.1 Amostragem probabilstica

Este tipo de amostragem garante o acaso na escolha. Assim, cada elemento da populao tem a mesma chance ser selecionado. Isto garante a representatividade da amostra e a validade das inferncias que sero feitas a partir dela. Sero discutidos aqui, sucintamente, quatro tipos de amostragem probabilstica.

3.1.1 Amostragem casual ou aleatria simples

Equivale a um sorteio dos indivduos que faro parte da amostra

Procedimento:

Enumera-se a populao de 1 a N

Sorteiam-se os indivduos.

Antigamente, os sorteios eram feitos por meio de tabelas de nmeros aleatrios. Hoje em dia, utiliza-se uma calculadora cientfica ou, o que mais comum, um software estatstico.

Exemplo

Uma populao composta de 200 indivduos. Retire uma amostra de tamanho 10, utilizando sua calculadora cientfica.

Amostra: ____ ____ ____ ____ ____ ____ ____ ____ ____ ____

3.1.2 Amostragem casual estratificada proporcional

Utilizada quando a populao se subdivide em estratos (subpopulaes).

Procedimento:

Calcula-se a frao de amostragem dada por:

Calcula-se o tamanho da amostra em cada estrato, fazendo-se:

Sorteiam-se os indivduos em cada estrato.

Exemplo

Uma populao composta por 7820 indivduos distribudos em trs estratos que apresentam as seguintes quantidades de elementos: N1 = 3270; N2 = 2680 e N3 = 1870. Se se deve retirar uma amostra de tamanho n = 1564, qual deve ser a quantidade de indivduos a ser sorteada em cada estrato?

Sorteiam-se, em cada estrato, as quantidades de indivduos calculadas acima.

3.1.3 Amostragem sistemtica

Utilizada preferencialmente quando a populao j se encontra ordenada, como por exemplo: as casas de uma rua, pronturios mdicos, nmero de registros de matrcula, etc.

Procedimento:

Calcula-se o fator de sistematizao ou intervalo de seleo, dado por:

Sorteia-se um indivduo no intervalo [1 ; F], que ser o primeiro elemento da amostra.

Os demais elementos so obtidos somando-se sucessivamente o valor do intervalo de seleo

Exemplo

Retirar uma amostra de tamanho n = 10 de uma populao ordenada composta de 80 elementos.

1 elemento = n. aleatrio multiplicado por 8.

Amostra: ____ ____ ____ ____ ____ ____ ____ ____ ____ ____

3.1.4 Amostragem por conglomerado em 1 estgio

semelhante amostragem aleatria simples, porm, cada unidade de amostragem equivale a um grupo ou conglomerado de elementos. Este tipo de amostragem utilizado quando se encontram dificuldades para obter uma lista dos indivduos da populao.

Procedimento:

Especifica-se o sistema de referncia (conglomerados)

Sorteiam-se alguns conglomerados

Pesquisam-se todos os indivduos dos conglomerados sorteados.

Exemplo

Estimar o nmero mdio de domiclios com aquecedor solar em uma grande cidade.

Como a amostragem aleatria simples, neste caso, necessita de uma listagem de todas as casas, ela se torna invivel. A amostragem estratificada tambm invivel, pois necessitaria da listagem dos domiclios. A melhor escolha a amostragem por conglomerado que pode ser realizada do seguinte modo:

Sistema de referncia (conglomerado): os quarteires da cidade.

Extrai-se a amostra de conglomerados (quarteires)

Pesquisa-se a existncia de aquecedor solar em todos os domiclios dos conglomerados (quarteires) sorteados.

4 ESTATSTICA DESCRITIVA E ANLISE EXPLORATRIA DE DADOS4.1 -Tratamento estatstico de variveis quantitativas

A fim de descrever uma amostra (ou uma populao), conveniente o clculo de algumas medidas que a caracterizam. Estas medidas quando bem interpretadas fornecem informaes valiosas sobre o conjunto de dados.

A rigor, tais medidas so calculadas com o objetivo de produzir uma sntese numrica que represente o conjunto de dados. Por exemplo, quando dizemos que a nota mdia de uma turma, em uma prova, foi 70 pontos; esta mdia, se consistente, equivale ao valor que sintetiza satisfatoriamente a nota da turma como um todo.

Essas medidas se classificam em dois grandes grupos: as medidas de tendncia central (mdia, mediana e moda) e as medidas de disperso ou variabilidade (varincia, desvio padro, coeficiente de variao). Alm destas, h o escore padronizado que uma medida que tenta captar a posio relativa de um indivduo dentro de um grupo.Cada uma dessas medidas ser discutida aqui com mais detalhes.

4.2 Medidas de tendncia central

4.2.1 Mdia aritmtica simples ()

Para calcular a mdia aritmtica simples () l-se: xis barra de um conjunto de dados, basta somar todos os valores e dividir pela quantidade deles, assim:

Exemplo: amostra de pesos (kg) de 7 alunos de uma turma.

Pesos:

90948070927072

kg

4.2.2 Mediana (Md)

A mediana o valor que ocupa a posio central da amostra. Para calcular a mediana, os dados devem estar ordenados (geralmente do menor para o maior valor). Para realizar o clculo da mediana, necessrio verificar se o tamanho da amostra (n) par ou mpar.

1 caso: n mparNeste caso, a mediana o valor que ocupa exatamente a posio central. Em linguagem matemtica, este valor pode ser designado por . Ou seja, a medida do indivduo que ocupa a posio . Para o exemplo anterior, como n = 7, tem-se:

Pesos:

70707280909294(Observe que os dados esto ordenados) n = 7Termo central: Portanto, o valor da mediana a medida do indivduo que est exatamente na quarta posio. Assim, a mediana : Md = 80 kg.

Interpretao da mediana

Como a mediana ocupa a posio central, podemos no presente exemplo dizer que 50% dos alunos tiveram pesos menores ou iguais a 80 kg e os outros 50% pesos maiores ou iguais a 80 kg.

2 caso: n parNeste caso, preciso identificar os dois termos centrais e calcular a mdia entre eles. O valor obtido considerado a mediana. Matematicamente, as ordens (posies) dos dois termos centrais so dadas por: o primeiro e o segundo por . Exemplo: amostra de pesos em kg de 6 alunos de uma turma.

Pesos:

707280909294(Observe que os dados esto ordenados)n = 6

Primeiro termo central: que equivale ao valor 80

Segundo termo central: que equivale ao valor 90

Portando: Md = Md = 85 kg4.2.3 Moda (Mo)

A moda o valor que ocorre com maior freqncia no conjunto de dados. Retomando o exemplo da amostra dos pesos de 7 alunos, tem-se:

Pesos:

70707280909294

Como o peso que mais se repete 70, pode-se dizer que: Mo = 70 kgCaso existissem dois valores distintos com maior freqncia (por exemplo: 70, 70 e 90, 90), dir-se-ia que a srie bimodal com modas 70 e 90.

Quando cada valor da amostra ocorre com a mesma freqncia, dizemos que no h moda (a srie amodal).

Breve comentrio sobre as medidas de tendncia central

Tabela resumo sobre as medidas de tendncia central do exemplo

Pesos:

90948070927072

Medidas de tendncia central da amostra do exemplo

MedidaValor

Mdia ()81 kg

Mediana (Md)80 kg

Moda (Mo)70 kg

A questo que se coloca aqui a seguinte: qual das trs medidas de tendncia central deve ser utilizada para sintetizar o conjunto de dados?

A medida mais utilizada a mdia aritmtica simples, principalmente porque o seu clculo envolve todos os valores do conjunto de dados; enquanto a mediana envolve um, no mximo dois, valores da amostra. Assim, se no houver nenhuma assimetria acentuada nos dados, utiliza-se a mdia. Quando a assimetria muito forte, significa dizer que h alguns poucos indivduos na amostra cujos valores so muito altos (ou muito baixos) e a mdia tende a ficar superestimada (ou subestimada) e, portanto, no sintetizando ou representando bem a amostra. Neste caso, recomendvel utilizar a mediana. J a moda uma medida que capta um valor tpico dos dados.

No exemplo em questo, h uma ligeira assimetria nos dados, pois, a moda menor que a mediana que, por sua vez, menor que a mdia. Entretanto, como mdia e mediana so relativamente prximas (81 e 80, respectivamente), a princpio, pode-se optar por sintetizar a amostra de pesos dos alunos com a mdia aritmtica simples.

O tpico seguinte (medidas de disperso) avalia melhor a representatividade da mdia.

4.3 Medidas de disperso ou variabilidade

As medidas de disperso ou variabilidade servem para avaliar a concentrao dos valores da amostra em torno da mdia. Neste sentido, elas auxiliam no estudo sobre a representatividade da mdia aritmtica simples em um conjunto de dados, na medida em que quanto menor for a disperso aqui entendida como o afastamento das medidas dos indivduos tomando como referncia a mdia , maior a representatividade desta. Em outras palavras: se a medida de variabilidade for pequena, ento realmente a maioria dos valores da amostra se concentra em torno da mdia, fazendo com que esta represente ou sintetize bem o conjunto de dados.

4.3.1 - varincia amostral (s2)

uma mdia das distncias calculada a partir dos quadrados dos desvios em relao mdia aritmtica simples. Ou seja, calculamos a diferena entre cada indivduo da amostra e a mdia aritmtica simples e elevamos ao quadrado. Em seguida, somamos todos os valores obtidos e dividimos pelo tamanho da amostra menos uma unidade. A frmula matemtica da varincia :

A rigor, o denominador desta expresso deveria ser n. Entretanto, por razes relacionadas inferncia estatstica, pode-se mostrar que conveniente dividir a soma dos quadrados das diferenas por n 1.

Retomando o exemplo da amostra dos pesos de 7 alunos, e lembrando que a varincia :

Pesos:

90948070927072

kg24.3.2 Desvio padro amostral (s)

a raiz quadrada da varincia. O desvio padro possui a mesma unidade de medida dos dados e a medida que, efetivamente, utilizada como sntese da disperso ou variabilidade. ela que mede a concentrao dos valores dos indivduos da amostra em relao mdia aritmtica simples. Em outros termos, pode-se dizer que quanto menor for o desvio padro, mais representativa a mdia aritmtica simples; pois, neste caso, a baixa disperso indica que a maioria das medidas dos indivduos da amostra esto razoavelmente prximas da mdia e, portanto, esta representa bem o conjunto de dados. A frmula do desvio padro :

Para o exemplo anterior, como a expresso sob o radical j foi calculada, o desvio padro :

kg

Concluso: a amostra revelou uma mdia foi de 81 kg com um desvio padro de 10,8 kg.

4.3.3 Coeficiente de variao (CV)

Coeficiente de variao (CV): ... conveniente exprimir a variabilidade em termos relativos, isto porque, por exemplo, um desvio padro de 10 pode ser insignificante se a observao tpica 10.000, mas altamente significativo para uma observao tpica 100. Toma-se ento uma medida relativa da variabilidade, comparando o desvio padro com a mdia. Esta medida o coeficiente de variao. J vimos que o desvio padro tem a mesma unidade de medida que os dados, de modo que o coeficiente de variao adimensional. A grande utilidade do coeficiente de variao permitir a comparao das variabilidades de diferentes conjuntos de dados. (SOARES, 1991).

O coeficiente de variao dado por: . Esta expresso pode ser multiplicada por 100 de modo que o CV possa ser expresso em percentagem.

Exemplo 1: As turmas A e B do 1 perodo de Engenharia Civil apresentaram as estatsticas abaixo em uma prova de Clculo I (dados na tabela abaixo). Qual das duas turmas se mostrou mais homognea na prova?

Estatsticas das notas de uma prova de clculo I

TurmasEstatsticas

A788?

B9215?

Chamando de CVA e CVB os coeficientes de variao das turmas A e B, tem-se:

.

Estes valores, se multiplicados por 100, correspondem a 10% e 16%.

Concluso: como o coeficiente de variao da turma A menor que o da turma B, conclui-se que os alunos da turma A mostraram notas mais homogneas. Assim, embora a turma B possua uma mdia maior, as notas dos alunos so mais heterogneas. Isto pode ter ocorrido, por exemplo, devido a presena de algumas notas altas que tendem a aumentar a mdia.

Comentrio: o valor do coeficiente de variao, em termos de identificar alta ou baixa homogeneidade, vai depender muito das caractersticas do estudo que est sendo desenvolvido. Entretanto, na maioria dos casos, pode-se avaliar a disperso do seguinte modo:

: Baixa disperso

: Disperso moderada

: Disperso alta

: Disperso muito alta

4.4 Estudo do escore padronizado (Zi)

No contexto de um nico conjunto de dados, o desvio padro pode ser interpretado intuitivamente como unidade natural de disperso dos dados. Essa interpretao utilizada na construo de escores padronizados, de larga aplicao em medidas educacionais. O problema o seguinte: em uma escala de 0 a 10, a nota 6 em uma prova em que a nota mxima foi 6 muito mais do que a mesma nota 6 em uma prova em que a nota mxima foi 9. Uma forma de captar essa diferena considerar a nota do aluno como a sua posio relativa no grupo. (SOARES, 1991)

Deste modo, enquanto o coeficiente de variao compara grupos, o escore padronizado capta a posio da medida de um indivduo dentro do grupo. O escore padronizado dado por:

. Onde a medida do i-esimo indivduo.

Retomando o exemplo das notas da prova de Clculo I das turmas A e B do 1 perodo de Engenharia Civil, suponha que o Joo aluno da turma A e tirou 85 pontos na prova; j a Maria aluna da turma B e tirou 90 pontos no teste. A questo : em termos relativos, qual dos dois alunos, Joo ou Maria, obteve melhor desempenho?

Estatsticas das notas de um teste de lngua portuguesa

TurmasEstatsticas

A788

B9215

Chamando de ZJ o escore do Joo e ZM o escore da Maria, tem-se:

Concluso: embora Maria tenha uma nota superior do Joo, em termos relativos a pontuao obtida por Joo melhor do que a de Maria, pois (0,875 > 0,133).

5 ESTATSTICA DESCRITIVA, ANLISE EXPLORATRIA DE DADOS (CONTINUAO)5.1 Distribuio de freqncia (variveis quantitativas)As distribuies de freqncias so tabelas que descrevem os dados estatsticos a fim de facilitar sua compreenso. Hoje em dia, com a expanso dos softwares, essas tabelas so obtidas com muita facilidade e, portanto, no so construdas manualmente. 5.1.1 Distribuio de freqncia sem intervalos de classeNotao:i: so as classesxi: valores assumidos pela varivel

fi: freqncia simples ou absoluta

fri: freqncia relativa simples

Fi: freqncia acumulada

n: equivale ao fiExemplo: amostra das idades (em anos) de uma amostra de alunos.TABELA 1

Distribuio de freqncia das idades em anos de uma amostra de alunos

ixififriFi

11980,1218

220120,18220

322170,25837

425130,19750

527120,18262

63040,06066

661,000

5.1.2 Distribuio de freqncia com intervalos de classe

Alm da notao anterior, usa-se o smbolo |( para designar o intervalo fechado esquerda e aberto direita. Alm disso, o xi o ponto mdio da classe.Para determinar o nmero de classes, i, e a amplitude do intervalo no h um critrio fixo. Entretanto, comum, para determinar o nmero de classes, usar-se a frmula: i = 1 + 3,3(logn). E para determinar a amplitude do intervalo, h, pode se utilizar: , onde AA a amplitude amostral e corresponde diferena entre o maior e o menor valor do rol (o rol so os dados ordenados).Exemplo: Rol das estaturas (em cm) de 40 alunos do colgio A. (Retirado do livro Estatstica Fcil)

150154155157160161162164166169

151155156158160161162164167170

152155156158160161163164168172

153155156160160161163165168173

Determinao do nmero de classes e da amplitude do intervalo:Classes: i = 1 + 3,3(logn) = 1 + 3,3log40 = 1 + 3,3(log40) = 1 + 3,3(1,602059991) = 6,286797971 = 6Amplitude amostral: AA = 173 150 = 23

Amplitude do intervalo:

A tabela de distribuio de freqncia ser:TABELA 2

Distribuio de freqncia das estaturas (em cm) de uma amostra de 40 alunos

iIntervaloxififriFi

1150 |( 15415240,1004

2154 |( 15815690,22513

3158 |( 162160110,27524

4162 |( 16616480,20032

5166 |( 17016850,12537

6170 |( 17417230,07540

401,000

6 Estudo dos percentis (Pk)Os percentis dividem o rol em 100 partes iguais. Os percentis so medidas de posio.

|__________|__________|____________________|____________________|__________|____________|Min P1 P2 P50 P98 P99 Max Para calcular um percentil qualquer, devemos encontrar a odem do percentil do seguinte modo:

Exemplo - Altura (cm) de uma amostra de 40 estudantes.150,2 154,2 155,9 157,4 160,2 161,0 162,1 164,2 166,8 169,5151,3 154,6 156,1 158,5 160,5 161,2 162,9 164,4 167,9 170,7152,4 155,3 156,5 158,9 160,7 161,5 163,3 164,9 168,1 172,4153,5 155,7 156,8 160,1 160,9 161,9 163,8 165,0 168,8 173,5Calcular:a) P10b) P25c) P67 d) P97

Resoluo

a) termo. Portanto: P10 = 153,5

b) termo. Portanto: P25 = 156,1

c) . Portanto, o P67 ser a mdia entre o 26 e 27 termos. Logo;

d) . Portanto, o P97 ser a mdia entre o 38 e 39 termos. Logo;

6.1 Percentis especiais: Quartis (Qk)Os quartis dividem a srie estatstica em 4 partes iguais. So eles: primeiro quartil (Q1), segundo quartil (Q2) e terceiro quartil (Q3). O primeiro quartil corresponde ao percentil 25; o segundo quartil o percentil 50 (que coincide com a mediana) e o terceiro quartil o percentil 75.

|__________|__________|__________|__________|Min Q1 Q2 Q3 MaxPara o exemplo Q1 = 156,1 (que corresponde ao P25) e Q3 = 164,4 (que equivale ao P75 confira!). 7 Mdia pondera

A media pondera utilizada quando se atribuem pesos distintos para os valores da varivel. dada por:

Onde xi so os valores da varivel e pi so os pesos. A mdia aritmtica simples uma mdia ponderada onde os pesos so iguais.EXERCCIOS LISTA 01

1) Para cada uma das descries abaixo, indique o seu significado escolhendo um dos seguintes conceitos: populao, um parmetro, censo, variveis quantitativas, variveis qualitativas, variveis discretas, experimento, uma estatstica, estudo observacional.a) Coleo completa de todos os elementos, com pelo menos uma caracterstica comum, a serem estudados.

b) Consistem em nmeros que representam contagens ou medidas.

c) Medida numrica que descreve uma caracterstica numrica de uma populao.

d) Resultam de um conjunto finito de valores possveis, ou de um conjunto enumervel desses valores.

e) Coleo de dados relativos a todos os elementos de uma populao.

f) Medida que descreve uma caracterstica numrica de uma amostra.

g) Dados que podem ser separados em diferentes categorias que se distinguem por alguma caracterstica no numrica.

h) Situao em que verificamos e medimos caractersticas especficas, mas no modificamos os elementos a serem estudados.i) Situao em que modificamos as caractersticas de elementos a fim de verificar o efeito desta modificao.2) D um exemplo para cada um dos seguintes nveis de mensurao de variveis: nominal, ordinal e razo.3) Nos itens a, b, c, d abaixo, indique se a descrio dada corresponde a um estudo observacional ou a um experimento.a) Uma pesquisa tenta captar a opinio da populao sobre sua preferncia em morar em casa ou apartamento. _______________________________________b) Em uma turma de educao fsica, estuda-se o efeito dos exerccios fsicos sobre a presso sangunea, determinando-se que metade dos estudantes ande mil metros cada dia, enquanto a outra metade corra mil metros diariamente. ______________________________________________________________c) Em determinada cidade, faz-se um levantamento do nmero de pessoas contaminadas com o vrus HIV, de acordo com o sexo. ___________________________________________________________d) A fim de aumentar a produtividade de tomate de sua plantao, um produtor faz um rgido controle sobre a irrigao (quantidade de gua diria) e a luminosidade (incidncia de raios solares) nos tomateiros de sua produo. ___________________________________________________________4) Deve-se extrair uma amostra de tamanho n=600 de uma populao de tamanho N=5.000, que consiste de quatro estratos com as seguintes quantidades de elementos: N1=3.000, N2=1.000, N3=800 e N4=200. Se a alocao deve ser proporcional, qual o tamanho da amostra em cada estrato?5) Retire uma amostra de tamanho n=10 de uma populao ordenada composta de 200 elementos, utilizando o processo de amostragem sistemtica. Explique todo o procedimento adotado.6) Explique o que amostragem por conglomerados e exemplifique.7) Construir uma tabela de distribuio de freqncia com intervalos de classe para os dados abaixo que representam uma amostra de pesos (kg) do curso de Engenharia (veja exemplo da tabela 2 acima). Utilizar as frmulas vistas no contedo para definir o nmero de classes (i) e a amplitude do intervalo (h).42,143,745,146,247,147,849,350,250,451,3

52,152,753,053,854,054,755,855,956,756,9

57,158,359,760,160,160,161,062,162,963,0

63,763,965,866,967,067,968,070,272,174,5

75,075,275,876,078,279,380,282,784,190,1

8) Nos itens de a at f abaixo, calcule a mdia, a mediana, a moda, o desvio-padro e o coeficiente de variao.a) Medidas do dimetro (em mm) interno de anis forjados de pisto de um motor de automvel. Os dados so: 1; 3; 15; 0; 5; 2; 5 e 4.

b) Tempo de esgotamento de um fluido isolante entre eletrodos a 34 kV. Os tempos em minutos so: 0,19; 0,78; 0,96; 1,31; 2,78; 3,16; 4,15; 4,67; 4,85; 6,50; 7,35; 8,01; 8,27; 12,06; 31,75; 32,52; 33,91; 36,71 e 72,89.c) Medida da espessura de xido em pastilhas que so estudas para verificar a qualidade em um processo de fabricao de semicondutores. Os dados, em angstroms, so: 1264; 1280; 1301; 1300; 1292; 1307 e 1275.d) Experimento para testar a resistncia resultante em tubos circulares com calotas soldadas nas extremidades. Os resultados em kN so: 96; 96; 102; 102; 102; 104; 104; 108; 126; 126; 128; 128; 140; 156; 160; 160; 164 e 170.e) Dados sobre acomodao visual (uma funo do movimento do olho), quando reconhecendo um padro de mancha em um vdeo CRT de alta resoluo. Os dados so: 36,45; 67,90; 38,77; 42,18; 26,72; 50,77; 39,30 e 49,71.

f) Dados referentes a medidas de intensidade solar direta (watts/m2), em dias diferentes, no sul da Espanha: 562; 869; 708; 775; 704; 809; 856; 655; 806; 878; 909; 918; 558; 768; 870; 918; 940; 946; 661; 820; 898; 935; 952; 957; 693; 835; 905; 939; 955; 960; 498; 653; 730 e 753. 9) Abaixo se encontra uma amostra dos pesos (kg) de uma turma de matemtica, ao final do 2 semestre de 2006 e ao final do 1 semestre de 2007.Nmero do aluno01020304050607080910

Peso ao final do 2 semestre/200666706871696770697170

Peso ao final do 1 semestre/200764666863666762646368

Escore padronizado do 2 semestre

Escore padronizado do 1 semestre

a) Calcule os coeficientes de variao e diga em qual momento os pesos so mais homogneos.

b) Complete a tabela com os escores padronizados de todos os alunos, nos dois momentos.

c) A partir dos escores padronizados, em que momento os alunos de nmeros 01 e 08 apresentam maior excesso relativo de peso?10) Mostrar que se todos os valores de um conjunto de dados forem aumentados de b, a mdia e a mediana tambm ficaro aumentadas de b. E o desvio padro tambm ficar aumentado de b?

11) A contagem de bactrias numa cultura aumentou de 2.500 para 9.200 em trs dias. Qual o acrscimo percentual dirio mdio?12) Tibrcio prestou recentemente um concurso e obteve as notas nas disciplinas listadas na tabela abaixo.

DisciplinasNota do TibrcioPeso

Portugus723,6

Matemtica911,1

Tcnicas Bancrias852,1

Informtica702,5

Ingls841,8

Contabilidade921,6

a) Calcule a mdia aritmtica simples do Tibrcio.

b) Calcule a mdia ponderada do Tibrcio.

c) Considerando que a nota mnima para ser aprovado 82 pontos, e que o concurso utiliza a mdia ponderada para efeito de classificao, o Tibrcio foi aprovado?

13) Os dados abaixo mostram a resistncia compresso de 80 corpos de prova da liga alumnio-ltio, medidas em psi (medida de presso ou libra por polegada quadrada).76123145154

87131146156

97133148157

101133149157

105134149158

110135150159

115135150160

118141151161

120142153163

121143154164

Calcule:

a) P20, P44, P67, P80 e P91b) Q1 e Q3c) Mdiad) Desvio-padro

e) Coeficiente de variao

f) Moda

g) Mediana

PAGE 2

_1247350148.unknown

_1262506796.unknown

_1262553549.unknown

_1262695286.unknown

_1262972624.unknown

_1280830860.unknown

_1262972646.unknown

_1262695703.unknown

_1262781370.unknown

_1262781439.unknown

_1262695391.unknown

_1262693508.unknown

_1262695140.unknown

_1262553586.unknown

_1262507845.unknown

_1262553432.unknown

_1262553461.unknown

_1262517716.unknown

_1262551915.unknown

_1262517687.unknown

_1262506911.unknown

_1262507726.unknown

_1262506861.unknown

_1247378069.unknown

_1247380381.unknown

_1255105109.unknown

_1262506259.unknown

_1262506733.unknown

_1262506156.unknown

_1255105161.unknown

_1247380870.unknown

_1247381012.unknown

_1247380437.unknown

_1247378855.unknown

_1247378918.unknown

_1247378041.unknown

_1247378062.unknown

_1247377718.unknown

_1247351919.unknown

_1247344837.unknown

_1247346332.unknown

_1247349812.unknown

_1247350071.unknown

_1247349784.unknown

_1247345171.unknown

_1247345360.unknown

_1247345102.unknown

_1247343384.unknown

_1247344315.unknown

_1247344793.unknown

_1247343925.unknown

_1247342085.unknown

_1247342880.unknown

_1247341933.unknown