Upload
nastaciabr
View
224
Download
1
Embed Size (px)
Citation preview
ESTATSTICA APOSTILA 1CURSO DE ENGENHARIA DE PRODUOProf. Jorge Santana
Montes Claros
Julho/20101 OS MTODOS ESTATSTICOS: finalidade e aplicaes; conceitos bsicos de Estatstica.1.1 - O que Estatstica?
Todas as cincias tm suas razes na histria do homem.
A Matemtica, que considerada a cincia que une clareza do raciocnio a sntese da linguagem, originou-se do convvio social, das trocas, da contagem, com carter prtico, utilitrio, emprico.
A Estatstica, ramo da Matemtica Aplicada, teve origem semelhante.
Desde a antiguidade, vrios povos j registravam o nmero de habitantes, de nascimentos, de bitos, faziam estimativas das riquezas individual e social, distribuam equitativamente terras ao povo, cobravam impostos e realizavam inquritos quantitativos por processos que, hoje, chamaramos de estatsticas.
Na Idade Mdia colhiam-se informaes, geralmente com finalidades tributrias ou blicas.
A partir do sculo XVI comearam a surgir as primeiras anlises sistemticas de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tbuas e tabelas e os primeiros nmeros relativos.
No sculo XVIII o estudo de tais fatos foi adquirindo, aos poucos, feio verdadeiramente cientfica. Godofredo Achenwal batizou a nova cincia (ou mtodo) com o nome de Estatstica, determinando o seu objetivo e suas relaes com as cincias.
As tabelas tornaram-se mais completas, surgiram as representaes grficas e o clculo das probabilidades, e a Estatstica deixou de ser simples catalogao de dados numricos coletivos para se tornar o estudo de como chegar a concluses sobre o todo (populao), partindo da observao de partes desse todo (amostras).
Atualmente, o pblico leigo (leitor de jornais e revistas) posiciona-se em dois extremos divergentes e igualmente errneos quanto validade das concluses estatsticas: ou cr em sua infalibilidade ou afirma que elas nada provam. Os que assim pensam ignoram os objetivos, o campo e o rigor do mtodo estatstico; ignoram a Estatstica, quer terica quer prtica, ou a conhecem muito superficialmente.
Na era da energia nuclear, os estudos estatsticos tm avanado rapidamente e, com seus processos e tcnicas, tm contribudo para a organizao dos negcios e recursos do mundo moderno.
(...) Exprimindo por meio de nmeros as observaes que se fazem de elementos com pelo menos uma caracterstica comum (por exemplo: os alunos do sexo masculino de uma comunidade), obtemos os chamados dados referentes a esses elementos.
Podemos dizer, ento, que:
A Estatstica uma parte da Matemtica Aplicada que fornece mtodos para coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises.
A coleta, a organizao e a descrio dos dados esto a cargo da Estatstica Descritiva, enquanto a anlise e a interpretao desses dados ficam a cargo da Estatstica Indutiva ou Inferencial.
Em geral, as pessoas quando se referem ao termo estatstica, o fazem no sentido da organizao e descrio dos dados (estatstica do Ministrio da Educao, estatstica dos acidentes de trfego, etc.), desconhecendo que o aspecto essencial da Estatstica o de proporcionar mtodos inferenciais que permitam concluses que transcendam os dados obtidos inicialmente.
Assim, a anlise e a interpretao dos dados estatsticos tornam possvel o diagnstico de uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condies de funcionamento, produtividade), a formulao de solues apropriadas e um planejamento objetivo da ao. (CRESPO, 1997).
1.2 Conceitos bsicos de Estatstica
1.2.1 Populao
uma coleo completa de todos os elementos (valores, pessoas, medidas, etc.) a serem estudados.
1.2.2 Censo
uma coleo de dados relativos a todos os elementos da populao.
1.2.3 Amostra
um subconjunto da populao.
1.2.4 Um parmetro
uma medida numrica que descreve uma caracterstica da populao.
1.2.5 Uma estatstica
uma medida numrica que descreve uma caracterstica de uma amostra.
1.2.6 Estudo observacional
Tipo de estudo em que se verificam e se medem caractersticas especficas, mas no se manipulam nem se modificam os elementos a serem estudados.
1.2.7 Experimento
Tipo de estudo em que se aplica determinado tratamento e observa-se seu efeito sobre os elementos a serem pesquisados.
2 VARIVEIS: qualitativa (ou categrica) e quantitativa; nveis de mensurao de variveis.
2.1 Varivel qualitativa (ou categrica)
expressa por atributos e pode ser separada em diferentes categorias, como por exemplo: sexo (masculino, feminino); cor da pele (branca, preta, amarela, parda); religio (catlica, evanglica, esprita...); etc.
2.2 Varivel quantitativa
expressa por nmeros que representam contagens ou medidas, como por exemplo: salrios, altura, peso, idade, etc.
2.2.1 Varivel quantitativa discreta
Resulta de um conjunto finito de valores possveis, ou de um conjunto enumervel desses valores. (Ou seja, o nmero de valores possveis 0, ou 1, ou 2, etc.)
2.2.2 Varivel quantitativa contnua
Resulta de um nmero infinito de valores possveis que podem ser associados a pontos em uma escala contnua de tal maneira que no haja lacunas ou interrupes.
Exemplos: o nmero de operrios de uma grande construo uma varivel quantitativa discreta porque representa uma contagem; j o peso desses operrios uma varivel quantitativa contnua porque representa mensuraes que podem tomar qualquer valor em um intervalo contnuo.
2.3 Nveis de mensurao de variveis
uma forma adicional de se classificarem os dados. H quatro nveis de mensurao de variveis: nominal, ordinal, intervalar e razo.
2.3.1 Nvel nominal
Caracterizado por dados que consistem apenas de nomes, rtulos ou categorias. Os dados no podem ser dispostos segundo um esquema ordenado (como de baixo para cima).
Exemplos:
Respostas do tipo sim, no ou indeciso.
O sexo dos estudantes em uma turma de matemtica.
2.3.2 Nvel ordinal
Envolve dados que podem ser dispostos em alguma ordem, mas as diferenas entre os valores desses dados no podem ser determinadas, ou no tem sentido.
Exemplos:
Um editor classifica alguns originais como excelentes, alguns como bons e alguns como maus. (No podemos determinar uma diferena quantitativa entre bom e mau, por exemplo).
Nas olimpadas de matemtica, Joo foi classificado em 3; Carlos em 7 e Joana em 10 lugar. (Podemos determinar a diferena entre os 3 e 7 lugares, mas a diferena de 4 no tem qualquer significado).
2.3.3 Nvel intervalar
anlogo ao nvel ordinal, com a propriedade adicional de que podemos determinar diferenas significativas entre os dados. Todavia, no existe um ponto de partida zero inerente, ou natural (onde no haja qualquer quantidade presente). As temperaturas 98,2F e 98,6F so exemplos de dados nesse nvel intervalar de mensurao. Os valores se apresentam ordenados, e podemos determinar diferenas entre eles (em geral chamadas distancias entre os dois valores). Entretanto, no h ponto de partida natural. O valor 0F pode parecer um ponto de partida, mas inteiramente arbitrrio, e no representa ausncia de calor. um erro dizer que 50F duas vezes mais quente que 25F.
Exemplos:
Os anos 1000, 2000, 1776 e 1944. (O tempo no comeou no ano zero e, assim, o 0 arbitrrio, e no um ponto de partida zero natural).
As temperaturas anuais mdias (em graus Celsius) das capitais brasileiras.
2.3.4 Nvel razo
o nvel de intervalo modificado de modo a incluir o ponto de partida zero inerente (onde o zero significa nenhuma quantidade presente). Para valores nesse nvel, tantos as diferenas como as razes tm significado.
Exemplos:
Pesos dos artigos de material plstico descartado pelas residncias (0 kg indica que nenhum plstico foi descartado, e 10 kg representa duas vezes 5 kg).
Durao (em minutos) de filmes.
Distncias (em km) percorridas por carros em um teste de consumo de consumo de combustvel.
3 AMOSTRAGEMSo as tcnicas utilizadas para se extrair a amostra da populao. A amostragem pode ser probabilstica ou no probabilstica. Na amostragem probabilstica so realizados sorteios para alocao dos elementos da amostra, j na amostragem no probabilstica no se procede ao sorteio. O tamanho da populao , geralmente, designado por N e o tamanho da amostra por n.3.1 Amostragem probabilstica
Este tipo de amostragem garante o acaso na escolha. Assim, cada elemento da populao tem a mesma chance ser selecionado. Isto garante a representatividade da amostra e a validade das inferncias que sero feitas a partir dela. Sero discutidos aqui, sucintamente, quatro tipos de amostragem probabilstica.
3.1.1 Amostragem casual ou aleatria simples
Equivale a um sorteio dos indivduos que faro parte da amostra
Procedimento:
Enumera-se a populao de 1 a N
Sorteiam-se os indivduos.
Antigamente, os sorteios eram feitos por meio de tabelas de nmeros aleatrios. Hoje em dia, utiliza-se uma calculadora cientfica ou, o que mais comum, um software estatstico.
Exemplo
Uma populao composta de 200 indivduos. Retire uma amostra de tamanho 10, utilizando sua calculadora cientfica.
Amostra: ____ ____ ____ ____ ____ ____ ____ ____ ____ ____
3.1.2 Amostragem casual estratificada proporcional
Utilizada quando a populao se subdivide em estratos (subpopulaes).
Procedimento:
Calcula-se a frao de amostragem dada por:
Calcula-se o tamanho da amostra em cada estrato, fazendo-se:
Sorteiam-se os indivduos em cada estrato.
Exemplo
Uma populao composta por 7820 indivduos distribudos em trs estratos que apresentam as seguintes quantidades de elementos: N1 = 3270; N2 = 2680 e N3 = 1870. Se se deve retirar uma amostra de tamanho n = 1564, qual deve ser a quantidade de indivduos a ser sorteada em cada estrato?
Sorteiam-se, em cada estrato, as quantidades de indivduos calculadas acima.
3.1.3 Amostragem sistemtica
Utilizada preferencialmente quando a populao j se encontra ordenada, como por exemplo: as casas de uma rua, pronturios mdicos, nmero de registros de matrcula, etc.
Procedimento:
Calcula-se o fator de sistematizao ou intervalo de seleo, dado por:
Sorteia-se um indivduo no intervalo [1 ; F], que ser o primeiro elemento da amostra.
Os demais elementos so obtidos somando-se sucessivamente o valor do intervalo de seleo
Exemplo
Retirar uma amostra de tamanho n = 10 de uma populao ordenada composta de 80 elementos.
1 elemento = n. aleatrio multiplicado por 8.
Amostra: ____ ____ ____ ____ ____ ____ ____ ____ ____ ____
3.1.4 Amostragem por conglomerado em 1 estgio
semelhante amostragem aleatria simples, porm, cada unidade de amostragem equivale a um grupo ou conglomerado de elementos. Este tipo de amostragem utilizado quando se encontram dificuldades para obter uma lista dos indivduos da populao.
Procedimento:
Especifica-se o sistema de referncia (conglomerados)
Sorteiam-se alguns conglomerados
Pesquisam-se todos os indivduos dos conglomerados sorteados.
Exemplo
Estimar o nmero mdio de domiclios com aquecedor solar em uma grande cidade.
Como a amostragem aleatria simples, neste caso, necessita de uma listagem de todas as casas, ela se torna invivel. A amostragem estratificada tambm invivel, pois necessitaria da listagem dos domiclios. A melhor escolha a amostragem por conglomerado que pode ser realizada do seguinte modo:
Sistema de referncia (conglomerado): os quarteires da cidade.
Extrai-se a amostra de conglomerados (quarteires)
Pesquisa-se a existncia de aquecedor solar em todos os domiclios dos conglomerados (quarteires) sorteados.
4 ESTATSTICA DESCRITIVA E ANLISE EXPLORATRIA DE DADOS4.1 -Tratamento estatstico de variveis quantitativas
A fim de descrever uma amostra (ou uma populao), conveniente o clculo de algumas medidas que a caracterizam. Estas medidas quando bem interpretadas fornecem informaes valiosas sobre o conjunto de dados.
A rigor, tais medidas so calculadas com o objetivo de produzir uma sntese numrica que represente o conjunto de dados. Por exemplo, quando dizemos que a nota mdia de uma turma, em uma prova, foi 70 pontos; esta mdia, se consistente, equivale ao valor que sintetiza satisfatoriamente a nota da turma como um todo.
Essas medidas se classificam em dois grandes grupos: as medidas de tendncia central (mdia, mediana e moda) e as medidas de disperso ou variabilidade (varincia, desvio padro, coeficiente de variao). Alm destas, h o escore padronizado que uma medida que tenta captar a posio relativa de um indivduo dentro de um grupo.Cada uma dessas medidas ser discutida aqui com mais detalhes.
4.2 Medidas de tendncia central
4.2.1 Mdia aritmtica simples ()
Para calcular a mdia aritmtica simples () l-se: xis barra de um conjunto de dados, basta somar todos os valores e dividir pela quantidade deles, assim:
Exemplo: amostra de pesos (kg) de 7 alunos de uma turma.
Pesos:
90948070927072
kg
4.2.2 Mediana (Md)
A mediana o valor que ocupa a posio central da amostra. Para calcular a mediana, os dados devem estar ordenados (geralmente do menor para o maior valor). Para realizar o clculo da mediana, necessrio verificar se o tamanho da amostra (n) par ou mpar.
1 caso: n mparNeste caso, a mediana o valor que ocupa exatamente a posio central. Em linguagem matemtica, este valor pode ser designado por . Ou seja, a medida do indivduo que ocupa a posio . Para o exemplo anterior, como n = 7, tem-se:
Pesos:
70707280909294(Observe que os dados esto ordenados) n = 7Termo central: Portanto, o valor da mediana a medida do indivduo que est exatamente na quarta posio. Assim, a mediana : Md = 80 kg.
Interpretao da mediana
Como a mediana ocupa a posio central, podemos no presente exemplo dizer que 50% dos alunos tiveram pesos menores ou iguais a 80 kg e os outros 50% pesos maiores ou iguais a 80 kg.
2 caso: n parNeste caso, preciso identificar os dois termos centrais e calcular a mdia entre eles. O valor obtido considerado a mediana. Matematicamente, as ordens (posies) dos dois termos centrais so dadas por: o primeiro e o segundo por . Exemplo: amostra de pesos em kg de 6 alunos de uma turma.
Pesos:
707280909294(Observe que os dados esto ordenados)n = 6
Primeiro termo central: que equivale ao valor 80
Segundo termo central: que equivale ao valor 90
Portando: Md = Md = 85 kg4.2.3 Moda (Mo)
A moda o valor que ocorre com maior freqncia no conjunto de dados. Retomando o exemplo da amostra dos pesos de 7 alunos, tem-se:
Pesos:
70707280909294
Como o peso que mais se repete 70, pode-se dizer que: Mo = 70 kgCaso existissem dois valores distintos com maior freqncia (por exemplo: 70, 70 e 90, 90), dir-se-ia que a srie bimodal com modas 70 e 90.
Quando cada valor da amostra ocorre com a mesma freqncia, dizemos que no h moda (a srie amodal).
Breve comentrio sobre as medidas de tendncia central
Tabela resumo sobre as medidas de tendncia central do exemplo
Pesos:
90948070927072
Medidas de tendncia central da amostra do exemplo
MedidaValor
Mdia ()81 kg
Mediana (Md)80 kg
Moda (Mo)70 kg
A questo que se coloca aqui a seguinte: qual das trs medidas de tendncia central deve ser utilizada para sintetizar o conjunto de dados?
A medida mais utilizada a mdia aritmtica simples, principalmente porque o seu clculo envolve todos os valores do conjunto de dados; enquanto a mediana envolve um, no mximo dois, valores da amostra. Assim, se no houver nenhuma assimetria acentuada nos dados, utiliza-se a mdia. Quando a assimetria muito forte, significa dizer que h alguns poucos indivduos na amostra cujos valores so muito altos (ou muito baixos) e a mdia tende a ficar superestimada (ou subestimada) e, portanto, no sintetizando ou representando bem a amostra. Neste caso, recomendvel utilizar a mediana. J a moda uma medida que capta um valor tpico dos dados.
No exemplo em questo, h uma ligeira assimetria nos dados, pois, a moda menor que a mediana que, por sua vez, menor que a mdia. Entretanto, como mdia e mediana so relativamente prximas (81 e 80, respectivamente), a princpio, pode-se optar por sintetizar a amostra de pesos dos alunos com a mdia aritmtica simples.
O tpico seguinte (medidas de disperso) avalia melhor a representatividade da mdia.
4.3 Medidas de disperso ou variabilidade
As medidas de disperso ou variabilidade servem para avaliar a concentrao dos valores da amostra em torno da mdia. Neste sentido, elas auxiliam no estudo sobre a representatividade da mdia aritmtica simples em um conjunto de dados, na medida em que quanto menor for a disperso aqui entendida como o afastamento das medidas dos indivduos tomando como referncia a mdia , maior a representatividade desta. Em outras palavras: se a medida de variabilidade for pequena, ento realmente a maioria dos valores da amostra se concentra em torno da mdia, fazendo com que esta represente ou sintetize bem o conjunto de dados.
4.3.1 - varincia amostral (s2)
uma mdia das distncias calculada a partir dos quadrados dos desvios em relao mdia aritmtica simples. Ou seja, calculamos a diferena entre cada indivduo da amostra e a mdia aritmtica simples e elevamos ao quadrado. Em seguida, somamos todos os valores obtidos e dividimos pelo tamanho da amostra menos uma unidade. A frmula matemtica da varincia :
A rigor, o denominador desta expresso deveria ser n. Entretanto, por razes relacionadas inferncia estatstica, pode-se mostrar que conveniente dividir a soma dos quadrados das diferenas por n 1.
Retomando o exemplo da amostra dos pesos de 7 alunos, e lembrando que a varincia :
Pesos:
90948070927072
kg24.3.2 Desvio padro amostral (s)
a raiz quadrada da varincia. O desvio padro possui a mesma unidade de medida dos dados e a medida que, efetivamente, utilizada como sntese da disperso ou variabilidade. ela que mede a concentrao dos valores dos indivduos da amostra em relao mdia aritmtica simples. Em outros termos, pode-se dizer que quanto menor for o desvio padro, mais representativa a mdia aritmtica simples; pois, neste caso, a baixa disperso indica que a maioria das medidas dos indivduos da amostra esto razoavelmente prximas da mdia e, portanto, esta representa bem o conjunto de dados. A frmula do desvio padro :
Para o exemplo anterior, como a expresso sob o radical j foi calculada, o desvio padro :
kg
Concluso: a amostra revelou uma mdia foi de 81 kg com um desvio padro de 10,8 kg.
4.3.3 Coeficiente de variao (CV)
Coeficiente de variao (CV): ... conveniente exprimir a variabilidade em termos relativos, isto porque, por exemplo, um desvio padro de 10 pode ser insignificante se a observao tpica 10.000, mas altamente significativo para uma observao tpica 100. Toma-se ento uma medida relativa da variabilidade, comparando o desvio padro com a mdia. Esta medida o coeficiente de variao. J vimos que o desvio padro tem a mesma unidade de medida que os dados, de modo que o coeficiente de variao adimensional. A grande utilidade do coeficiente de variao permitir a comparao das variabilidades de diferentes conjuntos de dados. (SOARES, 1991).
O coeficiente de variao dado por: . Esta expresso pode ser multiplicada por 100 de modo que o CV possa ser expresso em percentagem.
Exemplo 1: As turmas A e B do 1 perodo de Engenharia Civil apresentaram as estatsticas abaixo em uma prova de Clculo I (dados na tabela abaixo). Qual das duas turmas se mostrou mais homognea na prova?
Estatsticas das notas de uma prova de clculo I
TurmasEstatsticas
A788?
B9215?
Chamando de CVA e CVB os coeficientes de variao das turmas A e B, tem-se:
.
Estes valores, se multiplicados por 100, correspondem a 10% e 16%.
Concluso: como o coeficiente de variao da turma A menor que o da turma B, conclui-se que os alunos da turma A mostraram notas mais homogneas. Assim, embora a turma B possua uma mdia maior, as notas dos alunos so mais heterogneas. Isto pode ter ocorrido, por exemplo, devido a presena de algumas notas altas que tendem a aumentar a mdia.
Comentrio: o valor do coeficiente de variao, em termos de identificar alta ou baixa homogeneidade, vai depender muito das caractersticas do estudo que est sendo desenvolvido. Entretanto, na maioria dos casos, pode-se avaliar a disperso do seguinte modo:
: Baixa disperso
: Disperso moderada
: Disperso alta
: Disperso muito alta
4.4 Estudo do escore padronizado (Zi)
No contexto de um nico conjunto de dados, o desvio padro pode ser interpretado intuitivamente como unidade natural de disperso dos dados. Essa interpretao utilizada na construo de escores padronizados, de larga aplicao em medidas educacionais. O problema o seguinte: em uma escala de 0 a 10, a nota 6 em uma prova em que a nota mxima foi 6 muito mais do que a mesma nota 6 em uma prova em que a nota mxima foi 9. Uma forma de captar essa diferena considerar a nota do aluno como a sua posio relativa no grupo. (SOARES, 1991)
Deste modo, enquanto o coeficiente de variao compara grupos, o escore padronizado capta a posio da medida de um indivduo dentro do grupo. O escore padronizado dado por:
. Onde a medida do i-esimo indivduo.
Retomando o exemplo das notas da prova de Clculo I das turmas A e B do 1 perodo de Engenharia Civil, suponha que o Joo aluno da turma A e tirou 85 pontos na prova; j a Maria aluna da turma B e tirou 90 pontos no teste. A questo : em termos relativos, qual dos dois alunos, Joo ou Maria, obteve melhor desempenho?
Estatsticas das notas de um teste de lngua portuguesa
TurmasEstatsticas
A788
B9215
Chamando de ZJ o escore do Joo e ZM o escore da Maria, tem-se:
Concluso: embora Maria tenha uma nota superior do Joo, em termos relativos a pontuao obtida por Joo melhor do que a de Maria, pois (0,875 > 0,133).
5 ESTATSTICA DESCRITIVA, ANLISE EXPLORATRIA DE DADOS (CONTINUAO)5.1 Distribuio de freqncia (variveis quantitativas)As distribuies de freqncias so tabelas que descrevem os dados estatsticos a fim de facilitar sua compreenso. Hoje em dia, com a expanso dos softwares, essas tabelas so obtidas com muita facilidade e, portanto, no so construdas manualmente. 5.1.1 Distribuio de freqncia sem intervalos de classeNotao:i: so as classesxi: valores assumidos pela varivel
fi: freqncia simples ou absoluta
fri: freqncia relativa simples
Fi: freqncia acumulada
n: equivale ao fiExemplo: amostra das idades (em anos) de uma amostra de alunos.TABELA 1
Distribuio de freqncia das idades em anos de uma amostra de alunos
ixififriFi
11980,1218
220120,18220
322170,25837
425130,19750
527120,18262
63040,06066
661,000
5.1.2 Distribuio de freqncia com intervalos de classe
Alm da notao anterior, usa-se o smbolo |( para designar o intervalo fechado esquerda e aberto direita. Alm disso, o xi o ponto mdio da classe.Para determinar o nmero de classes, i, e a amplitude do intervalo no h um critrio fixo. Entretanto, comum, para determinar o nmero de classes, usar-se a frmula: i = 1 + 3,3(logn). E para determinar a amplitude do intervalo, h, pode se utilizar: , onde AA a amplitude amostral e corresponde diferena entre o maior e o menor valor do rol (o rol so os dados ordenados).Exemplo: Rol das estaturas (em cm) de 40 alunos do colgio A. (Retirado do livro Estatstica Fcil)
150154155157160161162164166169
151155156158160161162164167170
152155156158160161163164168172
153155156160160161163165168173
Determinao do nmero de classes e da amplitude do intervalo:Classes: i = 1 + 3,3(logn) = 1 + 3,3log40 = 1 + 3,3(log40) = 1 + 3,3(1,602059991) = 6,286797971 = 6Amplitude amostral: AA = 173 150 = 23
Amplitude do intervalo:
A tabela de distribuio de freqncia ser:TABELA 2
Distribuio de freqncia das estaturas (em cm) de uma amostra de 40 alunos
iIntervaloxififriFi
1150 |( 15415240,1004
2154 |( 15815690,22513
3158 |( 162160110,27524
4162 |( 16616480,20032
5166 |( 17016850,12537
6170 |( 17417230,07540
401,000
6 Estudo dos percentis (Pk)Os percentis dividem o rol em 100 partes iguais. Os percentis so medidas de posio.
|__________|__________|____________________|____________________|__________|____________|Min P1 P2 P50 P98 P99 Max Para calcular um percentil qualquer, devemos encontrar a odem do percentil do seguinte modo:
Exemplo - Altura (cm) de uma amostra de 40 estudantes.150,2 154,2 155,9 157,4 160,2 161,0 162,1 164,2 166,8 169,5151,3 154,6 156,1 158,5 160,5 161,2 162,9 164,4 167,9 170,7152,4 155,3 156,5 158,9 160,7 161,5 163,3 164,9 168,1 172,4153,5 155,7 156,8 160,1 160,9 161,9 163,8 165,0 168,8 173,5Calcular:a) P10b) P25c) P67 d) P97
Resoluo
a) termo. Portanto: P10 = 153,5
b) termo. Portanto: P25 = 156,1
c) . Portanto, o P67 ser a mdia entre o 26 e 27 termos. Logo;
d) . Portanto, o P97 ser a mdia entre o 38 e 39 termos. Logo;
6.1 Percentis especiais: Quartis (Qk)Os quartis dividem a srie estatstica em 4 partes iguais. So eles: primeiro quartil (Q1), segundo quartil (Q2) e terceiro quartil (Q3). O primeiro quartil corresponde ao percentil 25; o segundo quartil o percentil 50 (que coincide com a mediana) e o terceiro quartil o percentil 75.
|__________|__________|__________|__________|Min Q1 Q2 Q3 MaxPara o exemplo Q1 = 156,1 (que corresponde ao P25) e Q3 = 164,4 (que equivale ao P75 confira!). 7 Mdia pondera
A media pondera utilizada quando se atribuem pesos distintos para os valores da varivel. dada por:
Onde xi so os valores da varivel e pi so os pesos. A mdia aritmtica simples uma mdia ponderada onde os pesos so iguais.EXERCCIOS LISTA 01
1) Para cada uma das descries abaixo, indique o seu significado escolhendo um dos seguintes conceitos: populao, um parmetro, censo, variveis quantitativas, variveis qualitativas, variveis discretas, experimento, uma estatstica, estudo observacional.a) Coleo completa de todos os elementos, com pelo menos uma caracterstica comum, a serem estudados.
b) Consistem em nmeros que representam contagens ou medidas.
c) Medida numrica que descreve uma caracterstica numrica de uma populao.
d) Resultam de um conjunto finito de valores possveis, ou de um conjunto enumervel desses valores.
e) Coleo de dados relativos a todos os elementos de uma populao.
f) Medida que descreve uma caracterstica numrica de uma amostra.
g) Dados que podem ser separados em diferentes categorias que se distinguem por alguma caracterstica no numrica.
h) Situao em que verificamos e medimos caractersticas especficas, mas no modificamos os elementos a serem estudados.i) Situao em que modificamos as caractersticas de elementos a fim de verificar o efeito desta modificao.2) D um exemplo para cada um dos seguintes nveis de mensurao de variveis: nominal, ordinal e razo.3) Nos itens a, b, c, d abaixo, indique se a descrio dada corresponde a um estudo observacional ou a um experimento.a) Uma pesquisa tenta captar a opinio da populao sobre sua preferncia em morar em casa ou apartamento. _______________________________________b) Em uma turma de educao fsica, estuda-se o efeito dos exerccios fsicos sobre a presso sangunea, determinando-se que metade dos estudantes ande mil metros cada dia, enquanto a outra metade corra mil metros diariamente. ______________________________________________________________c) Em determinada cidade, faz-se um levantamento do nmero de pessoas contaminadas com o vrus HIV, de acordo com o sexo. ___________________________________________________________d) A fim de aumentar a produtividade de tomate de sua plantao, um produtor faz um rgido controle sobre a irrigao (quantidade de gua diria) e a luminosidade (incidncia de raios solares) nos tomateiros de sua produo. ___________________________________________________________4) Deve-se extrair uma amostra de tamanho n=600 de uma populao de tamanho N=5.000, que consiste de quatro estratos com as seguintes quantidades de elementos: N1=3.000, N2=1.000, N3=800 e N4=200. Se a alocao deve ser proporcional, qual o tamanho da amostra em cada estrato?5) Retire uma amostra de tamanho n=10 de uma populao ordenada composta de 200 elementos, utilizando o processo de amostragem sistemtica. Explique todo o procedimento adotado.6) Explique o que amostragem por conglomerados e exemplifique.7) Construir uma tabela de distribuio de freqncia com intervalos de classe para os dados abaixo que representam uma amostra de pesos (kg) do curso de Engenharia (veja exemplo da tabela 2 acima). Utilizar as frmulas vistas no contedo para definir o nmero de classes (i) e a amplitude do intervalo (h).42,143,745,146,247,147,849,350,250,451,3
52,152,753,053,854,054,755,855,956,756,9
57,158,359,760,160,160,161,062,162,963,0
63,763,965,866,967,067,968,070,272,174,5
75,075,275,876,078,279,380,282,784,190,1
8) Nos itens de a at f abaixo, calcule a mdia, a mediana, a moda, o desvio-padro e o coeficiente de variao.a) Medidas do dimetro (em mm) interno de anis forjados de pisto de um motor de automvel. Os dados so: 1; 3; 15; 0; 5; 2; 5 e 4.
b) Tempo de esgotamento de um fluido isolante entre eletrodos a 34 kV. Os tempos em minutos so: 0,19; 0,78; 0,96; 1,31; 2,78; 3,16; 4,15; 4,67; 4,85; 6,50; 7,35; 8,01; 8,27; 12,06; 31,75; 32,52; 33,91; 36,71 e 72,89.c) Medida da espessura de xido em pastilhas que so estudas para verificar a qualidade em um processo de fabricao de semicondutores. Os dados, em angstroms, so: 1264; 1280; 1301; 1300; 1292; 1307 e 1275.d) Experimento para testar a resistncia resultante em tubos circulares com calotas soldadas nas extremidades. Os resultados em kN so: 96; 96; 102; 102; 102; 104; 104; 108; 126; 126; 128; 128; 140; 156; 160; 160; 164 e 170.e) Dados sobre acomodao visual (uma funo do movimento do olho), quando reconhecendo um padro de mancha em um vdeo CRT de alta resoluo. Os dados so: 36,45; 67,90; 38,77; 42,18; 26,72; 50,77; 39,30 e 49,71.
f) Dados referentes a medidas de intensidade solar direta (watts/m2), em dias diferentes, no sul da Espanha: 562; 869; 708; 775; 704; 809; 856; 655; 806; 878; 909; 918; 558; 768; 870; 918; 940; 946; 661; 820; 898; 935; 952; 957; 693; 835; 905; 939; 955; 960; 498; 653; 730 e 753. 9) Abaixo se encontra uma amostra dos pesos (kg) de uma turma de matemtica, ao final do 2 semestre de 2006 e ao final do 1 semestre de 2007.Nmero do aluno01020304050607080910
Peso ao final do 2 semestre/200666706871696770697170
Peso ao final do 1 semestre/200764666863666762646368
Escore padronizado do 2 semestre
Escore padronizado do 1 semestre
a) Calcule os coeficientes de variao e diga em qual momento os pesos so mais homogneos.
b) Complete a tabela com os escores padronizados de todos os alunos, nos dois momentos.
c) A partir dos escores padronizados, em que momento os alunos de nmeros 01 e 08 apresentam maior excesso relativo de peso?10) Mostrar que se todos os valores de um conjunto de dados forem aumentados de b, a mdia e a mediana tambm ficaro aumentadas de b. E o desvio padro tambm ficar aumentado de b?
11) A contagem de bactrias numa cultura aumentou de 2.500 para 9.200 em trs dias. Qual o acrscimo percentual dirio mdio?12) Tibrcio prestou recentemente um concurso e obteve as notas nas disciplinas listadas na tabela abaixo.
DisciplinasNota do TibrcioPeso
Portugus723,6
Matemtica911,1
Tcnicas Bancrias852,1
Informtica702,5
Ingls841,8
Contabilidade921,6
a) Calcule a mdia aritmtica simples do Tibrcio.
b) Calcule a mdia ponderada do Tibrcio.
c) Considerando que a nota mnima para ser aprovado 82 pontos, e que o concurso utiliza a mdia ponderada para efeito de classificao, o Tibrcio foi aprovado?
13) Os dados abaixo mostram a resistncia compresso de 80 corpos de prova da liga alumnio-ltio, medidas em psi (medida de presso ou libra por polegada quadrada).76123145154
87131146156
97133148157
101133149157
105134149158
110135150159
115135150160
118141151161
120142153163
121143154164
Calcule:
a) P20, P44, P67, P80 e P91b) Q1 e Q3c) Mdiad) Desvio-padro
e) Coeficiente de variao
f) Moda
g) Mediana
PAGE 2
_1247350148.unknown
_1262506796.unknown
_1262553549.unknown
_1262695286.unknown
_1262972624.unknown
_1280830860.unknown
_1262972646.unknown
_1262695703.unknown
_1262781370.unknown
_1262781439.unknown
_1262695391.unknown
_1262693508.unknown
_1262695140.unknown
_1262553586.unknown
_1262507845.unknown
_1262553432.unknown
_1262553461.unknown
_1262517716.unknown
_1262551915.unknown
_1262517687.unknown
_1262506911.unknown
_1262507726.unknown
_1262506861.unknown
_1247378069.unknown
_1247380381.unknown
_1255105109.unknown
_1262506259.unknown
_1262506733.unknown
_1262506156.unknown
_1255105161.unknown
_1247380870.unknown
_1247381012.unknown
_1247380437.unknown
_1247378855.unknown
_1247378918.unknown
_1247378041.unknown
_1247378062.unknown
_1247377718.unknown
_1247351919.unknown
_1247344837.unknown
_1247346332.unknown
_1247349812.unknown
_1247350071.unknown
_1247349784.unknown
_1247345171.unknown
_1247345360.unknown
_1247345102.unknown
_1247343384.unknown
_1247344315.unknown
_1247344793.unknown
_1247343925.unknown
_1247342085.unknown
_1247342880.unknown
_1247341933.unknown