EST0224 - Estatística na Educação [Prof. André Rocha]

Embed Size (px)

Citation preview

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CINCIAS EXATAS E DA TERRA DEPARTAMENTO DE ESTATSTICA Estatstica na Educao Prof. Msc. Andr Luiz Sena da Rocha [email protected] Natal / RN 2011.2 NDICE

UNIDADE I - ESTATSTICA E APRESENTAO DE DADOS........................ 1 1.1 - NATUREZA E CAMPO DA ESTATSTICA...................................................................... 1 1.2 - O MTODO ESTATSTICO................................................................................................ 4 1.3 PRODUZINDO DADOS ....................................................................................................... 5 1.3.1 - Populao.......................................................................................................................... 5 1.3.2 - Amostra ............................................................................................................................. 5 1.3.3 Amostragem (No Probabilstica X Probabilstica)......................................................... 6 1.3.4 Principais Tipos de Amostragem Aleatria...................................................................... 8 1.3.4.1 Amostragem Aleatria Simples (AAS).................................................................................................... 8 1.3.4.2 Amostragem Aleatria Estratificada (AAE).......................................................................................... 12 1.3.4.3 Amostragem Aleatria por Conglomerados (AAC) .............................................................................. 14 1.3.4.4 Amostragem Sistemtica (AS) .............................................................................................................. 16 1.3.5 - Tipos de Variveis ........................................................................................................... 19 1.4 - REPRESENTAO TABULAR........................................................................................ 21 1.4.1 - Sries Estatsticas............................................................................................................ 21 1.4.2 - Distribuio de Frequncias ........................................................................................... 25 1.5 - REPRESENTAO GRFICA......................................................................................... 30 1.5.1 - Grfico de Setores ........................................................................................................... 30 1.5.2 - Grfico de Colunas e Barras........................................................................................... 32 1.5.3 - Histograma e Polgono de Frequncias.......................................................................... 33 1.6 EXERCCIOS...................................................................................................................... 36 UNIDADE II - MEDIDAS DE TENDNCIA CENTRAL E DISPERSO........ 40 2.1 MEDIDAS DE TENDNCIA CENTRAL......................................................................... 40 2.1.1 - Mdia Aritmtica............................................................................................................. 40 2.1.2 - Mediana........................................................................................................................... 43 2.1.3 - Moda................................................................................................................................ 46 2.1.4 Separatrizes .................................................................................................................... 49 2.1.4.1 - Dados No-Agrupados .......................................................................................................................... 51 2.1.4.2 - Dados Agrupados .................................................................................................................................. 52 2.2 - MEDIDAS DE DISPERSO............................................................................................... 55 2.2.1 Varincia ........................................................................................................................ 56 2.2.2 - Desvio Padro................................................................................................................. 58 2.2.3 - Coeficiente de Variao .................................................................................................. 60 2.3 MEDIDAS DE ASSIMETRIA E CURTOSE .................................................................... 62 2.4 EXERCCIOS...................................................................................................................... 67 UNIDADE III - ANLISE EXPLORATRIA DE DADOS................................ 69 3.1 RAMO-E-FOHAS................................................................................................................ 69 3.2 - ESQUEMA DOS 5-NMEROS .......................................................................................... 71 3.3 - BOX-PLOT........................................................................................................................... 71 3.4 EXERCCIOS........................................................................................................................... 74 REFERNCIAS BIBLIOGRFICAS ANEXO ANEXO A ELEMENTOS DE MATEMTICA ANEXO B ALFABETO GREGOEST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 1 UNIDADE I ESTATSTICA EAPRESENTAO DE DADOS 1.1 - NATUREZA E CAMPO DA ESTATSTICA Frequentementenosdeparamoscominformaesestatsticasnosjornais,televiso, empresaspblicasouprivadas,etc.Porexemplo,quandoadireodoMetrdoRiodeJaneiro informaquetransporta500.000passageirospordia,estamoslidandocomumaestatsticado nmero de passageiros do metr. Tal estatstica foi obtida com base na anlise do movimento dirio ao longo de um determinado perodo de tempo e dessas anlises resultou um nmero que pretende darumaideiadomovimentodiriodepassageiros.claroqueissonosignicaquetododia circulam exatamente 500.000 passageiros, mas tal nmero representa uma estimativa do nmero de passageiros. OutroexemploquepresenciamosperiodicamentenoBrasilsoosCensosDemogrcos, quesolevantamentosrealizadospelosgovernoscomoobjetivodeconhecerascaractersticasde suapopulao,suascondiesscio-econmicas,suascaractersticasculturaisereligiosas,etc. TemostambmosCensosEconmicos,comosquaissepretendeconhecerascaractersticasda populaoformadapelosestabelecimentoseconmicosdopas;assimpodemosteroCenso Industrial, o Censo Agropecurio, etc. Nas pesquisas censitrias, o objetivo que todos os elementos da populao tenham os seus dadoslevantados.Noscensosdemogrcos,issosignicaquetodasaspessoasedomicliostm que ser visitados; j no censo industrial, todas as empresas que desenvolvam atividades industriais tm que ser pesquisadas. Com esses exemplos, v-se que o conceito de populao de uma pesquisa estatstica mais amplo, no se restringindo a seres humanos; ela denida exatamente a partir dos EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 2 objetivosdapesquisa.Maisprecisamente,populaooconjuntodeelementosparaosquaisse deseja estudar determinada(s) caracterstica(s). Outroexemploquefazpartedonossodia-a-diaequeresultadeumlevantamentoestatsticoo ndice de inao, por exemplo, o ndice Nacional de Preos ao Consumidor (INPC) produzido pelo IBGE (Instituto Brasileiro de Geografia e Estatstica). O ndice de inao um nmero resultante de um levantamento depreos que resume a variao dos preos duranteum determinado perodo detempo.Sendoesselevantamentorealizadomensalmente,nopossvellevantarospreosde todos os produtos em todos os estabelecimentos. Ento,feitaumaseleodeprodutoseestabelecimentosaserempesquisados.Temos, assim,umexemplodepesquisaporamostragem.Nessaspesquisas,soselecionadosalguns elementosdapopulao,quecompemaamostra,emtodosestatsticosdeinferncianos permitemgeneralizarosresultadosobtidoscomaamostraparatodaapopulaodeinteresse.Na pesquisado INPC, temos amostragem dos produtos e servios, bem como dos locais onde feito o levantamento dos preos. Outroexemplodepesquisaporamostragemsoaspesquisasdeintenodevoto:alguns eleitoressoentrevistadosedatira-seestimativasdospercentuaisdevotosdecadacandidato. Essesexemplosilustram,ento,oconceitodepesquisaestatstica,queconsistenumtrabalhode identicao,reunio,tratamento,anliseeapresentaodeinformaes(dados)parasatisfazer certanecessidade.Emqualquerlevantamentooupesquisaestatsticafundamentalum planejamentocuidadosodetodooprocesso,resultandonanecessidadedaelaboraoda metodologiadapesquisa,queconsisteemumconjuntodedenies,procedimentos,rotinas, mtodos e tcnicas utilizados para a obteno e apresentao das informaes desejadas. Naspesquisasporamostragem,emparticular,omtododeseleodaamostraumapea fundamental,poisoselementosdaamostratmqueserrepresentativosdapopulaoqualos resultadosdapesquisaseroestendidos.Porexemplo,numapesquisadeintenodevotopara prefeito do municpio do Rio de Janeiro, a amostra tem que ser representativa de todas as regies do municpio;nopodemosconcentrarapesquisaemCopacabana,porexemplo,poiso comportamentodoeleitoradodessebairropodeserdiferentedocomportamentodoseleitoresda Rocinha,emSoConrado.NapesquisadepreosparaelaboraodoINPC,temosqueterum levantamento nas principais regies do pas para que o ndice resultante possa ser representativo do movimento de preos em todo o pas. Depossedosdadoslevantados,temosquedecidircomoosresultadosseroorganizadose apresentados.DoCensoDemogrco,porexemplo,saemdiversastabelasquenosinformama EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 3 populao do Brasil por municpio, o nvel de escolaridade da populao, etc. No levantamento de preosparamedirainao,umdosresultadosumnmeroemformapercentual,queindicaa variao dos preos de um ms para outro. Naspesquisasporamostragem,temosumaetapaimportante,queaetapadeestimao, onde se decide como os resultados obtidos para a amostra sero estendidos para toda a populao e qual o erro mximo que teremos nessa estimativa. Assim, temos identicadas em diferentes pesquisas as trs grandes reas da Estatstica, que, no entanto, no formam ramos isolados: a)Estatstica descritiva trata da observao de fenmenos de mesma natureza, da coleta de dados numricos referentes a esses fenmenos, da sua organizao e classificao atravs de tabelas e grficos, bem como da anlise e interpretao. b)Probabilidadeestatsticautilizadaparaanalisarsituaesqueenvolvemoacaso (aleatoriedade). c)Infernciaestatsticaestudaascaractersticasdeumapopulaocombaseemdados obtidos de amostras. Inferncia = Induo + Margem de Erro OBS:EstatsticaIndutivapodeserdenominadacomoinferncia.Portanto,aestatsticaindutiva estuda as caractersticas de uma populao, com base em dados obtidos de amostras. Neste curso introdutrio, estaremos lidando com a parte da Estatstica Descritiva, quando veremos tcnicasdeanliseexploratriadedados.Oobjetivocapacitaroalunoaorganizarconjuntosde dados,desenvolvendoumaposturacrticanaanlisedosfenmenosemestudo.Sempreque possvel,estaremosutilizandoconjuntosdedadosreais,referentesrealidadescio-econmica brasileira. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 4 1.2 - O MTODO ESTATSTICO A realizao de uma pesquisa deve passar, necessariamente pelas fases apresentadas abaixo: 1)Definiodoproblema Saberexatamenteoquesepretendepesquisar,ouseja,definir corretamente o problema.2)Planejamento determinaroprocedimentonecessriopararesolveroproblema,como levantarinformaessobreoassuntoobjetodoestudo.importanteaescolhadasperguntasem um questionrio, que na medida do possvel, devem ser fechadas. O levantamento de dados pode ser de dois tipos: Censitrio e Amostragem. Outros elementos do planejamento de uma pesquisa so: Cronograma das atividades; Custos envolvidos; Exame das informaes disponveis; Delineamento da amostra. 3)ColetadeDados consistenabuscaoucompilaodosdados.Podeserclassificado, quanto ao tempo em: Contnua (inflao, desemprego, etc.); Peridica (Censo); Ocasional (pesquisa de mercado, eleitoral). 4)Crticadosdados objetivaaeliminaodeerroscapazesdeprovocarfuturosenganos.Faz-se uma reviso crtica dos dados suprimindo os valores estranhos ao levantamento. 5)Apresentao dos dados a organizao dos dados denomina-se Srie Estatstica. Sua apresentao pode ocorrer por meio de tabelas e grficos. Coletas dos Dados Definio do problema Planejamento Crtica dos Apresentao dos dados Tabelas e Grficos Anlise e interpretao dos dados EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 5 6)AnliseeInterpretaodosDados consisteemtirarconclusesqueauxiliemo pesquisadoraresolverseuproblema,descrevendoofenmenoatravsdoclculodemedidas estatsticas, especialmente as de posio e as de disperso. 1.3 PRODUZINDO DADOS Acoletadedadosduranteumestudomuitoimportante,poisaqualidadedadecisoestar diretamenteinfluenciadaporumaboacoletadedados.Bonsdados,viaderegra,significam umbomreflexodaverdade.Porisso,precisa-sedemtodosqueforneamdadosdeboa qualidade.Servistonestaunidadedoismtodosdecoletardados,ocenso(POPULAO)ea amostragem (AMOSTRA). 1.3.1 - Populao oconjuntodeelementos(natotalidade)quetm,emcomum,umadeterminadacaracterstica. Pode ser finita, como o conjunto de alunos de uma determinada escola, ou infinita, como o nmero de vezes que se pode jogar um dado. 1.3.2 - Amostra qualquer subconjunto da populao. A tcnica de seleo desse subconjunto de elementos chamada de Amostragem. Populao (N) Amostra (n) X: determinada caracterstica de interesse da populao; : parmetro populacional; X EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 6 Comojvimos,ainfernciaestatsticatemcomoobjetivoaestimaodeparmetrosparauma populaotendocomobasesinformaesextradasatravsdeumaamostra.Nestecontexto,o estudo dos mais diversos tipos de procedimentos de amostragem se faz necessrio. 1.3.3 Amostragem (No Probabilstica X Probabilstica) Foramvistosalgunsexemplosdemtodostendenciososdeamostragem.Essesmtodos discutidosanteriormentetinhamacaractersticadeserumaamostraporconvenincia,emoutras palavras,mtodosdeamostragemnoqualasunidadessofacilmenteacessveisedeforma conveniente.Umexemplomuitocomumdessetipodeamostragemaamostragemporcotas(ou quotas).Aamostragemporcotasmuitoutilizadaempesquisadeopinioetemafinalidadede estabelecercotas(quantidades),segundodeterminadascaractersticasdapopulao.Essas caractersticas podem ser, sexo, idade, grau de instruo etc. Aessaaltura,sabe-sequeamostrasporconveninciageralmenteproduzemresultados tendenciosos.Umadasprincipaisrazesparaaintroduoda tendncianosresultadosestnapossibilidadedesefazerescolhasde quemserentrevistado.Nessetipodeamostragem,comtantoquese cumpramascotaspreestabelecidasestar-se-iamsatisfazendoos quesitosdoplanoamostral.Paraevitaresseproblemaseriamelhor usaraabordagemdealocarumaprobabilidade,acadaunidade amostralnapopulao,decomporaamostra.Assim,evitar-se-iam escolhas como a ilustrada na figura ao lado. AMOSTRAGEM PROBABILSTICAummtodoamostralqueassociaacadaunidadeamostralnapopulaouma probabilidade, conhecida e diferente de zero, de ser selecionada para a amostra. Hdoistiposde amostragensprobabilsticas.EstosodenominadasComreposioeSemreposio.Abaixo veremos os seus conceitos. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 7 I.Amostragem Probabilstica COM REPOSIO -Acadaseleodeumaunidadeamostral,antesdaprximaseleo,essaunidade anteriormente sorteada volta para a populao, podendo ser selecionada novamente; ou seja, ela s poder ser selecionada no mximo o nmero total de sorteios realizados. Exemplo: Numa urna com 8 bolas numeradas de 1 a 8, realiza-se um sorteio de uma bola. Apsverificadaonmerodabolasorteada,coloca-senovamentenaurna,eemseguida realizando novamente um sorteio. Assim, existe a possibilidade da bola sorteada poder ser selecionada novamente. II.Amostragem Probabilstica SEM REPOSIO -Maisusadonocotidiano.Apsaunidadeamostralsersorteada,elanovoltarparaa populao, ou seja, ela s poder ser selecionada no mximo uma vez. Exemplo:Serrealizadonumasaladeaula,umsorteioparaumacomissodogrmio estudantil. Na qual o 1, 2 e 3 aluno sorteado assumiro, respectivamente, as posies de: Presidente,Vice-PresidenteeTesoureiro.Assim,umavezsorteadoumdeterminadoaluno, ele no poder ser selecionado novamente!!! AMOSTRAGEM NO PROBABILSTICA Quando o mtodo de amostragem no satisfaz a condio da definio anterior. Servistonaprximaseoosprincipaistiposdeamostragemprobabilstica,comsuas caractersticas, vantagens e desvantagens. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 8 1.3.4 Principais Tipos de Amostragem Aleatria Dependendodasituaoemquesto,ummtododeamostragemprobabilsticapodeserdemais fcil execuo e produzir informaes melhores que os outros mtodos probabilsticos alternativos. Portanto,comasituaovigentequesedecidiporqualalternativaseriaamaisconvenientee adequada. Em suma, no existe uma alternativa que seja sempre melhor que as outras, cada situao tem as suas particularidades. Os mtodos probabilsticos que sero vistos nesse curso so: Amostra aleatria simples (AAS) Amostra aleatria estratificada Amostragem por conglomerados Amostragem sistemtica O enfoque deste curso ser a aplicao dos mtodos e no o desenvolvimento terico de resultados. 1.3.4.1 Amostragem Aleatria Simples (AAS) Pode-se pensar em uma amostra aleatria simples da seguinte forma: Numa cesta existem N cdulas idnticas, a no ser pela impresso na face de cada uma delas. Suponha que a varivel de interesse esteja impressa na face de cada cdula. Mistura-se bem o contedo da cesta. Uma amostra aleatria simplesseriaaseleo,semolharocontedodacesta,dealgumascdulas.Comonoqueremos selecionaramesmacduladuasvezes,aseleofeitasemreposio.Independentedeosorteio sercomreposioousemreposio,naAAShaveragarantiaquequalqueramostrademesmo tamanho ter a mesma probabilidade de ser selecionada. AMOSTRA ALEATRIA SIMPLES Umaamostraaleatriasimplesdetamanhonumaamostracomnunidadesamostrais selecionadas, de tal sorte que qualquer outra amostra de tamanho n ter a mesma probabilidade de compor a amostra. O mtodo fsico de gerar uma amostra pode ser pensado como:1)Ter um cadastro da populao;2)Usarumafontedenmerosaleatrios(tabeladenmerosaleatrios,umprogramade computador ou uma calculadora). A Tabela 1.2 contm uma lista de nmeros aleatrios. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 9 Aconstruodatabeladenmerosaleatriospodeserpensadacomosefazendoseleescom reposio de uma cesta com dez cdulas numeradas de 0 at 9. Aps cada seleo o resultado registrado e acdula colocada novamente dentro da cesta. Com isso, a tabela de nmeros aleatrios uma lista longa de dez dgitos, 0,1, . . ., 9; todos igualmente provveis de aparecer na tabela. Por conseguinte, cada par de dgitos, 00, 01, . . ., 99; tambm ter a mesma chance de aparecer na tabela.Omesmoraciocniopodeserestendidoparatriplas,000,001,...,999;ouqualqueroutra quantidade. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 10 Tabela 1. 1: Tabela de nmeros aleatrios Coluna Linha 1-56-1011-1516-2021-2526-3031-3536-4041-4546-5051-5556-6061-6566-70 110480150111536201181647916466917914194625903620720969995709129190700 22236846573255958539330995891982798253402939653409552666191743961599505 32413048360225279726576393648091517924830493403208130680196556334858629 4421679309362436168078561637639440535377134157004849749179775816379 53757039975818371665661219178260468813054968460672141106927126354613 6779216907110084275127756534981860270659906551505321916818254439442880 79956272905564206999498872310167119418738440134884063213210691063412952 896301919775463797218876209229459556869690146004518425849034250832307 9895791434263661102811745318103577408437825331125665867844947558556941 10854753685753342539885306059533388676230081581798316439114581859364952 1128918695788823133276709977993656865585990106315951547855909161078188 12635534096148235342749626694451866372695521802084712234905113370390322 1394299396952636927378897433488363201761730015827284115271563061374952 14103656112987529856894823752267676899339415112635885104202852997589868 1571199733671048817877233139164756481056977358597729372744612855190707 165108512765518215125977452163086075692144494425390070960639907560140719 172368213825240460268893681988555322448191188652556483544919594455157 181011540923336294904312734146185942985271585850305113219159274764951 195216253916463695858623216145138314998736234956435094738177523515635749 207056976283378799984269866917698813602518514610488916195092562558104 EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 11 Tabela 1.2: Tabela de nmeros aleatrios Coluna Linha 1-56-1011-1516-2021-2526-3031-3536-4041-4546-5051-5556-6061-6566-70 2148663912458582814346917230168902294734591932217830421616669990432812 22541645849222421741034707025306764682638458151664621524152279690944592 2332639323635597242001336338005943422872835806691217012641611829622851 242933427001876378730858731256458341539846557411351036776843618818510 2524883306228834735119731924206095261280500016765832586866795072094953 26815257229548399642324878826516656614778767971478013300870747966695725 272967620591680862643246901208498976881536866451265992259571028042825280 2874257392390646643284673400273283261362989479606764760645849609698253 2953664213256692642244407440483793763904457666613475470665203469390449 30919212641864117943052676625940399722220971500645689140242416784469618 315824711879177734142206351267408799547818174260743808766556202876630 3272569884627975617086324880727622236086846379316176038658557791988006 33690116579595876552931898827354265758625408015992029841801501277748501 34259765794829888886046791748708189128227165424697743361154262859633547 3597638347373577129083088318317282903579759984168834952378883891788050 EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 12 Exemplo 1.1: AAS de alunos em uma escola Um pedagogo planejar realizar um estudo sobre o grau de satisfao dos alunos do ensino mdio de sua escola, em relao qualidade de ensino. Ele confere no cadastro de matrculas e averigua que a escolatem80alunosdoensinomdiomatriculados(N=80).Devidoaotempoelimitaesde recursos, o pedagogo ir trabalhar com uma amostra de tamanho cinco, (n = 5). Aps a seleo dos cincoalunos,opedagogoirfazerumabreveentrevistaindividual,sobrecomoestosistemade ensino segundo a viso dos alunos. Usando a Tabela 1.2 para gerar a AAS de tamanho 5 Passo 1 Atribuir a cada aluno um nmero de 01 a 80. Cuidado para no duplicar uma numerao para diferentes alunos. Passo 2 Usar a Tabela 1.2. Seleciona-se uma determinada linha.Por exemplo, a dcima linha85475 36857 53342 etc. Agrupam-se os pares de nmeros85, 47, 53, 68, 57, 53, 34 etc. Oprimeiropar85,oquenocorrespondeanenhumaunidadenapopulao(01-80).Assim, descarta-se esse par. O prximo par 47, portanto o primeiro aluno selecionado o de nmero 47 (#47).Oparseguinte53,correspondenteaoaluno#53.Oprximopar68,seguidode57, associadosaosalunosde#68e#57,respectivamente.Oprximopar53,quejfoiselecionado, assim descarta-se esse par. O ltimo par para finalizar a amostra o 34. Desse modo, a amostra de tamanho cinco compreenderia os alunos de nmero 47, 53, 68, 57 e 34. 1.3.4.2 Amostragem Aleatria Estratificada (AAE) Algumasvezesnumapopulaoexistenaturalmenteaformaodesubgruposdeunidades amostrais,chamadosestratos.Porexemplo,deseja-severoperfildosalunosdaUFRN.Os subgruposquesurgemnaturalmentesoasgrandesreasdeconhecimento(CinciasHumanas, CinciasBiolgicaseCinciasExatas).AoinvsdesefazerumaAASdetodososalunos, poderamosselecionartrsamostrasaleatriasparacadaumdossubgrupos(estratos).Esse esquemaamostraldariainformaosobreoperfildosestudantesporestratocomotambmparaa populao como um todo. Uma vez que, supem-se que em determinados temas, haja diferena de EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 13 opiniesentresosalunosdastrsgrandesreas.Assim,teremosumarepresentaodealunosde cada rea de conhecimento (Cincias Humanas, Cincias Biolgicas e Cincias Exatas). AMOSTRA ALEATRIA ESTRATIFICADA Uma amostra aleatria estratificada obtida pela diviso ou estratificao da populao em grupos (estratos) mutuamente exclusivos (no h interseo entre os estratos) e fazendo uma AAS em cada estrato. As unidades de cada estrato so combinadas para formar a amostra completa. Aamostragemaleatriaporestratificaopodesermuitotilquandonecessriaa informaoporestratos.Outravantagemdesseesquemaamostralque,dependendodecomoos estratos so formados, a inferncia baseada na amostragem por estratificao melhor que na AAS. Aamostragemestratificadamaisefetivaquandoasunidadesdentrodosestratossomais semelhantesentresi,emrelaoavariveldeinteresse,quenapopulaocomoumtodo.A representao dessa pode ser vista nas Figuras 1.2 e 1.3. Figura 1.1: Boxplot dos estratos em relao ao boxplot da populao EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 14 4847464532313029161514134443424128272625121110940393837242322218 7 6 536353433201918174 3 2 1 Figura 1.2: Ilustrao da variao dentro dos estratos em relao variao entre os estratos Veja agora o porqu dessa razo. Suponha que s h recursos para uma amostra de tamanho n=4.Suponhatambmqueoshomenstmumpensamentomuitomaishomogneoqueas mulheres,emrelaoaumaperguntahipottica.Quantoshomensemulheresseriamselecionados paracomporaamostradetamanhoquatro?Comooshomensforneceriamrespostasmais semelhantesqueasmulheres,poderiamselecionarmaismulheresquehomens.Nesseexemplo,a amostra poderia ser composta de apenas um homem e trs mulheres. Resumindo,aamostragemaleatriaestratificadafuncionabemquandosetemosvalores dentrodosestratosmaissemelhantesentresi,quenapopulaocomoumtodo.Asinformaes obtidas de cada estrato so combinadas de maneira ponderada para estimar a mdia populacional. Algumasvezes,porquestodecusto,umaAASouumaamostraaleatriaestratificada podemserinviveisdeseremexecutadas.Emtaiscasos,deve-seutilizaroutrostiposde amostragemaleatria.Aamostragemporconglomeradosseriaumaalternativavivelparatal situao e ser vista na seo a seguir. 1.3.4.3 Amostragem Aleatria por Conglomerados (AAC) SuponhaquesequeirasaberoshbitostelevisivosdosresidentesnacidadedeNatal-RN. Especificamente, deseja-se saber sobre os hbitos das crianas, mulheres e homens adultos. Estudos passadosrevelaramqueoshbitosparacadaumdostrsgruposacimadiferembastanteentresi, massobemsemelhantesdentrodosrespectivosgrupos.Deseja-se,ento,obterumaamostra contendo pessoas dos trs grupos. Oprimeiropensamentoseriaousodeumaamostraaleatriaestratificada.Entretanto,a execuo desse plano amostral pode ser muito onerosa, especialmente se a entrevista for feita com cada uma das pessoas selecionadas. Por exemplo, uma criana selecionada pode morar na zona sul 13 5 24 6 EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 15 dacidade,enquantoumapessoadogrupodoshomensadultospoderiamorarnazonalesteda cidade.Comisso,osdeslocamentosnecessriosparaaobtenodaamostraseriamenormes, podendo at inviabilizar a sua execuo. Nasituaoacima,umaamostraporconglomeradospoderiaserumaboaalternativa.Uma famliacomumacriana,umhomemadultoeumamulheradultaformariaumanovaunidade chamadadeconglomerado.Portanto,selecionar-se-iamfamlias(conglomerados)eentrevistar-se-iam todos nesse conglomerado, facilitando assim, a coleta da informao. Esse tipo de amostragem muito utilizado em escolas. Vamos supor que queremos realizar um estudo com os alunos das escolas pblicas do Rio Grande do Norte, para saber se gostam das as aulasdeeducaofsica.Umapossvelsoluo(jqueentrevistartodososalunosdasescolas pblicas do RN tomaria muito tempo e recursos) seria selecionar uma amostra de alunos de todas as escolas e coletar essas informaes atravs de um questionrio. No entanto, uma opo mais rpida eeconmica,seriasortearumnmerodeescolasporregio,eacadaescolasorteada,aplicaro questionrio a TODOS os alunos da escola; assim, cada escola torna-se um conglomerado. AMOSTRAGEM POR CONGLOMERADOSEmumaamostragemporconglomerados,asunidadesdapopulaosoagrupadasformando conglomerados.Umoumaisdessesagrupamentossoselecionadosaleatoriamente.Seum conglomerado selecionado, todas as unidades dele faro parte da amostra. muito comum confundir uma amostra estratificada com uma amostra por conglomerados. Ambas dividem a populao em grupos mutuamente exclusivos. Todavia, as duas principais diferenas so:1)Na estratificao uma AAS feita em cada estrato, j no conglomerado feita uma AAS dos conglomerados;2)A variao das unidades dentro dos estratos menor do que a variao entre os estratos, j nosconglomeradosavariaodentronormalmentemaiorqueavariaoentreos conglomerados. Oobjetivomaiorcomumaamostraporconglomeradosaeconomiadetempoecusto.Menos energia e dinheiro so gastos se os entrevistados esto dentro de uma especfica regio geogrfica, ao invs de espalhados em todas as direes. Em contra partida, quando o conglomerado no tem a caractersticadeumaminipopulaoasuavariaonorefletiravariaonapopulaoe haver uma perda na exatido das informaes.EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 16 Exemplo1.2:AmostragemporconglomeradosemumacidadehipotticaAFigura1.5ilustra uma possvel diviso de uma parte da cidade em conglomerados de quarteires. H um total de seis conglomerados,emcoresdiferentes;eumtotalde48quarteires.Nessasituao,cada conglomerado constitudo de oito quarteires. 48 47 46 45 32 31 30 29 16 15 14 1344 43 42 41 28 27 26 25 12 11 10 940 39 38 37 24 23 22 21 8 7 6 536 35 34 33 20 19 18 17 4 3 2 1 Figura 1.3: Mapa de uma regio da cidade hipottica em conglomerados de quarteires. Suponhaquesedesejaretirarumaamostradetrsconglomerados.Paratanto,bastariafazeruma AAScomn=3eN=6.Umavezselecionadososconglomerados,todososseusquarteires comporiam a amostra final. Pergunta: Qual a chance de um quarteiro fazer parte da amostra? Observao:NoExemplo1.8todososconglomeradostinhamomesmotamanho.Numasituao maisgeral,osconglomeradospodemtertamanhosdiferentes.Assim,oprocessodeseleodos conglomerados teria que levar essa informao em considerao. Esse procedimento mais geral ser visto no curso de amostragem. 1.3.4.4 Amostragem Sistemtica (AS) Quandoocadastrodasunidadesamostraisnoexistir,ouestiveraproximadamenteemordem aleatria,ouforhomogneoemrelaovariveldeinteressepode-seusaroprocedimentode seleo chamado de amostragem sistemtica. Em linhas gerais, o procedimento consiste em retirar unidades amostrais a intervalos regulares at atingir o tamanho da amostra desejada. ParaobterumaamostrasistemticadetamanhondeumapopulaocomNunidadescom um intervalo de tamanho k segue-se o seguinte procedimento: 1 3 5 2 4 6 EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 17 1.Determina-se o tamanho da populao N; 2.Calcula-se o tamanho da amostra n; 3.Determina-se o tamanho do intervalo Nkn= ; a)Se k for fracionrio, deve-se aumentar n at tornar o resultado inteiro; b)Se N for um nmero primo ou no se puder aumentar o tamanho da amostra, retira-se algumasunidadesdapopulaodeformaaleatria,comointuitodetornarkum inteiro. 4.Seleciona-sealeatoriamenteopontodepartidaR,1Rk,ouseja,umadaskprimeiras unidades do primeiro intervalo. Observao:Apalavraaleatoriamenteestemdestaquenoitem4,poisdessaformaquese garante que todas as unidades podero fazer parte da amostra final. 5.Acadakunidadesdapopulao,retira-seumaunidadeparacomporaamostra,at completar o tamanho da amostra desejado, isto , R, R + k, R + 2k, R + 3k,,R + (n - 1)k. Na Figura 1.6 ilustra-se o esquema da amostragem sistemtica de uma amostra de tamanho n, de uma populao com N unidades e com intervalo de tamanho k. Figura 1.4: Esquema da amostragem sistemtica de uma amostra de tamanho n, de uma populao com N unidades e com intervalo de tamanho k EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 18 Exemplo1.3:UmReitorestinteressadoemsaberodesempenhomdiodeseusalunosna disciplinadeEstatsticaAplicada.Sabe-sequeafaculdadecontm8300alunos,cadastrados segundoonmerodesuamatrcula.Suponhaqueaamostratenhaqueserde270alunos(noh recursos para aumentar o tamanho da amostra!). Determinao do intervalo k 830030, 74270Nkn= = =Comonosepodeaumentarotamanhodaamostra(nmerodealunos),tem-seexcluiratravsde um sorteio algumas unidades. Determinao do nmero de unidades a serem excludas 1.Pegar a parte inteira de k e multiplicar por 270, isto , 30 270 = 8100. 2.Pegar o total da populao, 8300, e subtrair de 8100, ou seja, 8300 8100 = 200. Assim, 200 unidades devem ser excludas da populao para se obter um k inteiro, 830030270k = = . Portanto, a cada 30 alunos no cadastro, 1 retirado para compor a amostra. OPrximopassoselecionaraleatoriamenteumnmerode1a30.Porexemplo,imagine que o nmero sorteado foi 3. Dessa forma, a amostra conter as unidades que estiverem ocupando as seguintes posies: 3, 33, 63, 93, ..., 8073. Portanto,dopontodevistaprticoaamostragemsistemticaummtododeseleo bastante simples de selecionar as unidades amostrais que faro parte da amostra. Entretanto, quando humatendnciacclicaouperidicanasunidadesamostraisaamostragemsistemticapode apresentar resultados tendenciosos. Exemplo1.4:Suponhaquesedesejaobterumaamostradeidadesdosalunosdeumaescola particular. No entanto, o cadastro est organizado por idade, em ordem crescente. Nessa situao, a amostragemsistemticanodeveriaserutilizadacomopresentecadastroparaevitaraintroduo detendncianosresultados.Umnovocadastrodeveriasercriado,deformaqueasunidades estivessemdispostasemumaordemaleatriaparaqueaamostragemsistemticapudesseser utilizadadeformaadequada.Vejaqueessecasodiferentedoexemplo1.3,poisosalunosesto EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 19 cadastradosporordemdematrcula,assim,aordemdecadaalunotersecadastradoerecebidoo nmero de matrcula pode ser considerado aleatrio. Diferente desse exemplo que o fator idade no aleatrio. 1.3.5 - Tipos de Variveis condioinerenteaumapopulaonaturalexistirvariaoquantoaosatributosquelhepodem serestudados.Portanto,avariabilidadeumacaractersticacomumaosdadosdeobservaoe experimentos. Um atributo sujeito variao descrito em Estatstica por uma varivel. Nominal Qualitativa Ordinal Varivel DiscretaQuantitativa Contnua VARIVELQUALITATIVA:Osdadospodemserdistribudosemcategoriasmutuamente exclusivas. Por exemplo, sexo (masculino, feminino), cor, causa de morte, grupo sanguneo, etc. -Nominal: as categorias podem ser permutveis (no existe ordem natural dos seus nveis); Exemplo: [masculino, feminino], [sim, no], [fuma, no fuma]; -Ordinal: as categorias descrevem uma ordenao natural dos seus nveis. Exemplo: [pssimo, ruim, regular, bom, timo] VARIVEL QUANTITATIVA: Os dados so expressos atravs de nmeros. Por exemplo, idade, estatura, peso, etc. -Discreta: Assumem valores que podem ser associados aos nmeros naturais ( 1, 2, 3,... = ).D uma ideia de contagem. Exemplo: Idade dos alunos em anos [18, 19, 21, 24, 27, 30, 24, 17, 19, 22, 20, 21, 38, 25] EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 20 -Contnua: Assume infinitos valores em um dado intervalo.D uma ideia de medio. Exemplo: altura e/ou peso de animais ou de pessoas. [1.70, 1.57, 1.80, 1.94, 1.68, 1.71] Exerccio 1.1: Classifique as variveis abaixo segundo a sua natureza e o seu tipo de escala: a)Nmero de livros de biblioteca: (1, 2, 3, ...); b)Resultado de um tratamento mdico:(curado, no curado); c)Contedo de nicotina: (em miligramas); d)Grau de severidade de doenas: (escala de 1-9); e)Conformidade do produto fabricado: ( perfeito, defeituoso); f)Gravidade de um ferimento: (nenhuma, suave, moderada, severa); g)Classe social: (baixa, mdia, alta); h)Diagnstico de uma doena: (HIV, Tuberculose, Cncer); i)Resultado de um concurso: (aprovado, reprovado); j)Estudo de cultivo de bactrias: (presente, ausente); k)Tipo de defeito no produto: (amassado, arranhado, quebrado); l)Opinio sobre produtos no mercado pssimo, ruim, regular, bom, timo); m)Temperatura ambiente: (em graus Celsius); n)Espessura de parafusos: (em milmetros); EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 21 1.4 - REPRESENTAO TABULAR Consiste em dispor os dados em linhas e colunas, distribudas de modo ordenado, segundo algumas regrasprticaseobedecendoResoluon886/66,de26deoutubrode1966,doConselho Nacional de Estatstica. As tabelas devem conter: a) Ttulo - O qu? (fenmeno). Onde? (poca). Quando? (local). b) Cabealho - indica o contedo das colunas c) Coluna Indicadora - especifica o contedo das linhas d) Cabealho da coluna indicadora - indica o contedo da coluna indicadora e) Corpo - caselas ou clulas, onde so registrados os dados. f) Rodap - notas e identificao da fonte de onde foram coletados os dados. 1.4.1 - Sries Estatsticas Soosdadosorganizadosemformadetabelas.Deacordocomofenmeno,olocalea poca de ocorrncia, as Sries Estatsticas classificam-se em Temporal, Especificativa e Geogrfica. SRIE TEMPORAL a srie estatstica em que os dados so observados segundo a poca de sua ocorrncia. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 22 Exemplos:Tabela 1.2: Nmero de alunos matriculados em escolas pblicas no RN, perodo 1997 - 2002 AnosQuantidade de super-remdios 1997 1998 1999 2000 2001 2002 849.926 945.016 1.245.425 1.244.426 1.785.324 1.754.153 FONTE: Dados fictcios Tabela 1.3: Nmero de alunos de uma determinada escola de Natal-RN, que passaram no vestibular da UFRN, perodo 2006 - 2010 AnosValores 2006 2007 2008 2009 2010 41 37 61 118 148 FONTE: Dados fictcios SRIE GEOGRFICA a srie estatstica em que os dados so observados segundo o local onde ocorreram. Exemplo:Tabela 1.4: Lista dosdez estados do Brasil com maior ndice de analfabetismo (2010) EstadosAnalfabetismo (%) Alagoas Piau Paraba Maranho Rio Grande do Norte Cear Sergipe Pernambuco Bahia Acre 22,52 21,14 20,20 19,31 17,38 17,19 16,98 16,73 15,39 15,19 FONTE: IBGE (2010) EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 23 SRIE ESPECIFICATIVA OU ESPECFICA a srie estatstica em que os dados so agrupados segundo a modalidade (espcie) de ocorrncia. Exemplos: Tabela1.5:ValordeumadvidadeR$1.000aofimde1(um)ano,deacordocomotipode financiamento, Brasil, 2002. Tipo de FinanciamentoMontante (em R$) Emprstimo Pessoal Cheque Especial Credirio Carto de Crdito Emprstimo em Financeiras 1.847,84 3.087,46 2.172,01 3.296,01 2.842,06 FONTE: Rev. poca, 24/06/2002 Tabela 1.6: Fracionamento do Salrio no oramento familiar dobrasileiro (%), 2002 Descrio% Habitao Alimentao Sade, Tarifas Pblicas, Transporte Vesturio, Educao, Lazer e outros 24,4 23,7 13,4 11,2 FONTE: Rev. poca, 24/06/2002 SRIE MISTA OU DE DUPLA ENTRADA Corresponde fuso de duas ou mais sries simples. Exemplos: Tabela 1.7: Participao de cada fabricante no mercado de absorventes higinicos no Brasil, 1997-99 (em %) Participao (%)Fabricantes 199719981999 Johnson & Johnson42,439,038,7 Kimberly Clark16,021,925,7 Procter & Gamble23,619,215,5 Outros18,019,920,1 Fonte: Gazeta Mercantil, set/2000 EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 24 Tabela 1.8: Balana Comercial do Rio Grande do Norte, 1986-99 Valor (US$ mil)Anos ExportaesImportaes 198627.9475.016 198747.9784.890 198860.0478.488 198970.67220.186 199088.80021.889 199180.1896.826 199272.93411.271 199381.28816.393 199486.72933.279 199579.22834.542 199694.876101.978 199793.504125.445 1998101.74888.528 1999115.47384.267 Fonte: Boletim Conjuntural, Nordeste do Brasil, SUDENE, Agosto/2000 Tabela 1.9: Crescimento (%) em relao em 2001 at junho dos Setores Petrolfero e Industrial MesesSetor PetrolferoSetor Industrial Janeiro Fevereiro Maro Abril Maio Junho 9,5 7,0 15,33 15,71 22,92 15,95 - 1,18 - 1,26 - 3,67 6,10 - 0,96 0,69 Fonte: IBGE Tabela 1. 10: Valor de Mercado e Patrimnio (em US$ bilhes), de 5 empresas dos Estados Unidos EmpresasValor de MercadoPatrimnio Microsoft Merck Cisco Dell Ebay 336 146 120 70 15,5 65 44 37 13 1,5 FONTE: Rev. poca, jul/2002 Tabela 1.11: Evoluo do n de Milionrios (em mil), no Brasile na Amrica Latina AnosBrasilAmrica Latina 1997 1998 1999 2000 2001 61 68 81 83 90 190 213 252 259 280 FONTE: Rev. poca, jun/2002 EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 25 Tabela 1.12: ndice de Desemprego (%), em algumas Regies Metropolitanas do Brasil ndice de Desemprego Regies Metropolitanas 20002002 Distrito Federal Belo Horizonte Porto Alegre Recife Salvador So Paulo 21,6 18,4 18,8 20,1 28,2 18,6 21,1 18,9 15,7 21,8 28,8 20,4 FONTE: Rev. poca, 15/07/2002 1.4.2 - Distribuio de Frequncias Tabelascomgrandesnmerosdedadossocansativasenodoumavisorpidaegeral dofenmeno.Dessaforma,necessrioqueosdadossejamorganizadosemumatabelade distribuio de frequncias. Distribuio de Frequncias:Srieestatsticaemqueosdadossoagrupadosemclasses,comsuasrespectivasfrequncias absolutas, relativas e percentuais, com o objetivo de facilitar ao analista o seu estudo. Construo de uma Distribuio de Frequncias: Para a construo de uma distribuio de frequncias os seguintes componentes so necessrios: Dados Brutos: so os dados apresentados desordenadamente, da forma como foram coletados. Exemplo: Peso de alunos da disciplina:74 58698074955674768160576462 Rol: so os dados apresentados em ordem crescente. Exemplo: Peso de alunos da disciplina (em forma de rol):56 57586062646974747476808195 Os seguintes componentes so utilizados apenas em distribuio de frequncias em classes: EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 26 Amplitude Total (A): a diferena entre o maior valor do rol (LS) e o menor valor (LI). A = LS - LI NmerodeClasses(c):correspondequantidadedeclasses,nasquaisseroagrupadosos elementos do rol. Para determinar c, utiliza-se a frmula de Sturges: c = 1 + (3,33333.....) log(n)

em que n = nmero de elementos do rol. Amplitude ou Intervalo de Classe (i): geralmente utilizam-se intervalos iguais, obtidos atravs da frmula: i = A/c Outros elementos da tabela: -Li = limite inferior de cada classe; -Ls = limite superior de cada classe; -x = ponto mdio de cada classex = Li + (i/2); -f = frequncia absoluta = nmero de ocorrncias de cada classe; -fr = frequncia relativa= f / f fr; -f % = frequncia percentualf % = 100fr; - F= frequncia absoluta acumulada "abaixo de"; - F= frequncia absoluta acumulada "acima de"; - F%= frequncia percentual acumulada "abaixo de"; - F%= frequncia percentual acumulada "acima de"; EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 27 Exemplos 1)(DadosSimples)Numapesquisafeitaparadetectaronmerodefilhosqueospaisos matriculam no mesmo colgio, foram encontrados os seguintes valores: 1425320321 5425032423 2321421342 Soluo: Rol (dados em ordem crescente): 0011112222 2222223333 3344444555 Tabela 1.13: Tabela de Distribuio de Frequncias Xffrf % F F F% F%020,0676,72306,7100 140,13313,36282093,3 2100,33333,3162453,380 360,220221473,346,7 450,16716,72789026,7 530,11030310010 Total301100---- FONTE: Dados Fictcios Algumas consideraes ou concluses: a)Quantospaistm"x"filhosmatriculadosnomesmocolgio?Arespostadadaatravsdef (frequncia absoluta simples).b)Quantospaistmmenosde"x"filhosmatriculadosnomesmocolgio?Arespostadada atravs de F(frequncia absoluta acumulada "abaixo de"). c)Quantos pais tm mais de "x" filhos matriculados no mesmo colgio? A resposta dada atravs de F(frequncia absoluta acumulada "acima de"). EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 28 2)(DadosAgrupadosemClasses)Umpsiclogoestinteressadoemanalisarosdados referentes ao tempo (em horas) de estudo por dia, de alunos do ensino fundamental. Oitenta e quatro (84) alunos de uma escola foram acompanhados durante 1 ms, e ao final, foi estimado o tempo mdio por dia de estudo. Os dados so os seguintes: 1,511,651,581,541,651,401,611,081,811,381,561,83 1,691,221,221,681,471,681,491,801,331,831,501,46 1,671,601,231,541,731,432,181,461,531,601,591,49 1,461,721,561,431,691,151,891,472,001,581,371,40 1,761,621,961,661,511,312,291,582,341,661,711,44 1,661,361,431,261,471,521,571,331,861,751,571,83 1,521,661,901,591,471,861,731,551,521,401,862,02 Soluo: Rol (dados em ordem crescente): 1,081,151,221,221,231,261,311,331,331,361,371,38 1,401,401,401,431,431,431,441,461,461,461,471,47 1,471,471,491,491,501,511,511,521,521,521,531,54 1,541,551,561,561,571,571,581,581,581,591,591,60 1,601,611,621,651,651,661,661,661,661,671,681,68 1,691,691,711,721,731,731,751,761,801,811,861,86 1,861,861,861,861,891,901,962,002,022,182,292,34 Amplitude Total (d uma ideia do campo de variao dos dados): A = LS - LI = (2,34) - (1,08) = 1,26 Analisando-seaquantidademdiadehorasdeestudopordia,encontradanos84alunosdeum colgio,verificou-seque,ocorreuavariaode1,26horasnoseucampo(de1,08horasa2,34 horas de estudo por dia). EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 29 Estabelecer o Nmero de Classes (c): c = 1 + (3,3333.....) log(n) = 1 + (3,3333....) log(84) = 7,414 c = 7 Estabelecer o Intervalo de Classe (i): i = A / c = (1,26) / 7 = 0,18 Construo da Tabela: ClassesfiPm (X)frf % % f % f F F1,08 1,2651,170,0595,95,9100584 1,26 1,44131,350,15515,521,494,11879 1,44 1,62321,530,38138,159,578,65066 1,62 1,80181,710,21421,480,940,56834 1,80 1,9811 1,890,13113,194,019,17916 1,98 2,1622,070,0242,496,46,0815 2,162,3432,250,0363,61003,6843 Total84-1100---- Fonte: Dados Fictcios Observao 1: O melhor valor para representar cada classe o ponto mdio (Pm), o qual se obtm pela frmula:Pm = Li + (i / 2), ou ainda, Pm = (Li + Ls) / 2 Observao 2: fi : nmero de elementos de cada classe. fr : mede o quanto cada valor significa e relao a unidade (1). f%: mede o quanto cada valor significa com relao a 100. Observao3:1,081,26,intervalofechadoesquerda(pertencemaclassevaloresiguaisao extremo inferior, nesse caso, 1,08 horas) e aberto direita (no pertencem a classe valores iguais ao extremosuperior,nessecaso,1,26horas).Deformaanloga,2,162,34,intervalofechado esquerda e direita. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 30 Algumas consideraes ou concluses: a)Quantosalunostmquantidademdiadeestudodirianointervalode"x"?Arespostadada atravs de f (frequncia absoluta simples). Ex.: Quantos alunos tm quantidade mdia de estudo diria no intervalo [1,44; 1,62)? R.: 32 alunos. b)Quantosalunostmquantidademdiadeestudodiriainferioraointervalo"x"?Aresposta dadaatravsde F (frequnciaabsolutaacumulada"abaixode").Ex.:Quantosalunostm quantidade mdia de estudo diria inferior ao intervalo [1,80; 1,98)? R.: 68 alunos. c)Quantosalunostmquantidademdiadeestudodiriasuperioraointervalo"x"?Aresposta dadaatravsde F (frequnciaabsolutaacumulada"acimade").Ex.:Quantosalunostm quantidade mdia de estudo diria superior ao intervalo [1,80; 1,98)? R.:5 alunos. 2)Construir uma distribuio de frequncias, utilizando a frmula de Sturges e analis-la combasenoselementosabaixo,correspondenteaofaturamentobrutoanual(em Milhes de R$) de 50 faculdades particulares do Pas: 2,1 4,42,7 32,39,9 9,02,06,63,9 1,6 14,79,6 16,77,4 8,219,26,9 4,33,31,24,1 18,4 0,2 6,1 13,5 7,4 0,28,30,31,3 14,1 1,0 2,4 2,418,0 8,7 24,0 1,4 8,2 5,81,63,5 11,4 18,0 26,7 3,712,623,15,60,4 1.5 - REPRESENTAO GRFICA Todoogrficodeveapresentarttulo(podesercolocadotantoacimacomoabaixo)eescala (crescemdaesquerdaparaadireitaedebaixoparacima).Aslegendasdevemsercolocadas direita ou abaixo do grfico. A seguir vemos os principais tipos de grficos: 1.5.1 - Grfico de Setores Tambm conhecido como Grfico de Pizza, este grco usado quando cada valor representa uma partedeumtodo.,ento,usadoumcrculoderaioqualquer,comareaoungulototalsendo EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 31 proporcionalaototal(100%)dasriededadosarepresentareareaoungulodecadasetor circular sendo proporcional a cada dado da srie. Exemplo 1.5: Exemplo de um grfico de setores Tabela 1.14: ndice de reprovao por disciplina de um determinado colgio de ensino fundamental em 2010 Disciplina ndice de Reprovao (%) Portugus 12,57% Matemtica 48,54% Estudos Sociais 11,33% Cincias 17,45% Ingls 10,11% Total 100,00% Fonte: Dados Fictcios ndice de Reprovao (%)13%49%11%17%10%Portugus Matemtica Estudos Sociais Cincias InglsFigura 1.5: ndice de reprovao por disciplina de um determinado colgio de ensino fundamental em 2010 EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 32 1.5.2 - Grfico de Colunas e Barras Asvariaesquantitativasdatabelasorepresentadasporcolunasdispostasverticalmenteou horizontalmente. usado para representar qualquer tipo de srie. Exemplo 1.6: Exemplo de um Grfico de Barras Tabela 1.15: Principais causas de morte nos EUA em 2004 Tipo de morteFrequnciaPercentual (%) Acidentes de carro85623,70 lcool45712,65 Armas de fogo98527,27 Cigarro2476,84 Doenas Infecciosas1123,10 Doenas Venreas982,71 Drogas63117,47 Obesidade1243,43 Outras1022,82 Total3612100 Fonte: Ie Estatsticas, 2004. Figura 1.6: Principais causas de morte nos EUA em 2004 EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 33 Exemplo de um Grfico de Colunas (Referente Tabela 1.15 do Exemplo 1.11) Exemplo1.7:ndicedereprovaopordisciplinadeumdeterminadocolgiodeensinofundamentalem 2010 12,57%48,54%11,33%17,45%10,11%0%5%10%15%20%25%30%35%40%45%50%ndice de ReprovaoPortugus Matemtica Estudos Sociais Cincias InglsDisciplinasFigura 1.7: ndice de reprovao por disciplina de um determinado colgio de ensino fundamental em 2010 1.5.3 - Histograma e Polgono de Frequncias Aapresentaotabulardosdadosatravsdeumadistribuiodefrequnciasca complementadacomumarepresentaogrcadessesmesmosdados.Ohistogramaeopolgono de frequncias so tipos de grcos usados para representar uma distribuio de frequncias simples de uma varivel quantitativa contnua. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 34 Exemplo 1.8: Exemplo de um histograma e de um polgono de frequncias Tabela1.16:Distribuiodefrequnciasdospreosdelivrosdematemticado1anodoensino mdio em Natal / RN 2010. Preo dos livros (R$) ffr FF% 47 6819381938 68 8919383876 89 1109184794 110 131244998 131 1521250100 Total50100-- Fonte: Dados Fictcios. Um histograma um conjunto de retngulos com bases sobre um eixo horizontal dividido de acordocomoscomprimentosdeclasses,centrosnospontosmdiosdasclassesereas proporcionais ou iguais s frequncias.Um polgono de frequncias um grco de linha que se obtm unindo por uma poligonal ospontoscorrespondentessfrequnciasdasdiversasclasses,centradasnosrespectivospontos mdios. Para obter as intersees da poligonal com o eixo, cria-se em cada extremo uma classe com frequncia nula. Note que esses grcos podem ser construdos com base nas frequncias absolutas ou relativas. O importante que a escala nos eixos horizontal e vertical,bem como os retngulos, sejam construdos de forma a que suas reas espelhem a proporcionalidade dessas frequncias. Na Figura 1.10 apresentamos o histograma para a distribuio de frequncias dada na Tabela 1.17, referenteao preode livros de matemticado 1 ano do ensino mdio em Natal / RN, 2010. Aquicabeumaobservaosobreohistograma,quefoiconstrudocomosoftwarefreeR;cada retngulofoiconstrudodemodoquesuareafosseexatamenteigualfrequnciarelativa.Por exemplo, todos os retngulos tm base 21, que a amplitude de classe. A altura dos dois primeiros retngulos[rea/base=0,38/21=0,0180952],demodoquearearesultante0,38.Paraa terceira classe, temos que [altura = rea/base = 0,18 / 21 = 0,0085714].Opontofundamentalnainterpretaodeumhistogramacompreenderqueasreasdos retngulosrepresentamasfrequnciasdecadaclasse.Comoavarivelcontnuaeafrequncia dadaserefereaumaclassedevalores,asuposioquesefazqueessafrequnciasedistribui uniformemente pela classe. Na Figura 1.10, a frequncia relativa da classe 47 68 0,38 (ou 38%) eelaestuniformementedistribudapelaclasse,oquesignicaquesub-classesdemesmo EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 35 comprimentoteriamamesmafrequncia.Porexemplo,asfrequnciasdasclasses4757,5e 57,568seriamambasiguais0,19.Jasub-classe8995teriaumafrequnciade0,0085714 (9589) = 0,0514286. Mais uma vez, o princpio que rea = frequncia. Com relao ao polgono de frequncias, a ideia representar o comportamento tpico de cada classe atravs do seu ponto mdio. Assim, o polgono de frequncia est representado na Figura 1.11 HISTOGRAMA Figura 1.8: Histograma da distribuio de frequncia dos preos dos livros de matemtica POLGONO DE FREQUNCIAS Figura 1.9: Polgono de frequncia dos preos dos livros de matemtica EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 36 1.6 EXERCCIOS 1)Umaturmadecalourosconsistede100estudantes.Cadaestudanterecebeuumdos nmeros,01,02,...,100.Suponhaqueumacaixacontenha100fichascomessa numerao.Algummisturabastanteocontedodacaixa,esemolhar,retira20fichas simultaneamente. Os estudantes associados s fichas retiradas compem a amostra. a)Este plano amostral uma amostra aleatria simples? Justifique. b)Se voc respondeu sim em (a), a amostragem foi feita com ou sem reposio? 2)Asreferncias(segundooltimonomedo1autor)doslivrosdeumabibliotecadeuma escolaaindaestocadastradasemfichasporordemalfabtica.Odiretordaescolapede ao bibliotecrio para selecionar 1/3 das referncias, para comearem a cadastrar em meio digitalnositedabiblioteca.Paraassituaesabaixo,determineotipodeamostragem mais aconselhvel. a)Se o diretor pedir para na amostra selecionada, as referncias dos livros contenham todo o alfabeto.b)Se o diretor informar que no precisa na amostra, ter todas as letras do alfabeto, mas seria interessantenohaverapenasasprimeirasnemasltimasletras,esimuma representatividadeequilibradadequasetodooalfabeto;assimrepresentadoasletrasdo incio, meio e fim. c)Se o diretor pede apenas para extrair uma amostra de 1/3 dos livros sem mais critrios de seleo. d)Odiretorinformaquepreferecadastrarnositetodasasrefernciasdecadaletra.No entanto, como no darpra o bibliotecrio cadastrar todas as letra de incio, ele ter que fazer um sorteio de 10 letras e, aps isso, cadastrar todos os livros das letras selecionadas. 3)Em uma AAS de 200 livros, 5 esto mal conservados. Pode-se concluir que: (Justifique). a)A porcentagem de livros mal conservados na populao de 5/200 = 2,5%. b)A cada 200 livros, 5 sero mal conservados. c)A percentagem de mal conservados na amostra de 2,5%. d)Apercentagemdelivrosmalconservadosnapopulaomaiorque2,5%,poisa populao sempre maior que a amostra. e)Nenhuma das anteriores. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 37 4)OsestudantesrepresentantesdoDCEdaUFRNdesejamestimaroquantosegastaem cpias de livros e artigos na UFRN, com o objetivo de pleitear uma reduo no valor por cpia.Suponhaqueumaamostragemaleatriaestratificadaestsendopropostapara fazertallevantamento.Trsvariveisdeestratificao(paraformarosestratos)foram sugeridas.Faaumaavaliaoparacadaumadasvariveisdeestratificaosugeridas, isto , diga se a varivel em questo seria uma boa varivel de estratificao. a)Estratificao feita pela rea de concentrao. b)Estratificao feita por sexo. c)Estratificao feita pelo perodo: 1, 2, 3 etc. 5)Existem975professoresnumadeterminadauniversidade.Areitoradestauniversidade desejarealizarumestudoparaobteraopiniodosprofessorescomrelaoaumanova maneiradeensinar,segundoummtododidtico-pedaggico.Areitoratememmos umalistacom60departamentosnauniversidade.ElaplanejaretirarumaAASdeseis departamentos.Asuaamostrafinaldosprofessoresconsistirdetodososprofessores pertencentesaosseisdepartamentosselecionados.Cadaprofessorpertenceapenasaum departamento. Que tipo de plano amostral foi descrito acima? 6)SegundoosregistrosdoMEC,35%dosprofessoresestonafaixaetriaacimade40 anos.Paratestaraeficinciadeumtipodeamostragem,foirealizadoumsorteio aleatoriamente de 200 escolas em todo o Pas. Das 200 escolas selecionadas, foi analisados a idade de todos os professores. Chegando a uma estimativa de 28% dos professores com faixa etria acima de 40 anos. Informe qual o tipo de amostragem utilizada e Justifique. 7)Suponha que o DCE da UFRN est conduzindo umestudo para averiguar a opinio dos estudantesdaUFRNparaumapossvelmudananohorriodefuncionamentoda BibliotecaCentralZilaMamede.Parafacilitar,vamosassumirquetodososcursosna UFRN tenham durao de quatro anos. Eles aleatoriamente selecionam 100 calouros, 100 estudantesdosegundoano,100estudantesdoterceiroanoe100estudantesdoquarto ano. Que tipo de plano amostral foi utilizado? Justifique. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 38 8)Classifiqueasvariveisemquantitativa(contnuaoudiscreta)ouqualitativa(ordinalou nominal): a)Cor dos cabelos:b)Nmero de filhos: c)O ponto obtido em cada jogada de um dado: d)Nmero de peas produzidas por hora de certa mquina: e)Dimetro externo de uma pea: f)Precipitao pluviomtrica de uma cidade, durante um ano: g)Nmero de aes negociadas na Bolsa de Valores de So Paulo: h)Sexo dos filhos de casais residentes em certa cidade: i)Nmero de volumes das bibliotecas da Universidade de So Paulo: 9)Os dados referem-se ao capital de giro mensal (em mil reais) de 81 editoras do Brasil. 810152333343537424545474848 50 5050515354545557585860606060 60 6161616262636364646465656666 66 6666666767676869707070717171 71 7373747475757575767677777981 81 838585868892 a)Construa uma distribuio de frequncia por CLASSES para os dados acima e determine todas as frequncias, inclusive as frequncias acumuladas acima de e abaixo de. b)Com base nas frequncias obtidas em a e sabendo que o nvel mnimo admissvel pelo mercado de32milreais,quantasempresasestooperandoabaixodomnimoequalopercentual correspondente?Supondonormalafaixade44a56milreaiseaindaconformeasmesmas frequncias,quantasempresasestooperandodentrodanormalidadeequalopercentual correspondente?c)Desenho um histograma para a distribuio de frequncias em classes. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 39 10) Combasenasnotasobtidaspor50alunosdeumaturmadePedagogia,completea distribuio de frequncia e construa um histograma para a tabela: 1234566778 2334566788 2344566789 2345566789 2345567789 Classes (Notas)fiPm (X)f % % f % f F F 0 |- 2 2 |- 4 4 |- 6 6 |- 8 8 |- 10 Total 11) Considere a seguinte distribuio de salrios para uma amostra de professores de uma determinada escola.Salrios (R$)Nmero de professores 1500 180028 1800 210032 2100 240020 2400 27006 2700 30004 a)Qual intervalo salarial corresponde aos 10% mais bem remunerados?b)Qual intervalo salarial corresponde aos 15% mais mal remunerados?c)Qual intervalo salarial corresponde aos 66% mais mal remunerados?d)A partir de que salrio est os 18 professores mais bem pagos? Qual seu percentual? EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 40 UNIDADE II MEDIDAS DE TENDNCIA CENTRAL E DISPERSO 2.1 MEDIDAS DE TENDNCIA CENTRAL Os dados quantitativos, apresentados em tabelas e grficos, constituem a informao bsica doproblema.Masconvenienteapresentarmedidasquemostremainformaodemaneira resumida. Medidas de Tendncia Central So medidas que tendem para o centro da distribuio e tm a capacidade de represent-la como um todo.Doovalordopontoemtornodoqualosdadossedistribuem.Asprincipaisso:Mdia Aritmtica, Mediana e Moda e algumas. 2.1.1 - Mdia Aritmtica Amdiaaritmticapodeserdefinidaemdoistipos:populacional( )eamostral( X).Nosdois casos existem trs situaes quanto aos clculos. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 41 1.Dados apresentados em forma de rol: A mdia ser: rol do elementos de nmerorol do elementos os todos de somanxXni= ==1 i

Exemplo 2.1: Peso em quilogramas dos alunos de uma turma de Pedagogia (50, 62, 70, 86, 60, 64, 66, 77, 58, 55, 82, 74)X=67 Anlise: o peso mdio dos alunos dessa turma de 67 kg. Exerccio2.1:Umgerentedeumalivrariaquerestudaramovimentaodeleitoresemseu estabelecimento, constata que 195, 1.002, 941, 768 e 1.283 leitores entraram no seu estabelecimento nosltimoscincodias.Descubraonmeromdiodepessoasqueentraramdiariamenteneste estabelecimento no referido perodo. 2.Dados apresentados em forma de distribuio de frequncia simples: A mdia ser: ===n1 iini iff xX1 i Exemplo 2.2: Nmero de cries em crianas de uma turma da alfabetizao X01234Total f24106527

2,327(4).(5) (3).(6) (2).(10) (1).(4) (0).(2)ff xXn1 iini i=+ + + += ===1 i Anlise: Verifica-se que o nmero mdio de cries das 27 crianas observadas no estudo de 2,3 cries por criana. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 42 Exerccio2.2:Asinformaesabaixoapresentamaidadedealunosdeensinoparaadultos.Determine a idade mdia desses alunos. Idadefi 372 384 395 406 413 424 432 Total26 3.Dados apresentados em forma de distribuio de frequncia em classes: A mdia ser: ===n1 iin1 ii mff PX Exemplo2.3:Nmeromdiodehorasdeestudopordiade100alunosdopr-vestibulardeuma determinada escola de Natal. ClassesfiPm 1,5 2,031,75 2,0 2,5162,25 2,5 3,0312,75 3,0 3,5343,25 3,5 4,0113,75 4,0 4,544,25 4,55,014,75 Total100- 3100(4,75).(1) ) (2,25).(16 (1,75).(3)ff PXn1 iini m=+ + += ===1 i Anlise: Verifica-se que o nmero mdiode horas de estudo por dia 100 alunos de aprox. 3 horas. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 43 2.1.2 - Mediana Valor que divide a distribuio em duas partes iguais, em relao quantidade de elementos. Isto , ovalorqueocupaocentrodadistribuio,deondeseconcluique50%doselementosficam abaixo dela e 50% ficam acima. Colocadosemordemcrescente,amediana(MedouMd)ouvalorquedivideaamostra,ou populao, em duas partes iguais. 0Med100% a)VarivelDiscreta:osdadosestodispostosemformaderolouemumadistribuiode frequncia simples. Se "n" for mpar: Med = elemento central (de ordem 12n + | | |\ ) Exemplo 2.4: Dados em forma de rol Seja a amostra: 8, 10, 12, 14, 16Med =5 132+ | |= |\

elemento do rol = 12 Interpretao: o 3 elemento do rol (12) divide 50% da distribuio dos dados direitae esquerda. Exemplo 2.5: Dados em uma distribuio de frequncia simples Suponha a seguinte distribuio de frequncia simples. Xfi F111 234 359 4211 Total11- EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 44 n = 11 (mpar) Elemento mediano: [(n+1)/2] = 6 elemento 3 classe contm o 6 elementoMed = 3. Se "n" for par: Med = mdia aritmtica dos dois elementos centrais (de ordem 2n | | |\ e12n | |+ |\ )Exemplo 2.6: Dados em forma de rol Seja a amostra: 8, 10, 12, 14, 16, 1963elemento do rol2 261 1 4elemento do rol2 2nn| | | |= = ||\ \ | | | |+ = + = ||\ \

Med = 3elemento 4elemento 12 14132 2Mediana+ += = = Interpretao: a mdia do 3 e 4 elemento do rol (13) divide 50% da distribuio dos dados direita e esquerda. Exemplo 2. 7: Dados em uma distribuio de frequncia simples Suponha a seguinte distribuio de frequncia simples. Xfi F8255 851015 871530 89838 90442 Total42- n = 42 (par) Elemento mediano: (n/2) = 21 elemento (n/2) + 1 = 22 elemento 3 classe contm o 21 e o 22 elemento Med = (87 + 87)/2 = 87 EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 45 b)VarivelContnua:osdadosestoagrupadosemumadistribuiodefrequnciasemclasses, ento: 1 Passo: Organizar os dados em forma de rol (ordem crescente); 2 Passo: Calcular a ordem (n/2). Como a varivel contnua no importa se par ou mpar. 3Passo:Atravsda F identificaraclassequecontmamediana,isto,aposioda mediana. 4 Passo: Utilizar a frmula: MedMedMedMed.ifF PLI Med|||

\| + = -LIMed = limite inferior da classe que contm a mediana; -PMed= posio da mediana =2 fi / = x elemento; - -F= frequncia absoluta acumulada "abaixo de" da classe anterior classe que contm a mediana; -fMe = frequncia absoluta da classe que contm a mediana; -iMe = intervalo da classe que contm a mediana; Exemplo 2.8: Utilizando os dados do Exemplo 2.3 da pg. 42 (Nmero mdio de horas de estudo pordiade100alunosdopr-vestibulardeumadeterminadaescoladeNatal).Nestecaso,a mediana dada por: ClassesfiPm F1,5 2,031,753 2,0 2,5162,2519 2,5 3,0312,7550 3,0 3,5343,2584 3,5 4,0113,7595 4,0 4,534,2598 4,55,014,7599 Total99-- EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 46 PMe = (n/2) (99/2) 49,5 50 elemento3 classe: [2,5; 3,0) 3 ) 0,5 .(3119 - 502,5 .ifF PLI MedMedMedMedMed= ||

\|+ =|||

\| + = 2.1.3 - Moda o valor que ocorre com maior frequncia na srie, ou seja, aquele que mais se repete. Exemplo 2.9: Na srie 3, 4, 5, 7, 7, 7, 9, 9Mo = 7 SRIE UNIMODAL (tem uma nica moda) Exemplo 2.10: Na srie 3, 5, 6, 6, 6, 7, 8 Mo = 6 SRIE BIMODAL (ocorrem duas modas) Exemplo 2.11: Na srie 2, 5, 5, 5, 6, 7, 9, 9, 9, 10, 10 Mo1 = 5 e Mo2 = 9 SRIE TRIMODAL (ocorrem trs modas) Exemplo 2.12: Na srie 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, 9, 9 Mo1 = 4, Mo2 = 7 e Mo3 = 9 SRIE POLIMODAL (ocorrem quatro ou mais modas) Exemplo 2.13: Na srie 0, 0, 1, 3, 3, 4, 7, 8, 8, 11, 12, 12, 13, 13Mo1 = 0, Mo2 = 3, Mo3=8,Mo4 = 12 e Mo5 = 13 SRIE AMODAL (no existe moda) Exemplo 2.14: Na srie 0, 1, 3, 4, 7, 8no existe moda EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 47 a)DADOS APRESENTADOS EM UMA DISTRIBUIO DE FREQUNCIA SIMPLES. Mo = elemento que tenha maior frequncia Exemplo 2.15: Notas de 61 alunos de uma determinada matria. Notas f 113 315 625 108 Total61 Anlise: Mo = A nota que mais se repete dentre as obtidas pelos alunos a nota 6. Exemplo 2.16: Conceito final da disciplina Estatstica Aplicada de 1.136 alunos de Mestrado de uma determinada Universidade de uma regio. Conceito f A547 B441 C123 D25 Total1136 Anlise: Mo = O conceito que mais se repete dentro os dos alunos o conceito A. b)DADOS APRESENTADOS EM UMA DISTRIBUIO DE FREQUNCIA CLASSES. Nesse caso, a moda pode ser determinada atravs de quatro processos. So eles: Moda Bruta, Moda de Pearson, Moda de Czuber e Moda de King. No entanto, neste curso sero apresentadas apenas as duas primeiras. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 48 1.Moda Bruta (MoB) Corresponde ao ponto mdio da classe modal, ou seja: M2i sOBL L += Exemplo2.17:Nmerodereprovaesdealunosem2010segundoescoladeumadeterminada regio do Nordeste. Classesfi 1 25 2 313 3 432 4 518 5 611 6 72 783 Total84 Anlise:Aclassequemaistemrepresentatividadedentreasdemaisa3classe(34),com fi = 32. Ou seja, h 32 alunos (38,09%) quetiveram de 3a 4 reprovaes nessa escola. 2.Moda de Pearson (MoP) Utilizadamaisespecificamente,juntamentecomXeMed,paramostrarocomportamentoda distribuio, em relao concentrao ou no de seus elementos. 3 - 2PMo Med X = Utiliza-se a MoP para a anlise da assimetria. a)Assimetria esquerda:oPM Med X < < (concentrao direita ou nos valores maiores); b)Simtrica: X Med MoP= =(concentrao no centro); c)Assimetria direita: X Med MoP< 0, a distribuio assimtrica direita ou positiva.c) Se a = 0 a distribuio simtrica. Assimtrica Direita Simtrica Assimtrica Esquerda EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 63 CURTOSE OU ACHATAMENTO Medemograudeconcentraodoselementosdeumadistribuioatravsdocoeficiente percentlico de curtose k: ( )3 190 102Q QkP P= Anlise: Em relao ao achatamento, a) Se K = 0,263 A distribuio NORMAL MESOCRTICA.

b) Se K < 0,263 A distribuio AFUNILADA LEPTOCRTICA. c) Se K > 0,263 A distribuio ACHATADA PLATICRTICA. AchatadaNormalAfunilada Exemplo 2. 26: Os dados abaixo esto relacionados ao tempo de trabalho (em anos) de professores de uma determinada escola tcnica.XfFPmPm f Pm2 Pm2 f 00 022727127127 02 0425523759225 04 062173510525525 06 08128578449588 08 10109599081810 10 1251001155121605 Total100--436-2780 Para a tabela acima determine: a)Verifique a assimetria dos dados (se esquerda ou direita). b)Verifique o grau de curtose dos elementos da distribuio. FF% F%EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 64 Soluo: (a) Para verificar a assimetria dos dados, esta se d pela frmula PX - Mo. aS= Noentanto,sernecessrioencontrarovalordedamdiaX,dodesviopadroamostralS,eda Mediana (para encontrar o valor de MoP).Calculando a mdia: nm i1nii 1P f436X 4, 36100fi=== = = Ou seja, em mdia os professores trabalham nessa escola h 4,36 anos. Calculando a Mediana: Med100P 50elemento2 2f= = = Est na 2 classe! 50 27. 2 2 3,84 anos25MedMed MedMedP FMed LI if| | | |= + = + = ||\ \ Ouseja,dosprofessoresdessaescolatcnica,metadedelestmat3,84anosdetrabalhonela. Assim, agora podemos calcular a Moda de Pearson. Calculando a Moda de Pearson: ( ) ( ) 3 - 2 3 3,84 2 4, 36 11,52 8, 72 2,8PMo Med X = = = = Ouseja,dosprofessoredessaescolas,amaioriaaproximadamentetem2,8anosdetempode trabalho nela. Calculando o desvio-padro amostral: ( ) ( )2224361 12780 8,88 2, 98 anos1 100 1 100Pm fs Pm fn n = = = =

EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 65 Verificando a assimetria dos dados: PX - Mo 4, 36 2, 80,5232, 98aS= = = Assim, como a > 0, ento a distribuio assimtrica direita. Logo, h uma maior concentrao (representatividade)deprofessoresdireitadadistribuio,ouseja,hmaisprofessorescom poucos anos de trabalho nessa escola do que os que tem uma maior quantidade de tempo. Assim, a distribuio pode ser comparada a figura abaixo: Assimtrica Direita (b) Para averiguar sobre ou grau de curtose ou achatamento da distribuio, em que esta se d pela frmula ( )3 190 102Q QkP P=. Ser necessrio primeiro encontrar o valor do 1 e 3 quartil e do 10 e 90 percentil. Assim, temos: Calculando os quartis: [ ]10, 25 100 25Q if = = elemento1 Classe! (De acordo com a coluna F). 1 1 1125 0. 00 2 1,85 anos27Q iQ QQf FQ LI if| | | | | = + = + = | |\ \ Ou seja, 25% dos professores tm at 1,85 anos de trabalho nessa escola. [ ]30, 75 100 75Q if = = elemento4 Classe! (De acordo com a coluna F). 3 3 3375 73. 6 2 6, 33 anos12Q iQ QQf FQ LI if| | | | | = + = + = | |\ \ Ou seja, 75% dos funcionrios tm at 6,33 anos de trabalho nessa empresa. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 66 Calculando os percentis: [ ]100,1 100 10P if = = elemento1 Classe! (De acordo com a coluna F). 1010 10 101010 0. 00 2 0, 74 anos27P iP PPf FP LI if| | | | | = + = + = | |\ \ Ou seja, 10% dos professores tm menos de 1 ano de trabalho nessa escola. [ ]900, 90 100 90P if = = elemento4 Classe! (De acordo com a coluna F). 90 90 909090 73. 6 2 8,83 anos12P iP PPf FP LI if| | | | | = + = + = | |\ \ Ouseja,90%dosprofessorestmat8,83anos(aproximadamente9anos)detrabalhonessa escola. Verificando o grau de curtose ou achatamento: ( ) ( )3 190 106, 33 1, 85 4,480, 27692 2 8, 83 0, 74 16,18Q QkP P = = = = Assim,comok>0,263,entoadistribuioACHATADAoutambmconhecidacomo PLATICRTICA. A distribuio pode ser representada como a figura abaixo: Distribuio Achatada EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 67 2.4 EXERCCIOS 1)Parafazerumaavaliaopsicotcnica.Umcandidatoaauditordeverealizarquatro etapas distintas. Sendo denominados, respectivamente, peso 3, 4, 2 e 3 para cada uma das quatroetapas.Asnotasdocandidatonastrsprimeirasetapasforam:1etapa(7,5 pontos),2etapa(6,2pontos),3etapa(5,0pontos).Paraquesejaaprovadocomanota mnima para tal (7,0 pontos), quanto o candidato deve tirar na 4 etapa? 2)Atabelaabaixomostraadistribuiodesalriosemumaamostraaleatriade250 professores de certa escola do ensino fundamental. Salrios (R$)Nmero de professores 1500 1800100 1800 210060 2100 240050 2400 270040 a)Qual o salrio mdio (R$) dos professores dessa escola? b)Calcule a mediana e interprete. c)Calcule a moda de Pearson. d)Verifique a assimetria dos dados. e)Verifique o grau de curtose dos elementos da distribuio. 3)Asidades,emanos,de20alunosdeumaturmaespecialdealfabetizaoparaadultos, esto representadas na tabela seguinte: IdadesNmero de alunos 45 553 55 657 65 754 75 855 85 951 a)Qual a distncia mdia (em anos) dos alunos dessa turma? b)Calcule a mediana e interprete. c)Calcule a moda de Pearson e informe sobre a simetria da distribuio. d)Verifique a assimetria dos dados. e)Verifique o grau de curtose dos elementos da distribuio. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 68 4)De uma turma de alunos fsica, foi retirada uma amostra de 9 estudantes que indica a sua notanaprovareferenteaoassuntodeMecnicaClssicaeFsicaModernano primeiro semestre de 2010: As notas so disponibilizadas a seguir: 123444567 a)Calcule a Moda de Pearson b)Calcule o desvio-padro e a varincia dos dados. c)Calcule os trs quartis para a distribuio e interprete. 5) Na biblioteca da UFRN (Biblioteca Central Zila Mamede), foi realizado um estudo sobre seuacervodelivros.Dentreosinmerositensaveriguados,pode-sedestacarograude conservao do livro (este numa escala de 1 a 10, em que, quanto maior o nmero, maior o graudeconservao)epesodolivro(emgramas).Abaixoestoamdiaeodesviopadro dessas duas variveis: Mdia -XDesvio padro - S Estado de conservao52,56 Peso (gramas)480388,98 Compare a variabilidade do Estado de conservao com a variabilidade do Peso dos livros.Utilizeamedidadedispersoadequadaparatalcomparaoejustifiquesua escolha. 6)Osdadosabaixosereferemquantidadederesmasdepapelutilizadasemuma Universidade Federal durante 16 meses. 5090120170180180180240250280360480560560570590 Calcule: a)Mdia; b)Mediana; c)Moda Bruta e Moda de Pearson; d)Q1, Q2 e Q3; e)D3, D4, D8 e D9; f)P17; P28; P50; P58; P89 e P95. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 69 UNIDADE III ANLISE EXPLORATRIA DE DADOS 3.1 RAMO-E-FOHAS Trata-se de um procedimento alternativo para se resumir e analisar um conjunto de valores, com o objetivo de se obter uma ideia da forma de sua distribuio (assimetria), com a vantagem sobre o histograma de no perder informaes. Exemplo3.1:Construirumramo-e-folhasparaasnotasdeumaturmadePedagogiaecomenta sobre a assimetria: 1 2 2 3 3 3 4 4 4 4 4 5 5 5 5 5 5 5 5 6 6 6 6 6 7 7 7 8 8 9. Soluo: 1x 2xx 3xxx 4xxxxx 5xxxxxxxx 6xxxxx 7xxx 8xx 9x Anlise: A distribuio aparentemente simtrica, com uma maior concentrao na nota 5. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 70 Exemplo 3.2: Construa como no exemplo anterior, um ramo-e-folhas para o conjunto de nmeros a seguir e comentar sobre a assimetria. Salrio (em salrios mnimos) de 36 professores de uma Universidade Federal: 04,0004,5605,2505,7306,2606,6606,8607,3907,4407,5908,1208,4608,74 08,9509,1309,3509,7709,8010,5310,7611,0611,5912,0012,7913,2313,60 13,8514,6914,7115,9916,2216,6117,2618,7519,4023,30 Soluo: 40056 52573 6266686 7394459 812467495 913357780 105376 110659 120079 13236085 146971 1599 162261 1726 1875 1940 20 21 22 2330 Anlise: A distribuio aparentemente assimtrica direita. Ou seja, h mais professores com menores salrios que os professores com salrios maiores. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 71 3.2 - ESQUEMA DOS 5-NMEROS Nocasodeumadistribuiocomoutliers,noidealrepresentarumconjuntodevalores comousodamdiaedodesvio-padro,poisdevidoapresenadevaloresextremos,elasforam afetados. Tukey (1970, 1977) sugeriu o uso de cinco medidas para analisar casos como esse, sendo elas: -Limite Inferior (Li) e Limite Superior ( Ls) -Q1, Q2 e Q3 Forma de representao: Notaes: a) Q3 - Q1 = Intervalo interquartil (dj) b) Me - Li = Disperso inferior c) Ls - Me = Disperso superior.

Estascincomedidassochamadasdeestatsticadeordemesomedidasresistentesde posiodeumadistribuio.Dizemosqueumamedidadeposioresistentequandoforpouco afetadapormudanasdeumapequenaporodosdados.Amedianaumamedidaresistente,ao passo que a mdia no o . 3.3 - BOX-PLOT a representao grfica dos 5-nmeros, em que so destacados o intervalo interquartil (dj) e as observaes discrepantes, ou seja: valores menores que Q dj 132ou maiores queQ dj 332+ . (Os pontos discrepantes so representados por um asterisco ou travesso). O desenho esquemtico (Figura 3.1) d uma ideia da posio, disperso, assimetria, caudas e dadosdiscrepantes.Aposiocentraldosvaloresdadapelamedianaeadispersopordj.As LsQ2 = Med Li Q3Q1 EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 72 posiesrelativasdeQ1,Q2eQ3,doumanoodaassimetria.Ascaudassoaslinhasacimae abaixo do retngulo (ou caixa). (Q3 + 3/2dj) LS Q1 LI (Q1 - 3/2dj) Q2 = Med Q3 Figura 3. 1: Desenho esquemtico do Box-plot Exemplo 3.3: Os dados abaixo so referentes ao peso em quilogramas de 40 alunos de uma turma de Engenharia de Produo. Construa um Boxplot e faa uma breve descrio sobre os dados.47,5505057,56062,363,263,564,565,1 72,272,374,174,8 75,776,27979,279,3 81,5 82,18485,388,188,59092,694,7 95,59698,398,799,2100101,2110122,7125,9134,6 136,2 O que vamos precisar: LI = 47,5 LS = 136,2 1231 4010elemento = 65,14 42 4020elemento = 81,543 4030elemento = 964ooox nQQ MedianaQ = = == = == = dj = Q3 - Q1 = 96 65,1 = 30,9. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 73 Me - Li= 81,5 47,5 = 34 Ls - Me = 136,2 81,5 = 54,7 Assim, podemos calcular os limites que informaro se h pontos discrepantes (outliers). 313 396 30, 9 142,352 23 365,1 30, 9 18,752 2Q djQ dj| | | |+ = + = ||\ \ | | | | = = ||\ \ Logo,nohnenhumoutlier,umavezquenoexistenenhumalunocompesomaiorque137 quilogramas ou com peso menos que 47 quilogramas. O grfico representado abaixo: Podemosanalisarque25%dosalunospesamat65kg,equemetadedelespesamat81kg. Assim como metade deles pesam acima de 81 gramas. Analisa-se tambm que 75% dos estudantes pesam at 96 kg, assim como, 25% deles pesam no mnimo 96 kg. Chama-se ateno que o aluno de menor peso foi de 47 kg e o de maior peso foi de 136 kg. No h outliers na distribuio dos dados. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 74 3.4 Exerccios 1) Construa um ramo-e-folhas paras notas de uma turma de CinciasBiolgicas da UFRN e comente sobre a assimetria. 678728166965962 851096444 104 3 1076395 101416426 2) Construaumramo-e-folhasparaonmerodeprocessosquederamentradanoDAE (DiretoriadeAssuntosAcadmicos)daUFRNnosltimos32mesesecomentesobrea assimetria. 051035 40 425257636369717277 80 888889 90919299100 101 105 106 107 111 111 112 115 121 122 3) Construaumramo-e-folhasparasnotasdeumaturmadeAdministraodaUFRNe comente sobre a assimetria. 4,58,94,59,2104,87,96,56,86,78,41,56,81,52,89,75,87,89,82,57,57,57,98,07,06,36,0109,57,84,56,88,99,89,95,86,97,48,8 EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 75 4) OGrfico01informaonmeromdiodehorasdeestudopordiadeestudantesdopr-vestibulardeumadeterminadasescolatcnica.Realizeumadescriodosdadosapenas com as informaes do grfico. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 76 5) O Grfico 02 informa as notas de um exame de proficincia em lngua estrangeira (idoma: ingls)paraosalunosdoMestradoAcadmicodoscursosdeHistria,Geografiae Biblioteconomia.Realizeumadescriodasnotasobtidasnesseexameapenascomas informaesdogrfico.(Descrevacadavarivelseparada,posteriormentedescrevaasduas informando quem tem maior variabilidade, valores extremos, qual das duas apresenta o maior e menor ndice, e etc). Grfico 02 EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 77 REFERNCIAS BIBLIOGRFICAS [1] ARA,AmiltonBraio;MUSETTI,AnaVillares;SCHNEIDERMAN,Boris.Introduo Estatstica. Mau: Edgard Blucher, 2003. [2] AZEVEDO, Paulo Roberto de Medeiros. Introduo Estatstica. 2. Ed. Natal, RN: EDUFRN Editora da UFRN, 2009. [3] BARBETTA, Pedro Alberto. Estatstica Aplicada sCincias Sociais, EDITORA DA UFSC, Florianpolis, 1994. [4] BUSSAB, W. O.; MORETTIN, P. A. Estatstica Bsica. 6. Ed. So Paulo: Saraiva, 2010. [5] CRESPO, Antnio Arnot. Estatstica Fcil. 14. Ed. So Paulo: Saraiva, 1996. [6] FONSECA,JairoSimon;MARTINS,GilbertodeAndrade.CursodeEstatstica.6.Ed.14 Impresso. So Paulo: ATLAS, 2011. [7] MARTINS,GilbertodeAndrade;DONAIRE,Denis.PrincpiosdeEstatstica.4.Ed.12 Impresso. So Paulo: ATLAS, 2010. [8] MONTGOMERY,D.C.eRUNGER,G.C.EstatsticaAplicadaeProbabilidadepara Engenheiros. 4. Ed. Rio de Janeiro: LTC, 2009. [9] TRIOLA, M. F. Introduo Estatstica. 10. Ed. Rio de Janeiro: LTC, 2008. [10]VIEIRA, Snia. Elementos de Estatstica. 4. Ed. 6 Impresso. So Paulo: ATLAS, 2011. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 78 ANEXO ANEXO A ELEMENTOS DE MATEMTICA ANEXO B ALFABETO GREGO EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 79 ANEXO A ELEMENTOS DE MATEMTICA 1 SOMATRIOS Muitasvezesprecisoindicarasomadenvalores.Comoporexemplo,considerequen alunos fizeram uma prova e existe o interesse em calcular a mdia das notas obtidas. Deve-se ento somarasnotasedividirototalporn.Masaoperaodesomapodeserindicadademaneira bastante compacta. Para entender a indicao, primeiro imagine que os nomes dos alunos esto organizados em umalista,porordemalfabtica.Faax1indicaranotadoprimeiroaluno,x2indicaranotado segundo aluno e assim por diante, at xn, que ir indicar a nota do n-simo aluno. Ento, a soma das notas dos n alunos poderia ser indicada como segue: 1 2 3 4 2 1 n n nx x x x x x x + + + + + + + Em que os pontos significam e assim por diante. Entretanto, a maneira mais compacta de indicar essa soma como se segue: 1niix= Queselsomatriodexi,ide1an.Osmbolo,queindicaosomatrio,aletragrega maisculasigma.importantenotarqueondiceiassumevaloresinteiros,comeandopor1e terminando por n. Exemplo: Considere quatro nmeros: 1 2 3 42, 4, 3 e1 x x x x = = = = . fcil ver que nesse caso: 412 3 4 1 10iix== + + + = Emestatstica,muitasvezesprecisoindicaroquadradodasoma.Paraindicaroquadradoda soma, isto , para indicar( )21 2 3 nx x x x + + + + usando o somatrio, basta escrever: 21niix=| | |\ EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 80 Exemplo: Dados os nmeros 1 2 3 4 53, 4, 1, 2 e3 x x x x x = = = = = , fcil ver que: ( )252213 4 1 2 3 13 169iix=| |= + + + + = = |\ Outras vezes preciso indicar a soma de quadrados. Para indicar a soma de quadrados 2 2 2 21 2 3 nx x x x + + + + , usando o somatrio, basta escrever 21niix=. Exemplo: Considere os nmeros 1 2 33, 5 e1 x x x = = = . fcil ver que a soma de quadrados : 2 2 2 213 5 1 35niix== + + =. Finalmente,suponhadoisconjuntosdenmeros: 1 2, , ,nx x x e 1 2, , ,ny y y .Podehaverinteresse em obter a soma dos produtos 1 1 2 2 3 3 n nx y x y x y x y + + + + . usando somatrio, escreve-se 1ni iix y=. Exemplo:considereosnmeros 1 2 32, 3 e0 x x x = = = eosnmeros 1 2 31, 2 e5 y y y = = = .Asoma dos produtos : 312 1 3 2 0 5 8i iix y== + + = Para simplificar, muitas vezes se escreve x, y, xy, x2,( x)2, y2,( y)2. Isto pode ser feito, desde que esteja claro quais so os nmeros que devem ser formados. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 81 2 LOGARITMOS Sejam a e b dois nmeros tais que b > 0 e 0 < a 1. Por definio, logaritmo de b na base a um nmero x tal que ax = b. Escreve-se logbax = Para melhor entender a definio de logaritmo, considere eu voc quer obter o logaritmo de 8 na base 2. Escreva 82log x = . Dada a definio de logaritmo, tem-se que 2x = 8. Como 8 = 23, segue-se que 2x = 23. Logo x=3. Logaritmodecimaltodologaritmodebase10.Porfacilidade,abase,frequentemente, omitida. Imagine que voc quer calcular o logaritmo decimal de 100. Escreva log 100 = x. De acordo com a definio de logaritmo, x um nmero tal que 10x = 100. Como 100 = 102, segue-se que log 100 = 2. LOGARITMO NEPERIANO todologaritmodebasee,umnmeroirracionalquevale2,71828....Indica-selogaritmo neperiano por ln. Os logaritmos neperianos so muito usados na teoria Estatstica. EST0224 - Estatstica na Educao - Prof. Msc.Andr Luiz Sena da Rocha [email protected] 82 ANEXO B ALFABETO GREGO MAISCULOMINSCULONOME alfa beta gama delta psilon dzeta eta teta iota kapa lmbda mi ni ksi nicron pi r sigma tau ipsilon fi qui psi mega