Download pdf - Livro de Probabilidade

Transcript
  • Clculo das Probabilidades e Estatstica I Prof. Dr. Eufrsio de Andrade Lima Neto Tutor de EAD

    Curso de Matemtica - UFPBVIRTUAL [email protected]

    Ambiente Virtual de Aprendizagem: Moodle (www.ead.ufpb.br) Site do Curso: (www.mat.ufpb.br/ead)

    Site da UFPBVIRTUAL www.virtual.ufpb.br Telefone UFPBVIRTUAL (83) 3216 7257

    Carga horria: 60 horas Crditos: 04

    Ementa

    Conceitos Fundamentais. Distribuio de Frequncia. Tabelas e Grficos. Medidas de Posio e Disperso. Introduo Probabilidade. Variveis Aleatrias Unidimensionais. Esperana Matemtica. Distribuies Discretas e Contnuas. Noes Elementares de Amostragem. Estimao Pontual. Intervalos de Confiana e Testes de Hipteses. Correlao e Regresso.

    Descrio

    Esta disciplina servir de apoio ao educador em Matemtica no processo de tomada de deciso. Ao longo do curso o aluno ser apresentado a um leque de mtodos estatsticos, descritivos e inferenciais, com o intuito facilitar a manipulao e anlise de dados.

    Objetivos

    Ao final do curso, espera-se que o aluno 1. Possua competncia referente compreenso do significado de um experimento estatstico

    e saiba identificar as variveis a serem estudadas; 2. Esteja habilitado a reconhecer um grfico, uma tabela estatstica e fazer uma anlise dos

    dados ali apresentados; 3. Saiba fazer uma estimao pontual ou por intervalo de uma mdia ou proporo

    populacional; 4. Tenha criado uma concepo aplicada do conceito de teste de hiptese sobre a mdia e/ou

    sobre a proporo populacional, saiba formular tal teste e apresentar concluses sobre o mesmo.

    Unidades Temtica Integradas

    Unidade I: Anlise de Dados Estatsticos

    Conceitos Bsicos de Estatstica Fases do Experimento Estatstico Estatstica Descritiva Medidas Estatsticas

    Unidade II: Probabilidade

    Espao Amostral e evento O conceito de Probabilidade Propriedades Probabilidade em Espaos Amostrais Finitos Probabilidade Condicional Independncia de Eventos

  • 2

    Unidade III Variveis Aleatrias e Distribuies de Probabilidade

    O conceito de Varivel Aleatria Variveis Aleatrias Discretas Funo de Distribuio de Probabilidade Experimentos Binomiais e a Distribuio Binomial Distribuio Normal

    Unidade IV Teoria Elementar da Amostragem

    Conceitos Bsicos Tipos de Amostragem Distribuies Amostrais da Mdia e da Proporo

    Unidade V Intervalos de Confiana e Teste de Hiptese

    Estimao de Parmetros Intervalos de Confiana para a Mdia Populacional Determinao do Tamanho da Amostra para estimar mdias Intervalo de Confiana para uma Proporo Populacional Determinao do Tamanho da Amostra para estimar Propores Testes de Hipteses Conceitos Fundamentais Definio da Regra de Deciso, Erros e Nvel de Significncia Testes de Hipteses para a Mdia Populacional Testes de Hipteses para uma Proporo Populacional

    Unidade VI Correlao e Regresso

    Correlao: Conceitos Coeficiente de Correlao: Definio e Teste de Hipteses Regresso: Conceitos Regresso Linear Simples: Estimao dos Parmetros

  • 3

    Unidade I: Os Anlise de Dados Estatsticos

    1. Situando a Temtica

    A Estatstica considerada por alguns autores como Cincia no sentido do estudo de uma populao. considerada como mtodo quando utilizada como instrumento por outra Cincia.

    A palavra estatstica frequentemente est associada imagem de aglomerao de nmeros, dispostos em uma imensa variedade de tabelas e grficos, representando informaes to diversas quanto nascimentos, mortes, taxas, populaes, rendimentos, dbitos, crditos, etc. Isto devido ao uso comum da palavra estatstica como sinnimo de dados, como, por exemplo, quando falamos das estatsticas de uma eleio, estatsticas da sade, estatsticas de acidente de trnsito ou as estatsticas de acidentes de trabalho.

    No sentido moderno da palavra, estatstica lida com o desenvolvimento e aplicao de mtodos para coletar, organizar, analisar e interpretar dados de tal modo que a segurana das concluses baseada nos dados pode ser avaliada objetivamente por meio de proposies probabilsticas.

    O propsito da estatstica no exclusivo de qualquer cincia isolada. Ao contrrio, a estatstica fornece um conjunto de mtodos teis em toda rea cientfica onde haja a necessidade de se coletar, organizar, analisar e interpretar dados. Estes mtodos podem ser usados to eficazmente em farmacologia como em engenharia, em cincias sociais ou em fsica.

    2. Problematizando a Temtica

    Ao estudarmos fenmenos naturais, econmicos ou biolgicos tais como, a precipitao de chuvas em uma determinada regio, a evoluo da taxa de inflao em uma regio metropolitana, a influncia das mars no desenvolvimento de animais marinhos, etc., estamos lidando com experimentos cujos resultados no conhecemos e desejamos saber se as hipteses que afirmamos so verdadeiras, isto , se os fenmenos esto ocorrendo como espervamos. Para isto, necessrio que os dados oriundos das observaes possam nos dar informaes claras e precisas. Estes dados devem ser organizados de forma adequada para podermos fazer uma anlise crtica e fundamentada do fenmeno.

    A partir de agora voc est convidado a participar de uma experincia que consiste em obter um conjunto de dados, represent-lo em distribuies de frequncia e apresent-lo atravs de tabelas e grficos. Ver como algumas medidas estatsticas podem nos auxiliar nesta anlise e como utiliz-las.

    3. Conhecendo a Temtica

    3.1 Conceitos Bsicos de Estatstica

    Podemos considerar a Estatstica como um conjunto de mtodos e processos quantitativos que serve para estudar e medir os fenmenos coletivos.

    A estatstica teve acelerado seu desenvolvimento a partir do sculo XVII, atravs dos estudos de BERNOULLI, FERMAT, PASCAL, LAPLACE, GAUSS, GALTON, PEARSON, FISHER, POISSON e outros que estabeleceram suas caractersticas essenciais.

    A Estatstica tem como OBJETIVO o estudo dos fenmenos coletivos.

    A Estatstica a cincia que trata da coleta, do processamento e da disposio dos dados.

    Objetivando o estudo quantitativo e qualitativo dos dados (ou informaes), obtidos nos vrios campos da atividade cientfica, a Estatstica manipula dois conjuntos de dados fundamentais: a "populao" e a "amostra".

    Populao (ou Universo) o conjunto dos seres, objetos ou informaes que interessam ao estudo de um fenmeno coletivo

    segundo alguma(s) caracterstica(s). , portanto, um conjunto definido de informaes relativas a qualquer rea de interesse, podendo, quanto ao nmero de elementos, ser: finita (tamanho N) ou infinita. Na maioria

  • 4

    das vezes no conveniente, ou mesmo possvel, realizar o levantamento dos dados referentes a todos os elementos de uma populao. Portanto, analisamos parte da populao, isto , uma amostra.

    Amostra um subconjunto no vazio ou parte da populao. Duas consideraes devem ser feitas sobre o

    estudo amostral dos fenmenos. Uma diz respeito aos cuidados que se deve tomar para assegurar que a amostra seja representativa da populao. Para atender a essa exigncia, deve-se selecionar os elementos de forma aleatria, de modo que todo e qualquer elemento da populao tenha a mesma chance de participar da amostra, a outra diz respeito preciso dos dados coletados, buscando minimizar os erros que poderiam induzir a concluses equivocadas. O nmero de elementos de uma amostra chamado o tamanho da amostra, e denotado por n.

    Definio 1.1: Parmetro Uma caracterstica numrica estabelecida para toda uma populao denominada parmetro. So

    valores, geralmente desconhecidos (e que portanto tm de ser estimados), que representam certas caractersticas da populao.

    Definio 1.2: Estimador uma caracterstica baseada em observaes amostrais e usada para indicar o valor de um parmetro

    populacional desconhecido.

    Definio 1.3: Estimativa O valor numrico assumido pelo estimador numa determinada amostra denominada estimativa.

    Exemplo 1.1: No fenmeno coletivo eleio para reitor da UFPB, a populao o conjunto de todos os eleitores

    habilitados na Universidade. Um parmetro a proporo de votos do candidato A. Uma amostra pode ser um grupo de 300 eleitores selecionados em toda a UFPB. Um estimador a proporo de votos do candidato A obtida na amostra. O valor resultante do estimador, a proporo amostral, a estimativa.

    Processos Estatsticos de Abordagem Quando solicitados a estudar um fenmeno coletivo podemos optar entre os seguintes processos

    estatsticos: a) CENSO - avaliao direta de um parmetro, utilizando-se todos os componentes da populao. Entre

    as principais caractersticas de um Censo, podemos destacar: admite erro processual zero e tem confiabilidade 100%, caro, lento e quase sempre desatualizado. Nem sempre vivel.

    b) AMOSTRAGEM (INFERNCIA) - avaliao indireta de um parmetro, com base em um estimador atravs do clculo das probabilidades. Entre as principais caractersticas, podemos destacar: admite erro processual positivo e tem confiabilidade menor que 100%, barata, rpida e atualizada. sempre vivel.

    Dados Estatsticos Normalmente, no trabalho estatstico, o pesquisador se v obrigado a lidar com grande quantidade de

    valores numricos resultantes de um censo ou de uma amostragem. Estes valores numricos so chamados dados estatsticos.

    No sentido da disciplina, a Estatstica ensina mtodos racionais para a obteno de informaes a respeito de um fenmeno coletivo, alm de obter concluses vlidas para o fenmeno e tambm permitir tomada de decises, atravs dos dados estatsticos observados. Desta forma, a estatstica pode ser dividida em duas reas: Estatstica Descritiva e Estatstica Inferencial.

    Estatstica Descritiva a parte da Estatstica que tem por objetivo descrever os dados observados. A Estatstica Descritiva,

    na sua funo de descrio dos dados, tem as seguintes atribuies: A obteno dos dados estatsticos; A organizao dos dados; A reduo dos dados; A representao dos dados e A obteno de algumas informaes que auxiliam a descrio do fenmeno observado.

  • 5

    A obteno ou coleta dos dados normalmente feita atravs de um questionrio ou de observao direta de uma populao ou amostra. A organizao dos dados consiste na ordenao e crtica quanto correo dos valores observados, falhas humanas, omisses, abandono de dados duvidosos, etc. A reduo dos dados envolve o entendimento e a compreenso de grande quantidade de dados atravs de simples leitura de seus valores individuais uma tarefa extremamente rdua e difcil mesmo para o mais experimentado pesquisador. A representao dos dados compreende de tcnicas para uma melhor visualizao dos dados estatsticos, facilitando sua compreenso. Por exemplo, os grficos, quando bem representativos, tornam-se importantes instrumentos de trabalho. ainda atributo da Estatstica Descritiva a obteno de algumas informaes que sumarizam os dados, facilitando a descrio dos fenmenos observados.

    Estatstica Inferencial (ou Indutiva) a parte da Estatstica que tem por objetivo obter e generalizar concluses para a populao a partir

    de uma amostra. Complementando o processo descritivo, a Estatstica Indutiva estuda parmetros a partir do uso de estimadores usando o clculo das probabilidades, elemento este que viabiliza a Inferncia Estatstica.

    Dados ou Variveis Estatsticas As informaes ou dados caractersticos dos fenmenos ou populaes so denominados variveis

    estatsticas ou simplesmente variveis. Conforme suas caractersticas particulares, podem ser classificadas da seguinte forma:

    Quantitativas - So aquelas que podem ser expressas em termos numricos. Em geral so as resultantes de medies, enumeraes ou contagens. So subdivididas em contnuas e discretas, conforme abaixo:

    o Contnuas - so aquelas que podem assumir qualquer valor num certo intervalo de medida, podendo ser associados ao conjunto dos nmeros reais, ou seja, um conjunto no enumervel. Entre outras, enquadram-se nesta categoria as medidas de tempo, comprimento, espessura, rea, volume, peso, velocidade, dosagem de hemoglobina no sangue, concentrao de flor na gua oferecida populao, etc.

    o Discretas - quando s podem assumir determinados valores num certo intervalo, ou seja, um conjunto finito ou enumervel. Em geral, representam nmeros inteiros resultantes de processo de contagem, como o nmero de alunos por sala, de crditos por disciplinas, de pacientes atendidos diariamente num hospital, etc.

    De modo geral, as medies do origem a variveis contnuas e as contagens ou enumeraes, a variveis discretas. Designamos estas variveis por letras latinas, em geral, as ltimas: X, Y, Z.

    Qualitativas - Nem sempre os elementos de uma populao so exclusivamente contveis. Muitas vezes, eles podem ser qualificados tambm segundo algumas de suas caractersticas tpicas. Nesses casos, as variveis podem ser agrupadas em nominais ou ordinais (por postos)

    o Nominais - quando puderem ser reunidas em categorias ou espcies com idnticos atributos. Aqui se incluem os agrupamentos por sexo, rea de estudo, desempenho, cor, raa, nacionalidade e religio.

    o Ordinais - quando os elementos forem reunidos segundo a ordem em que aparecem dispostos numa lista ou rol. So tpicas desta forma de agrupamento, variveis como classe social, grau de instruo, entre outras.

    Em geral, uma mesma populao pode ser caracterizada por mais de um tipo de varivel. Assim, os inscritos num vestibular, por exemplo, podem ser contados, medidos ou pesados, podem ser agrupados segundo o sexo ou rea de estudo e podem ainda ser classificados segundo as notas obtidas nas provas prestadas.

    3.2 Fases do Experimento Estatstico

    Em linhas gerais, podemos distinguir no mtodo estatstico as seguintes etapas:

    3.2.1 Planejamento

    o trabalho inicial de coordenao no qual define-se a populao a ser estudada estatisticamente, formulando-se o trabalho de pesquisa atravs da elaborao de questionrio, entrevistas, etc.

  • 6

    A organizao do plano geral implica em obter respostas para uma srie tradicional de perguntas, antes mesmo do exame das informaes disponveis sobre o assunto, perguntas que procuram justificar a necessidade efetiva da pesquisa, a saber:

    - "quem", "o que", "sempre", "por que", "para que", "para quando".

    Imaginemos, por exemplo, que o Governo do Estado tenha necessidade de obter informaes acerca do desempenho em Matemtica dos estudantes matriculados na rede pblica de ensino.

    O primeiro trabalho da equipe encarregada da pesquisa, ser evidentemente, o de obter respostas para aquelas perguntas. Seriam ento:

    - Quem deseja as informaes? - O que devemos perguntar no questionrio? - A pesquisa ser peridica ou ocasional? Ser executada sempre? - Por que desejam as informaes? - Quando dever estar concluda a pesquisa? - Qual a poca oportuna para a aplicao dos questionrios? - Para que desejam as informaes?

    Ainda na fase do planejamento, temos:

    O exame das informaes disponveis: trabalho inicial de coleta de trabalhos ou publicaes sobre o assunto, obtendo-se relatrios sobre atividades semelhantes ou correlatas;

    A Definio do Universo, isto , saber qual o conjunto a ser pesquisado, distribuindo, classificando ou agrupando os elementos desse conjunto em subpopulaes, para permitir um trabalho mais fcil, mais lgico, mais racional;

    O tipo de levantamento, Censo ou Amostragem, dever ser decidido com a devida antecedncia e a necessria anlise das vantagens e desvantagens de um e de outro, em virtude do custo financeiro e do prazo determinado para a concluso do trabalho.

    3.2.2 Coleta de Dados

    Aps cuidadoso planejamento e a devida determinao das caractersticas mensurveis do fenmeno coletivamente tpico que se quer pesquisar, damos incio coleta dos dados numricos necessrios sua descrio.

    A coleta dos dados poder ser feita de diversas formas. A ideal aquela que maximiza os recursos disponveis, dados os objetivos e a preciso previamente estipulados. No seu planejamento, deve-se considerar o tipo de dado a ser coletado, o local onde este se manifestar, a frequncia de sua ocorrncia, e outras particularidades julgadas importantes.

    Quando os dados se referirem ou estiverem em poder de pessoas, sua coleta poder ser realizada mediante respostas a questionrios previamente elaborados. Esses questionrios podem ser enviados aos entrevistados para devoluo posterior ou podem ser aplicados pelos prprios pesquisadores ou por entrevistadores externos ou contratados.

    Os dados ou informaes representativas dos fenmenos ou problema em estudo podem ser obtidos de duas formas: por via direta ou por via indireta.

    1. Por via direta - quando feita sobre elementos informativos de registro obrigatrio (p. ex.: fichas no servio de ambulatrio, nascimentos, casamentos, bitos, matrculas de alunos etc.) ou, ainda, quando os dados so coletados pelo prprio pesquisador atravs de entrevistas ou questionrios. A coleta direta de dados, com relao ao fator tempo, pode ser classificada em: 1.1. Contnua - tambm denominada registro, feita continuamente, tal como a de nascimentos e

    bitos, etc. Tambm so do tipo contnuo o registro de certas doenas, como cncer, hansenase, tuberculose e tambm algumas doenas infecciosas agudas com finalidade de controle.

    1.2. Peridica - quando feita em intervalos constantes de tempo, como os censos(de 10 em 10 anos), os balanos de uma farmcia, etc.;

    1.3. Ocasional - quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergncia, como no caso de epidemias que assolam ou dizimam seres humanos

  • 7

    2. Por via indireta - quando inferida de elementos conhecidos (coleta direta) e/ou conhecimento de outros fenmenos relacionados com o fenmeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que feita atravs de dados colhidos via coleta direta.

    3.2.3 Crtica dos Dados

    Os dados colhidos por qualquer via ou forma e no previamente organizados so chamados de dados brutos. Esses dados brutos, antes de serem submetidos ao processamento estatstico propriamente dito, devem ser "criticados", visando eliminar valores imprprios e erros grosseiros que possam interferir nos resultados finais do estudo.

    A crtica externa quando visa s causas dos erros por parte do informante, por distrao ou m interpretao das perguntas que lhe foram feitas; interna quando se observa o material constitudo pelos dados coletados. o caso, por exemplo, da verificao de somas de valores anotados.

    3.2.4 Apurao ou Processamento dos Dados

    Uma vez assegurado que os dados brutos so consistentes, devemos submet-los ao processamento adequado aos fins pretendidos. A apurao ou processamento dos dados pode ser manual, eletromecnica ou eletrnica. Os processos e mtodos estatsticos a que um conjunto de dados pode ser submetido sero nosso objeto de estudo nas sees seguintes.

    3.2.5 Exposio ou Apresentao dos Dados

    Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada (tabelas ou grficos), tornando mais fcil o exame daquilo que est sendo objeto de tratamento estatstico.

    No caso particular da estatstica descritiva, o objetivo do estudo se limita, na maioria dos casos, simples apresentao dos dados, assim entendida a exposio organizada e resumida das informaes coletadas atravs de tabelas ou quadros, bem como dos grficos resultantes.

    Anlise dos Resultados Como j dissemos, o objetivo ltimo da Estatstica tirar concluses sobre o todo (populao) a

    partir de informaes fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatstica Descritiva), fazemos uma anlise dos resultados obtidos, atravs dos mtodos da Estatstica Inferencial, que tem por base a induo ou inferncia, e tiramos desses resultados concluses e previses.

    3.3 Estatstica Descritiva

    A Estatstica Descritiva a parte da estatstica que se ocupa com a coleta, crtica, ordenao e apresentao das informaes fundamentais caracterizao e descrio do fenmeno que se deseja estudar e interpretar. Aqui se trabalhar com alguma caracterstica notvel do objeto de estudo, a qual ter de ser coletada de alguma forma e em algum lugar. Na coleta das informaes deve-se considerar, preferencialmente, toda a populao; caso a obteno de dados sobre toda a populao (censo) seja difcil ou at mesmo impossvel (dado o grande nmero de elementos ou a sua disperso no tempo ou no espao), o estudo poder ser feito com base numa amostra representativa.

    3.3.1 Distribuies de Frequncia

    Os dados numricos, aps coletados, so colocados em srie e apresentados em tabelas ou quadros. Quando se estuda uma varivel (qualitativa ou quantitativa), o maior interesse do pesquisador conhecer a distribuio dessa varivel atravs das possveis realizaes (valores) da mesma. Iremos, pois, ver uma maneira de se dispor um conjunto de valores, de modo a se ter uma boa ideia global sobre esses valores, ou seja, de sua distribuio.

    Uma distribuio de frequncias pode ser apresentada nas seguintes maneiras: Distribuio de Frequncias por Valores (varivel qualitativa ou quantitativa discreta):

    construda considerando-se todos os diferentes valores ou categorias, levando em considerao suas respectivas repeties.

  • 8

    Distribuio de Frequncias por Intervalos ou Classes (varivel quantitativa): Constroem-se classes de valores, levando em considerao o nmero de valores que pertencem a cada classe e quando a variabilidade dos dados grande. A construo de tabelas de frequncias para variveis contnuas necessita de certos cuidados.

    Exemplo 1.1 - A tabela 01 apresenta a distribuio de frequncia da varivel PROCEDNCIA, a partir dos dados do Quadro 1

    Quadro 1- Informaes sobre sexo, curso, idade (anos), procedncia, renda familiar, nmero de disciplinas matriculado(a), peso (kg) e altura (cm) de 46 alunos matriculados na disciplina CLCULO DAS PROBABILIDADE E ESTATSTICA (CPE) - perodo 97.1 turma 01

    ID SEXO CURSO IDADE (Anos)

    PROCEDNCIA RENDA FAMILIAR

    NO. DISCIP. MATRIC.

    PESO (kg)

    ALTURA (cm)

    1 Fem Fsica 19 Interior Mdia 6 47 156 2 Masc Matem. 18 Capital Mdia 6 75 167 3 Fem Matem. 18 Outra Regio Mdia 6 61 169 4 Fem Matem. 18 Capital Mdia 6 56 163 5 Masc Matem. 18 Capital Mdia 6 80 178 6 Fem Matem. 20 Interior Mdia 6 44 158 7 Fem Matem. 20 Interior Mdia 6 52 158 8 Masc Matem. 19 Capital Mdia 6 67 174 9 Fem Matem. 19 Outra Regio Mdia 3 48 167 10 Masc Matem. 18 Capital Mdia 6 83 180 11 Fem Matem. 18 Capital Mdia 6 53 163 12 Masc Matem. 21 Outra Regio Mdia 5 66,5 175 13 Masc Matem. 18 Interior Mdia 6 78 180 14 Fem Matem. 18 Interior No Info. 6 46 158 15 Fem Matem. 18 Capital Mdia 6 54 160 16 Fem Matem. 19 Capital Mdia 6 56 162 17 Fem Matem. 19 Capital Mdia 7 53 160 18 Fem Matem. 18 Capital Mdia 6 57 164 19 Fem Fsica 23 Outra Regio Mdia 6 53 160 20 Masc Matem. 18 Interior Mdia 6 76 180 21 Masc Matem. 21 Outra Regio Mdia 6 65 171 22 Masc Matem. 19 Capital Mdia 6 78,5 180 23 Masc Matem. 19 Outra Regio Mdia 6 104 183 24 Fem Matem. 17 Interior Mdia 6 47,5 155 25 Masc Matem. 18 Interior Baixa 6 67,5 175

    Tabela 01 - Frequncias e Percentuais dos 46 Estudantes de CPE Turma 01- Perodo: 97.1, segundo a Regio de Procedncia

    PROCEDNCIA NO Estudantes

    ( Fi ) Percentual

    ( fi %) Capital 20 43,5 Interior 16 34,8

    Outra Regio 10 21,7 Total 46 100,0

    FONTE: Quadro 1

  • 9

    26 Masc Matem. 19 Outra Regio Mdia 6 61 160 27 Masc Matem. 17 Interior No Info. 6 68 169 28 Masc Matem. 21 Interior Mdia 5 75 178 29 Fem Matem. 18 Interior Mdia 5 58 154 30 Masc Matem. 21 Outra Regio Mdia 6 65 165 31 Masc Matem. 21 Capital Mdia 6 67 178 32 Fem Matem. 18 Capital Alta 6 47 167 33 Masc Matem. 21 Capital Mdia 5 69 179 34 Fem Matem. 19 Outra Regio Mdia 6 68 170 35 Masc Matem. 18 Capital Mdia 6 53 166 36 Fem Matem. 17 Capital Mdia 6 51 153 37 Fem Matem. 19 Capital Mdia 6 63 168 38 Masc Matem. 19 Capital Mdia 6 60 166 39 Masc Matem. 18 Capital Mdia 6 72 174 40 Masc Matem. 21 Interior Mdia 5 54 163 41 Masc Matem. 18 Interior Baixa 6 60 165 42 Masc Matem. 19 Interior Mdia 6 75 181 43 Fem Matem. 18 Capital Mdia 6 52 160 44 Masc Matem. 18 Outra Regio Mdia 6 100 175 45 Masc Matem. 22 Interior Mdia 6 80 179 46 Masc Matem. 21 Interior Mdia 6 50 166

    FONTE: Questionrio aplicado - aula 24/03/97

    Exemplo 1.2 - A tabela 02 apresenta a distribuio de frequncia da varivel NO DE DISCIPLINAS MATRICULADO(A), a partir dos dados do quadro 1 (Dados Agrupados sem Intervalos)

    OBS.: ==> letra grega "SIGMA", indica total ou somatrio.

    Regras Bsicas para Elaborao de uma Distribuio de Frequncias por Classes ou Intervalos (Dados Agrupados em Intervalos)

    1. Colete n dados referentes varivel cuja distribuio ser analisada. aconselhvel que n seja superior a 50 para que possa ser obtido um padro representativo da distribuio.

    2. Efetua-se um ROL ESTATSTICO (ordenao crescente ou decrescente de grandeza) nos Dados Brutos (aqueles ainda no organizados numericamente).

    3. Identifique o menor valor ( )minX e o maior valor ( )maxX da amostra. 4. Calcule a AMPLITUDE TOTAL dos dados ( )AT :

    minmax XXAT =

    Tabela 02 - Frequncias e Percentuais do N0 de Disciplinas Matriculadas dos 46 Estudantes de CPE Turma 01- Perodo: 97.1.

    No DISC. MATRIC. (Xi)

    NO Estudantes ( Fi )

    Percentual ( fi %)

    3 1 2,2 5 5 10,9 6 39 84,8 7 1 2,2

    Total ou 46 100,0 FONTE: Quadro 1

  • 10

    5. Escolhe-se convenientemente o nmero de classes k (inteiro); 155 k , onde podemos tomar: nk ou ( )nk log3,31+ , se 50n

    6. Calcule o comprimento de cada classe dos dados ( )h : k

    ATh =

    aconselhvel construir classes de mesma amplitude. 7. Efetua-se o AGRUPAMENTO EM CLASSES, calculando os limites de cada classe:

    1 Classe: Limite Inferior: min1 XLI = Limite Superior: hLILS += 11 2 Classe: Limite Inferior: 12 LSLI = Limite Superior: hLILS += 22

    M

    i-sima Classe: Limite Inferior: 1= ii LSLI Limite Superior: hLILS ii +=

    Continue estes clculos at que seja obtido um intervalo que contenha o maior valor da amostra ( )maxX entre seus limites.

    8. Construa a tabela de distribuio de frequncias.

    Uma tabela de distribuio de frequncias (por classes ou valores), dever conter as seguintes colunas: Nmero de ordem de cada classe (i) ou valor; Limites de cada classe (no caso da distribuio de frequncias por classes)

    o As classes so fechadas esquerda e abertas direita. o As observaes iguais ao limite superior da classe i-1, o qual igual ao limite inferior da

    classe i, pertencem classe i. NOTAO: |------. Ponto Mdio ipm da i-sima classe denotado por: 2

    iii

    LSLIpm

    +=

    Tabulao: contagem dos dados pertencentes a cada classe ou a quantidade de vezes que o valor se repete.

    Frequncia simples ou absoluta ( )iF da i-sima classe ou do i-simo valor =iF nmero de observaes da i-sima classe (ou do i-simo valor)

    Observe que: nFk

    ii =

    =1

    Frequncia Relativa ( )if da i-sima classe (ou do i-simo valor) =if nmero de observaes da i-sima classe (ou do i-simo valor) dividido pelo

    tamanho da amostra, isto , n

    Ff ii = Observe que a soma de todos os valores de if deve ser igual a 1, ou seja,

    11

    ==

    k

    iif . Multiplicando cada if por 100 obtm-se o percentual da classe (ou

    valor) correspondente, isto , 100% = ii ff . Existem outros tipos de frequncias que tambm podem ser calculadas:

    Frequncia Simples Acumulada (do tipo abaixo de): frequncia simples acumulada da i-sima classe ou valor

    ii FFFFac +++= L21 Frequncia Relativa Acumulada: frequncia relativa acumulada da i-sima classe ou valor.

    ii ffffac +++= L21 .

  • 11

    Normas Tcnicas para Apresentao Tabular

    De um modo geral tem-se a destacar em uma tabela (disposio escrita que se obtm referindo-se a uma coleo de dados numricos a uma determinada ordem de classificao) os seguintes elementos essenciais (obrigatrios) e complementares (no-obrigatrios):

    Elementos essenciais: Ttulo: Indicao que precede a tabela e que contm a designao do fato observado, o local e a

    poca em que foi registrado. Cabealho: Parte superior da tabela que especifica o contedo das colunas. Coluna Indicadora: Parte da tabela que especifica o contedo das linhas. Corpo da tabela: Conjunto de colunas e linhas que contm as informaes sobre a varivel em

    estudo. Fonte: Entidade responsvel pela informao.

    Elementos complementares: o Notas: Informaes de natureza geral destinadas a conceituar ou esclarecer o contedo das

    tabelas ou a indicar a metodologia adotada no levantamento ou na elaborao dos dados. o Chamadas: Informaes de natureza especfica sobre determinada parte da tabela, destinada a

    conceituar ou a esclarecer dados. o Sinais Convencionais:Nenhuma casa da tabela deve ficar em branco, apresentando sempre um

    smbolo, a saber: (hfen): quando o valor numrico nulo; K (reticncia): quando no se dispe de dado; ? (ponto de interrogao): quando h dvidas quanto exatido do valor numrico; 0,0: quando o valor numrico muito pequeno para ser expresso pela unidade utilizada. Se

    os valores so expressos em nmeros decimais, acrescenta-se o mesmo nmero de casas decimais ao valor zero;

    x (letra x): quando o dado for omitido a fim de evitar individualizao da informao.

    As tabelas apresentadas oficialmente devem atender s normas da ABNT (resoluo 886 de 20/10/60).

    Exemplo 1.3 Elabore uma tabela de distribuio de frequncias (dados agrupados em intervalos) da varivel ALTURA (em cm), dos 46 estudantes de CPE, turma 01 Perodo 07.1, usando-se os dados do Quadro 1.

    Soluo: Passo 1: Estabelecer o nmero de classes: 746 k Passo 2: Amplitude Total: 30153183 ==AT

    Passo 3: Amplitude das Classes: 3,47

    30==

    kATh

    Passo 4: Construo da Tabela de Distribuio de Frequncias

    Tabela 03 Distribuio de Frequncias das ALTURAS dos 46 Estudantes de CPE, Perodo: 97.1.

    ALTURA (Xi) NO Estudantes

    ( Fi ) Percentual

    ( fi %) 153,0 |----- 157,3 4 8,7 157,3 |----- 161,6 8 17,4 161,6 |----- 165,9 7 15,2 165,9 |----- 170,2 10 21,7 170,2 |----- 174,5 3 6,5 174,5 |----- 178,8 6 13,0 178,8 |----- 183,1 8 17,4

    Total ou 46 100,0 FONTE: Quadro 1

  • 12

    Exemplo 1.4 - Elabore uma tabela de distribuio de frequncias (dados agrupados em intervalos) da varivel IDADE (em anos) de 33 estudantes de CPE, conforme Dados Brutos abaixo:

    A Tabela 5, a seguir, um exemplo de como calcular os outros tipos de frequncias a partir da Tabela 3

    Exemplo 1.5

    3.3.2 Representao Grfica de Distribuies de Frequncia

    O grfico estatstico uma forma de apresentao dos dados estatsticos, cujo objetivo produzir, no investigador ou no pblico em geral, uma impresso rpida e viva do fenmeno em estudo..

    Para tornarmos possvel uma representao grfica, estabelecemos uma correspondncia entre os termos da srie (Tabela) e determinada figura geomtrica, de tal modo que cada elemento da srie seja representado por uma figura proporcional.

    DADOS BRUTOS ROL DE DADOS ORDENADOS 22 25 23 22 23 26 25 33 23 35 20 21 22 22 22 22 22 22 23 23 27 24 24 22 24 22 24 21 22 28 23 24 24 24 24 24 24 25 25 25 30 25 28 29 24 25 20 27 34 26 25 26 26 27 27 28 28 29 30 30 36 30 22 34 35 36

    Soluo: Passo 1: Estabelecer o nmero de classes: 633 k Passo 2: Amplitude Total: 162036 ==AT

    Passo 3: Amplitude das Classes: 7,26

    16==

    kATh

    Passo 4: Construo da Tabela de Distribuio de Frequncias

    Tabela 04 - Distribuio de Frequncias das IDADES de 33 Estudantes de CPE, Perodo: 97.1. IDADE (Xi) Fi

    20,0 |----- 22,7 8 22,7 |----- 25,4 13 25,4 |----- 28,1 6 28,1 |----- 30,8 3 30,8 |----- 33,5 0 33,5 |----- 36,2 3

    Total ou 33 FONTE: Quadro 1

    Soluo:

    Tabela 05 Distribuio de Frequncias das ALTURAS dos 46 Estudantes de CPE, Perodo: 97.1.

    ALTURA (Xi) Freq. Absoluta Fi Freq. Relativa

    fi Freq. Percentual

    fi % Freq. Abs.

    Acum. Faci

    Freq. Relat. Acum.

    faci

    Ponto Mdio

    pmi 153,0 |----- 157,3 4 0,087 8,7 4 0,087 155,15157,3 |----- 161,6 8 0,174 17,4 12 0,261 159,45161,6 |----- 165,9 7 0,152 15,2 19 0,413 163,75165,9 |----- 170,2 10 0,217 21,7 29 0,630 168,05170,2 |----- 174,5 3 0,065 6,5 32 0,695 172,35174,5 |----- 178,8 6 0,130 13,0 38 0,825 176,65178,8 |----- 183,1 8 0,174 17,4 46 1,000 180,95

    Total ou 46 1,000 100,0 - - - FONTE: Quadro 1

  • 13

    Requisitos A representao grfica de um fenmeno deve obedecer aos seguintes requisitos primordiais: Simplicidade - indispensvel devido necessidade de levar a uma rpida apreenso do

    sentido geral do fenmeno apresentado a fim de no nos perdermos na observao de mincias de importncia secundria;

    Clareza - o grfico deve possibilitar uma correta interpretao dos valores representativos do fenmeno em estudo;

    Veracidade - indispensvel qualquer comentrio, posto que, se no representa uma realidade, perde o grfico sua finalidade.

    Os principais tipos de grficos estatsticos para as distribuies de frequncias so os diagramas, que so grficos geomtricos de, no mximo duas dimenses. Para sua construo, em geral, fazemos uso s do sistema cartesiano. Dentre os principais tipos de diagramas, destacamos:

    Variveis Qualitativas: Para representarmos as variveis qualitativas graficamente usamos os grficos de Barras, Colunas,

    Setores ou Linha.

    Grfico em Barras ou Colunas: a representao de uma srie por meio de retngulos, dispostos horizontalmente (em barras) ou verticalmente (em colunas); Grfico de Setores: o grfico que representa as partes de um todo, por setores de um crculo, visando justamente comparar estas partes entre si em relao ao todo. Grfico de Linha: til na representao de tabelas ou sries que evoluem ao longo do tempo (sries temporais), possibilitando a identificao de tendncias.

    Exemplo 1.6: Construindo um Grfico de Barras

    0

    5

    10

    15

    20

    25

    Capital Interior Outra Regio

    Num. Estudantes

    Procedncia

    Procedncia dos Estudantes de CPE - Per. 97.1

    FONTE: Quadro 1

    Exemplo 1.7: Construindo um Grfico de Setor

    Capital

    43%

    Interior

    35%

    Outra Regio

    22%

    Procedncia dos Estudantes de CPE - Per. 97.1

    FONTE: Quadro 1

  • 14

    Variveis Quantitativas Discretas:para representarmos as variveis quantitativas discretas graficamente usamos grficos em

    Barras ou Colunas; Contnuas: para representarmos as variveis quantitativas contnuas graficamente usamos o

    Histograma ou o Polgono de Frequncias.

    Histograma a representao grfica de uma distribuio de frequncias de varivel quantitativa contnua

    (dados agrupados em intervalos) por meio de retngulos justapostos, centrados nos pontos mdios das classes e cujas reas so proporcionais s frequncias das classes.

    Exemplo 1.8: Construindo um Histograma

    0

    2

    4

    6

    8

    10

    12

    155.15 159.45 163.75 168.05 172.35 176.65 180.95

    Frequencia Absoluta

    Altura (cm)

    Distribuio das Alturas dos Estudantes de CPE, Per. 97.1

    FONTE: Quadro 1

    Polgono de Frequncia a representao grfica de uma distribuio de frequncias de varivel quantitativa contnua

    (dados agrupados em intervalos) por meio de uma linha poligonal fechada ou polgono, cuja rea total igual do histograma.

    Exemplo 1.10: Construindo um Polgono de Frequncias

    0

    2

    4

    6

    8

    10

    12

    150.85 155.15 159.45 163.75 168.05 172.35 176.65 180.95 185.25

    Fre

    qu

    en

    cia

    Ab

    solu

    ta

    Altura (cm)

    Distribuio das Alturas dos Estudantes de CPE, Per. 97.1

    FONTE: Quadro 1

  • 15

    3.4 Medidas Estatsticas

    Vimos anteriormente a sintetizao dos dados sob a forma de tabelas, grficos e distribuies de frequncias. Aqui, vamos aprender o clculo de medidas que possibilitem representar um conjunto de dados (valores de uma varivel quantitativa, isto , informaes numricas), relativos observao de determinado fenmeno de forma reduzida.

    Estes ndices estatsticos so as MEDIDAS DE POSIO e, dentre as mais importantes, citamos as Medidas de Tendncia Central, que recebem tal denominao pelo fato dos dados observados tenderem, em geral, a se concentrar em torno de valores centrais. Dentre as medidas de tendncia central, destacamos:

    Mdia aritmtica ou Mdia; Moda; Mediana.

    As outras medidas de posio so as SEPARATRIZES, que englobam: a mediana; os quartis; os percentis.

    3.4.1 Medidas de Tendncia Central

    Mdia Aritmtica (ou simplesmente MDIA) Notao:

    X = a mdia da amostra ou mdia amostral = a mdia da populao ou mdia populacional

    (a) Distribuio de Frequncias por Valor Sejam kxxx ,,, 21 K as medidas da varivel de interesse, realizadas para uma amostra de tamanho n

    extrada de uma populao. Definimos a mdia da amostra ( )X como:

    =

    =

    = k

    ii

    k

    iii

    F

    FxX

    1

    1 ou, simplesmente,

    n

    FxX

    k

    iii

    =

    =1

    onde:

    ix o i-simo valor da varivel de interesse;

    iF a frequncia absoluta do i-simo valor; n o tamanho da amostra.

    Exemplo 1.11: Determinar a mdia do seguinte conjunto (amostra) de valores 11 ,10 ,8 ,7 ,3

    Logo, 8,75

    1110873=

    ++++==

    n

    XX i

    Exemplo 1.12: Determinar a mdia do seguinte conjunto (amostra) de valores 2 ,8 ,5 ,2 ,8 ,5 ,2 ,2 ,8 ,3 ,5 ,8 ,2 ,2 ,2 ,5 ,8 ,8 ,3 ,2

    Ento: Dados Agrupados sem Intervalos xi iF ii Fx 2 8 16 3 2 6 5 4 20 8 6 48 20 90

  • 16

    5,42090

    4

    1

    4

    1==

    =

    =

    = XF

    FxX

    ii

    iii

    e 204

    1==

    =iiFn

    (b) Distribuio de Frequncias por Classes Sejam kpmpmpm ,,, 21 K os pontos mdios das classes, ocorrendo com frequncias kFFF ,,, 21 K ,

    respectivamente, de modo que =

    =

    k

    ii nF

    1.

    Definimos a mdia da amostra ( )X como:

    =

    =

    = k

    ii

    k

    iii

    F

    FpmX

    1

    1 ou, simplesmente,

    n

    FpmX

    k

    iii

    =

    =1

    onde: ipm o ponto mdio da i-sima classe;

    iF a frequncia absoluta da i-sima classe; n o tamanho da amostra

    Vantagens e Desvantagens da Mdia

    uma medida de tendncia central que, por uniformizar os valores de um conjunto de dados, no representa bem os conjuntos que revelam tendncias extremas. Ou seja, grandemente influenciada pelos valores extremos (grandes) do conjunto. Alm disso, no pode ser calculada para distribuies de frequncias com limites indeterminados (indefinidos).

    Propriedades:

    1. A soma dos desvios tomados em relao mdia nula, isto , ( )X Xii

    n

    =

    =

    1

    0 .

    2. Somando-se ou subtraindo-se uma constante c a todos os valores de uma varivel, a mdia do conjunto fica aumentada ou diminuda dessa constante, isto , Y X c Y X ci i= = . 3. Multiplicando-se ou dividindo-se todos os valores de uma varivel por uma constante c, a mdia do conjunto fica multiplicada ou dividida por essa constante, isto , cXYcXY ii == ou

    c

    XYc

    XY ii == , para 0c .

    Exemplo 1.13: Utilizando os dados apresentados na Tabela 5, determine a ALTURA MDIA dos 33 estudantes de Estatstica Vital - 97.1 turma 06

    ALTURA (Xi) Freq. Absoluta Fi Ponto Mdio

    pmi ii Fpm

    153,0 |----- 157,3 4 155,15 620,60157,3 |----- 161,6 8 159,45 1275,60161,6 |----- 165,9 7 163,75 1146,25165,9 |----- 170,2 10 168,05 1680,50170,2 |----- 174,5 3 172,35 517,05174,5 |----- 178,8 6 176,65 1059,90178,8 |----- 183,1 8 180,95 1447,60

    Total ou 46 - 7747,50

    Ento: 42,16846

    50,7747

    1

    1==

    =

    =

    =

    k

    ii

    k

    iii

    F

    FpmX cm

  • 17

    Moda Notao: Mo

    Dado um conjunto ordenado de valores. A moda (so) o(s) valor(es) que ocorre(m) com maior frequncia no conjunto de dados, ou seja (so) o(s) valor(es) mais frequente(s) do conjunto de dados.

    Exemplo 1.14: Determine a moda dos seguintes conjuntos de dados abaixo a) 2, 2, 3, 3, 5, 5, 8, 8 No existe moda (ou amodal) b) 2, 2, 3, 5, 5, 5, 8, 8 5=Mo c) 2, 2, 2, 3, 3, 5, 5, 5, 8 2=Mo e 5=Mo

    Observao: i) A moda de um conjunto de dados pode no existir (figura 1 (a) ) ii) A moda de um conjunto de dados pode no ser nica (figura 1 (c) )

    Figura 1: Caracterizao de Dados quanto moda

    Clculo da Moda em uma Distribuio de Frequncias por Classes Em uma distribuio de frequncias com dados agrupados em classes, denominamos classe modal a

    classe que possui a maior frequncia, e, consequentemente, ser esta classe que conter a moda.

    Exemplo 1.15: Utilizando os dados apresentados na Tabela 5, apresentamos o clculo determine a ALTURA MODAL (Moda) para dados agrupados em intervalos, a partir da frmula de Czuber apresentada na Figura 2.

    Figura 2: Clculo da moda para dados distribudos em classes

    Soluo:

    FRMULA de CZUBER (interpretao geomtrica atravs de Histograma)

    momo hLMo

    +

    +=21

    1

    onde: moL : limite inferior da classe modal

    moh : amplitude da classe modal

    anterioral FF = mod1

    posterioral FF = mod2

  • 18

    A Classe modal ser o intervalo com maior frequencia absoluta (Fi). Neste caso a classe modal (4a) ser 165,9 |----- 170,2 9,165=moL , 3,4=moh , 3710mod1 === anterioral FF e

    7310mod2 === posterioral FF .

    Da, 19,1673,473

    39,16521

    1=

    ++=

    +

    += momo hLMo cm.

    Vantagens e Desvantagens da Moda No depende de todos os valores do conjunto de dados, podendo mesmo no se alterar com a

    modificao de alguns deles; No influenciada por valores extremos (grandes) do conjunto de dados Pode ser calculada para distribuies com limites indeterminados (indefinidos) na maioria dos casos.

    Mediana Notao: Me

    Considere um conjunto de dados ordenado constitudo de n valores. A mediana o valor que divide o conjunto em duas partes iguais (isto , em duas partes de 50% cada).

    1 Caso: n mpar Para a srie de valores ordenados em ordem crescente de grandeza (isto , um rol), a mediana o

    valor central, isto ,

    Me = elemento que est na posio 2

    1+n.

    2 Caso: n par Para a srie de valores ordenados em ordem crescente de grandeza (isto , um rol), a mediana a

    mdia aritmtica dos valores centrais, isto ,

    Me = mdia aritmtica entre os elementos das posies 2n

    e 12

    +n

    .

    3o Caso: Clculo da Medida em uma Distribuio de Frequncias por Classes No caso de dados agrupados, relembramos que uma distribuio de frequncias pode ser

    representada por meio de um Histograma. Dizemos ento que a mediana ser o valor de X (abscissa) cuja ordenada divide a rea total do Histograma em duas partes iguais.

    Em uma distribuio de frequncias com dados agrupados em classes, denominamos classe mediana

    a classe que contm o elemento que est na posio 2n

    e, consequentemente, ser esta a classe que conter a

    mediana.

    Figura 3: Clculo da mediana para dados distribudos em classes

    me

    me

    ant

    me hF

    Facn

    LIMe

    += 2

    onde: meLI o limite inferior da classe mediana; meF a frequncia absoluta da classe mediana;

    antFac a freq. absoluta acumulada da classe anterior classe mediana; meh a amplitude da classe mediana; n o nmero de observaes.

  • 19

    Assim, para dados agrupados em intervalos, a mediana obtida atravs de interpolao de acordo com a frmula dada na figura 3.

    Propriedades da Mediana

    1. A mediana no influenciada por valores extremos (grandes) de uma srie ou conjunto de dados; 2. A mediana de uma srie de dados agrupados de classes extremas indefinidas pode ser calculada.

    Exemplo 1.16: Determinar a ALTURA MEDIANA dos 46 estudantes da turma de CPE, - Perodo: 97.1, conforme os dados agrupados na tabela 5.

    Classe mediana a classe que contm o elemento que est na posio 2n

    , ou seja, a classe mediana a classe que contm o elemento que est na 23 posio. Logo, a classe mediana ser a 4: 165,9 |----- 170,2 (Classe mediana: primeira classe que ultrapassar 50% (n/2) ou mais das observaes)

    9,165=meLI 10=meF 3,4=meh 19=antF Ento:

    62,16772,19,1653,410

    19246

    9,1652 =+=

    +=

    += meme

    ant

    me hfFn

    LIMe cm.

    3.4.2 Medidas de Disperso

    No item anterior, aprendemos a calcular e entender convenientemente as medidas de posio representativas de um determinado conjunto de dados, onde destacamos a mdia, a moda e a mediana.

    Sejam quatro conjuntos A, B, C e D com os seguintes valores:

    Conjunto A ====> 7, 7, 7, 7, 7 Conjunto B ====> 5, 6, 7, 8, 9 Conjunto C ====> 4, 5, 7, 9, 10 Conjunto D ====> 0, 5, 10, 10, 10

    Para representarmos cada conjunto, podemos calcular a sua respectiva mdia aritmtica, encontrando X X X XA B C D= = = = 7 .

    Vemos assim que, apesar de constitudos de valores diferentes, os grupos revelam uma mesma mdia aritmtica. Observando-os mais detalhadamente, notamos que em cada grupo, isto , conjunto de dados, os valores se distribuem diferentemente em relao mdia. Necessitamos assim de uma medida estatstica complementar para melhor caracterizar cada conjunto apresentado.

    As medidas estatsticas responsveis pela variao ou disperso dos valores de um conjunto de dados so as medidas de disperso ou de variabilidade, onde se destacam a amplitude total, a varincia, o desvio padro e o coeficiente de variao. Em princpio, diremos que entre dois ou mais conjuntos de dados, o mais disperso (ou menos homogneo ) aquele que tem a maior medida de disperso.

    Amplitude Total Notao: AT

    Medida j apresentada na elaborao de uma distribuio de frequncias com dados agrupados em classes, definida por:

    minmax XXAT = , onde: maxX o maior valor do conjunto de dados e minX o menor valor do conjunto de dados.

  • 20

    Varincia Notao: 2S a varincia da amostra ou varincia amostral

    2 a varincia da populao ou varincia populacional

    A varincia de um conjunto de dados (amostra ou populao ) mede a variabilidade do conjunto em termos de desvios quadrados em relao mdia aritmtica. uma quantidade sempre no negativa e expressa em unidades quadradas do conjunto de dados, sendo de difcil interpretao.

    Distribuio de Frequncias por valor Sejam kxxx ,,, 21 K as medidas da varivel de interesse, realizadas para uma amostra de tamanho n

    extrada da populao considerada. Definimos a varincia da amostra ( )2S como: ( )

    11

    2

    2

    =

    =

    n

    FXxS

    k

    iii

    onde: ix o i-simo valor da varivel de interesse;

    iF a frequncia absoluta do i-simo valor; X a mdia da amostra; n o tamanho da amostra.

    Observao: A equao acima utilizada quando nosso interesse no se restringe descrio dos dados mas, partindo da amostra, visamos tirar inferncias vlidas para uma respectiva populao.

    Distribuio de Frequncias por Classes Sejam kpmpmpm ,,, 21 K os pontos mdios das classes, ocorrendo com frequncias kFFF ,,, 21 K de

    modo que =

    =

    k

    ii nF

    1. A varincia da amostra ( )2S definida por como:

    ( )1

    1

    2

    2

    =

    =

    n

    FXpmS

    k

    iii

    onde: ipm o ponto mdio da i-sima classe;

    iF a frequncia absoluta da i-sima classe; X a mdia da amostra; n o tamanho da amostra.

    Desvio-Padro Notao: S o desvio-padro da amostra ou desvio-padro amostral

    o desvio-padro da populao ou desvio-padro populacional

    uma outra medida de disperso mais comumente empregada do que a varincia, por ser expressa na mesma unidade do conjunto de dados. Mede a "DISPERSO ABSOLUTA" de um conjunto de valores e obtida a partir da varincia.

    Desvio Padro = Varincia (Raiz quadrada da Varincia ).

    Assim, 2SS =

    Coeficiente de Variao

    uma medida que expressa a variabilidade em termos RELATIVOS, comparando o desvio-padro com a mdia:

  • 21

    %100=XSCV , sendo que 0X .

    Note que importante expressar a variabilidade em termos relativos porque, por exemplo, um desvio-padro igual a 1 pode ser muito pequeno se a magnitude dos dados da ordem de 1.000, mas pode ser considerado muito elevado se esta magnitude for da ordem de 10.

    Observe tambm que o coeficiente de variao adimensional e por este motivo permite a comparao das variabilidades de diferentes conjuntos de dados.

    Comentrios sobre as principais Medidas de Tendncia Central e Disperso 1. O conjunto de todos os possveis elementos de uma determinada pesquisa constitui uma populao

    estatstica. Sua mdia a mdia populacional, usualmente representada pela letra grega . Na grande maioria das situaes prticas, a mdia populacional desconhecida e deve ser estimada a partir de dados amostrais. Se a amostra for extrada de forma adequada, a mdia amostral X uma boa estimativa de .

    2. Comparando a mdia e a mediana, temos que a mediana pouco sensvel presena de valores muito altos ou muito baixos na amostra, enquanto a mdia j muito sensvel a esta situao. Para ilustrar o sentido desta afirmao, vamos considerar os dados abaixo:

    5 14 47 61 122 620

    A mediana deste conjunto de dados : 54

    26147

    =

    +=Me

    enquanto que a mdia dada por:

    8,1446

    8696

    6201226147145==

    +++++=X .

    Observe que a maior observao (620) exerceu uma grande influncia sobre a mdia somente este dado maior do que a mdia, o que ento no sintetiza de forma adequada as informaes contidas na massa de dados. Portanto, neste exemplo, a mediana parece ser a melhor medida para indicar a localizao dos dados. De modo geral, quando o histograma construdo para os dados da amostra do tipo assimtrico, devemos preferir a mediana como medida de tendncia central.

    3. A amplitude, apesar de ser muito fcil de calcular, tem a desvantagem de levar em considerao apenas os dois valores extremos (mximo e mnimo) da massa de dados, desprezando os demais.

    4. A varincia populacional representada por 2 . Usualmente, a varincia populacional desconhecida e deve ser estimada a partir dos dados amostrais. Se a amostra foi extrada de forma adequada, a varincia amostral 2S uma boa estimativa de 2 .

    5. As medidas X , 2S e S tomadas na amostra, denominadas ESTATSTICAS, so estimativas dos PARMETROS POPULACIONAIS , 2 e (supostos desconhecidos).

    Exemplo 1.17: Utilizando os dados apresentados na Tabela 5, determine a VARINCIA, o DESVIO-PADRO e o COEFICIENTE DE VARIAO DAS ALTURAS dos 46 estudantes de CPE - 97.

    ALTURA (Xi) Freq. Absoluta Fi Ponto Mdio

    pmi ii Fpm ii Fpm

    2

    153,0 |----- 157,3 4 155,15 620,60 96286,09157,3 |----- 161,6 8 159,45 1275,60 203394,42161,6 |----- 165,9 7 163,75 1146,25 187698,44165,9 |----- 170,2 10 168,05 1680,50 282408,03170,2 |----- 174,5 3 172,35 517,05 89113,57174,5 |----- 178,8 6 176,65 1059,90 187231,34178,8 |----- 183,1 8 180,95 1447,60 261943,22

    Total ou 46 - 7747,50 1308075,10

  • 22

    A expresso ( )

    11

    2

    1

    1

    2

    1

    2

    2

    =

    =

    =

    ==

    n

    n

    FpmFpm

    n

    FXpmS

    k

    iiik

    iii

    k

    iii

    . Assim,

    ( )2

    2

    1

    2

    12

    2 cm 35,7145

    83,3210146

    465,774710,1308075

    1==

    =

    =

    =

    =

    n

    n

    FpmFpm

    S

    k

    i

    k

    iii

    ii

    .

    Logo,

    cm 44,8cm 35,71 22 === SS e %01,5%100cm 42,168

    cm 44,8%100 ===XSCV

    Exemplo 1.18: Uma fbrica classifica operrios de acordo com os graus obtidos em testes de aptido. Os dados so apresentados na distribuio de frequncia abaixo:

    Notas Teste Aptido (Xi) Fi Faci pmi xpmi ( )

    2xpmi ( ) ii Fxpm 2

    0 |----- 2 6 6 1 -4,172 17,409 104,4542 |----- 4 10 16 3 -2,172 4,719 47,1934 |----- 6 23 39 5 -0,172 0,030 0,6846 |----- 8 11 50 7 1,828 3,340 36,7418 |---- 10 8 58 9 3,828 16,650 117,203

    Total ou 58 - - 40,149 306,276

    a) Calcule o grau mdio obtido pelos operrios; b) O operrio que tirar nota acima de SX 2

    ___

    + receber um prmio. Um operrio para receber esta meno dever ter tirado quanto?

    c) Com base nos dados da tabela, a partir de que nota temos 50% dos operrios mais aptos.

    Soluo:

    a) O grau mdio dado por: 172414,558

    300

    5

    1___

    ===

    =

    n

    FpmX i

    ii

    b) A varincia para os dados agrupados dada pela frmula:

    373,557

    276,3061

    )(5

    1

    2__

    2==

    =

    =

    n

    FXpmS i

    ii

    .

    Logo o desvio padro S = 2,318,

    Desta forma SX 2___

    + = 9,808, portanto qualquer operrio com nota maior que 9,808 receber o premio.

    c) A nota acima da qual esto 50% dos operrios chamada nota mediana, a qual calculada para dados agrupados em intervalos por:

    13,513,14232642

    23

    )162

    58(4

    )2

    (=+=

    +=

    +=

    += MdMd

    ant

    Mdd hF

    Facn

    LM .

  • 23

    4. Avaliando o que foi construdo

    Nesta unidade aprendemos a explorar dados estatsticos, onde estudamos desde a organizao dos dados em tabelas e grficos at o clculo de medidas estatsticas importantes que sero utilizadas nas unidades subseqentes e convidamos vocs a resolverem a lista de exerccio anexa a este material, tentando descobrir no seu dia a dia a utilidade para o contedo aqui abordado. Este foi o inicio da convivncia com a Estatstica. Esperamos que tenha sido prazeroso. Procure seus tutores, use e abuse deste material.

  • 24

    Unidade II Probabilidade

    1. Situando a Temtica

    A teoria das probabilidades o fundamento para a inferncia estatstica. O objetivo desta parte que o aluno compreenda os conceitos mais importantes da probabilidade.

    O conceito de probabilidade faz parte do dia-a-dia dos trabalhadores das rea das cincias exatas, cincias biolgicas, engenharia, etc., uma vez que seu conceito frequentemente usado na comunicao diria. Por exemplo, podemos dizer que um aluno tem chance de 70% de ser aprovado em uma determinada disciplina. Um professor est 90% seguro de que um novo mtodo de ensino proporcione uma melhor compreenso pelos alunos. Um engenheiro de produo afirma que uma nova mquina reduz em 20% o tempo de produo de um bem. Tal como mostram os exemplos, as pessoas expressam a probabilidade em porcentagem. Trabalhando com a probabilidade matemtica mais conveniente express-la como frao (as porcentagens resultam da multiplicao das fraes por 100).

    2. Problematizando a Temtica

    O conceito de probabilidade fundamental para o estudo de situaes onde os resultados so variveis, mesmo quando mantidas inalteradas as condies de sua realizao. Por exemplo, jogando-se um dado, temos seis resultados possveis de cada vez; a observao do sexo dos candidatos inscritos num concurso pblico conduz a dois resultados possveis - masculino ou feminino. Em ambos os casos, embora no sejamos capazes de afirmar de antemo que resultado particular ocorrer, temos condies de descrever o conjunto de todos os resultados possveis do experimento. A sua repetio continuada mostra uma certa regularidade nos resultados, o que nos permite estudar o experimento, apesar da incerteza nele presente.

    3. Conhecendo a Temtica

    3.1 Espaos Amostrais e Eventos

    Antes de passarmos definio de probabilidade necessrio fixarmos os conceitos de experimento aleatrio, espao amostral e evento.

    Experimento Aleatrio

    o processo da coleta dos dados relativo a um fenmeno que acusa variabilidade em seus resultados. Um experimento caracteriza-se como aleatrio, em funo de poder ser repetido indefinidamente sob condies, essencialmente inalteradas, e embora no sejamos capazes de afirmar que resultado particular ocorrer, seremos sempre capazes de descrever o conjunto de todos os possveis resultados do mesmo.

    Espao Amostral ( Notao: S ou (mega) )

    o conjunto formado por todos os possveis resultados de um experimento aleatrio.

    Eventos ( Notao: A, B. C, ... )

    qualquer subconjunto do espao amostral.

    3.1.1 Operaes entre Eventos

    Combinaes de Eventos

    Sejam A e B eventos em um mesmo espao amostral. Temos as definidas as seguintes operaes entre conjuntos:

    Evento Unio BA (l-se: A unio B): o evento unio de A e B equivale ocorrncia de A ou de B ou de ambos. Contm os elementos do espao amostral que esto em A ou em B ou em ambos.

  • 25

    Evento Interseo A B (l-se: A interseo B): o evento interseo de A e B equivale ocorrncia de A e de B, simultaneamente. Contm os elementos do espao amostral que esto em A e em B.

    Evento Complementar A (l-se: A evento complementar de A): o evento complementar de A equivale no ocorrncia do evento A. Contm os elementos do espao amostral que no esto em A.

    Eventos Disjuntos ou Mutuamente Exclusivos: dois eventos A e B dizem-se mutuamente exclusivos ou mutuamente excludentes quando a ocorrncia de um deles impossibilita a ocorrncia do outro. Os dois eventos no tm nenhum elemento em comum. Exprime-se isto escrevendo: A B =

    UNIO

    INTERSEO

    EVENTO COMPLEMENTAR

    EVENTOS DISJUNTOS

    3.2 O Conceito de Probabilidade

    Definio 2.1: Uma funo P : R dita uma probabilidade se satisfaz os seguintes axiomas: i) ( )P = 1; ii) ( )0 1 P A ; iii) Sejam A e B eventos em um mesmo espao amostral. Se A e B forem mutuamente exclusivos,

    ento ( ) ( ) ( )P A B P A P BU = + .

    Por enquanto, ainda no sabemos calcular a probabilidade de ocorrncia de um evento A P(A). No entanto, vamos enunciar algumas propriedades relacionadas a P(A) que decorrem das condies acima e que no dependem da maneira pela qual calculamos P(A).

    3.2.1 Propriedade de Probabilidade

    Sejam A e B eventos em um mesmo espao amostral: 1. Se o evento impossvel, ento ( )P = 0 ; 2. Se AC o evento complementar de A, ento ( ) ( )APAP C = 1 . 3. Se A e B so dois eventos quaisquer, ento ( ) ( ) ( ) ( )BAPBPAPBAP += ; 4. Se o evento A B, ento ( ) ( )P A P B .

  • 26

    3.2.2 Probabilidade em Espaos Amostrais Finitos

    Seja um espao amostral associado a um experimento aleatrio constitudo de N resultados igualmente provveis (equiprovveis). Seja A um evento qualquer constitudo de r resultados possveis ( 0 r N ).

    A probabilidade de ocorrncia do evento A, denotada P(A), dada por:

    ( )NrA

    n

    AnAP ==

    =

    possveis casos de nmero a favorveis casos de nmero

    )()(

    Exemplo 2.1: Em uma seleo para uma vaga de engenheiro mecnico de uma grande empresa verificou-se que dos 100 candidatos 40 tinham experincia anterior e 30 possuam curso de especializao. Vinte dos candidatos possuam tanto experincia profissional como tambm algum curso de especializao. Escolhendo um candidato ao acaso, qual a probabilidade de que: a) Ele tenha experincia ou algum curso de especializao? b) Ele no tenha experincia anterior nem curso de especializao?

    Soluo Vamos definir os seguintes eventos: A = {O candidato possui experincia anterior} B = {O candidato possui especializao}

    Dados: p(A) = 0,4, p(B) = 0,3 p(AB) = 0,2 pede-se as seguintes probabilidades:

    a) Ele tenha experincia ou algum curso de especializao p(AB) = p(A) + p(B) p(AB) = 0,4 + 0,3 0,2 = 0,5

    b) Ele no tenha experincia anterior nem curso de especializao? P(AcBc) = P((AB)C) = 1- P(AB) = 1- [P(A) + P(B) P(AB)] = = 1 [0,4 + 0,3 0,2] = 1 - 0,5 = 0,5.

    3.2.3 Probabilidade Condicional e Independncia de Eventos

    Dados dois eventos A e B contidos num espao amostral , muitas das vezes, estamos interessados na ocorrncia de A dado que o evento B tenha ocorrido.

    Para dar consistncia ideia de uma probabilidade condicional, suponhamos que uma organizao de pesquisa junto a consumidores tenha estudado os servios prestados dentro da garantia por 200 comerciantes de pneus em uma grande cidade, obtendo os resultados resumidos na tabela seguinte:

    Vendedores de Pneus Dentro da Garantia

    Total Bom Servio Servio Deficiente

    Com marca 64 16 80 Sem marca 42 78 120

    Total 106 94 200

    Selecionado aleatoriamente um desses vendedores de pneus (isto , cada vendedor tem probabilidade de ser selecionado), constatamos que as probabilidades de se escolher um vendedor de determinada marca (M), um vendedor que presta bons servios dentro da garantia (Bs), ou um vendedor de marca determinada e que presta bons servios dentro da garantia (MBs) so:

    32,020064)( e 53,0

    200106)( , 40,0

    20080)( ====== BsMPBsPMP .

    Todas essas probabilidades foram calculadas por meio da definio clssica de probabilidade. Como a segunda dessas probabilidades P(Bs) prxima a 0,50 (50%), vejamos o que acontece se limitamos a escolha

  • 27

    a vendedores de uma marca determinada. Isto reduz o espao amostral s 80 escolhas, correspondentes 1a linha da tabela. Temos ento, que a probabilidade de se escolher um vendedor que presta bons servios (Bs), sabendo (ou dado) que a marca de pneu vendido pelo mesmo determinada ser de 80,0

    8064)|( ==MBsP ,

    tendo-se uma melhora em relao a P(Bs) = 0,53 . Note que a probabilidade condicional que obtivemos aqui, 80,0)|( =MBsP pode escrever-se como:

    )()()|(

    20080

    20064

    MPBsMPMBsP ==

    Generalizando, formulamos a seguinte definio de probabilidade condicional, que se aplica a dois eventos quaisquer A e B pertencentes a um dado espao amostral :

    Probabilidade Condicional

    Se P(B) diferente de zero, ento a probabilidade condicional de A relativa a B, isto , a probabilidade de A dado que B ocorreu denotada por

    0 )( que desde , )()()|( >= BP

    BPBAPBAP .

    Teorema da Multiplicao O resultado a seguir, obtido a partir da definio de probabilidade condicional, fornece a

    probabilidade da ocorrncia conjunta de dois eventos A e B, isto , a probabilidade P(AB):

    )|()()(ou )|()()( BAPBPBAPABPAPBAP ==

    dependendo da ordem de ocorrncia dos eventos.

    Independncia de Eventos

    Dizemos que dois eventos A e B so independentes, se as probabilidades condicionais P(A | B) = P(A) e P(B | A) = P(B). Isto equivale, a partir da regra da multiplicao, escrevermos a ocorrncia simultnea de A e B como sendo:

    )()()( BPAPBAP = .

    Exemplo 2.2: Uma caixa contm 4 lmpadas boas e 2 queimadas. Retiram-se, ao acaso, 3 lmpadas sem reposio. Calcule a probabilidade dessas 3 lmpadas serem boas.

    Soluo: Seja Ai a i-sima lmpada boa, ento:

    P(A1 A2 A3) = P (A1) P(A2 | A1) P(A3 | A1 A2) = 51

    42

    53

    64

    =

    Exemplo 2.3: Sejam A e B dois eventos tais que P(A) = 0,4 e P(AB) = 0,7. Seja P(B) = p. Para que valor de p, A e B sero mutuamente exclusivos? Para que valor de p A e B sero independentes?

    Soluo:

    A e B so mutuamente exclusivos se BA = . Logo 0)( = BAP , com isso )()()( BPAPBAP += 0,7 = 0,4 + p p = 0,7 0,4 = 0,3.

    Se A e B so independentes pBPAPBAP 4,0)()()( == . Como )()()()( BAPBPAPBAP += temos que: 0,7 = 0,4 + p 0,4p. Logo, p = 0,5.

  • 28

    3.2.4 Teorema de Bayes

    Sejam B1, B2, ..., Bk uma partio do espao amostral , onde Bi Bj = i j e Uk

    iiB

    1== , ou

    seja, os eventos eventos B1, B2, ..., Bk so mutuamente exclusivos. Seja A um evento qualquer associado a , ento:

    Figura 4: Visualizao de um problema envolvento Teorema de Bayes

    B1

    B2B3

    B4

    A

    S

    Exemplo 2.3: Numa certa turma, 1% dos homens e 4% das mulheres tem menos que 1,60m de altura. Alm disso, 60% dos estudantes so homens. Considere que um estudante, selecionado aleatoriamente, tem menos que 1,60m de altura. Qual a probabilidade do estudante ser homem?

    Soluo: Sejam os eventos: A = {estudantes com menos de 1,60m de altura}; M = {estudantes do sexo feminino}; H = {estudantes do sexo masculino}.

    Note que os eventos M e H so mutuamente excludentes e representam uma partio do espao amostral , ou seja, M H = e M H = . Alm disso, sabemos que o evento A ocorreu, visto que dito que o estudante possui menos que 1,60m de altura.

    Assim, pelo Teorema de Bayes:

    4. Avaliando o que foi construdo

    Nesta unidade aprendemos lidar com um conceito muito importante da estatstica e que est presente quase diariamente nas nossas vidas, a probabilidade. Aprendemos nesta unidade que uma maneira de responder a pergunta qual a probabilidade de chover hoje seria observar, em um passado recente de dias, o nmero de dias que choveu e dividi-lo pelo total de dias. Aprendemos tambm os conceitos de probabilidade condicional, independncia de eventos e teorema de Bayes. Com isso, estamos nos preparando cada vez mais para as etapas futuras que so as mais significantes deste curso. Para voc que est conosco, Parabns.

    .,,1 ,)().|()().|()().|(

    )()()|(

    11

    kiBPBAPBPBAP

    BPBAPAP

    ABPABP

    kk

    iiii K

    K=

    ++=

    =

    113

    022,0006,0

    40,004,060,001,060,001,0

    )().|()().|()().|(

    )()()|( ==

    +

    =

    +=

    =

    MPMAPHPHAPHPHAP

    APAHPAHP

  • 29

    Unidade III Variveis Aleatrias e Distribuies de Probabilidade

    1. Situando a Temtica

    Na unidade anterior estudamos alguns fenmenos probabilsticos por meio de espaos amostrais mais simples. No entanto, em situaes prticas mais gerais, necessrio ampliar esses conceitos para que tenhamos modelos probabilsticos que atendam as necessidades do problema. A definio do conceito de varivel aleatria possibilitar uma maior flexibilidade e aplicabilidade dos conceitos de probabilidade em problemas diversos.

    2. Problematizando a Temtica

    Ao estudarmos fenmenos aleatrios tais como, a renda de uma populao, o desempenho escolar de um grupo de alunos, o impacto de uma dieta no peso de animais, etc., desejamos saber como controlar esses experimentos e tentar extrair concluses sobre as respostas obtidas. Neste caso, usaremos uma ferramenta valiosa que so as variveis aleatrias.

    3. Conhecendo a Temtica

    Quando na prtica desejamos investigar algum fenmeno, estamos na realidade interessados em estudar a distribuio de uma ou mais variveis relacionadas a este. Assim, por exemplo, podemos estar interessados em estudar a distribuio das notas de estudantes em uma determinada disciplina, do grau de instruo, da altura, etc.

    O que pretendemos, nesta unidade, apresentar alguns modelos tericos de distribuio de probabilidade, aos quais um experimento aleatrio estudado possa ser adaptado, o que permitir a soluo de um grande nmero de problemas prticos.

    3.1. O Conceito de Varivel Aleatria e Variveis Aleatrias Discretas

    Definio 3.1: Seja E um experimento e um espao amostral associado a E. Um funo X, que associe a cada elemento um nmero real, X(), denominada varivel aleatria.

    Observao: 1. Cada elemento de corresponder a exatamente um valor; 2. Diferentes valores , podem levar a um mesmo valor de X; 3. Nenhum elemento poder ficar sem valor de X.

    Definio 3.2: Seja E um experimento e seu espao amostral. Seja X uma varivel aleatria definida em e seja Rx seu contradomnio. Seja B um evento definido em relao a Rx, isto , B Rx. Ento, define-se o evento A como

    )(})(|{ 1 BXBXA == .

    Assim, o evento A ser constitudo por todos os resultados em para os quais X() B.

    Exemplo 3.1: Suponha 2 moedas lanadas e observada a sequncia de caras e coroas obtidas. Considere o espao amostral associado a este experimento:

  • 30

    = {(Ca,Co), (Ca,Ca), (Co,Ca), (Co,Co)}

    Agora, defina uma varivel aleatria X = nmero de caras obtidas no lanamento de 2 moedas. Assim, temos que X = {0, 1, 2}, visto que X(Co,Co) = 0; X(Ca,Co) = X(Co,Ca) = 1 e X(Ca,Ca) = 2.

    Variveis Aleatrias Discretas Denomina-se X uma varivel aleatria discreta se o nmero de valores possveis de X for um conjunto de

    pontos finito ou infinito enumervel. Digamos RX = {x1, x2, . . . , xn , . . . }.

    Definio 3.2: (Funo de Probabilidade) - Seja X uma varivel aleatria discreta. A cada possvel resultado xi de X est associado um nmero pi = P(X = xi), denominado probabilidade da varivel aleatria X assumir o valor xi, satisfazendo as seguintes condies:

    a) 0ip para todo xi RX b) 1......

    21 =++++= ni pppp (a soma das probabilidades igual a 1).

    Definio 3.3: (Funo de Distribuio de Probabilidade) - Dada uma varivel aleatria discreta X, definimos F(x) a funo de distribuio acumulada ou, simplesmente, funo de distribuio (f.d) de X, dada por:

    =

    ===n

    iiiii xXPxFxXPxF

    1)()( )()(

    Exemplo 3.2: Considerando o exemplo 3.1, denote a funo de probabilidade e a funo de distribuio da varivel aleatria X.

    Soluo:

    Seja X = nmero de caras obtidas no lanamento de 2 moedas, temos que a varivel aleatria X assume os seguintes valores, X = {0, 1, 2}.

    Temos que, P(Co,Co) = P(X = 0) = ; P(Ca,Co) = P(Co,Ca) = P(X = 1) = ; P(Ca,Ca) = P(X = 2) = .

    Denotamos a funo de probabilidade de X por

    xi 0 1 2 P(X = xi) 1/4 1/2 1/4

    Por conseguinte, a funo de distribuio acumulada de X dada por

    xi 0 1 2 F(xi) = P(X xi) 1/4 3/4 1

    Exemplo 3.3: Um par de dados lanado. Seja X a varivel aleatria que associa a cada ponto (d1, d2) de a soma desses nmeros, isto , X(d1, d2) = d1 + d2. Determine a funo de probabilidade de X.

    Soluo:

    O espao amostral formado de 36 pares ordenados, representando as possibilidades no lanamentos de dois dados = {(1,1), (1,2), ..., (5,6), (6,6)}.

    Ento, a varivel aleatria X = d1 + d2 assume os seguintes valores X = {2, 3, 4, ..., 12}. Por conseguinte, a funo de probabilidade de X obtida, calculando-se:

    P (X = 2) = P(d1=1,d2=1) = 1/6 1/6 = 1/36 P (X = 3) = P(d1=1,d2=2) + P(d1=2,d2=1) = 1/36 + 1/36 = 2/36

  • 31

    ..

    P (X = 12) = P(d1=6,d2=6) = 1/36

    Logo, a funo de probabilidade de X ser representada por

    xi 2 3 4 5 6 7 8 9 10 11 12 P(X = xi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

    3.2. Variveis Aleatrias Contnuas

    Uma varivel aleatria dita contnua se o seu contradomnio for um intervalo ou uma unio de sub-intervalos.

    Definio 3.4: Uma varivel aleatria X contnua se existir uma funo f, denominada funo densidade de probabilidade (fdp) de X, que satisfaa as seguintes condies:

    1. XRxxf ,0)( ; 2. 1)( =

    +

    dxxf ; 3. Sejam a e b quaisquer no intervalo +

  • 32

    .

    125

    3/136/5

    2

    2

    )3/23/1()2/13/1()3/23/1|2/1( 3/2

    3/1

    2/1

    3/1===

    =

    xdx

    xdx

    XPXPXXP

    Exemplo 3.5: Seja a varivel aleatria X com f(x) definida no exemplo 3.4, calcule sua funo de distribuio acumulada.

    Soluo:

  • 33

    [ ]22 )()( == XEXV , onde = E(X) a mdia de X.

    Observaes: V(X) 0 e mede a variabilidade ou disperso de X em torno da sua mdia ; V(X) expressa em unidades quadradas (o que torna difcil a sua interpretao); O Desvio Padro )(XVX = mede a disperso absoluta de X, sendo expressa na mesma unidade da

    varivel aleatria X. A definio de varincia de uma varivel aleatria (v.a.) X, pode ser re-escrita por

    [ ]222 )()()( XEXEXV == , onde: )()(

    1

    22i

    ixpxXE i

    =

    = .

    Propriedades Importantes do Valor Esperado

    Sejam X uma v.a. e c = constante, ento:

    1. O valor esperado (mdia) de uma constante a prpria constante: E(c) = c

    2. Multiplicando-se uma constante por uma varivel aleatria X, sua mdia fica multiplicada por esta constante:

    E(c.X) = c. E(X)

    3. Somando ou subtraindo uma constante de uma varivel aleatria X, sua mdia fica somada ou subtrada desta constante:

    E(X c) = E(X) c

    4. Sejam X e Y duas variveis aleatrias, o valor esperado da soma/subtrao de variveis aleatrias equivale a soma/subtrao dos valores esperados de X e Y:

    E(X Y) = E(X) E(Y)

    5. Sejam X e Y duas variveis aleatrias independentes, temos que E(X.Y) = E(X).E(Y).

    Propriedades Importantes da Varincia

    Sejam X uma v.a. e c = constante, ento:

    1. A varincia de uma constante zero: V(c) = 0

    2. Multiplicando-se uma constante por uma varivel aleatria X, sua varincia fica multiplicada pelo quadrado da constante:

    V(c.X) = c2. V(X)

    3. Sejam X e Y duas variveis aleatrias independentes, a varincia da soma/subtrao de variveis aleatrias equivale a soma das varincias de X e Y:

    V(X Y) = V(X) + V(Y)

    Exemplo 3.8: Encontre a varincia da varivel aleatria X, denotada por

  • 34

    Temos que, [ ]22 )()()( XEXEXV = . Assim,

    2)(

    )(2))((

    )(2)(

    211)(

    222 baab

    babaab

    abxab

    dxab

    xXEb

    a

    b

    a

    +=

    +=

    =

    =

    =

    Alm disso,

    3)2(

    )(3)2)((

    )(3)(1)(

    22223322 abab

    abababab

    ababdx

    abxXE

    b

    a

    ++=

    ++=

    =

    =

    Logo,

    [ ]12

    )(4

    )(3

    )2()()()(2222

    22 abbaababXEXEXVar =+++==

    3.4. Experimentos Binomiais e a Distribuio Binomial

    Dentre as funes de probabilidade, apresentaremos inicialmente uma distribuio discreta de grande importncia, denominada Distribuio Binomial. Em seguida, faremos estudo de uma distribuio contnua de grande utilizao na teoria da probabilidade, chamada a Distribuio Normal.

    Para utilizar a teoria das probabilidades no estudo de um fenmeno concreto, devemos encontrar um modelo probabilstico adequado a tal fenmeno. Endentemos por modelo probabilstico para uma v.a. X, uma forma especfica de funo de distribuio de probabilidade que reflita o comportamento de X. As propriedades bsicas de um modelo probabilstico devem ser:

    Adequao: O modelo deve refletir adequadamente o mecanismo aleatrio que ocasiona variao nas observaes;

    Simplicidade: Utilizao, sempre que possvel, de hipteses simplificadoras, de modo que o modelo se preste anlise estatstica, sem sacrifcio de adequao;

    Parcimnia de Parmetros: Um nmero excessivo de parmetros prejudicaria a anlise estatstica. Entre 2 modelos que constituam aproximao adequada de um fenmeno, devemos preferir aquele que apresente o menor nmero de parmetros.

    Distribuio de Bernoulli Suponha que realizamos um experimento E, cujo resultado pode ser observado e classificado

    como sucesso ou fracasso, caso o evento que nos interessa ocorra ou no, respectivamente. Associe p, a probabilidade de sucesso, ao evento que nos interessa e 1 p = q, a probabilidade de fracasso. Definimos, ento, a seguinte varivel aleatria discreta:

    =

    sucessoocorrer se ,1fracassoocorrer se ,0

    X .

    A distribuio de probabilidade de X definida por:

    xi 0 1 P(X = xi) 1 p p

    Verifica-se facilmente que E(X) = p e V(X) = p(1 p), que so as principais caractersticas da v.a. X.

    Experimentos Binomiais

    Um experimento binomial apresenta quatro propriedades:

    1. O experimento consiste em uma sequncia de n ensaios idnticos e independentes; 2. Dois resultados so possveis em cada ensaio. Um denominado de sucesso e o outro de fracasso;

  • 35

    3. A probabilidade de um sucesso denotada por p, e no se modifica de ensaio para ensaio. (O mesmo se aplica probabilidade de fracasso q = 1 p );

    4. Os ensaios so independentes; 5. Defina uma varivel aleatria Y como sendo o nmero de sucessos nos n ensaios.

    Definio 3.8: Dizemos que uma varivel aleatria discreta Y = X1 + X2 + ... + Xn, onde cada Xi um ensaio de Bernoulli, apresenta distribuio binomial com n provas (ensaios ou tentativas) e probabilidade p de sucesso, sendo sua funo de probabilidade definida por:

    nkppkn

    kXP knk K,1,0,)1()( =

    ==

    ,

    pois, para X = k teremos observado k sucessos, cada um com probabilidade p e consequentemente (n-k) fracassos, cada um com probabilidade q = 1 p.

    Notao: ),(~ pnBX , equivalente a dizer que X tem distribuio Binomial com parmetros n e p.

    Propriedades

    E(X) = np V(X) = npq

    Exemplo 3.9: Dois times de futebol, A e B, jogam entre si 6 vezes. Suponha que as probabilidades de A ganhar, perder ou empatar sejam as mesmas e permaneam constantes durante as 6 partidas. Encontre a probabilidade do time A ganhar 4 vezes e calcule a esperana e a varincia. Soluo Seja X = {nmero de vezes que o time A ganha} Note que p = 1/3 (vencer) e que q = 2/3 (perder ou empatar). Alm disso, n = 6.

    Logo, 08,024320)3/2()3/1(15)3/11()3/1(

    46)4( 24464 ==

    ==

    XP .

    Temos tambm que a esperana (mdia) de vitrias ser 2316)( === npXE e a

    varincia34

    32

    316)( === npqXV .

    3.5. Distribuio Normal

    A distribuio normal a mais importante das distribuies contnuas de probabilidade. Conhecida por alguns leitores como a curva em forma de sino, tem sua origem associada aos erros de mensurao. sabido que, quando se efetuam repetidas mensuraes de determinada grandeza com um aparelho equilibrado, no se chega ao resultado todas as vezes. Obtm-se, ao contrrio, um conjunto de valores que oscilam, de modo aproximadamente simtrico, em torno do verdadeiro valor. Construindo um histograma desses valores e o correspondente polgono de frequncias, obtm-se uma poligonal aproximadamente simtrica. A distribuio normal desempenha, no obstante, um papel preponderante na estatstica e os processos de inferncia, nela baseados, tm larga aplicao. Muitas das variveis quantitativas analisadas em pesquisas nas diversas reas de estudo correspondem ou se aproximam da distribuio normal.

    Uma distribuio normal caracteriza-se por uma funo real f(x) denominada de funo densidade de probabilidade (f.d.p) da v.a X, dado pelo modelo probabilstico abaixo e grfico correspondente:

    .0,- ,x- ,2

    )(exp

    21)( 22

    2

    2>+

  • 36

    Propriedades da Curva Normal

    1. unimodal, isto , f(x) tem um ponto de mximo cuja abscissa x = . Esse ponto, situado no meio da distribuio, aquele em que coincidem os valores da mdia, moda e mediana; 2. f(x) simtrica em relao mdia ; 3. f(x) tem dois pontos de inflexo, cujas abscissas so x = e x = + ; 4. O desvio-padro dado por ( a raiz quadrada positiva da varincia 2); 5. A rea total sob a curva normal e acima do eixo horizontal equivale a 1 (o eixo das abscissas o eixo dos valores de v.a. X; 6. f(x) tem uma assntota. A partir do topo, a curva cai gradativamente at formar as caudas que se estendem indefinidamente, aproximando-se cada vez mais da linha base sem, entretanto, jamais toc-la. 7. Fixando-se a mdia, verifica-se que o achatamento da curva est diretamente ligado ao valor do desvio padro , ou seja, quanto maior for o desvio padro mais achatada a curva, como pode ser vista na figura abaixo.

    Notao: X N ( , 2), ou seja, X tem distribuio normal com mdia e varincia 2. Ou ainda, X N ( , ) , isto , X tem distribuio normal com mdia e desvio padro .

    Distribuio Normal Padro

    O clculo direto de probabilidades envolvendo a distribuio normal no um processo elementar. Notemos, entretanto, que a funo de densidade normal depende de dois parmetros, e , de modo que se tabelssemos as probabilidades diretamente a partir dessa funo, seriam necessrias tabelas de dupla entrada para cada valor particular = 0 e = 0, complicando consideravelmente o problema. Recorre-se, por isso, a uma mudana de varivel, transformando a v.a. X na v.a. Z assim definida:

    Z X=

    Esta nova varivel chama-se varivel normal padronizada, ou reduzida, sendo sua mdia igual a zero ( = 0) e o seu desvio padro igual um ( = 1).

  • 37

    0)()( ===

    =

    XEXEZE

    10)()( 22

    2 ==

    =

    =

    XVXVZV

    A curva normal padro conserva as mesmas propriedades listadas anteriormente. Mediante tal transformao, basta construirmos uma nica tabela, a da normal reduzida e, atravs dela, obtermos as probabilidades associadas a todas as distribuies N (, ).

    A utilidade notvel da tabulao pela varivel normal padronizada devida ao fato de que, se X tiver qualquer distribuio normal N(, ), a tabela da distribuio N(0; 1) pode ser empregada para calcular probabilidades associadas a X, simplesmente aplicando a transformada para a varivel Z. Consequentemente, temos que

    =

    =

    abbZaPbXaP )( ,

    onde (z) = P (Z z), a funo de distribuio acumulada de N(0; 1).

    Exemplo 3.9: Os salrios mdios dirio dos operrios de uma indstria so distribudos segundo uma distribuio normal com mdia de R$ 50,00 e desvio padro de R$ 4,00. Encontre a probabilidade de um operrio ter um salrio dirio abaixo de R$ 52,00.

    Soluo

    Seja X = o salrio dirio do operrios, estamos interessados em encontrar P (X < 52). Assim,

    )50,0()50,0(4

    505252)52( =

  • 38

    probabilidade de que nenhum motorista selecionado seja mulher? Qual a probabilidade de que pelo menos 3 motoristas selecionados sejam mulheres?

    3.2 O departamento de Recursos Humanos da empresa FF recebe 25 currculos para diversos cargos, e espera que a probabilidade de no ocorrer candidatos experientes no grupo seja de 80%. Determine a probabilidade de no mximo 8 currculos recebidos apresentarem candidatos experientes.

    3.3 Uma confeco de roupa masculina suspeita que 35% de sua produo apresenta algum defeito. Se tal suspeita correta, determine a probabilidade de que, numa amostra de seis peas, sejam encontradas: duas peas defeituosas; no mnimo trs peas defeituosas; menos que trs peas defeituosas.

    3.4 A probabilidade de um atirador acertar o alvo 2/3. Se ele atirar 5 vezes, qual a probabilidade de acertar exatamente 2 tiros ?

    3.5 Suponhamos que a presso sangnea sistlica normal de indivduos com idade entre 15 e 25 anos uma varivel aleatria com distribuio normal de mdia 120mmHg e desvio padro 8mmHg. Nestas condies, calcule a probabilidade de um indivduo dessa faixa etria, com presso sangnea sistlica normal apresentar presso:

    a) Inferior a 120mmHg; (R: 0,5) b) Entre 100 e 110mmHg; (R: 0,0994) c) Acima de 106mmHg; (R: 0,9599) d) Abaixo de 136mmHg; (R: 0,9772) e) Para os 20% dos indivduos que tm as maiores presses sangneas sistlicas, determinar a menor presso sangnea sistlica. (R: 126,72 mmHg) f) Para os 18% dos indivduos que tm as menores presso sangneas sistlicas, determinar a maior presso sangnea sistlica. (R: 112,64 mmHg)

    3.6 Acredita-se que as vendas aproximadas do creme dental MM sejam normalmente distribudas, com uma mdia de 20.000 tubos por semana e um desvio padro de 3.000 tubos por semana. Calcule a probabilidade de que mais de 22.000 tubos sejam vendidos em qualquer dada semana;

    3.7- Os mergulhadores que so membros do Sindicato dos Mergulhadores Profissionais ganham em mdia U$ 17 por mergulho de alta profundidade. Considere que os dados disponveis indicam que o pagamento seja distribudo normalmente com desvio padro de U$ 2,25.

    a) Qual a probabilidade de que os salrios estejam entre U$15,00 e U$20,00 por mergulho; b) Qual a probabilidade de que os salrios sejam menores que U$12,00 por mergulho;

    4. Avaliando o que foi construdo

    Nesta unidade aprendemos o conceito de funo de distribuio de probabilidade, o conceito de varivel aleatria, alm dos conceitos de esperana e varincia de variveis aleatrias. Conhecemos tambm duas distribuies importantssimas na estatstica que so as distribuies Binomial e Normal. Particularmente, a distribuio normal ser uma ferramenta essencial nas unidades seguintes. Faa todos os exerccios propostos, pois eles sero de grande valia.

    Aguardo voc no MOODLE!

  • 39

    Unidade IV Teoria Elementar da Amostragem

    1. Situando a Temtica

    Amostragem uma rea da Estatstica que estuda tcnicas de planejamento de pesquisa para possibilitar inferncias sobre uma populao a partir do estudo de uma pequena parte de seus componentes, uma amostra.

    2. Problematizando a Temtica

    Ao fazermos uma jarra de suco e adicionamos acar desejamos saber se a quantidade de acar foi satisfatria. Para isto, no precisamos tomar toda a jarra de suco, uma colher basta. Da mesma forma, ao estudarmos um fenmeno probabilstico em uma populao no precisamos investigar toda a populao, e sim uma amostra dela. No entanto, algumas questes podem surgir: como obter essa amostra? qual deve ser o tamanho dessa amostra? Esta unidade tem como objetivo responder esta e mais algumas questes correlatas.

    3. Desenvolvendo a Temtica

    3.1 Conceitos Bsicos

    Muitas vezes faz-se necessria a coleta de dados diretamente na origem. Entretanto, quando impossvel se observar toda a populao recorremos s tcnicas de amostragem, onde nos limitamos a uma amostra da populao em estudo. Basicamente, nosso objetivo coletar uma pequena frao da populao de modo que as informaes observadas na amostra possam ser generalizadas para a populao. Para que esta generalizao seja possvel, os integrantes da amostra devem ser escolhidos adequadamente.

    Antes de aprofundarmos nosso discurso, vamos definir alguns termos necessrios: Populao Objeto: a populao de interesse sobre a qual desejamos obter informaes (ex.: peas

    produzidas em uma fbrica); Populao de Estudo: o conjunto de indivduos de interesse especfico (ex.: peas que

    permanecem em estoque); Caracterstica Populacional: Aspectos da populao que interessam serem medidos ou observados

    (ex.: dimetro da pea) Unidade Amostral: Definida de acordo com o interesse do estudo, podendo ser uma pea, um

    indivduo, uma fazenda, etc. Tal escolha deve ser feita no incio do estudo; Estrutura Amostral ou Amostra: o conjunto de unidades amostrais (ex.: o conjunto das peas

    selecionadas).

    importante ressaltar que existem dois tipos de amostragem, a saber: Amostragem Probabilstica: o procedimento atravs do qual existe uma probabilidade conhecida

    e diferente de zero (p) para cada elemento da populao ser escolhido para constituir a amostra; Amostragem No-Probabilstica: Quando, no processo de seleo, no existe nenhum mecanismo

    probabilstico para selecionar os indivduos da populao para constituir a amostra.

    De acordo com a definio de amostragem probabilstica, existe a suposio de um sorteio com regras bem determinadas, cuja realizao s ser possvel se a populao for finita e totalmente acessvel. Esse tipo de amostragem a melhor garantia para se obter uma representatividade da populao pela amostra. Os principais planos de amostragem probabilstica so:

    1. Amostragem Aleatria (ou Casual) Simples: Neste tipo de plano, supe-se que todos os elementos da populao tem igual probabilidade de pertencer amostra, ou alternativamente, se todas as possveis amostras, de mesmo tamanho, tm a mesma probabilidade de serem selecionadas. Normalmente, consideramos esse tipo de plano amostral quando a populao homognea. Esse processo de amostragem pode ser feito com ou sem reposio do elemento amostrado. Uma tcnica que garante esta igual probabilidade a seleo aleatria de elementos, por exemplo, atravs de sorteio.

  • 40

    2. Amostragem Sistemtica: Inicia com uma escolha aleatria de um elemento da populao e, a partir deste, usa-se um sistema de seleo para compor o restante da amostra. Por exemplo, numa listagem de element


Recommended