of 42/42
Inferência Estat Inferência Estat í í stica stica Prof. Prof. V V í í ctor ctor Hugo Hugo Lachos Lachos D D á á vila vila AULA: AULA:

Material Inferência

  • View
    244

  • Download
    0

Embed Size (px)

Text of Material Inferência

  • Inferncia EstatInferncia Estatsticastica

    Prof. Prof. VVctorctor Hugo Hugo LachosLachos DDvilavila

    AULA:AULA:

  • 2

    Inferncia Estatstica

    Inferncia Estatstica um conjunto de tcnicas que objetiva estudar uma populao atravs de evidncias fornecidas por uma amostra.

    Populao o conjunto de todos os elementos ou resultados sob investigao. Amostra qualquer subconjunto da populao.

  • 3

    Problemas da Inferncia

    Exemplo: Qual a distribuio da altura dos brasileiros adultos?. Parece razovel pensar num modelo Normal, a questo agora identificar os parmetros ( e 2) para que ela fique completamente especificada. Como fazer isso?

    Medindo a altura de todos os Brasileiros adultos. Neste caso no necessrio usar Inferncia Estatstica!

    Escolher estrategicamente uma amostra (X1,X2,...,Xn) da populao de adultos e atravs dessa amostra inferir sobre os parmetros ( e 2)da populao.

    Os resultados dependeram da qualidade da amostra. Esta tem que ser representativa da populao.

    Descrevemos aqui um dos problemas bsicos da Inferncia estatstica: Estimao

  • 4

    Problemas da Inferncia

    Exemplo: suponha agora que desejamos saber se a mdia da altura dos brasileiros maior que a dos argentinos (1,65m)?

    Para tomarmos uma deciso, escolhemos estrategicamente uma amostra (X1,X2,...,Xn) da populao de adultos e analisamos se > 1,65 com alta probabilidade.

    Descrevemos aqui um outro problema bsico da Inferncia estatstica: Teste de Hipteses

  • 5

    EstimaEstimaoo Teste de HipTeste de Hiptesesteses

    A moeda honesta ou desequilibrada?

    Qual a proporo de votos que o candidato A tem nas eleies?

    Qual a probabilidade de "cara"no lanamento de uma moeda?

    Qual a proporo de motoristas que tiveram sua carteira apreendida aps a vigncia da nova lei de trnsito?

    O candidato A vencer as eleies ?

    Pelo menos 2% dos motoristas habilitados de SP tiveram suas carteiras apreendidas aps a entrada da nova lei do trnsito ou no?

  • 6

    Como Selecionar uma Amostra

    Ex1: Anlise da quantidade de glbulos brancos na sangue de certo indivduo. Uma gota do dedo seguramente ser representativa para a anlise. Caso Ideal!

    Ex2: Opinio sobre um projeto governamental. Se escolhemos uma cidade favorecida o resultado certamente conter erro (vis).

    Note que a maneira de se obter a amostra muito importante. A Tecnologia da AMOSTRAGEM uma das especialidades dentro da estatstica que fornece procedimentos adequados.

    Aqui trataremos o caso mais simples e que serve de base para procedimentos muito mais elaborados: Amostragem aleatria simples(AAS)

  • 7

    AASSupomos que podemos listar todos os N elementos da populao (populao finita).

    Usando mtodos de gerao de nmeros aleatrios, sorteia-se um elemento da populao, sendo que todos os elementos tem a mesma chance de ser selecionados.

    Repete-se o procedimento at que sejam sorteadas as n unidades da amostra.

    Temos AAS com reposio e sem reposio.

    AAS com reposio implica que tenhamos independncia entre as unidades selecionadas, facilitando o estudo das propriedades dosestimadores. Logo, nestas notas:

    AAS AAS com reposio

  • 8

    Definio: Uma amostra aleatria simples (a.a) de tamanho n de uma v.a. X, o conjunto de n v.as independentes (X1,X2,...,Xn), cada uma com a mesma distribuio de X.

    Definio: As quantidades da populao, em geral desconhecidas, sobre as quais temos interesse, so denominadas parmetros. , , 2

    Definio: Chamamos de estatstica a qualquer funo T da amostra aleatria, i.e.

    T=T(X1,X2,...,Xn)

    Algumas Definies

    Definio: A combinao de elementos da amostra, construda com a finalidade de estimar um parmetro, chamado de estimador, exemplo, Aos valores numricos assumidos pelos estimadores chamamos de estimativas exemplo,

    ___

    X___

    x

  • 9

    Exemplo: Estamos interessados na mdia () e varincia (2) das alturas de jovens com idade entre 15 e 18 anos de certa cidade. Vamos coletar uma amostra para tirar concluses. Suponha que escolhemos ao acaso 10 jovens (AAS).Possveis estimadores para (que por sua vez so estatsticas)

    ;10...),...,(;),...,(;

    2)(),...,( 1011013311012210111 X

    XXXXtXXXtMaxMinXXt =++====+==

    Agora temos a amostra observada: (em metros) 1,65;1.57;1,72;1,66;1,71;1,74;1,81;1,68;1,60;1,77. As estimativas seriam:

    014,0 ;006,0 0,005;

    ;69,110

    77,1...65,1 ;65,1 ;69,12

    )81,157,1(

    322

    22

    12

    3121

    ====

    =++

    ===+

    =

    s

    Possveis estimadores para 2

    23

    2

    1

    222

    2

    1

    210141

    2 )2

    (;)(1

    1;)(1),...,( MinMaxXXn

    SXXn

    XXtn

    ii

    n

    ii

    =

    ====

    ==

  • 10

    Propriedades dos estimadores

    Definio: Um estimador no viciado para um parmetro se

    =)(

    )E

    Definio: Um estimador consistente, se, a medida que o tamanho de amostra aumenta, seu valor esperado converge para o parmetro de interesse e sua varincia converge para zero. i.e.

    0)(lim)

    )(lim)

    =

    =

    Varii

    Ei

    n

    n

    Observe que na definio de consistncia estamos supondo que o estimador depende do tamanho de amostra n. Na definio de vcio o resultado vale para qualquer que seja n.

  • 11

    Exemplo: Considere que uma certa caracterstica X, na populao tem media e varincia 2. Uma amostra aleatria simples (a.a.) de tamanho n, representado por (X1,...,Xn) obtida para estimar . Estudeas propriedades da media amostral.

    n

    n)n

    X...XE()XE()E( n ==++== 1

    LogoX,...,niX)Var(X)E(X iii

    . forma da es , alpopulacion media daestimador O.1 tes,independen so os que e , que Claro 2

    =

    ===

    )

    nXVar

    n)

    nX...XVar()XVar()Var(

    n

    ii

    n2

    12

    1 )(1 ==++== =

    Portanto, a mdia amostral um estimador no viciado para a mdia populacional e como sua variancia tende a zero conforme n cresce, conclumos tambm que um estimador consistente para .Se o interesse estimar 2. Estude as propriedades de

    22

    21

    2 e S=

  • 12

    n=100

    n=50

    n=30

    n=10

    medida que n aumenta, a f.d.p. vai se concentrando ao redor da mdiapopulacional 10. Quanto maior o tamanho de amostra maior probabilidade queuma estimativa de este prxima da mdia populacional.X

    Exemplo: Considere uma a.a. (X1,...,Xn) de uma varivel X~N(10,16). Como se comporta em funo de n. X

  • 13

    Parmetro Esimador Propriedades

    No viciado e consistente

    p

    No viciado e consistente

    2

    No viciado e consistente

    2

    Viciado e consistente

    X

    nicacaraterist favoraveis casos de No =p

    )(1

    1 222 = XnXnS i

    )(1 222 = XnXn i

    Estimadores para a mdia, proporo e Varincia

  • 14

    Suponha que uma amostra aleatria simples (X1,...Xn) retirada de uma populao com mdia e varincia 2 . Ento, temos que

    Teorema Limite Central (TLC)

    Em palavras o TLC garante que para n grande a distribuio da mdia amostral, devidamente padronizada, se comporta segundo um modelo Normal padronizado (Z).

    Em casos onde a verdadeira distribuio dos dados simtrica, boas aproximaes so obtidas para n ao redor de 30.

    Um estudo de simulao descreve graficamente o comportamento de

    para diferentes situaes. X~U(0,1), X~Bin(10,0,3) e X~Exp(1)X

    n quando ),1 ,0(

    /N

    nX

  • 15

    Efeito do tamanho de amostra sobre a distribuio de X

  • 16

    Exemplo: Numa certa cidade, a durao de conversas telefnicas em minutos, segue um modelo Exponencial com parmetro 3. Observando-se uma amostra aleatria de 50 dessas chamadas, qual ser a probabilidade de em mdia, a durao de conversas telefnicas no ultrapassarem 4 minutos.

    9Var(X) e 3E(X) Logo . Exp(3)~X , : ==chamadasdasduraoXSeja

    9909,0)36,2()50/934

    50/93()4( == ZPXPXP

    Admitindo que n grande o suficiente, podemos calcular a probabilidade desejada da seguinte forma:

  • 17

    Coletamos uma a.a. (X1,...Xn) de X~Bernoulli(p), com o objetivo de estimar p. Definimos a proporo amostral (estimador de p) como sendo a frao de indivduos com a caracterstica X , i.e.,

    Note que podemos escrever

    O Caso da Proporo Amostral ( )

    nicacaraterist favoraveis casos de No =p

    p

    pn

    npn

    XEXEXEPE n ==+++= )(...)()()( 21 npp

    npnp

    nXXXVarPVar n )1()1()...()( 2

    21 =

    =+++

    =

    Assim, temos que

    Pelo TLC

    )1,0(/)1(/)1()(

    )( Nnpp

    ppnpp

    pXXVarXEX

    =

    = )

    fracaso ,0 sucesso ,1

    X ,... i21 ==++

    = Xn

    XXXP n

  • 18

    Exemplo: A proporo de peas fora de especificao num lote de 0,4. Numa amostra de tamanho 30, calcule a probabilidade de que a proporo de peas defeituosas seja menor do que 0,5.

    nto, .) ( :

    EamostralproporoamostranasdefeituosapeasdeproporoapSeja

    8686,0)12,1()

    300,40(0,6)

    4,05,0

    300,40(0,6)

    4,0()5,0(

    Assim, ),30

    0,40(0,6) N(0,40,~p

    n quando ),1,0(p)/n-p(1p-p

    )pVar()pE(-p

    =

    =

    wewk

    kwfwk

    k

    2)(~ kW :Notao

  • 31

    Se W tem distribuio qui-quadrado com k graus de liberdade ento:

    E(W)=k, Var(W)=2k;

    A distribuio assimtrica direita;

    A medida que os graus de liberdade aumenta a distribuio torna-se simtrica.

  • 32

    Uso Da Tabela Distribuio Qui-Quadrado

    = 1)W(~WSe2

    ,12(k) kP

    Exemplo 4: Suponha que W uma v.a com 10 graus de liberdade determinar:

    (a) P(W>2,56);

    (b) P(2,56

  • 33

    2)1(2

    2

    ~)1(

    = nSnW

    Para uma nvel de confiana 100(1-)% fixado pode-se determinar 2 1,2

    n e

    2

    1,2

    1 n da distribuio qui-quadrado como mostra a figura::

    Da Estatstica dada em (2) temos:

    X2/2,n-1 X21-/2, n-1

  • 34

    Um intervalo de 100(1-)% de confiana para 2 ado por

    ( )

    =

    = 1

    )1( 21,2/12

    22

    1,2/2

    1,2/12

    1,2/ nnnnSnPWP

    =

    2

    1,2/

    2

    21,2/1

    22 )1(,)1()1,(

    nn

    SnSnIC

    Exemplo: pretende-se avaliar a variabilidade associada ao resultado de um determinado mtodo de anlise qumica. Com esse objetivo, efetuaram-se 24 anlises a uma determinada substncia em que se segui o referido mtodo, em condies perfeitamente estabilizadas. A varincia amostral dos resultados (expressados numa determinada unidade) foi de 4,58. Admitindo que o resultado das anlises segue uma distribuio normal. Obtenha um intervalo de 90% de confiana paravarincia.

  • 35

    Para 1-=0,90 =0,10, da distribuio qui-quadrado com n-1=24-1=23 graus de liberdade temos:

    ( )047,8;995,209,13

    )58,4)(124(,17,35

    )58,4)(124()9,0,( 2 =

    =IC

    x20.05,23 x20.95,23

  • 36

    Intervalo de confiana para uma proporo populacional

    Suponha que tem-se uma populao dicotmica, constituda apenas por elementos de dois tipos , isto , cada elemento podeser classificado com sucesso ou fracasso, suponha que probabilidade de sucesso p e de fracasso q=1-p, e desta populao se retira uma amostra aleatria, X1, Xn de n observaes. Vimos

    )1,0(~)1(

    N

    npp

    ppZ

    =

    Para um nvel confiana fixando em 100(1-)%,um intervalo para p, para uma amostra suficientemente grande.

    +

    = n

    ppzpn

    ppzppIC )1(;)1()1,( 2/12/1

  • 37

    Abordagem otimista

    )porsubstituir p-(p-p)p( 11

    Abordagem conservativa

    1/4 porsubstituir -p)p(1

    )1()1(;)

    1()1,( 2/12/1 anppzp

    nppzppIC

    +

    =

    )1(41;

    41)1,( 2/12/1 bn

    zpn

    zppIC

    +=

  • 38

    Exemplo: Um estudo foi feito para determinar a proporo de famlias em uma comunidade que tem telefone (p). Uma amostra de 200 famlias selecionada, ao acaso, e 160 afirmam ter telefone. Que dizer de p com 95% de confiana?

    Uma estimativa pontual de p %)80(8,0200160 ==p

    J que 1-=0,95, temos da tabela normal padro z0975.=1,96. Substituindo em (1a)

    ( )855,0;745,0200

    )8,01(8,096,18,0;200

    )8,01(8,096,18,0)95,0,( =

    +

    =pIC

    )869,0;731,0(2004

    196,18,0;2004

    196,18,0)95,0,( =

    =pIC

    Em (1b)

  • 39

    Determinao do tamanho da amostra para estimao de p

    O erro mximo de estimao na estimao de p dado por

    No caso de populao finita de N elementos introduzida o fator de correo de populao finita

    )1()1()1(

    2/122

    2/12

    ppzNEppNzn

    +

    =

    nppzE )1(

    21

    =

    ( )2

    2/12 )1(

    Eppzn =

    1)1(

    21

    =

    NnN

    nppzE

    Quando no se tem informao de p: ( )2

    2/12 25,0

    Ezn =

    Quando no se tem informao de p:)25,0()1(

    )25,0(2/1

    222/1

    2

    +=

    zNENzn

  • 40

    Exemplo: O servio social de um municpio deseja determinar a proporo de famlias com uma renda familiar inferior a R$ 200,00. Estudos anteriores indicam que esta proporo de 20%.

    (a) Que tamanho de amostra se requer para assegurar uma confiana de 95% que o erro mximo de estimao desta proporo no ultrapasse o 0,05?

    (b) Em quanto variara o tamanho da amostra se o erro mximo permissvel reduzido a 0,01.?

    Dos dados temos p=0,20 e 1-=0,95. Da tabela normal padro z0,975.=1,96.

    ( ) 24686,24505,0

    8,02,0)96,1(2

    2

    =

    = n

    (a) O erro mximo de estimao E=0,05.

  • 41

    (b) O erro mximo de estimao E=0,01.

    ( ) 614756,614601,0

    8,02,0)96,1(2

    2

    =

    = n

    No caso de estarmos usando nvel de confiana de 95% , temos que z0,975.=1,96 2, ento temos:

    201

    En =

    A expresso anterior muito usado no planejamento de pesquisa de levantamento, com o objetivo de estimar vrias propores como nos exemplos seguintes:

    Numa pesquisa eleitoral, em que comum a necessidade de avaliar a proporo de cada candidato;

    Na pesquisa de mercado, em que normalmente desejam-se avaliar as propores de vrias caractersticas dos consumidores.

  • 42

    No caso de populao finita de N elementos introduzida o fator de correo de populao finita:

    100

    +=

    nNNn

    n