25
Inferência Estatística Estimação Intervalar Média e Proporção Estimação Pontual x Estimação Intervalar Exemplo Inicial: Um estudo pretende estimar o valor de μ, a renda média familiar dos alunos da UFMG. Em uma amostra de 40 alunos da universidade, encontrou-se uma renda familiar média 1600 reais (estimativa pontual), com desvio-padrão s=323 reais. x = Já sabemos que os valores de variam de amostra para amostra e se distribuem em torno do valor de μ. x

Aula 15 - Intervalos de Confiança - Média e Proporção1

Embed Size (px)

DESCRIPTION

Aula de intervalo de confiança

Citation preview

  • InfernciaEstatstica

    Estimao IntervalarMdia e Proporo

    Estimao Pontual x Estimao Intervalar

    Exemplo Inicial:

    Um estudo pretende estimar o valor de , a rendamdia familiar dos alunos da UFMG.

    Em uma amostra de 40 alunos da universidade, encontrou-se uma renda familiar mdia 1600 reais (estimativa pontual), com desvio-padro s=323 reais.

    x =

    J sabemos que os valores de variam de amostra paraamostra e se distribuem em torno do valor de .

    x

  • Estimao Pontual x Estimao Intervalar

    Assim, divulgar somente um nico valor como estimativade (estimao pontual) deixa de lado toda a incerteza envolvida no processo de estimao de um parmetro.

    Estimativa Intervalar = Estimativa pontual Erro de estimao

    Para nos lembrar da incerteza envolvida no resultadoamostral, vamos associar um erro de estimao estimativa pontual:

    Estimao Pontual x Estimao Intervalar

    Exemplo Inicial:

    A estimativa pontual para a renda familiar mdia do aluno da UFMG 1600 reais.

    O erro de estimao foi calculado em 100 reais.

    Assim, a estimativa intervalar para a renda familiar mdia do aluno da UFMG de

    [1600 100] = [1500 ; 1700] reais.

  • Nvel de Confiana de umaEstimativa Intervalar

    Toda estimativa intervalar tem associada a ela um nvel de confiana, geralmente expresso em porcentagem.

    Ex: nvel de confiana de 95%

    Ento, falamos em Intervalo de Confiana.

    Ex: o intervalo de 95% de confiana para a renda familiar mdia do aluno da UFMG vai de R$1500,00 a R$1700,00.

    Como calcular um Intervalo de Confiana ?

    Intervalo de Confiana = Estimativa pontual Erro de estimao

    O erro de estimao ocorre porque uma varivel aleatria.

    X

    Assim, para calcular o erro de estimao, vamos precisar da distribuio de probabilidades de .X

  • Relembrando: Teorema Central do Limite

    Seja uma amostra aleatria , de uma varivel aleatria com mdia e desvio padro .

    1 2, ,..., nx x x

    X

    (0,1)/ ~

    nXZ Nn

    =

    Intervalo de 95% de confiana para a mdia populacional ()Queremos encontrar um intervalo (L1, L2) tal que com probabilidade 95% a mdia da populao esteja dentro dele, isto

    [[[[ ]]]] 95,02L1LP ====

  • +

    n1,96X,

    n1,96-X O intervalo

    chamado de intervalo de 95% de confiana para a mdia populacional.

    Exemplo: O peso mdio ao nascer de crianas nascidas de mes de certo grupo etrio tem mdia desconhecida e desvio padro conhecido igual a 0,5kg. Uma amostra de 30 crianas desta populao foi observada encontrando-se uma mdia amostral igual a 2,5 kg.

    Obtenha um intervalo de 95% de confiana para o peso mdio ao nascer dos filhos das mulheres deste grupo etrio.

    X peso ao nascer peso mdio ao nascer = 0,5 Kg desvio padro do peso ao nascer

    2,5x 30, n :amostra da Dados ========

    ]68,2;32,2[305,01,965,2;

    305,01,96-2,5 =

    +

    O intervalo de 95% de confiana para dado por

    Interpretao: Com 95% de confiana o peso mdio ao nascer das crianas nascidas de mes do grupo etrio de interesse estentre 2,32 kg e 2,68 kg.

  • Porque usamos o termo confiana ao invs de probabilidade?

    95,0n

    1,96Xn

    1,96-XP =

    +

  • Como podemos entender o termo confiana?

    Suponha que muitas amostras de mesmo tamanho n sejam retiradas da populao de interesse e que a partir de cada uma delas seja obtido um intervalo de 95% de confiana para o parmetro de Interesse. Qual a porcentagem esperada de intervalos que incluiro o valor do parmetro?

    No grfico seguinte so apresentados 200 intervalos de 95% de confiana obtidos a partir de amostras de tamanho 50 de uma populao Normal com mdia =100 e desvio padro = 10.

    Observe que alguns intervalos (com centro fora delimitado pelas retas inferior e superior) no incluem a media populacional =100.

    Esperaramos de 95% dos intervalos construdos o contivessem.

    0 50 100 150 200

    9496

    9810

    010

    210

    410

    6

    amostra

    Inte

    rval

    o de

    co

    nfin

    aa

  • Outra maneira de interpretar o intervalo de confiana

    erro de margemou estimao de erro chamado -X

    n1,96-X

    n1,96X

    n1,96-X

    1) . Toda a

    variao de Z resulta da variao da mdia amostral. Quando substitumos por S, outra quantidade amostral, introduzimos uma nova fonte de variao.

    4) Quanto menor for o tamanho da amostra, maior deve ser a variao introduzida em T como resultado da variao de S. Quando n cresce, S aproximar-se de .

    5) Temos ento uma distribuio diferente para tamanho de amostra.

    Resultado Importante:

    Se X1, X2, . . . Xn uma amostra aleatria de uma

    populao Normal com mdia e desvio padro , a varivel tem distribuio t de Student com

    (n-1) graus de liberdade./

    XTs n

    =

    Mas, qual a distribuio de T?

    Obs: O termo graus de liberdade para identificar a distribuio, pois para cada tamanho de amostra temos uma distribuio diferente.

  • Distribuio t-Student

    Normal (0;1)

    t-Student com 3 graus de liberdade

    Distribuio t-Student

    William Gosset(Student)

    A distribuio t-Student foi propostapor W. Gosset, que usava o pseudnimo de Student, paratrabalhar com pequenas amostras.

    A distribuio t-Student tem o formatoparecido com a da distribuio Normal Padro e tambm centrada no valor zero.

    A distribuio t-Student depende de um nico parmetro, chamado grau de liberdade (g.l.)

  • g.l.=1g.l.=2g.l.=3g.l.=4g.l.=5g.l.=6g.l.=7g.l.=8g.l.=9g.l.=10g.l.=15g.l.=20g.l.=25g.l.=30

    A distribuio t-Student aproxima-se da Normal Padro medida que os graus de liberdade crescem.

    Como calcular probabilidades com a distribuio t-Student ?

    Ao contrrio da tabela Normal, a tabela t-Student fornecepercentis.

    A distribuio t-Student simtrica em torno do valor 0. Assim, somente os percentis positivos so tabelados.

    . .;g lt . .;(1 ) . .;g l g lt t =

  • Tabela tDistribuio T de Student )( tTP >=

    Graus de liberdade .25 .20 .15 .10 .05 .025 .02 .01 .005

    1 1.000 1.376 1.963 3.078 6.314 12.71 15.89 31.82 63.66 2 .816 1.061 1.386 1.886 2.920 4.303 4.849 6.965 9.925 3 .765 .978 1.250 1.638 2.353 3.182 3.482 4.541 5.841 4 .741 .941 1.190 1.533 2.132 2.776 2.999 3.747 4.604 5 .727 .920 1.156 1.476 2.015 2.571 2.757 3.365 4.032 6 .718 .906 1.134 1.440 1.943 2.447 2.612 3.143 3.707 7 .711 .896 1.119 1.415 1.895 2.365 2.517 2.998 3.499 8 .706 .889 1.108 1.397 1.860 2.306 2.449 2.896 3.355 9 .703 .883 1.100 1.383 1.833 2.262 2.398 2.821 3.250 10 .700 .879 1.093 1.372 1.812 2.228 2.359 2.764 3.169 11 .697 .876 1.088 1.363 1.796 2.201 2.328 2.718 3.106 12 .695 .873 1.083 1.356 1.782 2.179 2.303 2.681 3.055 13 .694 .870 1.079 1.350 1.771 2.160 2.282 2.650 3.012 14 .692 .868 1.076 1.345 1.761 2.145 2.264 2.624 2.977 15 .691 .866 1.074 1.341 1.753 2.131 2.249 2.602 2.947 16 .690 .865 1.071 1.337 1.746 2.120 2.235 2.583 2.921 17 .689 .863 1.069 1.333 1.740 2.110 2.224 2.567 2.898

    Distribuio T de Student )( tTP >=

    Graus de liberdade .25 .20 .15 .10 .05 .025 .02 .01 .005

    18 .688 .862 1.067 1.330 1.734 2.101 2.214 2.552 2.878 19 .688 .861 1.066 1.328 1.729 2.093 2.205 2.539 2.861 20 .687 .860 1.064 1.325 1.725 2.086 2.197 2.528 2.845 21 .663. .859 1.063 1.323 1.721 2.080 2.189 2.518 2.831 22 .686 .858 1.061 1.321 1.717 2.074 2.183 2.508 2.819 23 .685 .858 1.060 1.319 1.714 2.069 2.177 2.500 2.807 24 .685 .857 1.059 1.318 1.711 2.064 2.172 2.492 2.797 25 .684 .856 1.058 1.316 1.708 2.060 2.167 2.485 2.787 26 .684 .856 1.058 1.315 1.706 2.056 2.162 2.479 2.779 27 .684 .855 1.057 1.314 1.703 2.052 2.15 2.473 2.771 28 .683 .855 1.056 1.313 1.701 2.048 2.154 2.467 2.763 29 .683 .854 1.055 1.311 1.699 2.045 2.150 2.462 2.756 30 .683 .854 1.055 1.310 1.697 2.042 2.147 2.457 2.750 40 .681 .851 1.050 1.303 1.684 2.021 2.123 2.423 2.704 50 .679 .849 1.047 1.295 1.676 2.009 2.109 2.403 2.678 60 .679 .848 1.045 1.296 1.671 2.000 2.099 2.390 2.660 80 .678 .846 1.043 1.292 1.664 1.990 2.088 2.374 2.639

    100 .677 .845 1.042 1.290 1.660 1.984 2.081 2.364 2.626 inf. .674 .841 1.036 1.282 1.64 1.960 2.054 2.326 2.576

  • Para compreender melhor .Encontre os seguintes percentis da distribuio t-Student

    19;0.05t =

    10;0.025t =

    7;0.005t =

    19;0.95t =

    019t

    1.729

    0.05

    019t

    -1.729

    0.95

    Agora,que j conhecemos a distribuio vamos utiliz-la na obteno de intervalos de confiana para a mdia populacional

  • Intervalo de 100(1-)% de Confiana para

    ( 1); / 2100(1 )%

    .n

    sIC x tn

    =

    o percentil de ordem 1 - /2 dadistribuio t-Student com (n-1) graus de liberdade, isto que deixa uma rea de /2 acima dele

    / 2;( 1)nt

    / 2;( 1)nt

    /2

    ( 1)nt

    Erro de estimao

    estimativapontual de

    Exemplo: estimao da idade mdia ao falar

    Em um experimento com uma amostra de n=20 crianas, a idade mdia ao falar foi de = 10 meses com desvio-padro de s =1.5 meses.

    x

    [ ]( 1; /2) (19; /2)

    100(1 )%

    100(1 )%

    . 10nsIC x t tn

    = =

    = ]( 1; /2) (19; /2) .

    1.5. 10

    2010 .0.335

    IC x t t

    = =

    [ ](19; / 2)100(1 )% 10 0.335IC t =

  • Em um experimento com uma amostra de n=20 crianas, a idade mdia ao falar foi de = 10 meses com desvio-padro de s =1,5 meses.

    x

    Intervalo de 90% de confiana: 100(1-)%=90%1- = 0.90 = 0.10 /2 = 0.05 t(19;0,05) = 1.729

    [ ] [[ ]

    90% 10 1.729 0.335 10 0,6 10 0.6;10 0.69.4;10.6

    ICIC

    = = = +=

    [ ] [ ]10 1.729 0.335 10 0,6 10 0.6;10 0.6= = = +[[ ]90% 9.4 ; 10.6IC =

    Exemplo: estimao da idade mdia ao falar

    [ ](19; / 2)100(1 )% 10 0.335IC t =

    A idade mdia ao falar para esta populao de crianas est entre 9.4 e 10.6 meses, com 90% de confiana.

    Interpretando o intervalo de confiana

  • Quando a amostra pode ser consideradagrande (n > 30) . os percentis da distribuio t-Student podem ser substitudos pelos percentis calculados na TabelaNormal-Padro (tabela Z).

    Percentis da Distribuio Normal Padro

    Intervalo de 100(1-)% de Confiana para quando n > 30

    / 2100(1 )%

    .

    sIC x zn

    =

    Erro de estimao

    estimativapontual de

    estimativa davariabilidade de

    x

    Fator para reduoda confiana

    / 2z

    /2 o percentil da distribuio Normal-padro que deixa uma rea de /2 acima dele

    / 2z

  • Intervalo de Confiana para a Proporo

    / 2100(1 )% (1 )

    .pp pIC p z

    n

    =

    Vlido somente quando n > 30 (amostras grandes)

    Proporoamostral

    Exemplo: estimao da proporo de pessoas curadas com um novo tratamento

    Deseja-se saber a eficcia de um novo tratamento contra micose em adultos. Ou seja, deseja-se estimar:

    P = proporo de pessoas que seriam curadas com o novo tratamento

    Uma amostra de 50 pessoas doentes foi tratada segundo o novo tratamento e 45 deles foram curadas.

    Estimativa Pontual: a proporo amostral 45 / 50 0.90p = =

  • Estimativa Intervalar

    100(1 )%/2

    (1 ) .p

    p pIC p zn

    =

    [ ]/2

    /2

    0.9(0.1)0.950

    .

    0.9 0.04

    z

    z

    =

    =

    Exemplo: estimao da proporo de pessoas curadas com um novo tratamento

    Intervalo de 90% de confiana: 100(1-)%=90%1- = 0.90 = 0.10 /2 = 0.05 z/2 = z0,05 =1.64

    [ ] [ ] [ ][ ]

    90%

    90%

    0.9 1.64 0.04 0.9 0.07 0.9 0.07;0.9 0.070.83 ; 0.97

    p

    p

    ICIC

    = == +=

    Assim, com base nesta amostra, estimamos que a proporo de cura com o novo tratamento est entre 83% e 97%, com 90% de confiana.

    Exemplo: estimao da proporo de pessoas curadas com um novo tratamento

  • Como aumentar a preciso da estimativa do parmetro de interesse,isto , como reduzir o erro amostral?

    Aumentando o tamanho da amostra

    Clculo do tamanho de amostra para estimao da mdia populacional

    Qual o menor tamanho de amostra necessrio para estimarmos com 100(1-)% de confiana a mdia populacional com erro de estimao de no mximo E?

    / 2erro de estimao = .zn

    O valor de n pode ser extrado da expresso para o erro de estimao

    /2

    2 = .

    erro de estimaon z

    Para o caso da mdia populacional , temos

  • Exemplo: idade mdia ao falar

    Qual o tamanho mnimo de amostra para se estimar a idade mdia ao falar, em um intervalo de 95% de confiana, com um erro de estimao mximo de 1 ms? Suponha que o desvio-padro seja de = 2 meses.

    (0.05/2)22.0

    =

    1.0n z

    22.0 = 1.96 15.37

    1.0n

    =

    Ou seja, devem ser amostradas, no mnimo, 16 crianas.

    Alternativa

    / 2

    2 = .

    erron z

    Se no tivermos como saber nem aproximar o valor de , podemos trabalhar com o valor da razo .

    erro

    Exemplo anterior: Qual o tamanho mnimo de amostra para se estimar a idade mdia ao falar, em um intervalo de 95% de confiana, de modo que o erro de estimao seja, no mximo, 80% do desvio-padro populacional? Ou seja,

    erro 0.80 0.80 erro 1.25erro

  • Clculo de tamanho de amostra para o caso da estimao de uma proporo

    /2(1 )

    erro de estimao . p pzn

    =

    Como fazer ???

    O erro de estimao depende do prprioparmetro a ser estimado (!!!)

    Vamos usar uma propriedade interessanteda expresso (1 )p p

    Propriedade de (1 )p p

    0.0 0.2 0.4 0.6 0.8 1.0

    0.0

    0.1

    0.2

    0.3

    0.4

    0.5

    p

    (1 )p p

    O valor de

    mximoquandop=0.50.

    (1 )p p

  • Clculo de tamanho de amostra para o caso da estimao de uma proporo

    /2(1 )

    erro de estimao . p pzn

    =

    O clculo de n feito considerando p=0.50.

    /22

    (1 )erro

    zn p p

    =

    /22

    20.5erro

    zn

    =

    Exemplo: estimao da proporo de pessoascuradas com um novo tratamento

    Qual o tamanho mnimo de amostra para se estimar a proporo de cura com novo tratamento, em um intervalo de 95% de confiana, com um erro de estimao mximo de 0.10?

    /22

    20.5erro

    zn

    =

    221.96 0.5 96.04

    0.10n

    = =

    Ou seja, devem ser amostradas, no mnimo, 97 pessoas.Se o erro mximo fosse de 0.05, seriam necessrias, no mnimo, 385 pessoas.

  • Ateno !!As expresses aqui apresentadas s so vlidaspara estudos em que:

    1 - Todos os indivduos da populao tero a mesma probabilidade de serem selecionados para a amostra.

    2 A populao pode ser considerada muito grandeem relao amostra (populaes infinitas).

    Para casos mais complexos, devemos utilizartcnicas de Amostragem mais avanadas (Bussab e Bolfarine, 2005) .

    Para compreender melhor .

    Exerccios de 9.1 a 9.5 da Seo 9