67
Introdução a Estatística Prof a . Juliana Freitas Pires Departamento de Estatística Universidade Federal da Paraíba - UFPB [email protected]

Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Introdução a Estatística

Profa. Juliana Freitas PiresDepartamento de Estatística

Universidade Federal da Paraíba - [email protected]

Page 2: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Introdução

O curso foi dividido em três etapas:1 vimos como resumir descritivamente variáveisde um conjunto de dados.

2 aprendemos um pouco de probabilidade e co-nhecemos a distribuição Normal, que é capazde representar adequadamente o comportamentode algumas variáveis.

3 esta etapa, apresentaremos métodos para fa-zer afirmações sobre as características de umapopulação (parâmetros), com base em informa-ções dadas por amostras.

Page 3: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Revisando alguns conceitos . . .

População: conjunto de todos os elementos ouindivíduos sob investigação.Amostra: qualquer subconjunto (não vazio) dapopulação.Variável Aleatória: característica da populaçãosujeita a variação.Parâmetro: Característica numérica observadana população.Estimador: Característica numérica estabelecidapor valores da amostra (uma função da amostra).Estimativa: um particular valor assumido porum estimador.

Page 4: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Introdução à Inferência Estatística

O uso de informações de uma amostra para con-cluir sobre o todo faz parte do dia a dia da maioriadas pessoas. Por exemplo:• Uma cozinheira ao verificar o sal de um pratoque está preparando;

• Um comprador, após experimentar uma pe-quena fatia de queijo, decide se vai ou não com-prar o queijo;

• A forma como as mães verificam a temperaturado mingau de seus bebês.

Page 5: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Inferência

• Inferência Estatística: conjunto de métodosde análise estatística que permitem tirar con-clusões sobre uma característica da populaçãocom base em somente uma parte dela (umaamostra).

• Em outras palavras, a inferência estatística tratade métodos que permitem a obtenção de con-clusões sobre um ou mais parâmetros de umaou mais populações através de quantidades (es-timadores) calculadas a partir da(s) amostra(s);

Page 6: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Inferência

• Fazer inferência (ou inferir) = tirar conclusõessobre as características de uma população (pa-râmetros), com base em informações dadas apartir da amostra (estimadores);

• Os métodos de inferência podem ser agrupadosem duas categorias:

1 Estimação: pontual ou intervalar2 Testes de Hipóteses

Page 7: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Com o que lida a Inferência?

Suponha que desejamos saber qual a altura médiados brasileiros adultos. Como podemos obter essainformação?• Medindo a altura de todos os brasileiros adul-tos. Nesse caso, não será necessário usar infe-rência estatística.

• Selecionar adequadamente uma amostra alea-tória (X1, X2, . . . , Xn) da população de brasi-leiros adultos e, através dessa amostra, inferirsobre a altura média (parâmetro).

Page 8: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Podemos inferir sobre a altura média dos brasileiros adultosde duas formas:

1 Estimação:• Estimativa Pontual: calculando a média das altu-ras dos brasileiros adultos selecionados na amostra;

• Estimativa Intervalar: através dos valores da amos-tra construir um intervalo de tal forma que a proba-bilidade de o verdadeiro valor da altura média dosbrasileiros pertencer a este intervalo seja alta.

2 Testes de Hipóteses:• Em uma outra situação, poderíamos estar interessa-dos em testar se a afirmação “os brasileiros têm, emmédia, 169 cm” é verdadeira. Com base na amostra,podemos realizar um Teste de Hipóteses.

Contudo, estes resultados dependerão da qualidade da amos-tra, que tem que ser representativa da população.

Page 9: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,
Page 10: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

A forma como selecionamos uma amostrainterfere nos resultados?

Ex 1: Análise da quantidade de glóbulos bran-cos no sangue de certo indivíduo. Uma gotado dedo seguramente será representativa paraa análise. Caso Ideal!Ex 2: Opinião sobre um projeto governamen-tal. Se escolhermos uma cidade favorecida, oresultado certamente conterá erro (viés)

OBS: Observe que a forma como se obtém a amos-tra é determinante para a validade da pesquisa.

Page 11: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Como selecionar uma amostra?

• A maneira de selecionar a amostra é tão im-portante que existem diversos procedimentosde obtê-la.

• A teoria da amostragem é o ramo da estatísticaque fornece procedimentos adequados para aseleção de amostras.

• Aqui, trataremos do caso mais simples de amos-tragem probabilística, e que serve como basepara procedimentos mais elaborados: a amos-tragem aleatória simples, com reposição, a serdesignada por AAS.

Page 12: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Amostragem Aleatória Simples (AAS)

• Supomos que podemos listar todos os N ele-mentos de uma população homogênea e finita.

• Usando um procedimento aleatório, sorteia-seum elemento da população.

• Repete-se o procedimento até que sejam sorte-adas as “n” unidades da amostra.

• Temos AAS com reposição e sem reposição,contudo, com reposição implica independênciaentre as unidades selecionadas facilitando o es-tudo das propriedades dos estimadores.

• Neste curso, será considerada a amostragemaleatória simples, com reposição, a ser desig-nada por AAS.

Page 13: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Estimação

• Em qualquer área do conhecimento nos depara-mos com o problema de estimar alguma quan-tidade de interesse.

Exemplo: estimar a proporção de indivíduos quevotarão em determinado candidato.

• A estimação pode ser feita de duas formas:1 Estimação Pontual: um único valor e utilizadopara inferir sobre um parâmetro de interesse.

2 Estimação Intervalar: uma faixa de valores ouintervalo é utilizado para inferir sobre umparâmetro de interesse, com algum grau deconfiança.

Page 14: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Estimação Pontual

Na estimação pontual desejamos encontrar umúnico valor numérico que esteja bastante próximodo verdadeiro valor do parâmetro.

Parâmetro EstimadorMédia (µ)

X =

∑ni=1Xi

nVariância (σ2)

S2 =

∑ni=1(Xi −X)2

n− 1Desvio Padrão (σ)

S =√S2

Proporção (p)p̂ = X

nondeX é o número de indivíduos

que possuem a mesma característica deinteresse

Page 15: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Exemplo

Os preços de um determinado produto em 10 diferentesmercados em um determinado mês foram:

0.75 1.1 0.6 2 1.3 0.69 2.1 1.3 0.83 1

• A estimativa pontual da média do preço do produto édada por

X =0.75 + 1.1 + · · ·+ 0.83 + 1

10= 1.167

• A estimativa pontual da proporção de preços menoresque 1 real é dada por

p̂ =4

10= 0.4

Page 16: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Estimação Pontual × Estimação Intervalar

• Estimadores pontuais, especificam um único va-lor para o parâmetro.

• Mas, sabemos que diferentes amostras levam adiferentes estimativas, pois o estimador é umafunção de uma amostra aleatória.

• E, estimar um parâmetro através de um únicovalor não permite julgar a magnitude do erroque podemos estar cometendo.

• Daí, surge a ideia de contruir um intervalo devalores que tenha uma alta probabilidade deconter o verdadeiro valor do parâmetro (deno-minado intervalo de confiança).

Page 17: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Como construir um intervalo de confiança?

• Um intervalo de confiança (ou estimativa inter-valar) é construído de forma que a estimativapontual esteja acompanhada de uma medidade erro.

Intervalode Confiança =

[EstimativaPontual ± Erro de

Estimação

]

Page 18: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Estimação Intervalar

• Um intervalo de confiança (ou estimativaintervalar) representa uma amplitude de valo-res que tem alta probabilidade (grau de confi-ança) conter o verdadeiro valor do parâmetro.

• O grau de confiança (ou nível de confi-ança) é uma medida que representa a proba-bilidade do intervalo conter o parâmetro popu-lacional. Tal probabilidade é chamada de 1−α.Logo, α será a probabilidade de erro ao se afir-mar que o intervalo contém o verdadeiro valordo parâmetro.

Page 19: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Intervalo de confiança para a média populacional

• Duas situações são consideradas quando de-sejamos estabelecer um intervalo de confiançapara a média de uma população:

1 A variância σ2 é conhecida;

2 A variância σ2 é desconhecida;

Page 20: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Intervalo de confiança para a média populacional

• Adicionalmente, deve-se verificar se uma dasduas suposições seguintes é satisfeita:

1 A amostra é proviniente de uma populaçãonormal. Pois, sabemos que seX ∼ N(µ, σ2) então X ∼ N(µ, σ2/n).

2 A amostra tem tamanho maior do que 30,n > 30, o que nos permite aproximar a dis-tribuição da média amostral X pela distri-buição normal, como na suposição anterior.

Page 21: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Intervalo de confiança para a média populacional

De modo geral, estamos interessados em encontrarum intervalo na forma:

IC = [X − ε0;X + ε0] = [X ± ε0]

onde ε0 representa a margem de erro ou erro deprecisão em relação à média µ.• Mas, lembre-se que existem duas situações:

1 A variância σ2 é conhecida;

2 A variância σ2 é desconhecida;

Page 22: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Caso 1: A variância σ2 é conhecida

Quando a variância é conhecida a margem deerro em relação à média µ é da forma:

ε0 = zα/2σ√n

em que zα/2 é o quantil da normal padrão de nívelα/2.

Page 23: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Caso 1: A variância σ2 é conhecida

Dessa forma, se X for a média de uma amostraaleatoria de tamanho n, proveniente de uma po-pulação com variância conhecida, um intervalo de100(1 − α)% de confiança para a média populaci-onal é dado por:

ICµ100(1−α)% =

(X − zα/2

σ√n,X + zα/2

σ√n

)em que zα/2 é o quantil da normal padrão de nívelα/2.

Page 24: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Exemplo

• Em uma industria de cerveja, a quantidade decerveja inserida em latas se comporta comouma distribuição normal com média 350 ml edesvio padrão 3 ml. Após alguns problemas nalinha de produção, suspeita-se que houve al-teração na média. Uma amostra de 20 latasacusou uma média de 346 ml. Obtenha umintervalo de 95% para a quantidade média decerveja inserida em latas, supondo que não te-nha ocorrido alteração na variabilidade.

Page 25: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Exemplo

Resposta: A variância σ2 é conhecida, então ointervalo é dado por

ICµ100(1−α)% =

(X − zα/2

σ√n,X + zα/2

σ√n

)Como 1− α = 0, 95, temos que α = 0, 05. Então,α/2 = 0, 025. Ou seja, devemos olhar na tabelada normal padrão qual o número z0,025.

Page 26: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Exemplo

Olhando na tabela, temos que zα/2 = 1, 96. Assim,o intervalo é obtido através de:

ICµ95% =

(346− 1, 96

3√20, 346 + 1, 96

3√20

)= (344.69, 347.31)

Isto é, o intervalo de valores [344, 69; 347, 31] con-tém a quantidade média de cerveja inserida naslatas está com 95% de confiança. Logo, conclui-seque realmente houve alteração, após os problemasencontrados na linha de produção, na quantidademédia de cerveja inserida em latas.

Page 27: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Calculando o tamanho da amostra

Note que, a partir da expressão obtida para a mar-gem de erro ε0, podemos estimar o tamanho daamostra, se α e ε0 estiverem especificados:

ε0 = zα/2σ√n⇒√n = zα/2

σ

ε0⇒ n =

(zα/2

σ

ε0

)2

Se a população for finita, com N elementos, deve-se utilizar o fator de correção para populações fi-nitas. Nesse caso, o tamanho da amostra será de-terminado por:

n∗ =n

1 + nN

Page 28: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Exemplo

• Uma construtora deseja estimar a resistênciamédia das barras de aço utilizadas na constru-ção de casas. Qual o tamanho amostral neces-sário para garantir que haja um risco de 0, 001de ultrapassar um erro de 5kg ou mais na es-timação? O desvio padrão da resistência paraeste tipo de barra é de 25kg.

Page 29: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Exemplo

Resposta: Do enunciado tem-se α = 0, 001, ε0 =5 e σ = 25. Da tabela da distribuição normalpadrão obtemos zα/2 = z0,0005 = 3, 29. Assim,

n =

(zα/2

σ

ε0

)2

=

(3, 29× 25

5

)2

= 270, 602 ∼= 271

Page 30: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Intervalo de confiança para a média populacionalCaso 2: A variância σ2 é desconhecida

O processo para se obter o intervalo de confiança ésemelhante ao anterior. Contudo, como σ2 é desco-nhecida, é preciso substitui-la pela variância amos-tral (S2):

S2 =

∑ni=1(Xi −X)2

n− 1

E, a quantidade zα/2 é substituída por t(n−1,α/2),que é o quantil da t-student de nível α/2.

Page 31: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Distribuição t-Student

• A distribuição t-student apresenta proprieda-des semelhantes as da distribuição normal pa-drão (como, por exemplo, simetria em torno de0), no entanto, é mais dispersa. Em outras pa-lavras, a distribuição t-student concentra maisprobabilidades nas caldas do que a distribuiçãonormal padrão.

• A medida que n cresce, a distribuição t-studentse aproxima mais da distribuição normal pa-drão, pois S se aproxima mais de σ.

Page 32: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Distribuição t-Student

Existe uma distribuição t-student para cada valordos graus de liberdade (n− 1).

Page 33: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Intervalo de confiança para a média populacionalCaso 2: A variância σ2 é desconhecida

Dessa forma, se X for a média de uma amostraaleatória de tamanho n, proveniente de uma po-pulação com variância desconhecida, um intervalode 100(1 − α)% de confiança para a média popu-lacional é dado por:

ICµ100(1−α)% =

(X − t(n−1,α/2)

S√n,X + t(n−1,α/2)

S√n

),

onde t(n−1,α/2) é o quantil da t-student de nívelα/2.

Obs: Se σ2 for desconhecida, mas o tamanho da amostra forgrande (n > 30), pode-se utilizar zα/2 no lugar de t(n−1;α/2)

Page 34: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Exemplo

Deseja-se avaliar a dureza média do aço produzidosob um novo processo de têmpera. Uma amostrade 10 corpos de prova de aço produziu os seguintesresultados, em HRc:

36, 4 35, 7 37, 2 36, 5 34, 9

35, 2 36, 3 35, 8 36, 6 36, 9.

Construir um intervalo de 95% de confiança paraa dureza média do aço.

Page 35: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Resposta:

Temos a média amostral dada por: X =

∑ni=1Xi

n= 36.15

E a variância amostral:

Xi (Xi − X̄) (Xi − X̄)2

36, 4 0, 25 0, 062535, 7 −0, 45 0, 202537, 2 1, 05 1, 102536, 5 0, 35 0, 122534, 9 −1, 25 1, 562535, 2 −0, 95 0, 902536, 3 0, 15 0, 022535, 8 −0, 35 0, 122536, 6 0, 45 0, 202536, 9 0, 75 0, 5625∑

4, 865

Então,

S2 =

∑ni=1(Xi − X̄)2

n− 1

=4, 865

9= 0.5406

Daí S = 0.7352.

Page 36: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Resposta:

Além disso, n = 10 e 1− α = 0, 95, daí

t(n−1,α/2) = t(9,0.025) = 2.26

Assim,

ICµ95% =

(X − t(n−1,α/2)

S√n,X + t(n−1,α/2)

S√n

)=

(36.15− 2.26

0.7352√10

, 36.15 + 2.260.7352√

10

)= (35.625, 36.675) .

Ou seja, com 95% de confiança o intervalo [35, 625; 36, 675]

contém a dureza média do aço.

Page 37: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Intervalo de confiança para a proporçãopopulacional

• O intervalo que estamos procurando é da forma

IC = [p̂± ε0].

• Lembrando que p̂ é o estimador pontual para oparâmetro proporção populacional (p), e é daforma:

p̂ = Xn ; em que X é o número de indivíduos que

possuem a mesma característica de interesse.

Page 38: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Intervalo de confiança para a proporçãopopulacional

Dessa forma, se p̂ for a proporção de indivíduoscom uma característica de interesse em uma amos-tra aleatória, de tamanho n, proveniente de umapopulação onde a proporção verdadeira de indi-víduos com a característica é p, um intervalo de100(1−α)% de confiança para essa proporção po-pulacional p é dado por

ICp100(1−α)% =

(p̂− zα/2

√p(1− p)

n, p̂+ zα/2

√p(1− p)

n

)

em que zα/2 é o quantil da normal padrão comα/2 de nível de confiança.

Page 39: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Na prática, o valor de p é desconhecido (é justa-mente p que queremos estimar!). Nessa situação,duas abordagens são razoáveis:

1 Abordagem otimista: substituir o valor dep por sua estimativa p̂. Nesse caso,

ICp100(1−α)% =

(p̂− zα/2

√p̂(1− p̂)

n, p̂+ zα/2

√p̂(1− p̂)

n

)

2 Abordagem conservadora: substituirp(1− p) por seu valor máximo, 1/4, quandop = 1/2. Nesse caso,

ICp100(1−α)% =

(p̂− zα/2

1√4n, p̂+ zα/2

1√4n

)

Page 40: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Exemplo

• Um estudo foi feito para determinar a propor-ção de famílias que tem telefone em uma certacomunidade. Uma amostra de 200 famílias éselecionada ao acaso, e 160 afirmam ter tele-fone. Qual o intervalo para p com 95% de con-fiança?

Page 41: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Exemplo

Resposta:Temos que p̂ = 160/200 = 0, 8.Como 1− α = 0, 95 então zα/2 = z0,025 = 1, 96.Assim, adotando abordagem “otimista”, temos

ICµ95% =

(p̂− zα/2

√p̂(1− p̂)

n, p̂+ zα/2

√p̂(1− p̂)

n

)

=

(0, 8− 1, 96

√0, 8(1− 0, 8)

200, 0, 8 + 1, 96

√0, 8(1− 0, 8)

200

)= (0.7446, 0.8554).

Ou seja, com 95% de confiança o intervalo[74, 46%; 85, 54%] contém a porcentagem defamílias que tem telefone nessa comunidade.

Page 42: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Exemplo

Se calcularmos o intervalo adotando abordagem“conservadora”, temos

ICµ95% =

(p̂− zα/2

1√4n, p̂+ zα/2

1√4n

)=

(0, 8− 1, 96

1√4 · 200

, 0, 8 + 1, 961√

4 · 200

)= (0.7307, 0.8692).

Observe que, o intervalo com a abordagemconservadora fornece um intervalo maior.

Page 43: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Calculando o tamanho da amostra

Mais uma vez, podemos estimar o tamanho da amostra apartir da margem de erro ε0, basta especificar α e ε0:

ε0 = zα/2

√p(1− p)

n⇒√n = zα/2

√p(1− p)ε0

⇒ n = (zα/2)2 × p(1− p)

(ε0)2

Como p é desconhecido, para a substituição de p(1 − p) ouutiliza-se 1/4 ou adota-se um valor de p̂ obtida de um estudopiloto ou de um estudo similar. Se a população for finita,deve-se utilizar, de forma similar o fator de correção parapopulações finitas:

n∗ =n

1 + nN

Page 44: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Teste de Hipóteses

O Teste de Hipóteses consiste em uma regra dedecisão elaborada para rejeitar (ou não) uma afir-mação (hipótese) feita a respeito de um parâmetropopulacional desconhecido, com base em informa-ções colhidas de uma amostra aleatória.

Exemplo:• Verificar se o salário médio de certa categoriaprofissional no Brasil é igual a R$1.500, 00.

• Testar se 40% dos eleitores votarão em certocandidato nas próximas eleições.

• Testar se um medicamento é mais eficaz queoutro.

Page 45: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Conceitos fundamentais

Hipótese Nula (H0): É a hipótese a ser testada.

Hipótese Alternativa (H1): É a hipótese a serconfrontada com H0.• O teste será feito de tal forma que deverá sem-pre concluir na rejeição (ou não) de H0.

• Como estamos tomando uma decisão com baseem informações de uma amostra, estaremos su-jeitos a cometer dois tipos de erros.

Page 46: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Conceitos fundamentais

Erro do tipo I: Rejeitarmos H0 quando H0 é ver-dadeira.

α = P(erro do tipo I) = P(rejeitar H0|H0 é verdadeira)

Erro do tipo II: Não rejeitarmos H0 quando H0

é falsa.

β = P(erro do tipo II) = P(não rejeitar H0|H0 é falsa)

Obs: α é denominado de nível de significância doteste.

Page 47: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Conceitos fundamentais

Nossas decisões em um teste de hipóteses podemser resumidas na seguinte tabela:

Page 48: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Conceitos fundamentais

Estatística do teste: É a estatística utilizadapara julgar H0.

Região crítica do teste (RC): É formada peloconjunto de valores que levam a rejeição de H0. Eladepende do tipo de hipótese alternativa, do nivelde significância (α) adotado, e da distribuição deprobabilidade da estatística do teste.

Page 49: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Etapas para a elaboração de um Teste deHipóteses

1 Definir as hipóteses nula (H0) e alternativa (H1);

2 Fixar o nível de significância (α);

3 Determinar a estatística do teste;

4 Determinar a região crítica do teste;

5 Calcular o valor da estatística do teste (combase numa amostra da população de interesse);

6 Se o valor calculado no passo 5 pertencer aRC, rejeitar H0, caso contrário, não rejeitar H0;

7 Conclusão do teste.

Page 50: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Teste de Hipóteses para a média populacional

Caso 1: σ2 conhecida.

1. Definição das hipóteses:

H0 : µ = µ0 H0 : µ = µ0 H0 : µ = µ0

H1 : µ 6= µ0 ou H1 : µ < µ0 ou H1 : µ > µ0

2. Fixar o nível de significância α;

3. Definir a estatística de teste:

Z =X − µσ/√n∼ N (0, 1)

Page 51: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Teste de Hipóteses para a média populacional

4. Definir a região crítica do teste (RC):

Page 52: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Teste de Hipóteses para a média populacional

5. Com base nos valores observados da amostra,calcular o valor da Estatística de teste Z :

Zc =X − µ0σ/√n

6. Se Zc ∈ RC ⇒ rejeitar H0 (aceitar H1).Se Zc /∈ RC⇒ não rejeitar H0 (não aceitar H1).

7. Concluir sobre a decisão tomada no passo 6.

Page 53: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Exemplo

Os sistemas de escapamento de uma aeronave fun-cionam devido a propelente sólido. A taxa dequeima desse propelente é uma característica im-portante do produto. As especificações requeremque a taxa média de queima tem de ser 50 centíme-tros por segundo. Sabemos que a taxa de queimaé normalmente distribuída com desvio padrão deσ = 2 centímetros por segundo. O experimenta-lista seleciona uma amostra aleatória de tamanho25 e obtém uma taxa média amostral igual a 51, 3centímetros por segundo. Que conclusões pode-riam ser tiradas ao nível de significância, de 0, 05?

Page 54: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Resolução: Teste para média com σ2 conhecida

1. As hipóteses que queremos testar são:

H0 : µ = 50 contra H1 : µ 6= 50

2. Fixamos α = 0, 05;3. A estatística de teste é: Z = X−µ

σ/√n∼ N (0, 1)

4. A região crítica é do tipo:

onde z = zα/2 = z0,025 = 1, 96 (tabela da dis-tribuição normal padrão).

Page 55: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Resolução: continuação

5. A partir dos dados amostrais temos que:

Zc =X − µ0σ/√n

=51, 3− 50

2/√

25

6. Temos que Zc ∈ RC pois 3, 25 > 1, 96, por-tanto, rejeitamos a hipótese nula.

7. Baseados nos dados amostrais, podemos con-cluir, ao nível de 5% de significância, que ataxa média de queima difere de 50 centímetrospor segundo.

Page 56: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Teste de Hipóteses para a média populacional

Caso 2: σ2 desconhecida.

1. Definição das hipóteses:

H0 : µ = µ0 H0 : µ = µ0 H0 : µ = µ0

H1 : µ 6= µ0 ou H1 : µ < µ0 ou H1 : µ > µ0

2. Fixar o nível de significância α;

3. Definir a estatística de teste:

T =X̄ − µS/√n∼ t(n−1)

Page 57: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Teste de Hipóteses para a média populacional

4. Definir a região crítica do teste (RC):

Page 58: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Teste de Hipóteses para a média populacional

5. Com base nos valores observados da amostra,calcular o valor da Estatística de teste Z :

Tc =X̄ − µ0S/√n

6. Se Tc ∈ RC ⇒ rejeitar H0 (aceitar H1).Se Tc /∈ RC⇒ não rejeitar H0 (não aceitar H1).

7. Concluir sobre a decisão tomada no passo 6.

Obs: se σ2 for desconhecida, mas o tamanho daamostra for grande (n > 30), pode-se definir a re-gião crítica através da distribuição Normal padrão.

Page 59: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Exemplo

Suponha que, no exemplo anterior, o valor do des-vio padrão fosse desconhecido e o experimentalis-ta o tivesse estimado, a partir da amostra comoS = 2, 5 centímetros por segundo. Ao nível de 5%de significância, que conclusão obteríamos acercada queima média do propelente?

Page 60: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Resolução: Teste para média com σ2

desconhecida

1. As hipóteses que queremos testar são:

H0 : µ = 50 contra H1 : µ 6= 50

2. Fixamos α = 0, 05;3. A estatística de teste é: T = X−µ

S/√n∼ t(n−1)

4. A região crítica é do tipo:

onde t = tn−1;α/2 = t24;0,025 = 2, 064 (tabela dadistribuição t-student).

Page 61: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Resolução: continuação

5. A partir dos dados amostrais temos que:

Tc =X − µ0S/√n

=51, 3− 50

2, 3/√

25

6. Temos que Tc ∈ RC pois 2, 83 > 2, 064, por-tanto, rejeitamos a hipótese nula.

7. Baseados nos dados amostrais, podemos con-cluir, ao nível de 5% de significância, que ataxa média de queima difere de 50 centímetrospor segundo.

Page 62: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Teste de Hipóteses para a proporçãopopulacional

1. Definição das hipóteses:

H0 : p = p0 H0 : p = p0 H0 : p = p0

H1 : p 6= p0 ou H1 : p < p0 ou H1 : p > p0

2. Fixar o nível de significância α;

3. Definir a estatística de teste:

Z =p̂− p0√p0(1−p0)

n

∼ N (0, 1)

Page 63: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Teste de Hipóteses para a proporçãopopulacional

4. Definir a região crítica do teste (RC):

Page 64: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Teste de Hipóteses para a proporçãopopulacional

5. Com base nos valores observados da amostra,calcular o valor da Estatística de teste Z:

Zc =p̂− p0√p0(1−p0)

n

6. Se Zc ∈ RC ⇒ rejeitar H0 (aceitar H1).Se Zc /∈ RC⇒ não rejeitar H0 (não aceitar H1).

7. Concluir sobre a decisão tomada no passo 6.

Page 65: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Exemplo

Dentre 1655 pacientes tratados com um medica-mento A, 2, 1% tiveram reações adversas. A em-presa que fabrica o medicamento afirma que ape-nas 1, 2% dos usuários têm algum tipo de reaçãoadversa. Teste, ao nível de significância de 1%, aafirmativa da empresa pode ser considerada verda-deira.

Page 66: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Resolução: Teste para porporção

1. As hipóteses que queremos testar são:

H0 : p = 0, 012 contra H1 : p > 0, 012

2. Fixamos α = 0, 01;3. A estatística de teste é: Z = p̂−p0√

p0(1−p0)n

∼ N (0, 1)

4. A região crítica é do tipo:

onde z = zα = z0,01 = 2, 33 (tabela da distri-buição normal padrão).

Page 67: Introdução a Estatísticajuliana/Introducao a Estatistica/Aula4.pdf · utiliza-se1=4 ouadota-seumvalordep^obtidadeumestudo piloto ou de um estudo similar. Se a população for finita,

Resolução: continuação

5. A partir dos dados amostrais temos que:

Zc =p̂− p0√p0(1−p0)

n

=0, 021− 0, 012√

0,012(1−0,012)1655

= 3, 36

6. Temos que Zc ∈ RC, pois 3, 36 > 2, 33 por-tanto, rejeitamos a hipótese nula.

7. Ao nível de significância de 1%, a amostra for-nece evidências estatísticas suficientes de queo percentual de usuários do medicamento quetêm alguma reação adversa é superior a 1, 2%