25
Estatística: Revelando o Poder dos Dados Lock 5 Seção 3.2 Compreensão e Interpretação dos Intervalos de Confiança

Seção 3.2 Compreensão e Interpretação dos Intervalos de ...mrubens/cursos/EstatAplicCom/Capitulo3-2.pdf · Estatística: Revelando o Poder dos Dados Sumário Estimativas de intervalo

Embed Size (px)

Citation preview

Estatística: Revelando o Poder dos Dados Lock5

Seção 3.2

Compreensão e Interpretação dos

Intervalos de Confiança

Estatística: Revelando o Poder dos Dados

Sumário

Estimativas de intervalo

Estimativa intervalar com base na margem de erro

Intervalo de confiança

Intervalo de confiança de 95% usando o erro-padrão

Compreendendo intervalos de confiança

Interpretações erradas comuns

Estatística: Revelando o Poder dos Dados

Plano de Saúde-Empresa

Um relatório de uma pesquisa Gallup em 2011 com base em uma amostra aleatória de n = 147.291 adultos diz

“Quarenta e cinco por cento dos adultos americanos relataram obter o plano de saúde de um empregador…”

Qual a precisão de 45%???

http://www.gallup.com/poll/148079/Employer-Based-Health-Insurance-Declines-Further.aspx

Estatística: Revelando o Poder dos Dados

Estimativa Intervalar

Uma estimativa intervalar fornece um intervalo de valores plausíveis para um parâmetro populacional.

Estatística: Revelando o Poder dos Dados

Margem de Erro

Uma forma comum para uma estimativa intervalar é

estatística ± margem de erro

onde a margem de erro reflete a precisão

da estatística amostral como uma estimativa de ponto para o parâmetro.

Estatística: Revelando o Poder dos Dados

Plano de Saúde-Empresa

“Quarenta e cinco por cento dos adultos americanos relataram obter o plano de saúde de um empregador…”

Mais tarde no relatório, diz

“a margem máxima de erro de amostragem é de 1 ponto percentual”

Estimativa intervalar: 45% 1% = [44%, 46%]

A porcentagem de adultos americanos recebendo seu plano de saúde de um empregador estará provavelmente entre 44% e 46%

Estatística: Revelando o Poder dos Dados

Mensagens de Texto

• Uma amostra aleatória de 2011 de n = 755 usuários de telefone celular dos EUA com idade acima de 18 anos descobriu que o número médio de mensagens de texto enviadas ou recebidas por dia é de 41,5 mensagens, com uma margem de erro de 12,2.

• Forneça uma estimativa intervalar para o número médio de mensagens de texto enviadas ou recebidas por dia para usuários adultos de telefone celular nos EUA. 41.5 12.2

= (29.3, 53.7)Smith, A. “Americans and Text Messaging,” Pew Research Center, http://www.pewinternet.org/Reports/2011/Cell-Phone-Texting-2011/Main-Report/How-Americans-Use-Text-Messaging.aspx , accessed 9/19/11.

Estatística: Revelando o Poder dos Dados

Sondagem Eleitoral

http://www.realclearpolitics.com/epolls/2012/president/us/general_election_romney_vs_obama-1171.html

Por que a margem de erro é menor para a pesquisa Gallup do que para a pesquisa de notícias da ABC??

Estatística: Revelando o Poder dos Dados

Sondagem Eleitoral

Usando a pesquisa Gallup, calcule uma estimativa de intervalo para a proporção de eleitores registrados que planejam votar em Obama.

Estatística: Revelando o Poder dos Dados

Sondagem Eleitoral

A eleição presidencial de 2012 já aconteceu, então essa é uma das raras situações em que realmente conhecemos o verdadeiro parâmetro populacional, p!

Na eleição real, 50,4% votaram em Obama.

Sua estimativa intervalar contém o parâmetro populacional verdadeiro?

Estatística: Revelando o Poder dos Dados

Margem de Erro

• Como determinamos a margem de erro???

• Podemos usar a dispersão da distribuição amostral (o erro padrão) para determinar a margem de erro de uma estatística

Estatística: Revelando o Poder dos Dados

Intervalo de Confiança

Um intervalo de confiança para um parâmetro é um intervalo calculado a partir de dados da amostra por um método que irá

incluir o parâmetro para uma proporção especificada de todas as amostras possíveis

A taxa de sucesso (proporção de todas as amostras cujos intervalos contêm o parâmetro) é conhecida como nível de confiança

Um intervalo de confiança de 95% deverá conter o parâmetro verdadeiro em 95% de todas as amostras

Estatística: Revelando o Poder dos Dados

Intervalos de Confiança StatKey

O parâmetro é fixo

A estatística é aleatória (depende da amostra)

O intervalo é aleatório (depende da estatística)

95% dos intervalos de confiança de 95% incluirão o verdadeiro parâmetro

Estatística: Revelando o Poder dos Dados

Se você tivesse acesso à distribuição amostral, como você encontraria a margem de erro para garantir que os intervalos do formulário

estatística ± margem de erro

capturaria o parâmetro para 95% de todas as amostras?

(Dica: lembre-se da regra de 95% do capítulo 2)

Distributição Amostral

Estatística: Revelando o Poder dos Dados

Intervalo de Confiança de 95%

Se a distribuição amostral é relativamente simétrica e em forma de sino, um intervalo

de confiança de 95% pode ser estimado usando

estatística ± 2 × EP

Estatística: Revelando o Poder dos Dados

EconomiaUma pesquisa com 1.502 americanos em janeiro de 2012 descobriu que 86% consideram a economia uma "prioridade máxima" para o presidente e o congresso.

O erro-padrão para esta estatística é de 0,01.

Qual é o intervalo de confiança de 95% para a proporção verdadeira de todos os americanos que consideravam a economia uma “prioridade máxima” naquela época?

http://www.people-press.org/2012/01/23/public-priorities-deficit-rising-terrorism-slipping/

estatística ± 2×EP0,86 ± 2×0,010,86 ± 0,02[0,84; 0,88]

Estatística: Revelando o Poder dos Dados

Compreendendo Intervalos de Confiança

95% de todas as amostras produzem intervalos que contêm o parâmetro verdadeiro, por isso dizemos que temos “95% de certeza” ou “95% de confiança” de que um intervalo contém a verdade.

“Temos 95% de confiança de que a proporção real de todos os americanos que consideraram a economia como "prioridade máxima" em janeiro de 2012 está entre 0,84 e 0,88”

Estatística: Revelando o Poder dos Dados

Carbono na Biomassa Florestal Os cientistas que esperam reduzir o desmatamento

estimam que o carbono armazenado em florestas tropicais na América Latina, África subsaariana e sudeste da Ásia tem uma biomassa total de 247 gigatoneladas.

Para chegar a esta estimativa, eles primeiro estimam a quantidade média de carbono por quilômetro quadrado.

Com base em uma amostra de tamanho n = 4079 lotesde inventário, a média da amostra é ҧ𝑥 = 11.600toneladas com um erro-padrão de 1000 toneladas.

Forneça e interprete um intervalo de confiança de 95%.Saatchi, S.S. et. al. “Benchmark Map of Forest Carbon Stocks in Tropical Regions Across Three Continents,” Proceedings of the National Academy of Sciences, 5/31/11.

Estatística: Revelando o Poder dos Dados

Carbono na Biomassa Florestal

95% IC: 11.600 21.000 = [9.600; 13.600]

Temos 95% de confiança de que a quantidade média de carbono armazenada em cada quilômetro quadrado de floresta tropical está entre 9.600 e 13.600 toneladas.

Estatística: Revelando o Poder dos Dados

Proporção de Caras p = Proporção de vezes que uma moeda da cara

Sabemos p = 0,5, mas vamos fingir que não sabemos disso e queremos estimar

Jogue uma moeda 25 vezes e calcule sua proporção de amostra, Ƹ𝑝

Estatística: Revelando o Poder dos Dados

Proporção de Caras Crie uma distribuição amostral para calcular o

erro-padrão para ො𝑝

Estatística: Revelando o Poder dos Dados

Interpretações Erradas Comuns

• Interpretação incorreta 1: “Um intervalo de confiança de 95% contém 95% dos dados na população”

• Interpretação incorreta 2: "Tenho 95% de certeza de que a média de uma amostra cairá dentro de um intervalo de confiança de 95% para a média"

• Interpretação incorreta 3: “A probabilidade de o parâmetro populacional estar nesse intervalo de confiança de 95% específico é de 0,95”

Estatística: Revelando o Poder dos Dados

Intervalos de Confiança

População Amostra

Amostra

Amostra

AmostraAmostraAmostra

. . .

Calcule estatística para cada amostra

Distribuição Amostral

Erro-Padrão (EP): desvio-padrão da distribuição amostral

Margem de Erro (ME)(95% IC: ME = 2×EP)

estatística ± ME

Estatística: Revelando o Poder dos Dados

Resumo• Para criar um intervalo de confiança de 95%

para um parâmetro:o Pegue muitas amostras aleatórias da população e

calcule a estatística amostral para cada amostrao Calcule o erro-padrão como o desvio-padrão de

todas essas estatísticaso Use a estatística 2EP

• Um pequeno problema…

Estatística: Revelando o Poder dos Dados

Realidade

… NÓS SÓ TEMOS UMA AMOSTRA!!!!

• Como saberemos quanto as estatísticas amostrais variam, se tivermos apenas uma amostra?!?

… continua