26
Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Embed Size (px)

Citation preview

Page 1: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Aula 1. Introdução à InferênciaEstatística

Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Page 2: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

PopulaçãoCaracterísticas

Informações contidasnos dados

Conclusõessobre as

característicasda população

Técnicas de amostragem

Análisedescritiva

Inferênciaestatística

Estatística

Amostra / dados

População é o conjunto de todos os elementosou resultados sob

investigação

Amostra é qualquer subconjunto da

população

Page 3: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

População ↔ Amostra

Exemplo 10.1: Consideramos uma pesquisa para estudar os salários dos 500funcionários da Companhia M&B. Seleciona-se uma amostra de 36 indivíduos, e anotam-se os seus salários.

População = 500 salários correspondentes aos 500 funcionários

Amostra = 36 salários de funcionários selecionados

Esperamos que amostra reflita as caraterísticas principais da distribuiçãopopulacional de salários da empresa =

Amostra representativa

Page 4: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

População ↔ Amostra

Exemplo 10.3: Consideramos uma pesquisa para estudar a duração de vida útilde um novo tipo de lâmpadas, pois acredita-se que a duração desse novo tipo é maior. Então 100 lâmpadas do novo tipo são deixadas acesas até queimarem.

População = a vida útil de todas as lâmpadas fabricadas ou que venham a ser fabricadas por essa empresa; = a distribuição de vida útil de lâmpada fabricada por empresa

Amostra = tempos de vida observada de 100 lâmpadas selecionados

Esperamos que amostra reflita as caraterísticas principais da distribuiçãopopulacional de vida útil de lâmpadas produzidas pela empresa =

Amostra representativa

Page 5: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

PopulaçãoCaracterísticas

Técnicas de amostragem

Amostra / dadosA.A.S.

AmostragemAleatóriaSimples

Aleatoriamente sorteia-se um elemento da população, sendo que todos os elementostêm a mesma chance de ser escolhidos. Repete-se o procedimento até que sejamsorteadas as n unidades da amostra.

AAS com/sem reposição. AAS com reposição implica a propriedade de independência entre unidades selecionadas. Isso facilita o tratamento matemáticode propriedades de estimadores que vamos construir em cima de amostra.

Page 6: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Amostra / dados

Amostra aleatória simples

Amostra Aleatória Simples de tamanho de uma variável aleatória, com dada distribuição, é o conjunto de variáveis aleatóriasindependentes cada uma com a mesma distribuiçãode .

Page 7: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Amostra / dados

Amostra aleatória simples

Amostra Aleatória Simples de tamanho de uma variável aleatória, com dada distribuição, é o conjunto de variáveis aleatóriasindependentes cada uma com a mesma distribuiçãode .

PopulaçãoCaracterísticas

é v.a.

Page 8: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Amostra / dados

Amostra aleatória simples

Amostra Aleatória Simples de tamanho de uma variável aleatória, com dada distribuição, é o conjunto de variáveis aleatóriasindependentes cada uma com a mesma distribuiçãode .

PopulaçãoCaracterísticas

é v.a.

Em caso de população contínua, com função de densidade , a densidadeconjunta da amostra será dada por tal que

Page 9: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Estatística

Qualquer função de amostra chamaremosestatística

𝑋= 1𝑛∑𝑖=1𝑛

𝑋𝑖 𝑆2= 1𝑛−1∑𝑖=1

𝑛

(𝑋 𝑖− 𝑋 )2

𝑋(1)=min (𝑋 1 ,𝑋 2 , …, 𝑋𝑛 )𝑋(𝑛)=max (𝑋 1 , 𝑋 2 , …,𝑋𝑛)

-gêsima maior observação da amostra

𝑊=𝑋(𝑛)− 𝑋(1)

Page 10: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Amostra ↔amostra

amostra é vetor aleatório

amostra é vetor de números observados

estatística é variável aleatória

estatística é valor observado de

estatística é variável aleatória

estatística é valor observado de

Page 11: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

distribuição populacionaldistribuição amostral da

estatística

distribuição populacionaldistribuição amostral da

estatística

Page 12: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Distribuição amostral da médiaTeorema. Seja uma variável aleatória com média e variância, e seja uma amostra aleatória simples (AAS) devariável . Então

𝐸 ( 𝑋 )=𝐸( 1𝑛∑𝑖=1𝑛

𝑋 𝑖)= 1𝑛∑𝑖=1𝑛

𝐸 (𝑋 𝑖)=1𝑛∑

𝑖=1

𝑛

𝜇= 1𝑛𝑛𝜇=𝜇

𝑉𝑎𝑟 ( 𝑋 )=𝑉𝑎𝑟 ( 1𝑛∑𝑖=1𝑛

𝑋 𝑖)= 1𝑛∑𝑖=1𝑛

𝑉𝑎𝑟 (𝑋 𝑖 )=1𝑛∑

𝑖=1

𝑛

𝜎2= 1𝑛𝑛𝜎2=𝜎2

Page 13: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Distribuição amostral da média

𝑍= 𝑋−𝜇𝜎 /√𝑛

=√𝑛 (𝑋−𝜇 )𝜎 ≈𝑁 (0 ,1 )

aprox

Page 14: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Distribuição amostral da média

Teorema. Seja uma variável aleatória normal com média e variância , , e seja uma amostra aleatória simples (AAS) de variável . Então

𝑍= 𝑋−𝜇𝜎 /√𝑛

=√𝑛 (𝑋−𝜇 )𝜎 𝑁 (0 ,1 )

Page 15: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

distribuição populacionaldistribuição amostral da

estatística

Page 16: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Exemplo 10.11

Uma máquina está regulada para encher pacotes de café automaticamentesegundo a distribuição normal com média de 500 gramas e desvio padrão de10 gramas. Colhendo-se uma amostra de pacotes e pesando-os. Qualé a probabilidade de encontramos a média defirindo de 500 g. de menos de2 gramas.

Page 17: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Distribuição amostral de proporção

distribuição populacional

Page 18: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Distribuição amostral de proporção

distribuição amostra

𝑍= 𝑋−𝜇𝜎 /√𝑛

=√𝑛 (𝑋−𝜇 )𝜎 ≈𝑁 (0 ,1 )

𝑍=√𝑛(�̂�−𝑝)

√𝑝 (1−𝑝)≈𝑁 (0 ,1 )

Page 19: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Exemplo 10.12

Suponha que 30% dos estudantes de uma escola sejam mulheres. Colhemos umaAAS de estudantes e calculamos proporção de mulheres na amostra.Qual probabilidade de que difere de em menos de 0,01?

𝐸 (�̂� )=𝑝 ,𝑉𝑎𝑟 (�̂� )=𝑝 (1−𝑝)𝑛

�̂� ≈𝑁 (𝑝 ,𝑝 (1−𝑝 )

𝑛 )=𝑁 (0.3 ,0.021)

Page 20: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Da relação

),(12

ppεzn

segue que o tamanho amostral n, dados e a margem de erro , tem a forma

, )(1n

ppzε

onde z é tal que = P(-z Z z) e Z ~ N(0,1).

Dimensionamento da amostra

Entretanto, nesta expressão, n depende de p(1-p), que é desconhecido.

Como calcular o valor de n?

Page 21: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Pela figura observamos que:• a função p(1-p) é uma parábola simétrica em torno de p = 0,5;

Assim, na prática, substituímos p(1-p) por seu valor máximo, obtendo

, 0,252

εzn

que pode fornecer um valor de n maior do que o necessário.

Gráfico da função p(1-p), para 0 p 1.

• o máximo de p(1-p) é 0,25, alcançado quando p = 0,5.

Page 22: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Pergunta: É possível reduzir o tamanho da amostra quando temos alguma informação a respeito de p?

Em alguns casos, podemos substituir a informação p(1-p), que aparece na expressão de n, por um valor menor que 0,25.

Por exemplo, sabemos que:

• p não é superior a 0,30, ou• p é pelo menos 0,80, ou• p está entre 0,30 e 0,60.

Resposta: Depende do tipo de informação sobre p.

Page 23: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Vimos que, se nada sabemos sobre o valor de p, no cálculo de n, substituímos p(1-p) por seu valor máximo, e calculamos

. 0,252

εzn

Se temos a informação de que p é no máximo 0,30 (p 0,30), então o valor máximo de p(1-p) será dado por 0,3x0,7 = 0,21.

Redução do tamanho da amostra

Logo, reduzimos o valor de n para

. 0,212

εzn

Page 24: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Agora, se p é pelo menos 0,80 (p 0,80), então o máximo valor de p(1-p) é 0,8x0,2 = 0,16, e temos

. 0,162

εzn

Mas, se 0,30 p 0,60, o máximo valor de p(1-p) é 0,5x0,5=0,25 e, neste caso, não há redução, ou seja,

.0,252

εzn

Page 25: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Exemplo 3:No Exemplo 2, suponha que temos a informação de que no máximo 30% dos alunos da USP foram ao teatro no último mês.

conseguindo uma redução de 2401- 2017 = 384 estudantes.

Portanto, temos que p 0,30 e, como vimos, o máximo de p(1-p) neste caso é 0,21.

,estudantes 20170,210,021,960,21

22

εzn

Assim, precisamos amostrar

Page 26: Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição

Intervalo de confiança para p

Vimos que a estimativa intervalar para p tem a forma: , ε pε ; p ˆˆ

nppzp

nppzp p ; γIC )()()( ˆ1ˆˆˆ1ˆˆ ;

Na prática, substituímos a proporção desconhecida p pela proporção amostral , obtendo o seguinte intervalo de confiança com coeficiente de confiança :

com e z tal que = P(-z Z z) na N(0,1).n

ppzε )(

1