AULA 4: DISTRIBUIÇÕES DE PROBABILIDADES AMOSTRAIS

Preview:

Citation preview

AULA 4: DISTRIBUIÇÕES DE PROBABILIDADES

AMOSTRAIS

Gleici Castro Perdoná

pgleici@fmrp.usp.br

2. Sabe-se que o tempo gasto no exame de um paciente tem distribuição aproximadamente Normal, com média 30 min e desvio padrão de 5 min. a. Sorteando-se um médico residente ao acaso, qual é a probabilidade dele terminar o exame antes de 24 minutos?

b. Qual deve ser o tempo de exame, de modo a permitir que 95% dos residentes terminem no prazo estipulado?

c. Qual é o intervalo de tempo, simétrico em torno da média tal que 80% dos residentes gastam para completar o exame?

Exemplo

Exercício (10 min)

• Uma população X tem uma distribuição normal de média 100 e desvio padrão 10. Qual P(95 < X < 105)?

• Uma população X tem uma distribuição normal de média 10 e desvio padrão 1. Qual P(X>7)?

TÉCNICAS DE AMOSTRAGEM E SEUS USOS

I) Aleatória simples Populações ricamente homogêneas.

II) Sistemática Populações ordenadas.

III) Estratificada Populações heterogêneas.

IV) Conglomerado Subgrupos de populações.

V) Não-probabilística Amostragem acidental, intencional ou por quotas.

AMOSTRA ALEATÓRIA SIMPLES

População finita (n:N) ou população infinita (n:∞).

SORTEIO COMPUTADOR COM REPOSIÇÃO SEM REPOSIÇÃO

Dados gerados num sistema de

referência.

Dados coletados numa tabela de

números aleatórios.

Um elemento pode ser retirado mais de uma vez.

Cada elemento só pode ser retirado

uma vez.

Nn CnN

AMOSTRA SISTEMÁTICA

Lista de N elementos da população (p.ex., lista

telefônica). Amostra de tamanho n.

Unidade amostral inicial selecionada das primeiras k unidades da lista (k = N/n).

Ex.: seleciona-se, aleatoriamente, a 4ª pessoa da lista; a amostra segue, então, com os elementos

4+k, 4+2k...

AMOSTRA ESTRATIFICADA

População heterogênea

Estratos mais ou menos homogêneos

Amostragem simples ao acaso

AMOSTRA POR CONGLOMERADOS

POPULAÇÃO

CONGLOMERADO (ex.: quarteirões, famílias, edifícios,

escolas)

Amostra aleatória simples

Contagem completa dentro do

conglomerado

AMOSTRAGEM NÃO-PROBABILÍSTICA

(Não-inferência – não se conhece a probabilidade de um indivíduo ser incluído na amostra)

AMOSTRAGEM ACIDENTAL

AMOSTRAGEM INTENCIONAL

AMOSTRAGEM POR QUOTAS

Coletam-se elementos até se atingir o

número desejado (ex.: pesquisas de opinião).

Os elementos são coletados dentro do grupo de interesse

(ex.: sala de espera da clínica X).

A amostra recebe quotas proporcionais ao total da população

(ex.: pesquisas de mercado).

EXERCÍCIO Exercício (10min) Use o rol de dados abaixo (pesos, em kg, de 50 frequentadores do NSF X de Ribeirão Preto) para responder às questões.

45,2 53,1 57,7 58,4 61,4 61,5 62,3 63,5 63,6 64,3

64,8 65,7 66,7 66,7 67,5 67,8 67,8 68,0 68,0 68,9

68,9 71,3 71,3 71,5 71,6 72,5 73,1 74,0 74,1 74,1

74,2 76,1 76,1 76,5 76,7 77,5 77,7 77,7 79,1 79,4

79,5 79,9 81,9 82,2 82,3 84,9 85,0 87,7 89,8 94,1

1) Obtenha uma amostra aleatória simples de 10 elementos e calcule sua média. 2) Compare as duas estimativas encontradas com a média populacional.

Exemplo

Intervalo (10 minutos)

Estimador, estimativas e parâmetros

Uma característica da população é denominada parâmetro. Um parâmetro é um valor, um número que representa uma característica única da população. Se X uma variável de uma população, os principais parâmetros seriam: • A média de X, anotada por μ • A variância de X, anotada por σ2 • O desvio padrão de X, anotado por σ • A proporção de elementos de P que apresentam

determinada característica, anotada por: p, entre outros.

Exemplo

• X= { 1, 3, 5, 6 } é amigos na república

• μ= (1 + 3 + 5 + 6) / 4 = 15 / 4 = 3,75

• σ2= (1 + 9 + 25 + 36) / 4 - 3,752 = 71/4 - 3,752 = 17,75 - 14,0625 = 3,6875 = 3,69.

• σ = 1,9203 = 1,92

• p = 3 / 4 = 75%, exemplo para a proporção de numero ímpar.

Um estimador é uma característica da amostra.

Veja que se a amostra é aleatória o estimador é uma variável aleatória. Então tudo de distribuição de probabilidade para variáveis aleatórias, aplica-se aos estimadores. A distribuição de probabilidadede um estimador é denominada de distribuição amostral. Entendendo…. A média da amostra, X que é um estimador da média da população: μ A variância amostral, S2 que é um estimador da variância populacional: σ2

A proporção amostral, P, que é um estimador amostral da proporção populacional p.

Estimativa é um valor particular de um estimador

• O estimador é a expressão (fórmula) enquanto que a estimativa é o valor particular que ele assume (número).

MÉDIA E VARIÂNCIA: POPULAÇÃO X AMOSTRA

19

X

2

X

2S 2

2s

x, s2

x ,s2

x, s2

x, s2

X

2

X

média

variância

população

população

população

DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS

Se n suficientemente grande, distribuição amostral ~ normal.

Média da distribuição amostral das médias = média da população

𝐸(𝑋) = 𝜇𝑋 = 𝜇𝑋

População infinita, amostra com reposição, variância da distribuição amostral das médias:

𝐸 𝑋 − 𝜇 ² = 𝜎²𝑋 = 𝜎²

𝑛

População finita, amostra sem reposição, variância da distribuição amostral das médias:

𝜎²𝑋 = 𝜎²

𝑛

𝑁 − 𝑛

𝑁 − 1

DISTRIBUIÇÃO AMOSTRAL DAS 𝑓𝑟

Média: 𝐸 𝑓𝑟 = 𝑝

Variância: 𝑉𝑎𝑟 𝑓𝑟 = 𝑝𝑞

𝑛

DISTRIBUIÇÃO AMOSTRAL DE 𝑠²

Média: 𝐸 𝑠² = 𝜇𝑠² = 𝜎²

Variância: 𝑉𝑎𝑟 𝑠² = 2𝜎4

𝑛 −1

fr

Voltando ao caso dos amigos da república

• X:{ 1, 3, 5, 6 } , todas as amostras possíveis de tamanho n

= 2 extraídas com reposição. Para cada amostra vai-se calcular a média. Ter-se-á assim um conjunto de 16 valores que serão dispostos em uma tabela, com as respectivas probabilidades, e que constituirá então a distribuição amostral da média da amostra.

• As possíveis amostras com as respectivas médias são:

• (1,1) = 1

• (1,3)=2

• (1,5)=3, etc então temos:

Distribuição amostral da média é

μ= 3,75 e σ2=254,5/16 - 3,752= 1,84 = 3,69/2

E sem reposição?

Comparando com o primeiro exercício

• Uma população X tem uma distribuição normal de média 100 e desvio padrão 10. Se X é a média de 16 elementos extraída desta população, qual a P(95 < X < 105) ?

• A renda de um conjunto de pessoas de uma certa região tem média 6 salários mínimos e desvio padrão de 2. Extraída uma amostra de n = 100 pessoas, qual a probabilidade de a média desta amostra ter um valor superior a 6,3 sal.min?

DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS

Se n suficientemente grande, distribuição amostral ~ normal.

Média da distribuição amostral das médias = média da população

𝐸(𝑋) = 𝜇𝑋 = 𝜇𝑋

População infinita, amostra com reposição, variância da distribuição amostral das médias:

𝐸 𝑋 − 𝜇 ² = 𝜎²𝑋 = 𝜎²

𝑛

População finita, amostra sem reposição, variância da distribuição amostral das médias:

𝜎²𝑋 = 𝜎²

𝑛

𝑁 − 𝑛

𝑁 − 1

DISTRIBUIÇÃO AMOSTRAL DAS 𝑓𝑟

Média: 𝐸 𝑓𝑟 = 𝑝

Variância: 𝑉𝑎𝑟 𝑓𝑟 = 𝑝𝑞

𝑛

DISTRIBUIÇÃO AMOSTRAL DE 𝑠²

Média: 𝐸 𝑠² = 𝜇𝑠² = 𝜎²

Variância: 𝑉𝑎𝑟 𝑠² = 2𝜎4

𝑛 −1

fr

APLICAÇÃO DO TCL

• Pelo TCL, a distribuição de médias de amostras de tamanho 25 é aproximadamente normal com média 𝜇 = 211 e desvio-padrão 𝜎 𝑛 = 9,2 mg/100 mL. Como

𝑍 = 𝑋 − 𝜇

𝜎 𝑛 é uma variável aleatória normal padrão, 𝑧 =

230 −211

9,2= 2,07. Acima

desse valor, encontra-se 0,019 da área sob a curva normal padrão, logo 1,9% das amostras terá um valor médio acima de ou igual a 230 mg/100 mL.

Tem-se a distribuição dos níveis séricos de colesterol de todos os homens de 20 a 74 anos (EUA), µ = 211 mg/100 mL e σ = 46 mg/100 mL. Selecionando amostras repetidas

de tamanho 25 da população, que proporção de amostras terá um valor médio de 230

mg/100 mL ou acima?

• É possível obter, por exemplo, os limites superior e inferior que incluem 95% das médias das amostras de tamanho 25 extraídas da população, e conforme o tamanho das amostras aumenta, a quantidade de variabilidade entre as médias diminui; consequentemente, os limites que englobam 95% dessas médias se aproximam.

Podemos pensar em um intervalo para a média μ

Vimos até o momento estimador e estimativas pontuais. O estimador por intervalo para a

média μ tem a forma

Nossa questão é determinar

Exemplo

• O colesterol das mulheres universitárias tem uma distribuição de probabilidades com σ=50mg/dl e média desconhecida. Desejamos estimar a média μ com erro de 20 mg/dl e confiança de 90%, quantas alunas precisamos na amostra?

BIBLIOGRAFIA RECOMENDADA

BUSSAB, W.O.; MORETTIN, P. Estatística básica. 4 ed. São Paulo, Atual, 1987. PAGANO, M. e GAUVREAU, K. Princípios de Bioestatística - Tradução da 2ª Edição Norte Americana, Pioneira Thonpson Learning, São Paulo, SP,2004.

MEDRONHO R; CARVALHO DM; BlOCH KV; LUIZ RR; WERNECK GL. Epidemiologia. Atheneu, 2 ed. São Paulo, 2008 ROSNER, B.Fundamentos de bioestatistica. 8ª Edição Norte Americana, Cengage Learning, 2016.

OBRIGADA

• EXERCÍCIOS estarão no stoa para entregar como tarefa para próximas aulas.

Recommended