28
Comparando duas populações: amostras independentes Inferência Estatística Básica

Comparando duas populações: amostras independentes Inferência Estatística Básica

Embed Size (px)

Citation preview

Page 1: Comparando duas populações: amostras independentes Inferência Estatística Básica

Comparando duas populações: amostras independentes

Inferência Estatística Básica

Page 2: Comparando duas populações: amostras independentes Inferência Estatística Básica

Consumo de chocolate amargo e redução na pressão arterial*

*Taubert, D. et al. (2007) Effects of Low Habitual Cocoa Intake on Blood Pressure and Bioactive Nitric Oxide: A Randomized Controlled Trial, JAMA, July 4, 2007—Vol 298, No. 1

44 adultos com hipertensão arterial leve

Antes

Depois

18 semanas

Antes

Depois

18 semanas

Amostras Pareadas

Amostras Pareadas

Amostras independentes

Chocolate amargo

Chocolate branco

Page 3: Comparando duas populações: amostras independentes Inferência Estatística Básica

Amostras independentes devem ser comparáveis….

No exemplo, isso significa que os grupos “chocolate amargo” e “chocolate branco” devem ser parecidos quanto a:

idadepesosexonível de colesterolpressão sanguínea inicialcircunferência de quadriletc…

variáveis que afetam a resposta:

pressão sanguínea depois do experimento

Page 4: Comparando duas populações: amostras independentes Inferência Estatística Básica

Tabela 2 do artigo (Taubert et al, 2007)

Page 5: Comparando duas populações: amostras independentes Inferência Estatística Básica

μV ≠ μA

σV=σA=σ

Médias Populacionais (desconhecidas): μ1 e μ2 , μd = μ1 - μ2Hipótese nula: H0: μ1 = μ2 H0: μd

= 0

Suposição:

as amostras dos Grupos 1 e 2 vêm de populações com distribuição Normal com desvios-padrão iguais.

n1: tamanho da amostra no Grupo 1n2: tamanho da amostra no Grupo 2

Comparação de duas médias Amostras Independentes

Page 6: Comparando duas populações: amostras independentes Inferência Estatística Básica

Amostras Grupo 1 Grupo 2Tamanho n1 n2

MédiaDesvio-Padrão

s1 s2

s1 e s2 são estimativas do desvio-padrão comum σ

x y

Hipótese nula: H0: μd = 0Hipótese alternativa: HA: μd ≠ 0

Comparação de duas médias Amostras Independentes

Page 7: Comparando duas populações: amostras independentes Inferência Estatística Básica

0

α/2α/2

( ; / 2)glt ( ; / 2)glt

Estatística de Teste:

Valor P = 2P(Tgl >|Tobs |)

2 2

1 2

0obs

comb comb

x yT

s sn n

( ; / 2)obs glT t ouRR: ( ; / 2)obs glT t gl = n1 + n2 - 2

Supondo que as amostras dos Grupos 1 e 2 tenham vindo de populações com distribuição Normal e desvios-padrão iguais:

sn s n s

n ncomb2 1 1

22 2

2

1 2

1 12

( ) ( )

Comparação de duas médias Amostras Independentes

Page 8: Comparando duas populações: amostras independentes Inferência Estatística Básica

Tabela 2 do artigo (Taubert et al, 2007)

Page 9: Comparando duas populações: amostras independentes Inferência Estatística Básica

Valor P = P[T42 <-0.23] + P[T42 > 0.23] = 2 x P[T42 < -0.23]

2 22

2 2

(22 1)14 (22 1)1522 22 2

14 15 = 4212

combs

189 190 -0.231 142122 22

obsT

H0: μCA – μCB = 0HA: μCA – μCB ≠ 0

Valor P = 2 x P[Z <-0.23]= c 0.4090 = 0.8180“Não foram encontradas evidências estatisticamente significantes contra a hipótese de que as taxas médias de colesterol total são iguais nos dois grupos de estudo (valor p = 0.8180)”

Page 10: Comparando duas populações: amostras independentes Inferência Estatística Básica

Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame

Uma equipe de pesquisa gostaria de verificar o efeito da presença de pragas no tamanho da área foliar de plantas de ciclame. A suspeita é que a presença de pragas diminuiria a área foliar das plantasUma amostra de 14 plantas com pragas e outra amostra de 12 plantas sem pragas foi avaliada quanto à área foliar.A área foliar média das plantas com pragas foi de 7.5 cm2, com desvio-padrão de 1.76 cm2. Nas plantas sem pragas, a área foliar média foi de 8.9 cm2, com desvio-padrão de 1.68 cm2.Ao nível de 5% de significância, os dados desse estudo mostram evidências estatísticas a favor da hipótese dos pesquisadores?

1/4

Page 11: Comparando duas populações: amostras independentes Inferência Estatística Básica

Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame

2/4

H0: μSP – μCP = 0HA: μSP – μCP > 0

μSP é a área foliar média das plantas sem pragas, em cm2

μCP é a área foliar média das plantas com pragas, em cm2

8.90 7.50 2.071 12.97

12 14

obsT

8.9; 1.68; 127.5; 1.76; 14

SP SP SP

CP CP CP

x s nx s n

Dados amostrais:

2 22 (12 1)(1.76) (14 1)(1.68)

12 14 231.05 40.27 = 2.97

24

combs

Estatística de teste

Page 12: Comparando duas populações: amostras independentes Inferência Estatística Básica

Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame

3/4

Valor P = P[T24 > 2.07] = ?

Valor P = P[T24 > 2.07] ≈ 0.025

2.07

Page 13: Comparando duas populações: amostras independentes Inferência Estatística Básica

Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame

4/4

Conclusão em termos do problema:

Ao nível de 5% de significância, os dados desse estudo mostram evidências estatísticas a favor da hipótese que da área foliar média de plantas sem pragas é maior do que a área foliar média de plantas com pragas (valor p ≈ 0.025 ).

Page 14: Comparando duas populações: amostras independentes Inferência Estatística Básica

IC x y t s n nn n comb

1 2 1 2

100 12 2

2

1 2

1 1

( )%( ; / )( )

Intervalos de Confiança para diferença entre duas médias

Amostras Independentes

sn s n s

n ncomb2 1 1

22 2

2

1 2

1 12

( ) ( )

Page 15: Comparando duas populações: amostras independentes Inferência Estatística Básica

Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame

2/4

100(1 )% 2( 2; / 2)

1 1( )SP CP SP CPSP CP n n comb

SP CP

IC x x t sn n

100(1 )%(24; / 2)

1 1(8.90 7.50) 2.9712 14SP CP

IC t

(24;0.05) 1.71t Se 100(1-α)%=90%, então α=0.05 e

90% 1.40 (1.71 0.68)SP CP

IC

90% 1.40 1.16 [0.24 ; 2.56]SP CP

IC

Page 16: Comparando duas populações: amostras independentes Inferência Estatística Básica

Usando Intervalos de Confiança para fazer Testes de Hipóteses

Em estudo sobre os efeitos da suplementação de vitamina A, um grupo de crianças de 4 a 24 meses de idade, com sarampo e complicações (pneumonia e diarréia grave) foi dividido em dois grupos: um grupo recebeu vitamina A nas doses recomendadas pela OMS e outro grupo recebeu um placebo.

Durante o acompanhamento, foram medidas as seguintes variáveis: PC – duração da pneumonia clínica (dias), DI – duração da diarréia (dias) e GP – ganho de peso após 6 semanas (g).

Page 17: Comparando duas populações: amostras independentes Inferência Estatística Básica

H0: μA - μP = 0

HA: μA - μP ≠ 0

Média e desvio-padrão (entre parênteses) para três características

dos grupos de Placebo e Vitamina A

Placebo Vitamina AIntervalo de 99% de

Confiança para (μA – μP) PC (dias) 4.50 (0.79) 4,10 (0.40) -0.82 a 0.02

DI (dias) 3.60 (0.35) 3.30 (0.71) -0.67 a 0.07

GP (g) 900 (140) 1150 (310) 70 a 430

(não rejeitar H0 a 1% de sig.)

(não rejeitar H0 a 1% de sig.)

(rejeitar H0 a 1% de sig.)

Usando Intervalos de Confiança para fazer Testes de Hipóteses

Page 18: Comparando duas populações: amostras independentes Inferência Estatística Básica

Comparação de duas proporções Amostras Independentes

Deseja-se comparar as proporções de dois grupos:

p1: valor populacional da proporção no Grupo 1

p2: valor populacional da proporção no Grupo 2

Amostras Grandes (n1 ≥ 30 e n2 ≥ 30)

Amostras Grupo 1 Grupo 2Tamanho n1 n2

N° de sucessos

m1 m2

Proporção de sucessos p

mn1

1

1 p

mn2

2

2

Page 19: Comparando duas populações: amostras independentes Inferência Estatística Básica

1 2

1 1 2 2

1 2

ˆ ˆˆ ˆ ˆ ˆ(1 ) (1 )

p pZp p p p

n n

Comparação de duas proporções Amostras Independentes

Hipótese nula: H0: p1 = p2

Estatística de teste:

Se H0 for verdadeira, Z ~ Normal(0 ; 1)

Page 20: Comparando duas populações: amostras independentes Inferência Estatística Básica

Exemplo 3: comparação de duas marcas de luvas quanto à permeabilidade a vírusA administração de um hospital deseja verificar se luvas de duas marcas (A e B) são homogêneas quanto à permeabilidade a vírus. Para isto, realizou um experimento, no qual 240 luvas da marca A e 240 luvas da marca B foram submetidas à tensão. Durante os testes, 151 luvas da marca A (62.9%), 134 luvas da marca B (55.8%) deixaram passar vírus quando submetidas à tensão. Ao nível de 5% de significância, os dados do experimento apresentam evidências estatísticas suficientes contra a hipótese de que as duas marcas possuem a mesma permeabilidade?

1/4

Page 21: Comparando duas populações: amostras independentes Inferência Estatística Básica

Exemplo 3: comparação de duas marcas de luvas quanto à permeabilidade a vírus

2/4

H0: pB – pA = 0HA: pB – pA ≠ 0

pA é a proporção luvas da marca A que deixa passar vírus quando tensionada.

Dados amostrais:

Estatística de teste

pB é a proporção luvas da marca B que deixa passar vírus quando tensionada.151ˆ 0.629

240Ap 134ˆ 0.558240Bp

0.558 0.6290.558(1 0.558) 0.629(1 0.629)

240 240

obsZ

-0.071 -1.580.045obsZ

Page 22: Comparando duas populações: amostras independentes Inferência Estatística Básica

Exemplo 3: comparação de duas marcas de luvas quanto à permeabilidade a vírus

3/4

-1.58obsZ

Valor P = P[Z < -1.58] + P[Z > 1.58] = 2 x P[Z < -1.58] = 2 x 0.0571 = 0.1141

0.0571 0.0571

-1.58 1.58

Page 23: Comparando duas populações: amostras independentes Inferência Estatística Básica

Exemplo 3: comparação de duas marcas de luvas quanto à permeabilidade a vírus

4/4

Conclusão em termos do problema:

Ao nível de 5% de significância, os dados desse estudo não mostram evidências estatísticas suficientes contra a hipótese de que as duas marcas possuem a mesma permeabilidade (valor p = 0.1141).

Page 24: Comparando duas populações: amostras independentes Inferência Estatística Básica

Intervalos de Confiança para diferença entre duas proporções

Amostras independentes e grandes (n1 30 e n2 30)

1 1 2 21 21 2

1 2/ 2

100(1 )% ˆ ˆ ˆ ˆ(1 ) (1 )ˆ ˆ( )p pp p p pIC p p z

n n

Page 25: Comparando duas populações: amostras independentes Inferência Estatística Básica

Exemplo 4: efeito do uso do cinto de segurança sobre a proporção de feridos graves em acidentes automobilísticos

Um estudo com crianças hospitalizadas em conseqüência de acidentes com veículos teve o objetivo de estimar o efeito do uso do cinto de

segurança na proporção de ferimentos graves. Entre 290 crianças que não estavam usando o

cinto de segurança, 50 sofreram ferimentos graves. Entre 123 crianças que estavam usando cintos, 16

sofreram ferimentos graves. Com 95% de confiança, qual é a estimativa do efeito

do uso do cinto de segurança na proporção de ferimentos graves?

1/3

Page 26: Comparando duas populações: amostras independentes Inferência Estatística Básica

Exemplo 4: efeito do uso do cinto de segurança sobre a proporção de feridos graves em acidentes automobilísticos

2/3

pSIM é a proporção de crianças que sofreram ferimentos graves dentre as que estavam usando cinto de segurança.pNAO é a proporção de crianças que sofreram ferimentos graves dentre as que não estavam usando cinto de segurança.Efeito do uso do cinto = (pSIM – pNAO)

0.02595% ˆ ˆ ˆ ˆ(1 ) (1 )ˆ ˆ( )

123 290SIM SIM NAO NAO

SIM NAOSIM NAOp pp p p p

IC p p z

Page 27: Comparando duas populações: amostras independentes Inferência Estatística Básica

Exemplo 4: efeito do uso do cinto de segurança sobre a proporção de feridos graves em acidentes automobilísticos

3/3

95% 0.130(1 0.130) 0.172(1 0.172)(0.130 0.172) 1.96123 290SIM NAOp pIC

95% -0.042 (1.96 0.038) -0.042 0.073SIM NAOp pIC

95% -0.116 ; 0.031SIM NAOp pIC

Com 95% de confiança, o efeito do uso no cinto de segurança está entre reduzir em 11.6 pontos percentuais até aumentar 3.1 pontos percentuais na proporção de ferimentos graves. O que isto quer

dizer ???

Page 28: Comparando duas populações: amostras independentes Inferência Estatística Básica

Para aprender mais …

Exercícios da Seção 11 Somente amostras independentes