Comparando duas populações: amostras independentes Inferência Estatística Básica

Preview:

Citation preview

Comparando duas populações: amostras independentes

Inferência Estatística Básica

Consumo de chocolate amargo e redução na pressão arterial*

*Taubert, D. et al. (2007) Effects of Low Habitual Cocoa Intake on Blood Pressure and Bioactive Nitric Oxide: A Randomized Controlled Trial, JAMA, July 4, 2007—Vol 298, No. 1

44 adultos com hipertensão arterial leve

Antes

Depois

18 semanas

Antes

Depois

18 semanas

Amostras Pareadas

Amostras Pareadas

Amostras independentes

Chocolate amargo

Chocolate branco

Amostras independentes devem ser comparáveis….

No exemplo, isso significa que os grupos “chocolate amargo” e “chocolate branco” devem ser parecidos quanto a:

idadepesosexonível de colesterolpressão sanguínea inicialcircunferência de quadriletc…

variáveis que afetam a resposta:

pressão sanguínea depois do experimento

Tabela 2 do artigo (Taubert et al, 2007)

μV ≠ μA

σV=σA=σ

Médias Populacionais (desconhecidas): μ1 e μ2 , μd = μ1 - μ2Hipótese nula: H0: μ1 = μ2 H0: μd

= 0

Suposição:

as amostras dos Grupos 1 e 2 vêm de populações com distribuição Normal com desvios-padrão iguais.

n1: tamanho da amostra no Grupo 1n2: tamanho da amostra no Grupo 2

Comparação de duas médias Amostras Independentes

Amostras Grupo 1 Grupo 2Tamanho n1 n2

MédiaDesvio-Padrão

s1 s2

s1 e s2 são estimativas do desvio-padrão comum σ

x y

Hipótese nula: H0: μd = 0Hipótese alternativa: HA: μd ≠ 0

Comparação de duas médias Amostras Independentes

0

α/2α/2

( ; / 2)glt ( ; / 2)glt

Estatística de Teste:

Valor P = 2P(Tgl >|Tobs |)

2 2

1 2

0obs

comb comb

x yT

s sn n

( ; / 2)obs glT t ouRR: ( ; / 2)obs glT t gl = n1 + n2 - 2

Supondo que as amostras dos Grupos 1 e 2 tenham vindo de populações com distribuição Normal e desvios-padrão iguais:

sn s n s

n ncomb2 1 1

22 2

2

1 2

1 12

( ) ( )

Comparação de duas médias Amostras Independentes

Tabela 2 do artigo (Taubert et al, 2007)

Valor P = P[T42 <-0.23] + P[T42 > 0.23] = 2 x P[T42 < -0.23]

2 22

2 2

(22 1)14 (22 1)1522 22 2

14 15 = 4212

combs

189 190 -0.231 142122 22

obsT

H0: μCA – μCB = 0HA: μCA – μCB ≠ 0

Valor P = 2 x P[Z <-0.23]= c 0.4090 = 0.8180“Não foram encontradas evidências estatisticamente significantes contra a hipótese de que as taxas médias de colesterol total são iguais nos dois grupos de estudo (valor p = 0.8180)”

Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame

Uma equipe de pesquisa gostaria de verificar o efeito da presença de pragas no tamanho da área foliar de plantas de ciclame. A suspeita é que a presença de pragas diminuiria a área foliar das plantasUma amostra de 14 plantas com pragas e outra amostra de 12 plantas sem pragas foi avaliada quanto à área foliar.A área foliar média das plantas com pragas foi de 7.5 cm2, com desvio-padrão de 1.76 cm2. Nas plantas sem pragas, a área foliar média foi de 8.9 cm2, com desvio-padrão de 1.68 cm2.Ao nível de 5% de significância, os dados desse estudo mostram evidências estatísticas a favor da hipótese dos pesquisadores?

1/4

Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame

2/4

H0: μSP – μCP = 0HA: μSP – μCP > 0

μSP é a área foliar média das plantas sem pragas, em cm2

μCP é a área foliar média das plantas com pragas, em cm2

8.90 7.50 2.071 12.97

12 14

obsT

8.9; 1.68; 127.5; 1.76; 14

SP SP SP

CP CP CP

x s nx s n

Dados amostrais:

2 22 (12 1)(1.76) (14 1)(1.68)

12 14 231.05 40.27 = 2.97

24

combs

Estatística de teste

Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame

3/4

Valor P = P[T24 > 2.07] = ?

Valor P = P[T24 > 2.07] ≈ 0.025

2.07

Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame

4/4

Conclusão em termos do problema:

Ao nível de 5% de significância, os dados desse estudo mostram evidências estatísticas a favor da hipótese que da área foliar média de plantas sem pragas é maior do que a área foliar média de plantas com pragas (valor p ≈ 0.025 ).

IC x y t s n nn n comb

1 2 1 2

100 12 2

2

1 2

1 1

( )%( ; / )( )

Intervalos de Confiança para diferença entre duas médias

Amostras Independentes

sn s n s

n ncomb2 1 1

22 2

2

1 2

1 12

( ) ( )

Exemplo 2: efeito da presença de pragas na área foliar das plantas de ciclame

2/4

100(1 )% 2( 2; / 2)

1 1( )SP CP SP CPSP CP n n comb

SP CP

IC x x t sn n

100(1 )%(24; / 2)

1 1(8.90 7.50) 2.9712 14SP CP

IC t

(24;0.05) 1.71t Se 100(1-α)%=90%, então α=0.05 e

90% 1.40 (1.71 0.68)SP CP

IC

90% 1.40 1.16 [0.24 ; 2.56]SP CP

IC

Usando Intervalos de Confiança para fazer Testes de Hipóteses

Em estudo sobre os efeitos da suplementação de vitamina A, um grupo de crianças de 4 a 24 meses de idade, com sarampo e complicações (pneumonia e diarréia grave) foi dividido em dois grupos: um grupo recebeu vitamina A nas doses recomendadas pela OMS e outro grupo recebeu um placebo.

Durante o acompanhamento, foram medidas as seguintes variáveis: PC – duração da pneumonia clínica (dias), DI – duração da diarréia (dias) e GP – ganho de peso após 6 semanas (g).

H0: μA - μP = 0

HA: μA - μP ≠ 0

Média e desvio-padrão (entre parênteses) para três características

dos grupos de Placebo e Vitamina A

Placebo Vitamina AIntervalo de 99% de

Confiança para (μA – μP) PC (dias) 4.50 (0.79) 4,10 (0.40) -0.82 a 0.02

DI (dias) 3.60 (0.35) 3.30 (0.71) -0.67 a 0.07

GP (g) 900 (140) 1150 (310) 70 a 430

(não rejeitar H0 a 1% de sig.)

(não rejeitar H0 a 1% de sig.)

(rejeitar H0 a 1% de sig.)

Usando Intervalos de Confiança para fazer Testes de Hipóteses

Comparação de duas proporções Amostras Independentes

Deseja-se comparar as proporções de dois grupos:

p1: valor populacional da proporção no Grupo 1

p2: valor populacional da proporção no Grupo 2

Amostras Grandes (n1 ≥ 30 e n2 ≥ 30)

Amostras Grupo 1 Grupo 2Tamanho n1 n2

N° de sucessos

m1 m2

Proporção de sucessos p

mn1

1

1 p

mn2

2

2

1 2

1 1 2 2

1 2

ˆ ˆˆ ˆ ˆ ˆ(1 ) (1 )

p pZp p p p

n n

Comparação de duas proporções Amostras Independentes

Hipótese nula: H0: p1 = p2

Estatística de teste:

Se H0 for verdadeira, Z ~ Normal(0 ; 1)

Exemplo 3: comparação de duas marcas de luvas quanto à permeabilidade a vírusA administração de um hospital deseja verificar se luvas de duas marcas (A e B) são homogêneas quanto à permeabilidade a vírus. Para isto, realizou um experimento, no qual 240 luvas da marca A e 240 luvas da marca B foram submetidas à tensão. Durante os testes, 151 luvas da marca A (62.9%), 134 luvas da marca B (55.8%) deixaram passar vírus quando submetidas à tensão. Ao nível de 5% de significância, os dados do experimento apresentam evidências estatísticas suficientes contra a hipótese de que as duas marcas possuem a mesma permeabilidade?

1/4

Exemplo 3: comparação de duas marcas de luvas quanto à permeabilidade a vírus

2/4

H0: pB – pA = 0HA: pB – pA ≠ 0

pA é a proporção luvas da marca A que deixa passar vírus quando tensionada.

Dados amostrais:

Estatística de teste

pB é a proporção luvas da marca B que deixa passar vírus quando tensionada.151ˆ 0.629

240Ap 134ˆ 0.558240Bp

0.558 0.6290.558(1 0.558) 0.629(1 0.629)

240 240

obsZ

-0.071 -1.580.045obsZ

Exemplo 3: comparação de duas marcas de luvas quanto à permeabilidade a vírus

3/4

-1.58obsZ

Valor P = P[Z < -1.58] + P[Z > 1.58] = 2 x P[Z < -1.58] = 2 x 0.0571 = 0.1141

0.0571 0.0571

-1.58 1.58

Exemplo 3: comparação de duas marcas de luvas quanto à permeabilidade a vírus

4/4

Conclusão em termos do problema:

Ao nível de 5% de significância, os dados desse estudo não mostram evidências estatísticas suficientes contra a hipótese de que as duas marcas possuem a mesma permeabilidade (valor p = 0.1141).

Intervalos de Confiança para diferença entre duas proporções

Amostras independentes e grandes (n1 30 e n2 30)

1 1 2 21 21 2

1 2/ 2

100(1 )% ˆ ˆ ˆ ˆ(1 ) (1 )ˆ ˆ( )p pp p p pIC p p z

n n

Exemplo 4: efeito do uso do cinto de segurança sobre a proporção de feridos graves em acidentes automobilísticos

Um estudo com crianças hospitalizadas em conseqüência de acidentes com veículos teve o objetivo de estimar o efeito do uso do cinto de

segurança na proporção de ferimentos graves. Entre 290 crianças que não estavam usando o

cinto de segurança, 50 sofreram ferimentos graves. Entre 123 crianças que estavam usando cintos, 16

sofreram ferimentos graves. Com 95% de confiança, qual é a estimativa do efeito

do uso do cinto de segurança na proporção de ferimentos graves?

1/3

Exemplo 4: efeito do uso do cinto de segurança sobre a proporção de feridos graves em acidentes automobilísticos

2/3

pSIM é a proporção de crianças que sofreram ferimentos graves dentre as que estavam usando cinto de segurança.pNAO é a proporção de crianças que sofreram ferimentos graves dentre as que não estavam usando cinto de segurança.Efeito do uso do cinto = (pSIM – pNAO)

0.02595% ˆ ˆ ˆ ˆ(1 ) (1 )ˆ ˆ( )

123 290SIM SIM NAO NAO

SIM NAOSIM NAOp pp p p p

IC p p z

Exemplo 4: efeito do uso do cinto de segurança sobre a proporção de feridos graves em acidentes automobilísticos

3/3

95% 0.130(1 0.130) 0.172(1 0.172)(0.130 0.172) 1.96123 290SIM NAOp pIC

95% -0.042 (1.96 0.038) -0.042 0.073SIM NAOp pIC

95% -0.116 ; 0.031SIM NAOp pIC

Com 95% de confiança, o efeito do uso no cinto de segurança está entre reduzir em 11.6 pontos percentuais até aumentar 3.1 pontos percentuais na proporção de ferimentos graves. O que isto quer

dizer ???

Para aprender mais …

Exercícios da Seção 11 Somente amostras independentes

Recommended