18
Curso de Biomedicina Disciplina 5EMA080: Biostatística E APLICAÇÕES NO SOFTWARE R 3 0 BIMESTRE Prof a . Dr a . Ana Verginia Libos Messetti LONDRINA 2016

Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

Embed Size (px)

Citation preview

Page 1: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

Curso de Biomedicina

Disciplina 5EMA080: Biostatística E

APLICAÇÕES NO SOFTWARE R

30 BIMESTRE

Profa. Dr

a. Ana Verginia Libos Messetti

LONDRINA

2016

Page 2: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

1

AULA 13 – Distribuição Amostral da Média

Estatística Indutiva - Fornece procedimentos formais para tirar conclusões sobre uma

população, a partir de uma amostra.

Parâmetros - Alguma medida descritiva (média, variância, proporção etc..) dos valores x1, x2,

x3,.....,xn associados à população.

Estatística - Alguma medida descritiva (média, variância, proporção etc..) dos valores x1,

x2,.....,xn associa à amostra.

Considere uma amostragem aleatória simples, qualquer medida associada à amostra

(estatística) é uma variável aleatória, devido à aleatoriedade introduzida na amostragem. Uma

estatística é uma variável aleatória e sua distribuição de probabilidade é chamada distribuição

amostral.

13.1 - Distribuição amostral da média

Seja uma amostra aleatória simples {x1, x2,.....,xn} e a estatística x . A distribuição da

média amostral apresenta as seguintes propriedades:

a) O valor esperado da média amostral é igual à média da população: E ( x ) = .

b) A variância da média amostral é inferior à variância populacional (2 ) e a relação é dada

por: V( x ) = 2 /n; se a amostragem for com reposição, ou N grande e até infinito.

V( x ) = )1N

nN(

n

2

; se a amostragem for sem reposição e N pequeno ou N < 20n.

c) Teorema do limite central. Quando amostra for grande, a distribuição da média segue a

distribuição normal.

Exemplo 13.1 - Seja a população dos 4 ônibus e a variável X = número de vezes que o ônibus

teve um defeito grave. Se um ônibus teve 2 defeitos graves, o outro 3, o outro 4, e o último 5

defeitos graves. A variável X = {2, 3, 4, 5}. Construir a distribuição amostral da média

amostral, considerando uma Amostragem aleatória simples, com n=2 elementos, extraída com

reposição.

Determine: a) média (valor esperado) e a variância da populacional b) média (valor esperado)

e a variância da distribuição da média amostral c) relacione os itens a e b com as Propriedades

13.2- Distribuição amostral da proporção

O estudo da proporção dos elementos que tem certo atributo A, segue as seguintes propriedades:

a) O valor esperado da proporção amostral é igual à proporção da população: E(P^ ) = P.

b) A variância da proporção amostral é dada por:

V(P^

) = P (1-P) /n; se a amostragem for com reposição, ou N grande e até infinito.

V(P^

) = )1

()1(

N

nN

n

PP; se a amostragem for sem reposição e N pequeno, N<20n.

Page 3: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

2

ATIVIDADE 13 – Distribuição Amostral da Média

1) Considere a seguinte população: Y = {1, 3, 5, 5, 7}. Seja y a variável aleatória valor

assumido por um elemento sorteado ao acaso dessa população.

a) Seja Y a (variável aleatória). Determine à média e variância populacional.

b) Seja y1 a variável aleatória número selecionado na 1a extração e y2, a variável aleatória

número selecionado na 2a extração. O sorteio, com reposição, de uma amostra de dois

elementos dessa população. Determine: b) média (valor esperado) e a variância da distribuição

da média amostral. c) relacione os itens a e b com as Propriedades P1 e P2.

AULA 14 – Intervalo de Confiança (I.C.)

Trata-se de uma técnica para se fazer inferência estatística, ou seja, a partir de um

intervalo de confiança, construído com os elementos amostrais, pode-se inferir sobre um

parâmetro populacional.

A construção de intervalos de confiança fundamenta-se nas distribuições amostrais. Se a

partir de uma amostra procura-se obter um Intervalo de Confiança 21

ˆˆ 1 - com

certa probabilidade de conter o verdadeiro parâmetro populacional.

A construção de intervalos de confiança fundamenta-se nas distribuições amostrais. Se a

partir de uma amostra procura-se obter um Intervalo de Confiança P 21

ˆˆ 1 - com

certa probabilidade de conter o verdadeiro parâmetro populacional.

Quando se diz que o Intervalo de Confiança contém o verdadeiro parâmetro

populacional com uma probabilidade 1 - (nível de confiança), será o nível de

significância, ou seja, o erro que está se cometendo ao afirmar-se que o intervalo contém o

verdadeiro parâmetro.

Esta técnica diferencia-se da estimação “por ponto” onde se calcula um único valor

(estimativa) para o parâmetro populacional.

Por exemplo, retira-se uma amostra de 500 brasileiros e calcula-se a média de suas

alturas encontrando-se 1,70m. Logo, uma estimação pontual da verdadeira altura média é dada

por m70,1x . Já através do Intervalo de Confiança (I. C.) poder-se-ia encontrar um

Intervalo, por exemplo [1,68; 1,72] que, em 95% das vezes, incluiria a verdadeira altura média

dos brasileiros.

14.1 Intervalo de Confiança para Proporção ou Probabilidade P

Quando n > 30. Vimos que P ~ N (p; pq/n), logo .

n

)p1(p

PpZ

^^

^

O denominador da

fórmula é o desvio padrão da distribuição amostral de P, ou seja, é o erro padrão da proporção.

Portanto, o intervalo para um nível será:

/2

/2 1 -

−𝑍∝2 + 𝑍∝

2

Page 4: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

3

Então:

1

)1(

12

^^

^

222

Z

n

pp

PpZPZZZP

1n

)p1(pZp P

n

)p1(pZpP

^^

2

^^^

2

^

resumindo temos:

IC (P, 1-α) = [ ^

pn

)p1(pz

^^

2

]

Exemplo 14.1 - Ache os valores críticos para Z (Normal padrão) nos intervalos de confiança que

corresponde ao nível de confiança (1- α) = 90%; (1- α) = 95% e (1- α) = 99%

Exemplo 14.2 – Considere a distribuição de sobrevivência de cinco anos para os indivíduos

fumantes e abaixo dos 40 anos diagnosticados com câncer nos pulmões. Essa distribuição tem

proporção da população (P) desconhecida. Em uma amostra aleatoriamente selecionada de 400

indivíduos fumantes e abaixo dos 40 anos diagnosticados com câncer nos pulmões, somente 240

sobreviveram cinco anos. Obtenha um intervalo de confiança de 95% para verdadeira

proporção. Refaça para o intervalo de 99% de confiança. O que ocorreu com a amplitude do

intervalo quando diminuímos o nível de significância?

14.2 Intervalo de Confiança para a Média Populacional

Neste caso, precisa-se calcular a estimativa da variância a partir da amostra. Trabalha-se então

com a distribuição “t” de Student, com (n – 1) graus de liberdade, isto é:

n

s

xt

, com (- t + )

O gráfico da função densidade da variável “t” de Student é simétrico e tem a forma da

normal. Logo, o intervalo de confiança para um nível de significância ou erro é:

Portanto: 1]n

s.tx

n

s.tx[P

22

Valor do teste t tabelado: ttab )2

;1(

n resumindo temos: ].[)1,(

2n

stxIC

/2

/2 1 -

- +

Page 5: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

4

Exemplo 14.3 - Ache na tabela t de Student, o valor crítico utilizado no intervalo de confiança

conhecendo o “n” amostral e o nível de confiança α.

a) 1- α = 99%; n=28 b) 1- α = 95%; n= 22 c)1- α = 90%; n= 50

Exemplo 14.4 - Quando oito pessoas sofreram um epsódio não explicado de intoxicação de

vitamina D que exigiu hospitalização, foi sugerido que essas ocorrências não usuais poderiam

ser resultado de suplementação excessiva de leite. Os níveis de cálcio (mmol/l) e os níveis de

albumina (g/l) no sangue para cada indivíduo no momento da internação no hospital são

exibidos na tabela abaixo.

Tabela 1 - Níveis de cálcio (mmol/l) e os níveis de albumina (g/l) no sangue

Cálcio 2,92 3,84 2,37 2,99 2,67 3,17 3,74 3,44 Albumina 43 42 42 40 42 38 34 42

a) construir o intervalo com 95% de confiança para o nível médio de cálcio.

b) construir o intervalo com 95% de confiança para o nível médio de albumina.

c) para indivíduos saudáveis, o intervalo normal de cálcio [2,12; 2,74 mmol/l] e o intervalo para

níveis de albumina [32; 55 g/l]. Você acredita que os pacientes com intoxicação de vitamina D

tem níveis normais de cálcio e albumina no sangue?

ATIVIDADE 14 – Intervalo de Confiança (I.C.)

1) Ache os valores críticos para z (Normal padrão) nos intervalos de confiança que corresponde

ao nível de confiança: a) 1- α = 80% b) 1- α = 98% c) 1- α = 96%

2) O registro de vacinação, de determinada localidade informou que, na última campanha

realizada, 10% da população deixaram de ser imunizados. Entretanto em uma amostra com 130

pessoas de um determinado bairro, foram detectados 20 casos de não-vacinação. Construir o

Intervalo de confiança com nível de significância de 1% para a verdadeira proporção de

indivíduos não imunizados. Você acredita que 10% da população deixaram de ser imunizados?

3) Um dentista examinou 100 crianças e verificou que 33 delas não tinham cáries. A proporção

de criança sem cáries é de 0.33. O dentista quer uma boa estimativa da probabilidade de uma

criança da mesma população de onde proveio a amostra não ter cáries. Construa o I.C. com 95%

de confiança para a verdadeira proporção de crianças sem cáries.

4) Ache na tabela t de Student, o valor crítico utilizado no intervalo de confiança (bilateral)

conhecendo o “n” amostral e o nível de confiança α.

a) 1- α =99%; n = 43 b) 1- α =95%; n = 45 c) 1- α =90 %; n = 60

5) Suponha que se deseja estimar o diâmetro pupilar médio de coelhos adultos normais, a partir

de uma amostra de 12 animais, cuja média foi 5,2 mm. Considerando o desvio padrão

populacional desconhecido, construir o intervalo com 95% de confiança para o verdadeiro

diâmetro médio das pupilas de coelhos adultos.

Tabela 2 – Diâmetro pupilar em coelhos adultos normais

coelho 1 2 3 4 5 6 7 8 9 10 11 12 Diam. 5.0 5.5 5.0 4.5 4.5 6.0 6.5 5.5 5.5 5.0 5.5 4.0

6) O número de horas de sono induzidas por um medicamento tem distribuição normal. Foi

tomada uma amostra aleatória de 10 indivíduos que tomaram o medicamento, obtendo-se os

resultados em horas de sono: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9. Construir um IC de 90% para a média

do número de horas de sono induzidas pelo medicamento.

Page 6: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

5

AULA 15 – Teste de hipóteses para uma amostra

Decisões Estatísticas - Na prática somos chamados com muita frequência a tomar decisões

acerca de populações, baseados nas informações das amostras. Essas decisões são denominadas

decisões estatísticas. Pode-se desejar decidir, com base em dados amostrais, se um novo soro é

realmente eficaz na cura de uma doença, se um processo educacional é melhor do que outro, se

uma certa moeda é viciada e outras.

Hipótese Estatística - A Hipótese Estatística é uma suposição ou afirmação relativa a uma ou

mais populações, que pode ser verdadeira ou falsa.

Exemplos: a) 3% da população brasileira possui vírus HIV;

b) A média de vida do brasileiro é de 78 anos.

Testes de Hipótese - Consiste em decidir se a hipótese é verdadeira ou falsa. Assim, através de

uma amostra testaremos a hipótese formulada e concluiremos se ela deve ser rejeitada ou aceita.

As Hipóteses - A hipótese lançada para ser rejeitada ou aceita é chamada de hipótese nula,

denotada por Ho. A rejeição de Ho leva a aceitação de uma hipótese alternativa, representada

por H1.

Erros do Tipo I e II - Se uma hipótese for rejeitada quando deveriam ser aceita, diz-se que foi

cometido um erro do Tipo I. se, por outro lado, for aceita uma hipótese que deveria ser

rejeitada, diz-se que foi cometido um erro Tipo II .Em ambos os casos ocorreu uma decisão

errada ou um erro de julgamento.

Os exemplos abaixo esclarecem esta situação

Decisão de um médico sobre uma cirurgia

Estado da natureza

Decisão Precisa operar Não precisa operar

Opera Decisão correta Erro tipo II

Não opera Erro tipo I Decisão correta

O erro tipo I seria não operar, quando o paciente precisa ser operado.

O erro tipo II seria operar, quando o paciente não precisa ser operado.

Nível de Significância - Ao testar uma hipótese estabelecida, a probabilidade máxima com a

qual estaremos dispostos a correr o risco de um erro Tipo I é denominada nível de significância

do teste. Essa probabilidade, representada frequentemente por , é geralmente especificada

antes da extração de quaisquer amostras, de modo que os resultados obtidos não influenciem a

escolha. Se, por exemplo, é escolhido um nível de significância 5%, no planejamento de um

teste de hipótese, há então cerca de 5 chances em 100, de a hipótese ser rejeitada, quando

deveria ser aceita, isto é, há uma confiança de cerca de 95% de que se tome uma decisão

acertada.

Tipos de Testes de Hipóteses

15.1 - Teste para a proporção – Abordagem clássica

1a) Formulação das hipóteses

Ho: P = p0 vs H1:

P p0 (a) Teste bilateral

P > p0 (b) Teste unilateral à direita

P < p0 (c) Teste unilateral à esquerda

Page 7: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

6

2a) Nível de significância

Normalmente adota-se um valor de ( entre 1% a 10%). Para estabelecer os valores críticos:

3a)

)1.(.

'

00

0

ppn

npyZcalc

Regra de decisão: Abordagem clássica

a) Se 22

ZZZ cal Não rejeita Ho

b) Se ZZ cal Rejeita-se Ho

c) Se ZZ cal Rejeita-se Ho.

4a) Conclusão: (Rejeita ou não rejeita Ho) finalizar com a conclusão estatística e biológica.

Abordagem do p valor: Se p > Não rejeita Ho

Se p Rejeita-se Ho

Exemplo 15.1a - Tabela normal padrão. Considere os três níveis de significância α = 10;

0.05; 0.01] e determine os valores críticos.

a)Para o teste de hipótese bilateral, encontre os valores críticos na Tabela normal padrão

b)Para o teste de hipótese unilateral à direita, encontre os valores críticos na T. normal padrão

c)Para o teste de hipótese unilateral à esquerda, encontre os valores críticos na Tnormal padrão

Exemplo 15.1b - Encontre o p-valor para um teste de hipótese para proporção.

a) Unicaudal à direita com estatística teste igual Zcalc = 2,16.

b) Unicaudal à esquerda com estatística teste igual Zcalc = -2,23.

c) Bicaudal com estatística teste igual Zcalc = 2,14

Exemplo 15.1c – Considere a distribuição de sobrevivência de cinco anos para os indivíduos

fumantes e abaixo dos 40 anos diagnosticados com câncer nos pulmões. Essa distribuição tem

proporção da população (P =62%). Em uma amostra aleatoriamente selecionada de 400

indivíduos fumantes e abaixo dos 40 anos diagnosticados com câncer nos pulmões, somente 240

sobreviveram cinco anos.

a) Testar a hipótese para verificar se a proporção de indivíduos fumantes com câncer na amostra

diferem da proporção populacional ao nível de significância de 5%. Realize a abordagem

clássica e apresente o p-valor.

1 -

+Z

1 -

/2

/2

1 -

-Z/2 Z/2

-Z

(a) (b) (c)

y = num. elementos c/ atributos atributo

y’= y+0,5 se y < np0 e y’=y-0,5 se y > np0

po = valor de Ho

n = tamanho da amostra

Page 8: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

7

15.2 - Teste de hipótese para a Média (Não conhece 2 )

1a) Formulação das hipóteses

Ho: = 0 vs H1:

2a) Nível de significância - Estabelecer os valores críticos:

Variável “t” tabelada - Teste bilateral: tabt (n – 1; 2

) e Teste Unilateral: ttab (n – 1; )

3a) Cálculo da variável teste

s

nxtcalc

)( 0

Regra de decisão a) Se

22

ttt calc Não rejeita Ho

b) Se ttcalc Rejeita-se Ho

c) Se ttcalc Rejeita-se Ho.

4a) Conclusão: (Rejeita ou não rejeita Ho). Finalizar com a conclusão estatística e biológica.

Exemplo 15.2a – Considere um teste de hipótese para média. Encontre os valores críticos na

tabela t. Considere os três níveis de significância α = [0.10; 0.05; 0.01] e o n amostral.

a) Teste Bilateral: n=15

b) Teste Unilateral à direita: n=18

c) Teste Unilateral à esquerda: n=20

Exemplo 15.2b - Encontre o p-valor para um teste de hipótese para média.

a) Teste Bicaudal com estatística de teste tcalc = 2,95 e n=20.

b) Teste Unicaudal à direita com estatística de teste tcalc = 2,34 e n= 60.

c) Teste Unicaudal à esquerda com estatística de teste tcalc = -2,45 e n=10.

Exemplo 15.2c – A eliminação pela urina de aldosterona é avaliada em indivíduos normais em

7,4mg/24 hora. Em uma amostra de 10 indivíduos, com insuficiência cardíaca, observou-se o

seguinte resultado: [6.8,7.1,5.9,7.5,6.3,6.9,7.2,7.6,6.6,6.3] eliminação de aldosterona (mg/24h).

Esse resultado são compatíveis com os indivíduos normais ou eliminam menos aldosterona?

Adote o nível de significância de 5%. Realize a abordagem clássica e encontre o p-valor.

(Dados fictícios)

0 (a) Teste bilateral

> 0 (b) Teste unilateral à direita

< 0 (c) Teste unilateral à esquerda

1 -

1 -

/2

/2

1 -

- t

(a) (b) (c)

= média amostral

0 = valor da hipótese nula

s = desvio-padrão amostral

n = tamanho da amostra

Page 9: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

8

ATIVIDADE 15 – Teste de Hipóteses para uma amostra

1) Tabela normal padrão - Considere o nível de significância α = [0,20; 0,02; 0,005] a) Para um teste bilateral, encontre o valor crítico na tabela normal padrão

b) Para um teste unilateral à direita, encontre o valor crítico na tabela normal padrão

c) Para um teste unilateral à esquerda, encontre o valor crítico na tabela normal padrão.

2) Encontre o p-valor para um teste de hipótese para proporção.

a) Unicaudal à esquerda com estatística de teste zcalc = -2.23.

b) Bicaudal com estatística de teste zcalc = 2.31

c) Unicaudal à direita com estatística de teste zcalc = 1.48.

3) O registro de vacinação, de determinada localidade informou que, na última campanha

realizada, 1,5% da população deixaram de ser imunizados. Entretanto em uma amostra com 500

pessoas de um determinado bairro, foram detectados 9 casos de não-vacinação. Para testar ao

nível de significância de 5% se a proporção de indivíduos não imunizados na amostra seja maior

que a proporção verificada na população.

4) Para comprovar se determinada enfermidade se apresenta, em maior proporção nos homens

que nas mulheres. A expectativa seria 0.5 para cada sexo. Para testar isso, escolheu-se uma

amostra aleatória de 100 homens enfermos e observou-se que 0.70 são homens. Testar se a

proporção desta enfermidade nos homens é maior que nas mulheres. Adote nível de

significância de 10%.

5) Tabela t de student - Considere o nível de significância e determine os valores críticos.

a)Para um Teste Bilateral: n=14 e nível de significância α =10%; 5% e 1%.

b)Teste Unilateral à direita: n=13 e nível de significância α =10%; 5% e 1%.

c)Teste Unilateral à esquerda: n=12 e nível de significância α =10%; 5% e 1%.

6) Encontre o p-valor para um teste de hipótese para média.

a) para um Teste bicaudal com estatística teste tcalc = 1.28 e n = 30.

b) Teste unicaudal à direita com estatística teste tcalc = 1,36 e n = 150.

c) Teste unicaudal à esquerda com estatística teste tcalc = -1,45 e n=12.

7) Suponha que as alturas X dos indivíduos de uma cidade se distribuem de modo gaussiano

com altura populacional de 174 cm. Deseja-se testar, com nível de significância de 5%, se a

altura média diminuiu, para isso, foi retirada uma amostra aleatória de 25 pessoas e obteve

média de 170 cm e desvio padrão de 10,26 cm. Qual a conclusão?

8) Quando oito pessoas sofreram um epsódio não explicado de intoxicação de vitamina D que

exigiu hospitalização, foi sugerido que essas ocorrências não usuais poderiam ser resultado de

suplementação excessiva de leite. Os níveis de cálcio (mmol/l) e os níveis de albumina (g/l) no

sangue para cada indivíduo no momento da internação no hospital são exibidos na tabela 2:

Tabela 3 - Níveis de cálcio (mmol/l) e os níveis de albumina (g/l) no sangue

Cálcio 2,92 3,84 2,37 2,99 2,67 3,17 3,74 3,44

Albumina 43 42 42 40 42 38 34 42

Se o nível médio de cálcio é de 2.43(mmol/l), testar se os indivíduos que sofreram intoxicação

de vitamina D e tiveram um aumento significativo no nível de cálcio. Adote nível de

significância de 1%.

Page 10: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

9

AULA 16 – Teste de Hipóteses para duas amostras

Introdução - O teste t permite inferir sobre a igualdade de médias de duas amostras. Primeiro caso as

amostras se apresentam pareadas (ou emparelhadas). Frequentemente cada caso é analisado duas vezes,

antes e depois de um tratamento ou intervenção, formando pares de observações, cujas diferenças são

testadas para ver se o resultado difere entre os dois momentos. E o segundo caso, é o teste t para duas

amostras independentes. Aplica-se sempre que se pretende comparar as médias de uma variável

quantitativa em dois grupos diferentes de sujeitos e se desconhecem as respectivas variâncias.

16.1 - Teste t para duas amostras pareadas

O teste t é apropriado para comparar dois conjuntos de dados quantitativos, em termos

de seus valores médios. O pressuposto para este teste é verificar a normalidade das diferenças

pelo teste Shapiro-Wilk, Teste de Lilliefors e outros para verificarem a hipótese nula (Ho: as

diferenças provêm de um população com distribuição normal). Caso p-valor ≤ α rejeita-se Ho e

optar por um teste não paramétrico. Caso p-valor > α não rejeita Ho e seguir a próxima etapa

descrita abaixo.

1a) Hipóteses H0: 21 vs H1: 21 ; 21 ou 21

1 - valor esperado da resposta do tratamento 1

2 - valor esperado da resposta do tratamento 2

2a) Nível de significância e Valores críticos: bilateral t(n-1;

2

) e unilateral t(n-1; )

3a) Variável teste tcalc =

ds

nd onde n: tamanho da amostra; d : média das diferenças

observadas (d = x2 – x1 ou d = x1-x2 ) e sd: desvio padrão das diferenças.

Regra de decisão: a) Se

22

ttt calc Não rejeita-se Ho

b) Se ttcalc Rejeita-se Ho

c) Se ttcalc Rejeita-se Ho.

4a) Formular a conclusão estatística e conclusão biológica

Exemplo 16.1 - Foi conduzido um experimento para estudar o conteúdo de hemoglobina no

sangue de suínos com deficiência de niacina. Aplicaram-se 20 mg de niacina em oito suínos.

Pode-se afirmar que o conteúdo de hemoglobina no sangue diminui com a aplicação, ao nível de

significância de 5%? Construir o Intervalo de confiança para a verdadeira redução no teor médio

da hemoglobina. Os níveis de hemoglobina foram mensurados antes e depois da aplicação da

niacina. Os resultados obtidos estão na tabela baixo:

Tabela 4 – Níveis de hemoglobina no sangue de suínos

Antes 13,6 13,6 14,7 12,1 12,3 13,2 11 12,4

Depois 11,4 12,5 14,6 13 11,7 10,3 9,8 10,4

a)Verifique o pressuposto para a realização do teste. b) Realize o teste c) apresente o p-valor

na tabela t de Student.

Page 11: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

10

16.2 Teste t para duas amostras independentes – Variâncias iguais

A formação de pares de elementos similares nem sempre é viável. Uma alternativa é

considerar duas amostras independentes. Os pressupostos abaixo devem ser verificados para não

comprometer os resultados.

O pressuposto 1 - quando a amostra aleatória, as observações garante a independência.

O pressuposto 2 - sugere a normalidade dos dados. Existem gráficos QQplot, PPplot para

visualizar a normalidade. Teste de hipótese de Shapiro-Wilk, Lilliefors e outros para verificarem

Ho: os dados provêm de um população com distribuição normal.

Caso p-valor ≤ α, rejeita-se Ho, concluindo pela não normalidade dos dados.

O pressuposto 3 - sugere a homogeneidade das variâncias. Para verificar este pressuposto,

existe o teste F para duas variâncias populacionais. Suponha que queremos comparar duas

populações, supostamente com distribuições normais, têm a mesma variância.

Pressuposto 3 - Comparação de 2 variâncias - Teste F para duas variâncias

Para verificar o Pressuposto 3 comparamos se duas populações, supostamente com distribuições

normais, têm a mesma variância. Formulam-se as hipóteses:

1a) Ho:

2

2

2

1 vs H1: 2

2

2

1 (teste bilateral) ou 2

2

2

1

2

2

2

1 ; (teste unilateral)

onde 1var:2

1 populaçãodaiância

2var:2

2 populaçãodaiância .

2a) Nível de significância e os valores críticos:

Bilateral: Fsup ( gl1= n1 -1; gl2= n2 -1; 2

) e

Finf ( gl1= n1 -1; gl2 = n2 -1; 1-2

) = Finf = );(

1

12)

2(

glglF

Unilateral: Finf [(1- ) (gl1; gl2)] ou Fsup [ (gl1; gl2)]

3a)Estatística teste: f =

2

2

2

1

s

s onde si

2 são as variâncias das amostras 1 e 2.

Condição da amostra 1 ser maior que amostra 2 (maior variância posicionada no numerador).

Regra de decisão: Rejeita-se Ho: Para teste unilateral esquerda fcalc < F(1- ) (gl1 gl2)

Para teste unilateral direita fcalc > F (gl1; gl2)

Para teste bilateral fcalc < F(1-

2

) (gl1; gl2) e fcalc > F2

(gl1; gl2)

Obs: F(1-

2

) (gl1; gl2) = );(

1

12)2

(glglF

4a) Conclusão: Caso não rejeita Ho, concluímos pela homogeneidade das variâncias.

Verificado os pressupostos realiza o teste t para comparar duas médias populacionais.

(a) 21

1a) Hipóteses : H0: 21 vs H1: (b) 21

(c) 21

Page 12: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

11

2a) Nível de significância e valores críticos.

Teste bilateral tcalc (n1 +n2 -2; 2

) e Teste unilateral tcalc (n1 + n2 -2; )

3a) Variável teste t =

2

a

21

S2

n)xx( onde a variância agregada: Sa

2 =

2

SS 2

2

2

1

n: tamanho da amostra;

1x : média do grupo1;

2x : média do grupo2;

Sa2: variância comum (agregada) dos dois grupos.

Regra de decisão: considere a distribuição t com (n-2) graus de liberdade, se H0 for verdadeira,

assim rejeita-se a hipótese nula se calct > )

2;2(

ncalct

4

a) Formular a conclusão estatística e conclusão biológica

Exemplo 16.2 - Encontre valores críticos na Tabela F de Snedecor. Considere n1 = 12 e n2 = 12.

a) Teste bilateral com nível de significância α=10%

b) Teste unilateral a direita com nível de significância α=5%

c) Teste unilateral a esquerda com nível de significância α=5%

Exemplo 16.3 - Um estudo para avaliar se a cirrose de fígado faz variar o índice de atividade da

colinesterase no soro. Selecionaram duas amostras aleatórias e independentes de indivíduos

normais e indivíduos cirróticos. A cirrose do fígado faz variar o índice de colinesterase no soro

(bilateral)?

Adote o nível de significância de 5%, aplicar o “teste t” para duas amostras independentes,

verifique se os pressupostos (homocedasticidade e normalidade) foram atendidos.

Tabela 5- Índice de atividade da colinesterase no soro.

Tratamento

Cirróticos 0.2 0.22 0.18 0.23 0.12 0.2 0.13 0.12 0.13 0.22 0.17

Normais 0.36 0.48 0.33 0.43 0.4 0.43 0.33 0.36 0.35 0.40 0.35

Observação: Caso os pressupostos não forem atendidos, partir para os testes não paramétricos.

Caso de emparelhados ou pareados o teste correspondente é o Teste de Wilcoxon. No caso de

duas amostras independentes o correspondente é o Teste de Mann-Whitney.

ATIVIDADE 16 – Teste de Hipóteses para duas amostras

1) Escreva as hipóteses nula e alternativa abaixo em termos de parâmetros populacionais;

a) a média do tempo de resposta de um tratamento A é diferente da média do tempo de resposta

de um tratamento B;

b) a média das vendas depois da campanha publicitária é maior que a média das vendas antes da

campanha publicitária;

c) a proporção de reclamações após a realização do programa de melhoria de qualidade é menor

do que antes da realização do programa;

d) crie uma hipótese, dentro de sua área de estudo, em termos de proporção.

e) crie uma hipótese, dentro de sua área de estudo, em termos de média.

2) Para verificar os efeitos de um produto denominado “creme redutor” foram medidos os

diâmetros abdominais de 10 indivíduos, antes de começar o tratamento e uma semana após a

aplicação diária do produto.

Page 13: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

12

Tabela 6 – Diâmetro abdominal em cm antes e depois da aplicação do creme redutor.

Antes 80 77 74 86 72 66 78 62 82 94

Depois 76 75 74 82 74 60 77 65 80 90

a) Verificar os pressupostos para aplicar o teste t pareado.

b) Testar a hipótese do diâmetro diminue com o tratamento com o creme redutor (α=5%)

c) Determine o p-valor na tabela t de Student.

d) Construa o Intervalo de confiança para a diferença.

3) Um o remédio produzido de certa erva foi testado em 10 pacientes com distúrbio de sono

selecionados aleatoriamente. A tabela abaixo mostra a variável (horas de sono) antes do

tratamento (sem droga) e depois do tratamento (com droga). Com nível de significância de 5%,

verifique se há evidência suficiente para concluir que o medicamento natural faz efeito?

Tabela 7 – Horas de sono antes e depois do tratamento produzido de certa erva

Pacientes 1 2 3 4 5 6 7 8 9 10

Antes 3,4 4,5 4,2 3,7 5,1 2,9 4,4 5,5 5,8 4,5

Depois 5,0 4,8 6,2 4,8 5,0 4,6 5,0 6,0 6,0 7,5

4) Os dados na tabela abaixo referem-se os pesos, em gramas, das refeições de dez homens e

dez mulheres tomados casualmente em um restaurante “a Kilo” .

a) Verificar os pressupostos antes de aplicar o teste t para duas amostras independentes.

b)Testar a hipótese dos pesos das refeições de homens e mulheres serem diferentes, ao nível de

5% significância.

c) Construir o boxplot para visualizar o comportamento das duas variáveis.

d) Construa o Intervalo de confiança para a diferença das médias.

Tabela 8 - Peso (gramas) das refeições de homens e mulheres indivíduos 1 2 3 4 5 6 7 8 9 10

Homens 680 750 620 540 580 660 450 560 860 660

Mulheres 450 560 400 480 320 520 680 520 300 420

5) Tesche e colaboradores (1984) informaram que o diâmetro de ovos de jacaré-do-papo

(Caiman Latirostris) obtidos em 2 locais diferentes: no zoológico de Sapucaia do Sul, RS, e no

jardim zoológico do Rio de Janeiro, RJ. Responda as questões e adote o nível de significância

de 5% para resolver os itens abaixo.

Tabela 9 - Medidas do diâmetro de ovos (mm) de jacaré-do-papo (Caiman Latirostris)

Zoológico 1 - RS

18 19.4 20 17.5 16 16 18 18 18.2 20

22 23.1 25 19 22 21 22.4 24 21 23.5

Zoológico 2 - RJ

15 16.5 18 20.4 22 17 18.6 22 19 21

18 15.4 20 21.2 19 22 20 18 16 15.8

a) Verifique os pressupostos para o teste paramétrico, utilizando nível de significância 5%.

b) Os dados tem evidência suficiente para indicar uma diferença entre os diâmetros médios de

ovos (mm) de jacaré papo (Caiman Latirostris) devido à localização dos zoológicos?

c) Determine o p-valor.

d) Neste contexto, como você elaboraria as hipóteses para o caso unilateral? O que mudaria na

realização do teste caso a hipótese fosse unilateral? Apresente as mudanças neste teste.

Page 14: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

13

6) Testar a hipótese se nos dez ensaios com cada catalizador verificou que os catalizadores A e

B têm efeitos diferentes no rendimento de certa reação química.

a) Verifique se os pressupostos para realizar o teste paramétrico.

b) Confirme se os efeitos diferem, nível de significância 5% e faça a abordagem clássica e

apresente o p-valor.

Tabela 10- Rendimento ( % ) de uma reação química em função do catalizador utilizado.

Cat A 45 51 50 62 43 42 53 50 48 55

Cat B 45 35 43 59 48 45 41 43 49 39

AULA 17 – Teste de Hipóteses para mais de duas amostras

Análise de Variância: Comparações de várias Médias

A análise de variância é uma técnica que pode ser realizada para determinar se a média

de duas ou mais populações são iguais.

O teste se baseia numa amostra extraída de cada população e testa as seguintes hipóteses

ao nível de significância .

H0: As médias das populações são iguais ( 2

H1: As médias das populações são diferentes.

Pressupostos do modelo matemático: yij = m + ti + eij

a) Os erros devem ser independentes

b) Os erros devem ter distribuição normal

c) As amostras devem ter variâncias iguais.

Princípios básicos da experimentação - a pesquisa científica está constantemente se utilizando

de experimentos para provar suas hipóteses. É claro que os experimentos variam de uma

pesquisa para outra, porém, todos eles são regidos por alguns princípios básicos, necessários

para que as conclusões que venham a ser obtidas se tornem válidas.

Princípio da repetição - Ao compararmos, por exemplo, dois herbicidas (A e B), aplicados em

duas parcelas perfeitamente iguais, apenas o fato do herbicida A ter apresentado maior controle

que o B não é suficientemente para que possamos concluir que o mesmo é mais eficiente, pois

esse seu maior controle poderá ter ocorrido por simples acaso ou ter sido influenciado por

fatores estranhos. Porém, se os dois herbicidas forem aplicados a várias parcelas e, ainda assim,

verificarmos que o herbicida, A apresenta, em média, maior controle, existe já um indício de

que ele seja mais eficiente.

Esquematicamente:

A

B

Experimento

básico Repetições

Princípio da casualização - Mesmo reproduzindo o experimento básico, poderá ocorrer

que o herbicida A apresentou maior controle por ter sido favorecido por qualquer fator, como

por exemplo, ter todas as suas parcelas agrupadas numa faixa de menor infestação.

Princípios da

repetição

A A A A A A

B B B B B B

Page 15: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

14

Para evitar que um dos herbicidas seja sistematicamente favorecido por qualquer fator

externo, procedemos à casualização dos herbicidas nas parcelas, isto é, eles são designados às

unidades experimentais de forma totalmente casual.

O princípio da casualização tem por finalidade propiciar a todos os tratamentos a

mesma probabilidade de serem sorteados a qualquer das unidades experimentais.

Esquematicamente:

A

B

Experimento

básico Repetições + casualização

Ao fazer um experimento considerando apenas esses dois princípios, temos o

delineamento inteiramente casualizado ou com um fator. As parcelas que receberão cada um

dos tratamentos são determinadas de forma inteiramente casual, através de um sorteio, ou

usando a tabela de números aleatórios para que cada unidade experimental tenha a mesma

probabilidade de receber qualquer um dos tratamentos estudados, sem qualquer restrição no

critério de casualização. ver Figura 1:

Consideremos que estamos planejando um experimento de competição de inseticidas para o

controle da mosca branca do feijoeiro, com 4 repetições e 1 testemunha, denotados por A, B, C,

D, e E, com 5 repetições, no delineamento inteiramente casualizado.

A1 A2 A3 A4 A5 B1 B2 B3 B4 B5 C1 C2 C3 C4 C5 D1 D2 D3 D4 D5 E2 E3 E4 E5

1 A3 2 C1 3 A4 4 E3 5 C3

6 B4 7 E4 8 D2 9 A5 10 C5

11 B2 12 D5 13 D4 14 E5 15 A1

16 B3 17 C4 18 E2 19 D1 20 B5

21 E1 22 C2 23 D3 24 B2 25 A2

Quadro 1 - Disposição do experimento inteiramente casualizado.

Este experimento é frequentemente utilizado em ensaios de laboratório e em casas de

vegetação, nos quais as condições experimentais podem ser perfeitamente controladas e, nele

temos apenas duas causas ou fontes de variação, que são Tratamentos (causa conhecida ou fator

controlado) e Resíduo ou Erro (causa desconhecida, de natureza aleatória, que reflete o efeito

dos fatores não controlados).

Considerando o exemplo de competição de inseticidas para o controle da mosca branca

no feijoeiro, o esquema de análise de variância do experimento será:

Causas da variação (C.V.) G.L.

Tratamentos (Trat.) I – 1 = 5 – 1 = 4

Resíduo (Res.) I(J – 1) = 5(5 – 1) = 20

Total (To) I.J – 1 = 5.5 – 1 = 24

As observações de cada grupo ou tratamento são tabeladas para facilitar a análise

segundo as hipóteses lançadas.

Princípios da

repetição e casualização

B A A B A B

A B A B B A

Page 16: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

15

Tratamentos ( I )

Repetições (J) 1 2 ... I Totais

1 X11 X21 ... XI1

2 X12 X22 ... XI2

... ... ... ...

J X1J X2J ... XIJ

Totais T1 T2 TI G

Médias 1

m̂ 2

m̂ ... I

m̂ m̂

Onde:

J

j

JXT1

11 ;

J

j

JXT1

22 ; ......

J

j

IJI XT1

;

I

i ij

iji XTG1

; média global: JxI

Gm ˆ

Os procedimentos para realizarem o teste F - ANOVA

i) Hipóteses: H0: As médias das populações são iguais ( 2

H1: As médias das populações diferem entre si.

ii) Ftab[(I – 1), I(J – 1)]

iii) Quadro de Análise de Variância e Teste Fcalc.

Fonte de

Variação(FV)

Graus de

Liberdade(GL)

Somas de

Quadrados(SQ)

Quadrados

Médios(QM)

Fcalc

Tratamento(T) I - 1 SQT QMT QMT/QMR

Resíduo (R) I(J – 1) SQR QMR

Total (To) IJ - 1 SQTo

Onde,

ij

ijJI

GCdoCXSQTo

22 sen; ;

CJ

T

SQT

I

i

i

1

2

; SQR = SQTo – SQT

1

I

SQTQMT ;

)1(

JI

SQRQMR

QMR

QMTFcal ; )]1();1[( JIIFtab

Regra de decisão: Se Fcal > Ftab Rejeita-se H0

iv) Conclusão: As médias das populações são diferentes. Com a análise de variância descobre-se

que existe diferença entre as médias. Para comparar estas diferenças de médias, pode-se utilizar

o teste de Tukey.

Exemplo 17.1 - O estudo avaliou o efeito terapêutico de três métodos de administração (Grupo

I, II e III) de uma droga flebotrópica. O efeito desejado é a diminuição de edema do membro

inferior. Os dados experimentais de avaliação, medindo a diminuição da circunferência do

1-

Page 17: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

16

tornozelo do membro mais afetado. O esquema terapêutico selecionado será o que apresentar a

maior diminuição da circunferência do tornozelo.

GI: 2 comprimidos de placebo pela manhã, e dois comprimidos de Toflex 500mg à noite;

GII: 2 comprimidos de Toflex 500mg pela manhã, e um comprimido de placebo à noite;

GIII: 1 comprimidos de Toflex 500mg pela manhã, e dois comprimidos de placebo à noite;

a) Verifique se há diferença significativa entre os resultados obtidos na forma em que foi

administrado ao paciente.

b) Caso identifique diferença entre os tratamentos aplique o teste Tukey.

c) Com esta análise poderíamos indicar um tratamento mais eficaz? Qual? Ou quais?

Justifique sua resposta. Discuta qual melhor conduta medicamentosa.

d) Apresente o coeficiente de variação do experimento.

Tabela 11 - Diminuição da circunferência do tornozelo (cm), após 60 dias de tratamento

Tratamentos

Repetições GI GII GIII

1 7.2 7.8 6.3

2 9.3 8.2 6.0

3 8.7 7.1 5.3

4 8.9 8.6 5.1

5 7.6 8.7 6.2

6 7.2 8.2 5.2

7 8.8 7.1 7.2

8 8.0 7.8 6.8

Soma 65,7 63,5 48,1

Média 8,21 7,94 6.01

Caso ocorra rejeição de Ho, prossiga com o teste Tukey para identificar as diferenças entre

médias.

TESTE DE COMPARÇÕES MÚLTIPLAS

Teste de Tukey - Consiste em comparar as médias duas a duas através da sua diferença em

valor absoluto, com a diferença mínima significativa que é dada por:

J

QMRq .

onde q = amplitude total estudentizada (tabela), tomada em tabelas ao nível de 5% e 1%,

considerando-se número de tratamentos e graus de liberdade do resíduo.

O Coeficiente de Variação (C.V.) é dado pela fórmula: %100ˆ

.. xm

QMRVC

Se C.V. ≤ 15% Experimento ótimo e a média representativa;

Se 15% < C.V. 30% Experimento bom e a média pouco representativa;

Se C.V. > 30% Experimento ruim e a média não representativa.

Page 18: Curso de Biomedicina - Universidade Estadual de Londrina · Quando amostra for grande, a distribuição da média segue a ... 13.2- Distribuição amostral da proporção ... fórmula

17

ATIVIDADE 17 – Teste de Hipóteses para mais de duas amostras

1) Suponha que um médico pesquisador deseja determinar se há diferença na média de tempo

em que três tipos de analgésicos levam para aliviar a dor de cabeça. Várias pessoas que sofrem

de dor de cabeça são selecionadas aleatoriamente e tomam um dos três medicamentos. Cada

uma diz o tempo (em minutos) que o medicamento começou a fazer efeito. Você pode concluir

que as médias de tempo são diferentes.

Considere que cada população de tempo de alívio seja normalmente distribuída e as três

com variâncias populacionais iguais. Caso encontre diferença significativa entre as médias,

aplique o teste tukey e conclua.

Tabela 12 – Tempo do efeito do analgésico para dor de cabeça

Tratamentos

Repetições Medicamento I Medicamento II Medicamento III

1 12 16 14

2 15 14 17

3 17 21 20

4 12 15 15

5 16 19 18

Soma 72 85 84

Média 14.4 17.0 16.8

2) Em uma experiência para comparar a eficiência de diversas técnicas no tratamento da dor

produzida por uma intervenção cirúrgica superficial, 28 pacientes foram agrupados, ao acaso em

quatro grupos de sete, que foram tratados: um grupo com placebo e, os demais, com dois tipos

de analgésicos (A e B) e acupuntura.

Tabela 13 - Técnicas utilizadas e o tempo (em minutos) para alivío da dor

Tratamentos

Repetições placebo AnalgésicoA Analgésico B acunputura

1 35 85 100 86

2 22 80 107 125

3 5 46 142 103

4 14 61 88 99

5 38 99 63 154

6 42 114 94 75

7 65 110 70 160

Soma 221 595 664 802

Média 35.571 85.0 94.857 114.571

a)Verifique a eficiência destas técnicas por meio da análise de variância.

b)Com esta análise poderíamos indicar um tratamento mais eficaz? Qual? Ou quais?

c)Justifique sua resposta com uma conclusão prática.