BIOESTATISTICA

Teste para a mdia de uma N ( ), desconhecida

1. TESTES PARAMTRICOS

I. COMPARAES DE PARMETROS DE DUAS POPULAESComparao das varincias de duas populaes normais

Suponha duas amostras aleatrias independentes de tamanhos n1 e n2 ou seja, e , respectivamente, de uma populao com distribuio e de uma populao com distribuio .

Hipteses:

H0 : = ( ou / = 1 )

H1 : ( ou / 1 )

Estatstica do teste:

Sendo e as varincias, respectivamente, das amostras n1 e n2, o quociente

segue a distribuio de F (Snedecor) com n1-1 e n2-1 graus de liberdade (gl) [F(n1-1, n2-1)].

Sob a suposio de H0 ser verdadeira, isto , = , tem-se que

F

Construo da regio crtica:

Fixado , os pontos crticos sero F1 e F2 da distribuio F, tais que :

Se = 10%, pode-se, utilizando a Tabela 5, encontrar diretamente F2(5%). Para encontrar F1(95%) utiliza-se a propriedade:

Por exemplo, se n1-1 = 5 e n2 -1 = 7,

Assim, RC = { 0 < F < 0,205 ou F > 3,97 }

Entretanto, o procedimento que se usa na prtica calcular F utilizando sempre a maior varincia no numerador (>), portanto F > 1, e considerar o ponto crtico .Amostra: Colhidas amostras aleatrias n1 e n2, calcula-se e (>), ento

Concluso: Se Fobs RC, rejeita-se H0, caso contrrio, no se rejeita.Exemplo 2. Os resultados da tabela abaixo so relativos s propriedades soporferas da hiosciamina (droga A) e hioscina (droga B). Dois grupos de 10 pacientes so aleatoriamente selecionados e cada grupo toma uma das drogas. Os resultados em horas extras de sono so:

A1,9 0,8 1,1 0,1 -0,1 4,4 5,5 1,6 4,6 3,4

B0,7 -1,6 -0,2 -1,2 -0,1 3,4 3,7 0,8 0,0 2,0

Testar H0 : = vs. H1: , ao nvel de significncia de 10%.

Soluo:

H0: = H1:

nA = nB = 10 = 10%

Fc (0,05; 9, 9) = 3,18 RC = F > 3,18

Como Fobs RC, no se rejeita H0, ou seja, as varincias so estatisticamente iguais ao nvel de 10%.A anlise da hiptese da igualdade de varincias crucial para o uso do teste t, na comparao de duas mdias, apresentado a seguir.2. COMPARAO DE DUAS MDIAS DE POPULAES NORMAIS: AMOSTRAS INDEPENDENTESCom o objetivo de se comparar duas populaes ou, sinonimamente, dois tratamentos, examinaremos a situao na qual os dados esto na forma de realizaes de amostras aleatrias de tamanhos n1 e n2, selecionadas, respectivamente, das populaes 1 e 2. Os dados so as medidas das respostas associadas com o seguinte delineamento experimental. Uma coleo de n1 + n2 elementos so aleatoriamente divididos em 2 grupos de tamanhos n1 e n2, onde cada membro do primeiro grupo recebe o tratamento 1 e do segundo, o tratamento 2. Especificamente, estaremos interessados em fazer inferncia sobre o parmetro:

(mdia da populao 1) (mdia da populao 2) = 1 2Formalmente, suponha uma amostra selecionada aleatoriamente de uma populao N(1,) e uma amostra selecionada de uma populao N(2,), n1 e n2 independentes. Para cada uma delas, teremos os respectivos estimadores da mdia e varincia: e

EMBED Microsoft Equation 3.0 e e . Hiptese: H0 : 1 2 ou 1 - 2 0

Definindo a varivel (), note-se que:

E () = E () E () = 1 2 e

Como as variveis so independentes, , ento

Portanto,

e, consequentemente, (1)tem distribuio N(0, 1).1 caso: varincias e conhecidas

Para testar a hiptese H0 usa-se a estatstica (1). Como H0 estabelece que

1 2 = 0,

Hipteses alternativas: Regies crticas (nvel ):H1 : 1 2 ou 1 - 2 0 Z > zc (/2) ou Z < -zc (/2)H1 : 1 > 2 ou 1 - 2 > 0 Z > zc ()H1 : 1 < 2 ou 1 - 2 < 0 Z < -zc ()2 caso: varincias desconhecidas e iguais

Preliminarmente, testa-se se as varincias das duas populaes so iguais. Caso a hiptese no seja rejeitada, isto , que = = , a estatstica (1) transforma-se em:

Substituindo por um estimador, teremos uma expresso muito semelhante t de Student. Uma estatstica para a mdia ponderada:

,

que, como so dois estimadores no viciados de , tambm um estimador no viciado de .

O desvio padro da diferena estimado por:

de modo que pode-se construir a estatstica

que tem distribuio t de Student, com n1 + n2 2 graus de liberdade.

Sob H0 verdadeira (12 0),

Hipteses alternativas: Regies crticas (nvel ): H1: 1 2 H1: 1 > 2

H1: 1 < 2

Nota: quando ambas as amostras (n1 e n2) so pequenas (n < 30), o teste pode ser usado supondo, alm da normalidade das distribuies das populaes originais, que suas varincias, , so iguais.

Exemplo 3. Usando os dados do exemplo 2, testar se h evidncia de que as duas drogas so igualmente eficientes (H0: A B vs. H1: A B), ao nvel de 5%.

Soluo:

H0: A B H1: A B

tc(18; 0,05) = 1,734 RC =t > 1,734

Como tobs RC, rejeita-se H0, ou seja, h evidncia de que a droga A mais eficiente do que a B como soporfero.3 caso: varincias desconhecidas e desiguais (Teste de Smith Satterthwaite)

Quando a hiptese de igualdade de varincias for rejeitada, deve-se substituir e em (1) pelos seus respectivos estimadores, e , obtendo a estatstica:

que, sob a veracidade de H0 (1 - 2 = 0), aproxima-se de uma distribuio t de Student, com nmero de graus de liberdade dado aproximadamente por:

Como o nmero de graus de liberdade assim calculado, geralmente, no inteiro, recomenda-se aproxim-lo para o inteiro imediatamente anterior a este.

Se n1 e n2 so ambos grandes ( n 30 ), o teste pode ser baseado na estatstica

sob H0,

pois (1) permanece vlido se e so substitudos por seus respectivos estimadores amostrais, e .

A escolha da regio de rejeio, mono ou bilateral, depende do tipo da hiptese alternativa.Nota: no caso da inferncia originada de amostras grandes, no necessrio assumir que as distribuies das populaes originais so normais, porque o teorema limite central garante que as mdias amostrais so aproximadamente distribudas como e , respectivamente. Alm disso, a suposio de varincias populacionais iguais , que usada para amostras pequenas, evitada nessa situao. Exemplo 4. Querendo comparar o ganho em peso de duas raas de bovinos, A e B, num mesmo regime alimentar, tomaram-se n = 35 animais da raa A e m = 40 animais da raa B. Os resultados obtidos foram:

Raa

s2

A70,581,6

B84,3200,5

Testar ao nvel de 5% , se o ganho em peso mdio das duas raas o mesmo, ou seja H0: A B vs. H1: A B.

Soluo:

H0: A B H1: A BnA = 35 nB = 40 = 5%

zc = 1,96

RC = z < -1,96 ou z >1,96

Como zobs RC, rejeita-se H0, ou seja, h evidncia que as duas raas tm ganhos em peso mdios diferentes , ao nvel de 5%.3. COMPARAO EMPARELHADA: AMOSTRAS RELACIONADAS (OU DEPENDENTES)Quando as mdias de duas populaes so comparadas, pode ocorrer uma diferena significativa entre elas por causa de fatores externos no controlveis, mesmo no havendo diferenas nos tratamentos avaliados. Reciprocamente, fatores externos podem mascarar ou ocultar uma diferena real. Uma maneira de contornar estes problemas coletar as observaes em pares, de modo que os dois elementos de cada par sejam homogneos em todos os sentidos (por exemplo, quanto ao sexo, a idade, semelhana gentica e de ambiente, etc.), exceto no que diz respeito aos tratamentos que se quer comparar. Assim, se houver uma diferena na resposta entre os dois grupos, esta pode ser atribuda a uma diferena nos tratamentos.

Tal planejamento chamado comparao emparelhada e consiste em formarem pares e sortear os tratamentos dentro de cada par.

Como na formulao geral de comparao de duas mdias, tm-se duas amostras e , s que agora as observaes esto emparelhadas, isto , a amostra formada pelos pares .

Se definirmos a varivel

Di = Xi Yi, i = 1, 2 ,... , n

teremos um conjunto de n observaes, cada uma das quais a diferena entre duas observaes originais.

Os pares de observaes (Xi Yi) so independentes, mas Xi e Yi dentro do i-simo par, so, geralmente, dependentes. Assim, se o emparelhamento das unidades experimentais for eficiente, espera-se Xi e Yi ser, ao mesmo tempo, pequenos ou grandes, ou seja, ter uma correlao positiva alta. Um modo de se detectar isto verificar se X e Y tem uma covarincia positiva. Como

a varincia da diferena ser menor neste caso do que seria no caso de variveis aleatrias independentes, onde Cov(X, Y) = 0.

Esse procedimento tambm usado quando as observaes das duas amostras so feitas no mesmo indivduo, por exemplo, medindo uma caracterstica do indivduo antes e depois dele ser submetido a um tratamento.

A estrutura das observaes em uma comparao emparelhada dada a seguir, onde X e Y denotam as respostas aos tratamentos 1 e 2, respectivamente. Tratamento

Par 1 2 Diferena (Di)1 X1 Y1 D1 X1 Y12 X2 Y2 D2 X2 Y2 n Xn Yn Dn Xn YnDefinida as diferenas Di = Xi Yi, i = 1, 2 ,... , n, razovel assumir que elas constituem uma amostra aleatria de uma populao com mdia = e varincia , onde representa a diferena mdia real dos efeitos de tratamento dentro de pares. De outro modo,E(Di) E(Xi Yi) eVar(Di) Var(Xi Yi) , i = 1, 2 ,... , n Se = 0, ento os dois tratamentos podem ser considerados equivalentes. Uma diferena positiva (D > 0) significa que o tratamento 1 tem uma resposta mdia maior do que a do tratamento 2.

A hiptese a ser testada : H0: 1 = 2 ou = 0.

Hipteses alternativas:

Supondo Di : N (,),

tem distribuio N (, /n )

Definindo , a estatstica

t tem distribuio t de Student, com n 1 graus de liberdade.

Como H0 estabelece que = 0, a frmula de t apresentada como

que a estatstica a ser usada no teste.

Quando n grande ( 30), a inferncia pode ser baseada na distribuio N(0, 1) ou equivalentemente na distribuio t com infinitos graus de liberdade (gl).

Note que h n pares de observaes e apenas n 1 gl. Se as observaes no forem emparelhadas, mas tratadas como dois grupos independentes, teremos (n 1) + (n 1) = 2(n 1) gl. A diminuio do nmero de gl resulta em um valor maior para , o que torna necessrio um maior valor para atingir o limite de significncia. Deste modo, se a formao de pares no for justificvel, o teste ser menos sensvel, ou seja, preferindo pares, corre-se o risco de alguma perda de poder, a qual resulta em um aumento na probabilidade de aceitar a hiptese nula quando falsa (). O aumento insignificante, todavia, se o nmero de pares grande, digamos, maior do que 10. O nvel de significncia () no afetado.

Com um emparelhamento eficaz, a reduo na varincia da diferena (X Y), geralmente, mais do que compensa a perda de graus de liberdade. Exemplo 5. Cinco operadores de certo tipo de equipamento laboratorial so treinados em equipamentos de duas marcas diferentes, A e B. Mediu-se o tempo que cada um deles gastou na realizao de uma mesma tarefa, e os resultados foram:

Operador

Marca12345

A8072657885

B7570607278

Ao nvel de 1%, poderamos afirmar que a tarefa realizada no equipamento A demora mais do que no B (A B)?

Soluo:

H0: A = B H1: A > BDi = 5, 2, 5, 6, 7 n = 5 = 1%

tc( 0,01; 4) = 3,747 RC = t > 3,74Como tobs RC, rejeita-se H0, ou seja, a tarefa realizada no equipamento A demora mais do que no B ao nvel de 1%.

4. COMPARAO DE DUAS PROPORES BINOMIAISVejamos agora como comparar as propores de incidncia de uma particular caracterstica em duas populaes. A estrutura da inferncia :Parmetro: p1 - p2 (proporo na populao 1 - proporo na populao 2) Propores amostrais: , onde X e Y correspondem aos nmeros de elementos que possuem a caracterstica nas amostras n1 e n2, selecionadas aleatoriamente, respectivamente, das populaes 1 e 2; n1 e n2 independentes.

Consideremos a estatstica , como ponto de partida, para fazer a inferncia sobre p1 p2. Como a mdia e a varincia das propores amostrais so:

e dado que so independentes, a mdia e a varincia da diferena so:

e

Logo,

O primeiro resultado [] mostra que um estimador no viciado de . Uma estimativa do desvio padro (DP) pode ser obtida substituindo p1 e p2 dentro da raiz por, respectivamente, . Alm disso, para n1 e n2 grandes, a estatstica tem distribuio aproximadamente normal, de modo que aproximadamente N(0, 1).

Para testar H0: p1 p2 ou p1 p2 = 0 denota-se por p a proporo populacional conjunta no especificada.

Sob H0 verdadeira, a estatstica aproximadamente distribuda como normal, com

e ,

O parmetro p estimado envolvendo as informaes das duas amostras, ou seja,

(estimativa conjunta)

Assim, considerando n1 e n2 grandes, a estatstica

aproximadamente N(0, 1).

Dependendo de H1, a regio crtica mono ou bi-caudal (regra de deciso) pode ser construda em termos da aproximao normal (Z).

Exemplo 6. Em um estudo sobre a incidncia de abortos naturais entre mdicas anestesistas (1) e de outras especialidades (2), obtiveram-se os seguintes resultados:

12Totais

Gestaes normais235275

Abortos naturais140620

Totais375895

Denotando as propores populacionais de abortos naturais em (1) e (2) por p1 e p2, respectivamente, testar Ho : p1 = p2 vs. H1 : p1 p2, ao nvel de 1%.

Soluo:

H0: p1 = p2 H1: p1 p2

= 1% zc = 2,57 RC = z >2,57 ou z p2, o teste 2 no apropriado.

2. TESTES NO - PARAMTRICOS

As tcnicas da Estatstica No-Paramtrica so, particularmente, adaptveis aos dados das cincias do comportamento. A aplicao dessas tcnicas no exige suposies quanto distribuio da varivel populacional. Os testes no-paramtricos so extremamente interessantes para anlises de dados qualitativos. Na Estatstica Paramtrica, para aplicao de teste como o t de Student, a varivel em anlise precisa ser numrica. Como o prprio nome sugere, a Estatstica No-Paramtrica independe dos parmetros populacionais e de suas respectivas estimativas.

Assim, se a varivel populacional analisada no segue uma distribuio normal e/ou as amostras forem pequenas, pode-se aplicar um teste No-Paramtrico.

Vantagens dos Mtodos No-Paramtricos

1. Os mtodos No-Paramtricos podem ser aplicados a uma ampla diversidade de situaes, porque no exigem populaes distribudas normalmente.

2. Ao contrrio dos mtodos Paramtricos, os mtodos No-Paramtricos podem freqentemente ser aplicados a dados no-numricos.

3. Os mtodos No-Paramtricos em geral envolvem clculos mais simples do que seus correspondentes Paramtricos, sendo, assim, mais fceis de entender.

Desvantagens dos Mtodos No-Paramtricos

1. Os mtodos No-Paramtricos tendem a perder informao, porque os dados numricos so freqentemente reduzidos a uma forma qualitativa.

2. Os testes No-Paramtricos no so to eficientes quanto os testes Paramtricos; assim, com um teste No-Paramtrico, em geral necessitamos de uma amostra maior ou maiores diferenas para ento rejeitarmos uma hiptese nula.

Testes No-Paramtricos para Amostras Independentes

2.1 TESTE DA MEDIANA O teste da mediana verifica a probabilidade de grupos independentes proverem de populaes com a mesma mediana. O teste da mediana particularmente til quando existem dados censurados.

Dados Censurados so aqueles que ficam alm dos limites estabelecidos para coleta, embora no se saiba exatamente quais so esses valores. Exs.:

- experimentos com animais onde alguma condio especfica demora a aparecer ou desaparecer. Se nada acontece a alguns animais at o final do experimento esses dados so censurados.

- tempo de sobrevivncia

- limite mnimo em aparelhos de medio

Para esse teste, a varivel em anlise tambm deve ser medida em escala ordinal ou numrica.

Procedimento

a) Formular as hipteses: a hiptese em teste a de que os grupos provm de populaes com a mesma mediana;

b) Juntar os k grupos em comparao em um s conjunto. Calcular a mediana de todos os dados;

c) Contar, em cada grupo, o nmero de dados que esto acima e o nmero de dados que esto abaixo da mediana geral. Arranjar as contagens em uma tabela 2 x k;

d) Aplique o teste de (2 para testar essa hiptese.

Ex. (Bioestat, pg. 108): Aps alta hospitalar, 12 indivduos de uma casa de sade (A) e 10 pessoas de outra entidade nosocomial (B) foram avaliados quanto aos cuidados de enfermagem dispensados a cada um nas respectivas instituies. O escore de auto-avaliao de cada paciente, numa escala de 0 a 100, est mostrado abaixo. Teste se h diferena na avaliao dos pacientes atendidos no Hospital A em relao queles atendidos no Hospital B. Use ( = 0,05.

Hospital A 80 94 92 707883908887908991

Hospital B 63 57 71 82706185667266

2.1 TESTE DE MANN-WHITNEY

usado para testar se duas amostras independentes foram retiradas de populaes com mdias iguais. Esse teste , portanto, uma alternativa para o teste t para amostras independentes quando a amostra for pequena e/ou as pressuposies, exigidas pelo teste t, estiverem seriamente comprometidas. A nica exigncia do teste de Mann-Whitney a de que as observaes sejam medidas em escala ordinal ou numrica.

Procedimentoa) Coloque os dados dos dois grupos em ordem crescente. s observaes empatadas atribuir a mdia dos postos correspondentes;

b) Considerar n1 = nmero de casos do grupo 1;

n2 = nmero de casos do grupo 2;

c) Calcular R1 = soma dos postos do grupo 1;

R2 = soma dos postos do grupo 2;

d) Calcular a estatstica de Mann-Whitney (U);

e) Escolher o menor valor de U para ser utilizado no clculo de z.

Exemplo (Bioestat, pg. 107): Foram medidos nveis de fosfatase sangnea em 12 pacientes acometidos de malria por P. vivax e em 10 parasitados pelo P. falciparum. Verifique, ao nvel de 5% de significncia, se os nveis de fosfatase diferem significativamente em relao espcie encontrada nos doentes.

P vivax 3,70 2,80 2,90 2,30 2,40 3,00 2,20 3,40 2,80 3,20 1,90 3,20

P. falciparum3,60 2,90 3,00 2,40 2,00 2,50 2,10 2,90 2,70 3,10

2.3 TESTE KRUSKAL-WALLISTrata-se de teste extremamente til para decidir se k amostras (k > 2) independentes provm de populaes com mdias iguais. Esse teste s deve ser aplicado se a amostra for pequena e/ou as pressuposies, exigidas para proceder Anlise de Varincia, estiverem seriamente comprometidas. Como o teste de Mann-Whitney, esse teste tambm condiciona que a varivel em anlise seja medida em escala ordinal ou numrica.

Procedimento

a) Dispor, em ordem crescente, as observaes de todos os k grupos, atribuindo-lhes postos de 1 a n. Caso haja empates, atribuir o posto mdio;

b) Determinar o valor da soma dos postos para cada um dos k grupos: Ri, i = 1, 2, ..., k;

c) Escolher uma varivel Qui-quadrado com ( = k 1 (cada amostra deve conter pelo menos 5 observaes);

d) Realizar o teste:

Obs.: Esse teste exige varincias iguais, por isso no deve ser usado se as diferentes amostras tm varincias muito diferentes.

O teste de Kruskal-Wallis um teste unilateral direita.

Ex.; Imagine que para comparar o tempo de latncia de trs anestsicos usados por cirurgies dentistas tenha sido feito um ensaio clnico casualizado com 15 pacientes. Os dados esto apresentados na tabela abaixo. Seja ( = 0,05.

Tempo de latncia, em segundos, de trs anestsicos locais usados em clnicas odontolgicas

Anestsico AAnestsico BAnestsico C

62

138

78

96

66108

216

174

234

27072

132

156

204

84

Obs.: Quando ocorrem muitos empates, no se deve utilizar a estatstica H. preciso aplicar uma correo na frmula. Os softwares fazem essa correo automaticamente. Assim, se mais de um tero dos dados est envolvido em empates, use um software de estatstica.

/2

/2

1-

_212181080.unknown

_218045104.unknown

_221398120.unknown

_228645784.unknown

_230594728.unknown

_1202729686.unknown

_1202729694.unknown

_1202729706.unknown

_1202729929.unknown

_1202729702.unknown

_1202729690.unknown

_231883792.unknown

_231908104.unknown

_230740232.unknown

_230853344.unknown

_229202888.unknown

_229229688.unknown

_229193720.unknown

_224473472.unknown

_224646728.unknown

_225278784.unknown

_226937568.unknown

_224667576.unknown

_224618896.unknown

_224546856.unknown

_221791184.unknown

_224451016.unknown

_224471536.unknown

_224453976.unknown

_222719608.unknown

_221400592.unknown

_221636152.unknown

_218409400.unknown

_220372384.unknown

_220401984.unknown

_220513432.unknown

_220683248.unknown

_220402736.unknown

_220396168.unknown

_219890184.unknown

_220132240.unknown

_220034440.unknown

_218736936.unknown

_219815152.unknown

_218722184.unknown

_218224872.unknown

_218310064.unknown

_218387120.unknown

_218107600.unknown

_218198160.unknown

_216437728.unknown

_217325864.unknown

_217814112.unknown

_217873072.unknown

_217590264.unknown

_217796696.unknown

_217580664.unknown

_217213168.unknown

_217273232.unknown

_216741824.unknown

_216713312.unknown

_213732568.unknown

_215682840.unknown

_216265432.unknown

_216277984.unknown

_215781496.unknown

_215815616.unknown

_215628272.unknown

_215670616.unknown

_215599008.unknown

_213477440.unknown

_213515960.unknown

_213683424.unknown

_212950272.unknown

_213365072.unknown

_212772680.unknown

_202707272.unknown

_207825664.unknown

_209310160.unknown

_210934544.unknown

_211395984.unknown

_211504944.unknown

_211372736.unknown

_211034544.unknown

_210028936.unknown

_210254536.unknown

_209329832.unknown

_207882560.unknown

_208357024.unknown

_208381744.unknown

_208399808.unknown

_208093160.unknown

_207831720.unknown

_205490152.unknown

_205678024.unknown

_205842320.unknown

_206460928.unknown

_205799384.unknown

_205602736.unknown

_205603640.unknown

_205586120.unknown

_205331096.unknown

_205467760.unknown

_205466864.unknown

_205287520.unknown

_202781216.unknown

_196509592.unknown

_197709216.unknown

_198410632.unknown

_199899112.unknown

_199993192.unknown

_202700328.unknown

_199985456.unknown

_199640280.unknown

_198161216.unknown

_198189232.unknown

_198066336.unknown

_197763400.unknown

_197163304.unknown

_197333512.unknown

_197531832.unknown

_197567920.unknown

_197319544.unknown

_196886648.unknown

_197127776.unknown

_191824040.unknown

_194595984.unknown

_195448408.unknown

_196360680.unknown

_196503464.unknown

_196363056.unknown

_195509280.unknown

_195545360.unknown

_195494368.unknown

_195278912.unknown

_195292408.unknown

_195322136.unknown

_194923744.unknown

_194935952.unknown

_194822808.unknown

_192723024.unknown

_193969352.unknown

_193971848.unknown

_192805808.unknown

_192581280.unknown

_184453344.unknown

_190817608.unknown

_191330656.unknown

_188954680.unknown

_190231848.unknown

_188979144.unknown

_188914152.unknown

_184442288.unknown

_184442720.unknown

_184289712.unknown

_184438856.unknown

_164057944.unknown

Documents

BIOESTATISTICA