20
LEITURA CRíTICA DE ARTIGOS CIENTíFICOS | 61 Inferência estatística pode ser definida como um conjunto de procedimentos que nos permite tirar conclusões acerca de populações, a partir do estudo de amostras coletadas desta população. No capítulo 3 aprendemos a quantificar características de uma população ou grupo de dados, fazer estimativas e, principalmente, saber a precisão destas estimativas. Os testes de hipóteses, que fazem parte da inferência estatística, incluem um amplo conjunto de procedimentos, mas no que diz respeito à oncologia, o mais importante são os testes de significância estatística, por fornecer indicações sobre a extensão da diferença entre os valores médios de 2 ou mais agrupamentos de dados e qual a probabilidade desta diferença ser devida ao acaso. Trata-se de ferramenta amplamente usada em várias áreas do conhecimento humano nas quais os dados envolvidos estão sujeitos à variabilidade. No contexto deste Manual, estamos interessados na comparação entre dois, ou mais, grupos, como por exemplo, tratamentos, procedimentos diagnósticos, dietas, etc. Este tema deverá ser subdividido nos seguintes tópicos: 4.1) Hipóteses a serem testadas 4.2) Critério de decisão 4.3) Erros tipos I e II, nível de significância e o poder do teste 4.4) Probabilidade de significância (valor p) 4.5) Hipóteses unilaterais X bilaterais (one-sided e two-sided) 4.6) Critérios de escolha e exemplos 4.1. Hipóteses a serem testadas Uma hipótese é uma alegação a respeito de um determinado problema. Em termos estatísticos, uma hipótese é uma afirmação sobre um parâmetro de uma população, tais como média, proporção, desvio-padrão, coeficiente de correlação, etc. Uma vez definida a hipótese, esta deverá ser comprovada ou rejeitada. A ferramenta de comprovação é denominada teste de hipótese. Na comparação entre dados numéricos, sujeitos a variabilidade, extraídos de amostras de uma mesma população, uma diferença real entre eles pode não ser evidente à primeira vista. A afirmativa inversa, ou seja, de que a ausência de diferença real pode não ser evidente à primeira vista, também é verdadeira. Por convenção, podemos formular os problemas através de 2 hipóteses: a.1) Hipótese nula Quando temos um problema de comparação de dois tratamentos é usual fixar como hipótese de interesse a inexistência de diferença entre os dois tratamentos comparados. A hipótese a ser testada é chamada de hipótese nula (H 0 ). a.2) Hipótese Alternativa A hipótese nula deve ser comparada com uma hipótese alternativa, denominada H 1 . Para Capítulo 4 Testes de Hipóteses

ARTIGO_leitura Critica de Artigo-testes de Hipoteses

Embed Size (px)

DESCRIPTION

artigo cinetifico

Citation preview

LEI TURACR TI CADEARTI GOSCI ENT FI COS | 61Inferncia estatstica pode ser denida como um conjunto de procedimentos que nos permitetirar concluses acerca de populaes, a partir do estudo de amostras coletadas desta populao.No captulo 3 aprendemos a quanticar caractersticas de uma populao ou grupo de dados,fazer estimativas e, principalmente, saber a preciso destas estimativas.Os testes de hipteses, que fazem parte da inferncia estatstica, incluem um amplo conjuntodeprocedimentos,masnoquedizrespeitooncologia,omaisimportantesoostestesdesignicncia estatstica, por fornecer indicaes sobre a extenso da diferena entre os valores mdiosde 2 ou mais agrupamentos de dados e qual a probabilidade desta diferena ser devida ao acaso. Trata-se de ferramenta amplamente usada em vrias reas do conhecimento humano nasquais os dados envolvidos esto sujeitos variabilidade.No contexto deste Manual, estamos interessados na comparao entre dois, ou mais, grupos,como por exemplo, tratamentos, procedimentos diagnsticos, dietas, etc.Este tema dever ser subdividido nos seguintes tpicos:4.1) Hipteses a serem testadas4.2) Critrio de deciso4.3) Erros tipos I e II, nvel de signicncia e o poder do teste4.4) Probabilidade de signicncia (valor p)4.5) Hipteses unilaterais X bilaterais (one-sided e two-sided)4.6) Critrios de escolha e exemplos4.1. Hipteses a serem testadasUmahiptese umaalegaoarespeitodeumdeterminadoproblema.Emtermosestatsticos, uma hiptese uma armao sobre um parmetro de uma populao, tais comomdia, proporo, desvio-padro, coeciente de correlao, etc. Uma vez denida a hiptese, estadever ser comprovada ou rejeitada. A ferramenta de comprovao denominada teste de hiptese.Na comparao entre dados numricos, sujeitos a variabilidade, extrados de amostras deuma mesma populao, uma diferena real entre eles pode no ser evidente primeira vista. Aarmativa inversa, ou seja, de que a ausncia de diferena real pode no ser evidente primeiravista, tambm verdadeira.Por conveno, podemos formular os problemas atravs de 2 hipteses:a.1) Hiptese nulaQuando temos um problema de comparao de dois tratamentos usual xar como hiptesede interesse a inexistncia de diferena entre os dois tratamentos comparados. A hiptese a sertestada chamada de hiptese nula (H0).a.2) Hiptese AlternativaA hiptese nula deve ser comparada com uma hiptese alternativa, denominada H1. ParaCaptulo 4Testes de HiptesesManal deLEITURA CR"TICA_La!ot 16/10/201117:32Page 6162 | LEI TURACR TI CADEARTI GOSCI ENT FI COScada situao existem muitas hipteses alternativas adequadas. Seguindo conveno, a hiptesealternativa a inexistncia de igualdade entre os tratamentos.Exemplo:H0: pc = ptversus H1: pc ptOnde pc e pt so respectivamente as probabilidades de se observar a resposta de interesseentre os controles e entre os pacientes do grupo tratamento.importantenotarqueashiptesesdenidassereferemcomparaodoparmetropopulacional dos pacientes controles com o parmetro populacional do grupo tratamento. Noentanto, para testar estas hipteses so empregados resultados baseados em amostras. Logo, osresultados amostrais so generalizados, aps o teste de hiptese, para todo o universo estudado.Existem situaes inerentes a alguns experimentos clnicos nos quais hipteses diferentespodem ser utilizadas, como veremos no prximo captulo.4.2. Critrio de decisoAps decidirmos as hipteses a serem testadas, teremos que construir um critrio baseado noqual a hiptese H0 ser julgada. O critrio de deciso baseado na estatstica de teste. De umaforma bem genrica e intuitiva podemos dizer que a estatstica do teste mede a discrepncia entreoquefoiobservadonaamostraeoqueseriaesperadoseahiptesenulafosseverdadeira.Rejeitaremos a hiptese nula se o valor da estatstica de teste for grande, o que traduziria umadiscrepncia entre os dados. Na prtica para se decidir quo grande o valor da estatstica deteste necessria a comparao entre o valor obtido e o valor estabelecido em uma distribuiohipottica de dados. Pequenas diferenas podem ser devido ao acaso em funo da variabilidadedos dados; quanto maior a diferena menor a probabilidade do acaso para sua explicao. Nestacircunstncia uma relao de causa e efeito, ou de concomitncia, pode ser inferida.Para que clculos estatsticos possam ser realizados, vrios critrios necessitam ser denidosa priori, como veremos em seguida. 4.3 - Erros tipo I e II (nvel de signicncia e poder do teste)A deciso de rejeitar H0 quando de fato ela verdadeira chamada de erro tipo I. Para evit-lo,escolhemosumcritriodedecisoquetornaesteerropoucoprovvel.Naliteratura,aprobabilidadedecometeresseerrorecebeonomedenveldesignicnciadoteste,sendorepresentado pela letra grega a(alfa).H um segundo tipo de erro, erro tipo II, que consiste em no rejeitar a hiptese nula sendoque ela falsa. Isto implicaria na no liberao do novo tratamento, cujo efeito real no est sendopercebido. representado por b(beta).Convencionou-se que o erro mais srio seria o tipo I. O quadro 4.1 a seguir sintetiza os errospossveis associados a cada deciso tomada em um teste de hipteses.Manal deLEITURA CR"TICA_La!ot 16/10/201117:32Page 62LEI TURACR TI CADEARTI GOSCI ENT FI COS | 63A capacidade de um teste identicar diferenas que realmente existem, ou seja, de rejeitar H0quando realmente falsa, denominada poder do teste e denida como 1 - b.4.4. Probabilidade de signicncia (valor p)Existem duas opes para expressar a concluso nal de um teste de hipteses. A primeiraconsiste em comparar o valor da estatstica de teste com o ponto crtico a partir da distribuioterica, especca para o teste, para um valor pr-xado do nvel de signicncia (por exemplo 5%ou 1%), conforme descrito na gura 4.1.Concluso do testeNo rejeitar H0Rejeitar H0Situao H0verdadeiradeciso corretaerro tipo IRealH0falsaerro tipo IIdeciso correta QUADRO 4.1 - Erros possveis associados a teste de hiptesesFIGURA 4.1 - Concluso para um teste de hiptese. Na primeira curva, a estatstica de testese encontra fora da rea de rejeio, logo no rejeito Ho. Para a segunda curva, a estatsticade teste se encontra dentro da rea de rejeio, logo rejeito H0.Na segunda opo, a mais usada, o interesse quanticar a ocorrncia do que foi observadoou de resultados mais extremos, sob a hiptese da igualdade dos grupos. Assim, essa opo, baseia-se na probabilidade de ocorrncia de valores iguais ou superiores ao assumido pela estatstica deteste, sob a hiptese de que H0 seja verdadeira, conforme mostrado na gura 4.2.Manal deLEITURA CR"TICA_La!ot 16/10/201117:32Page 6364 | LEI TURACR TI CADEARTI GOSCI ENT FI COSEste nmero chamado de probabilidade de signicncia ou valor p e freqentemente indicadoapenasporp.Comoovalorpcalculadosupondo-sequeH0sejaverdadeira,duasconjecturaspodemserfeitasquandoseobtmumvalormuitopequeno.Umeventoqueextremamente raro pode ter ocorrido ou a hiptese H0no deve ser verdadeira, isto , a conjecturainicial e conservadora no parece plausvel.De um modo geral, na rea mdica, considera-se que valor p menor ou igual a 0,05 indicaque h evidncias para rejeitar H0, ou seja, h diferena signicativa entre os grupos.Nas outras situaes a diferena encontrada no signicante, do ponto de vista estatstico.Essespontosdecortesoarbitrriosenosedevedarumaimportnciaexageradaaeles.inaceitvelqueosresultadosdedoisestudosemqueosvalorespsejam0,045e0,055sejaminterpretados de forma diferente para a= 0,05. Esses valores devem levar a concluses muitoparecidas e no diametralmente opostas (signicativo e no signicativo). 4.5Hipteses bilaterais versus unilateraisAs hipteses alternativas, respectivamente para o teste de comparao de propores, demdias ou de medianas (no caso de testes no-paramtricos) so: H1: p1 p2eH1: 1 2Mas podem ser desmembradas como: H1: p1> p2ou H1: p1< p2e H1: 1> 2ou H1: 1< 2.Estashiptesesassumem,portanto,quequalquerumdosdoisgrupospodeterumaproporo ou mdia maior do que o outro. Por isto este tipo de hiptese denominada bilateral.O valor p bilateral a probabilidade de se obter em qualquer direo uma diferena igual ou maisextrema do que a observada. Existe tambm a possibilidade de se formular hipteses alternativas unilaterais (H1), como a seguir: FIGURA 4.2 - CConcluso para um teste de hiptese. Na primeira curva, ovalor p maior doque o nvel de signicncia (alfa), logo no rejeito H0. Para a segunda curva, o valor p menor do que o nvel de signicncia(alfa), logo rejeito H0.Situao(1)(2)ProporesH1: p1> p2H1: p1< p2MdiasH1: 1> 2H1: 1< 2Manal deLEITURA CR"TICA_La!ot 16/10/201117:32Page 64LEI TURACR TI CADEARTI GOSCI ENT FI COS | 65Nestes casos, as comparaes so estabelecidas em uma determinada direo. Assim, porexemplo, ao se comparar um procedimento novo com o padro, estamos avaliando se a inovaodeveserrecomendada.Portanto,aescolhadehiptesesunilateraisoubilateraisinuenciadecisivamente a interpretao dos resultados da anlise estatstica.Asduasopesdetestes(unilateraloubilateral)estodisponveisemprogramasdecomputador. Em geral, o valor p para teste bilateral o dobro do valor p correspondente hipteseunilateral (gura 4.3).FIGURA 4.3 - Opes de testes de hipteses (unilateral ou bilateral).H circunstncias em que hiptese unilateral a melhor forma de se descrever a questo deinteresse.Emestudoscomparandoumainovaodeumprocedimentopadro,ahiptesealternativa mais interessante que a inovao superior, um apelo hiptese unilateral. Um teste unilateral tambm pode ser justicado quando se pode armar que uma das direescontempladas pela hiptese bilateral completamente inconcebvel.O argumento mais forte contra o uso de hipteses unilaterais que, por maior que seja aevidncia de que um tratamento seja superior ao outro, nunca se tem certeza absoluta do querealmentepodeacontecer.Emboraexistamrazesparaesperarquenovasdrogas,ounovosprocedimentos, sejam melhores que os do grupo controle (caso contrrio o estudo no estariasendo realizado), ainda assim existe a possibilidade, mesmo que remota, de que seus resultadossejam piores. Na comparao de uma droga com o placebo, no se pode descartar a possibilidadede que a droga tenha um efeito deletrio, e portanto, no deva ser recomendada.Na escolha entre hiptese bilateral e unilateral os seguintes aspectos devem ser considerados:1. O tipo de hiptese adotado deve preceder a anlise dos dados, isto , a escolha no deveser inuenciada pelo resultado da amostra.2. O teste bilateral mais conservador que o unilateral. Na maioria dos casos, testes unilateraisso vistos como uma maneira de se exagerar a fora dos achados. Se houver qualquer dvida, deve-se optar pelo teste bilateral.3. Segundo alguns autores, a distino entre testes unilaterais e bilaterais no de funda-mental importncia na interpretao dos resultados, desde que que claro qual foi usado.4. Mesmo quando o teste unilateral pode ser justicado, pode-se encontrar resistncia editorialpara publicar tais achados.5. Teste bilateral a forma padro, usada em peridicos mdicos.Manal deLEITURA CR"TICA_La!ot 16/10/201117:32Page 6566 | LEI TURACR TI CADEARTI GOSCI ENT FI COSAlguns estatsticos e editores de jornais acreditam que o valor p unilateral nunca deva serusado.Oprimeiroargumentoauniformidadedeapresentaodosresultados,talqueumdeterminado valor p tenha um mesmo signicado em todos os artigos. Segundo, acreditam quesituaes que justicam o uso do testes unilaterais so extremamente raras. Terceiro, em estudossobre importantes questes, como a regulamentao de uma droga, o valor p apenas um fatorusadonatomadadedecises.Ocritriodequeovalorpsejamenorque0,05,emgeralinsuciente para estabelecer ecincia e pelo menos o teste bilateral mais conservador.Aceitandoestesargumentoseconsiderandoapadronizaojexistentenamaioriadosperidicos mdicos, recomendamos o uso rotineiro de hipteses bilaterais.4.6Critrios de escolha e exemplos4.6.1 Critrios de escolhaDentreosinmerostestesetcnicasestatsticosqueseapresentamnocontextodeumtrabalho de pesquisa, natural certo grau de desorientao inicial quanto identicao daquelesquesoounoaplicveisacadasituao.Pararealizarasescolhasadequadas,importanteconsiderar alguns parmetros bsicos dos dados a serem analisados, tais como: N de Amostras: O nmero de grupos distintos sendo analisados. Relaes Entre Amostras: Refere-se a duas ou mais amostras consistirem ou no de mltiplas medidas das mesmas entidades ou de entidades relacionadas (serem ou no pareadas oucasadas). Escala Numrica: A forma que os dados foram registrados (escala qualitativa, quantitativa discreta e quantitativa contnua). Distribuio:Adensidadedeprobabilidade(distribuiodeprobabilidade)dosdados (Normal ou No-Normal). Dependncia Entre Variveis: O conhecimento de que uma varivel pode contribuir ou no para o conhecimento de outras (respectivamente, serem associadas ou independentes entre si). So estes os fatores que determinam quais os procedimentos grcos e analticos possveispara cada combinao de nmero de amostras e tipos de dados.A tabela 4.2 abaixo indica as tcnicas estatsticas que podem ser aplicadas para a comparaoentre os parmetros de dois ou mais grupos de dados.Manal deLEITURA CR"TICA_La!ot 16/10/201117:32Page 66LEI TURACR TI CADEARTI GOSCI ENT FI COS | 67O quadro a seguir mostra as tcnicas analticas e procedimentos grcos aplicveis quandose quer vericar a existncia e/ou caracterizar a relao entre duas ou mais variveis.Tabela 4.2 - Testes estatsticos utilizados na comparao entre parmetros de duas oumais amostrasComparaesN deAmostras222222333333Tipo deRelaoPareadasPareadasPareadasNo-PareadasNo-PareadasNo-PareadasPareadasPareadasPareadasNo-PareadasNo-PareadasNo-PareadasDistribuioNormalNo-NormalNo-NormalNormalNo-NormalNo-NormalNormalNo-NormalNo-NormalNormalNo-NormalNo-NormalEscala NumricaQuant. ContnuaQuant. discretaQuant. discreta,Quant. contnuaQualitativaDicotmica*Quant. ContnuaQuant. discretaQuant. discreta,Quant. contnuaQualitativaQuant. ContnuaQuant. discretaQuant. discreta,Quant. contnuaQualitativaQuant. ContnuaQuant. discretaQuant. discreta,Quant. contnuaQualitativaAnlises AplicveisTeste t de StudentPareadoSign-Test, WilcoxonMatched-Pairs TestTeste de McNemarTeste t de StudentTeste Mann-Whitney UTeste de Qui-Quadrado ANOVA c/ MedidasRepetidasTeste de FriedmanTeste Q de CochranANOVA c/ GruposIndependentesTeste de Kruskal-WallisTeste de Qui-Quadrado* Varivel com apenas dois valores ou duas categorias (varivel binria).Manal deLEITURA CR"TICA_La!ot 16/10/201117:32Page 6768 | LEI TURACR TI CADEARTI GOSCI ENT FI COSOs quadros acima apontam para as anlises de dados possveis nas diversas situaes depesquisa, porm, no indicam exatamente os procedimentos a serem adotados em cada situao.Isso ocorre devido ao fato de que a deciso nal depende no apenas das restries matemticas,mastambmdosobjetivosdoestudoedaprprianaturezadosachadosquevosendoproduzidos. importante, contudo, ter em mente que as tabulaes apresentadas constituem ummapaderefernciaquedeixaclaroespaoparaaes,dentrodoqualpodesemanifestaraliberdade do pensador analtico.4.6.2 ExemplosI - Testes paramtricosIlustraremos alguns testes estatsticos da tabela 4.3 acima omitindo no entanto, o clculo daestatstica de teste, que fornecido pelos programas estatsticos usuais. Varivel dicotmica: amostras independentesNestecaso,avariveldeinteresseaocorrnciadeumdeterminadoevento,comoodesenvolvimento de uma doena, ou a presena de certo atributo, por exemplo, albinismo.UsaremosexemplocitadoporSiqueiraeTeixeira(2002),apropsitodotratamentodepacientes aidticos com AZT ou placebo e cujos resultados so descritos na tabela 4.4.Tabela4.3 -Tcnicasanalticaseprocedimentosgrcosusadosnadeterminaodarelao entre duas ou mais variveisN de Variveis2223333Escala Numrica dasVariveisQuantitativacontnuaQuant. discreta e/ouQuant. contnuaQualitativaQuantitativa contnuaQualitativaQuantitativa contnuaQualitativadicotmica* (Varivel-Resposta) eQualitativa ouQuantitativa(variveis explicativas)DistribuioNormalNo-NormalNo-NormalNormal ouNo-NormalNo-NormalNormal e/ouNo-NormalNormal e/ouNo-NormalAnlisesAplicveisCorrelao dePearson, RegressoLinear SimplesCorrelao deSpearmanOdds Ratio, Teste deQui-QuadradoRegresso Mltipla(Linear e No-linear)AnliseDiscriminanteRegresso LinearMltipla, RegressoNo-LinearRegresso LogsticaGrcos AplicveisDiagrama deDisperso (X,Y)Diagrama deDisperso (X,Y)---Diagrama Previso vs.Observao---------* Varivel com apenas dois valores ou duas categorias (varivel binria).Relao / AssociaoManal deLEITURA CR"TICA_La!ot 16/10/201117:32Page 68Ovalordaestatsticadetestefoide13,14.Comoestevalormaiorque3,84,obtidodadistribuio de X21para um nvel de signicncia de 0,05, rejeita-se a hiptese de igualdade entreos grupos de tratamento e controle. Em outras palavras, decidimos com 95% de conana que hevidncia do efeito do AZT. Para obtermos a probabilidade de signicncia devemos calcular aprobabilidade de encontrar valores maiores que 13,14, isto , P[X21 13,14], sendo verdadeira ahiptese de igualdade das propores. Da tabela da distribuio do X21, vemos que este valor aproximadamente 0,0001, ou seja, o valor p 0,0001.Baseadonesteestudo,possvelarmar,com95%decerteza,queoAZTtemefeitodeprolongar a vida de pacientes com AIDS, sendo esta a primeira evidncia necessria para a liberaodo medicamento.FIGURA 4.4 - Distribuio qui-quadrado e o valor da estatstica de teste.LEI TURACR TI CADEARTI GOSCI ENT FI COS | 69O problema da comparao das probabilidades de ocorrncia do evento ou do atributo nosdois grupos formulado atravs das hiptesesH0: p AZT vivo = p AZT morto = p Placebo vivo = p Placebo morto H1: pelo menos 1 grupo diferenteTabela 4.4 - Nmero de sobreviventes tratados com AZT ouplaceboAZTPlaceboTotalVivo144121265Morto11617Total145137282Fonte: Siqueira e Teixeira (2002)Grupo SituaoCalculado o valor da estatstica do teste (teste do X2), preciso decidir se este ou no um valorgrande. Assim, para se tomar uma deciso sobre a igualdade ou no das duas propores, precisoconhecer o comportamento, isto , a distribuio estatstica dos valores de X2quando as proporesso iguais. Esta distribuio foi obtida e recebeu o nome de qui-quadrado com 1 grau de liberdade, indicada por X21e est sintetizada em tabelas de fcil utilizao. A gura 4.4 ilustra a distribuiodo X2com 1 grau de liberdade. Manal deLEITURA CR"TICA_La!ot 16/10/201117:32Page 6970 | LEI TURACR TI CADEARTI GOSCI ENT FI COSApresentaremos, agora, um teste para a comparao entre 2 propores: o teste Z. Trata-sede um teste aproximado que requer grandes amostras para a sua aplicao. Um critrio exigir quen1p1e n2p2excedam o valor 5.Queremos testar a hiptese de equivalncia entre dois tratamentos:H0: p1= p2versus H1: p1 p2Comoobjetivodecompararaecciadedoispreventivoscontranusea,dividiu-sealeatoriamente uma amostra de 400 marinheiros em dois grupos de 200. Um grupo recebeu aplula A e o outro a plula B, sendo que no 1 grupo 152 no enjoaram durante uma tempestade eno outro grupo apenas 132. H indicaes de que a eccia das plulas A e B seja a mesma?Sejam pAe pBas propores de marinheiros que no enjoam, respectivamente com as plulasA e B. Temos nA= 200 e nB= 200, O valor da estatstica de teste : 2,22FIGURA 4.5 - Curva normal com o valor da estatstica de teste e o ponto crtico.Fixando-se o nvel de signicncia em 5%, rejeita-se H0. O valor p encontrado para Z 0,026.Portanto pode-se concluir, com conana de 95%, que as duas plulas no so igualmente efetivas.H indicaes de que a plula A oferece maior proteo contra nuseas comparada plula B.Varivel dicotmica: amostras pareadasForam avaliados 100 doentes com cefaleias frequentes. Os mesmos 100 doentes tomaramdurante um ms um determinado medicamento A e no ms seguinte o medicamento B. Pediu-seaos pacientes que registrassem se durante cada ms tiveram ou no dores de cabea.Manal deLEITURA CR"TICA_La!ot 16/10/201117:33Page 70LEI TURACR TI CADEARTI GOSCI ENT FI COS | 71O teste apropriado para esta situao o teste de McNemar.As hipteses so:H0: A percentagem de doentes com cefalias usando o medicamento A igual a percentagemde doentes com cefaleias usando o medicamento B. H1:ApercentagemdedoentescomcefaliasusandoomedicamentoAdiferentedapercentagem de doentes com cefaleias usando o medicamento B.O valor da estatstica do teste de McNemar : 6,86, conforme ilustrado na gura 4.6.FIGURA 4.6 - Estatstica de teste do teste de McNemar.Tabela 4.5 - Pacientes com cefalias frequentes usandos dois tipos de medicamentosMedicamento BSem cefaliaCom cefaliaTotal Sem cefalia451762Com cefalia43438Total4951100Fonte: http://medicina.med.up.pt/im/im2004/teoricas/categoricas.pptMedicamento AEste valor deve ser comparado com 3,84 para um nvel de signicncia de 5%. Ou seja, comumaconanade95%apercentagemdedoentescomcefaliasusandoomedicamentoAdiferente da percentagem de doentes com cefaleias usando o medicamento B.Resposta Contnua: amostras independentesAgora apresentaremos a metodologia para comparar dois grupos de pacientes (por exemplo,doentes vs no doentes) em relao a uma resposta contnua, por exemplo presso sistlica. Testa-se ento, nesse caso, a igualdade das mdias das respostas de dois tratamentos.Sejam1e2asmdiasdavarivelestudadaparaosdoisgrupos,respectivamente.Ashipteses a serem testadas so:Manal deLEITURA CR"TICA_La!ot 16/10/201117:33Page 7172 | LEI TURACR TI CADEARTI GOSCI ENT FI COSH0: 1= 2versus H1:1 2Vamos apresentar agora, o teste mais conhecido (o teste t para duas amostras) e adequadoparasituaesemqueasrespostasaosdoistratamentossovariveisquantitativascomdistribuio normal (gaussiana) para os dois grupos. Assim, as suposies para se usar este testeso que as variveis estudadas tm distribuies gaussianas com o mesmo desvio padro. Paraisso, deve-se realizar o teste de normalidade (Kolmogorov-Smirnov) e o teste de duas varincias(teste de Fisher). Um estudo relata os resultados de um ensaio clnico aleatorizado, duplo-cego, realizado como objetivo de comparar a tianeptina com o placebo. Participaram desse estudo pacientes de BeloHorizonte, Campinas e Rio de Janeiro.Sucintamente,oensaioconsistiuemadministraradrogaadoisgruposdepacientes,compostos de forma aleatria, e quanticar a depresso atravs da escala de MADRS, em que osvalores maiores indicam maior gravidade da doena. O escore foi obtido para cada paciente 7, 14,21, 28 e 42 dias aps o incio do ensaio.Pelo planejamento adotado, os dois grupos no diferiam em termos de depresso no inciodo ensaio. Assim, uma evidncia sobre o efeito da tianeptina obtida comparando-se os doisgrupos ao m de 42 dias.A Tabela 4.6 apresenta os escores nais dos pacientes dos dois grupos admitidos em BeloHorizonte.Tabela 4.6 - Escore nal na escala MADRS de pacientes dosdois grupos admitidos em BeloHorizonteGrupoPlacebo Tianeptina Escores63321261029 33293715221726131081741714942137102913142Fonte: Siqueira e Teixeira (2002)Para se efetuar o teste t preciso usar as seguintes informaes:n1= 15 x1= 20,53 s1= 11,09n2= 16x2= 11,37s2= 7,26A estatstica de teste encontrada foi igual a 2,74, que comparando com o valor de t29;0,975=2,045levarejeiodaigualdadeentreosdoisgruposnonvelde5%(gura4.7).Ovalorpencontrado foi 0,0104.Paraaplicarmosotestetnecessrioqueosdoisgruposcomparadostenhamamesmavariabilidade, o que nem sempre ocorre na prtica. No caso de amostras grandes (n1e n2> 30)dispomos de um teste em que no necessria qualquer suposio adicional sobre s21e s22, ouseja, as varincias podem ser iguais ou diferentes: o teste Z para comparao de mdias.Manal deLEITURA CR"TICA_La!ot 16/10/201117:33Page 72LEI TURACR TI CADEARTI GOSCI ENT FI COS | 73Umestudofoifeitoemumgrandenmerodepacientesparacomparardoisagentesanestsicos, o halotano, de efeito poderoso, mas que pode causar complicaes em pacientes comproblemas cardacos e a morna, que tem pequeno efeito na atividade cardaca. Todos pacientesforam submetidos a uma cirurgia de rotina para reparo ou substituio da vlvula cardaca. Paraobter duas amostras comparveis, eles foram alocados aleatoriamente a cada tipo de anestesia.Amdeestudaroefeitodessesdoistiposdeanestesia,foramregistradasvariveishemodinmicas, como presso sangunea antes da induo da anestesia, aps a anestesia, masantes da inciso, e em outros perodos importantes durante a operao. A questo que surge seo efeito do halotano e da morna na presso sangunea o mesmo. A mdia e o desvio-padro dosdois grupos encontram-se a seguir:Tabela4.7 -Mdiaedesvio-padrodapressosangunea(mmHg)segundootipodeanestesiaInformaes sobre a amostraMdia Desvio-padronHalotano66,912,261Morna73,214,461AnestesiaFonte: Siqueira e Teixeira (2002)FIGURA 4.7 - Distribuio de t com grau de liberdade de 29 para nvel de signicncia de5,0%.Nas condies do problema, as hipteses so:H0: 1= 2e H1:1 2Isto,devemostestaradiferenaentreaspressessanguneasmdiasdeindivduosanestesiados com halotano ou morna.Como as amostras so grandes, podemos usar o teste Z, cujo valor da estatstica do teste de-2,61Adotando um nvel de signicncia de 5%, o resultado estatisticamente signicativo, j que|-2,61| > 1,96 (gura 4.8). Alm disso, o valor p = 0,009, que menor que o valor de estipulado,indicando que os dois anestsicos no so equivalentes.Manal deLEITURA CR"TICA_La!ot 16/10/201117:33Page 7374 | LEI TURACR TI CADEARTI GOSCI ENT FI COSVarivel contnua ou discreta: amostras pareadasConsideremosaseguintepergunta:serqueoarmazenamentodaamostradosangueinuencia o valor da medida do colesterol e do triglicrides?Neste caso, o problema de interesse uma comparao entre dois grupos de medidas: detriglicrides, por exemplo. razovel supor, e existem evidncias empricas neste sentido, que adistribuio estatstica do nvel de triglicrides normal (gaussiana). No entanto, aconselhvelusar o teste de normalidade para o nvel de triglicrides. Se o possvel efeito do armazenamentose d apenas no aumento ou decrscimo na mdia da distribuio, no na sua variabilidade, entoas hipteses a serem testadas so:H0: 1= 2e H1:1 2Onde 1e 2so as mdias antes e depois do armazenamento. A escolha de H0implica que, naausncia de outras evidncias, consideremos que o armazenamento no tem efeito. Intuitivamente,o critrio de deciso, a ser utilizado para testar H0, deve ser baseado nas diferenas entre os nveisencontrados de triglicrides nas duas ocasies das medidas. Se houver inuncia do armazena-mento, ento essas diferenas devem ser diferentes de zero.O problema de escolha de um critrio de deciso reduz-se a escolher uma forma de vericarse as diferenas so provenientes de uma distribuio com mdia zero.Um exemplo semelhante pode ser ilustrado pelo estudo cujo objetivo era avaliar a efetividadede uma dieta combinada com um programa de exerccios fsicos na reduo do nvel srico decolesterol.Atabelaabaixomostraosnveisdecolesterolde12participantesnoincioenonaldoprograma.FIGURA4.8 -Testedadiferenaentreaspressessanguneasmdiasdeindivduosanestesiados com halotano ou morna.Manal deLEITURA CR"TICA_La!ot 16/10/201117:33Page 74LEI TURACR TI CADEARTI GOSCI ENT FI COS | 75Quanto maior o valord (que representa a mdia das diferenas x1- x2) maior a evidncia dequeoprogramareduzonveldecolesterol;quantomenoravariabilidadedasdiferenasindividuais,maiorachancedesedetectarumefeitomdiosignicativo,isto,umareduosignicativa do colesteroldevido ao do programa e no ao acaso. Estes aspectos podem seravaliados atravs do teste t.Sejam aedrespectivamente as mdias dos nveis de colesterol antes e depois do programa.Para testar a hiptese de que o programa altera o nvel de colesterol (H0: a= dx H1: a d) seraplicado o teste t (11 graus de liberdade).Apenas dois participantes tiveram o nvel de colesterol aumentado aps o programa, maspor pequenas quantidades (5 e 8 mg/dl). As mdias antes e depois do programa so respectiva-mente244,25e224,08,correspondenteaumareduomdiade20,12mg/dl(d =20,17).Aestatstica de teste foi de 3,02 (p = 0,012), isto , h evidncia de que, em mdia, o programa alterao nvel de colesterol (gura 4.9).FIGURA 4.9 - Teste t para as mdias antes e depois do programaTabela 4.8 - Nveis de colesterol no incio e no nal do programaIncio (x1)201231221260228237326235240267284201Final (x2)200236216233224216296195207247210209Diferenad = x1-x21-55274213040332074-8Desviod- d-19,16-25,16-15,166,83-16,160,839,8319,8312,83-0,1653,83-28,16Desvio ao quadrado(d-d)2367,36633,36230,0346,69261,360,6996,69393,36164,690,032898,03793,36Fonte: Arango (2005).ProgramaManal deLEITURA CR"TICA_La!ot 16/10/201117:33Page 7576 | LEI TURACR TI CADEARTI GOSCI ENT FI COSII - Testes No Paramtricos Os testes estudados at agora envolviam problemas nos quais a distribuio da populao emestudo era conhecida, ou pelo menos nunca colocada em causa, e as hipteses testadas apenasenvolviam parmetros populacionais. Noentanto,outrostiposdeproblemaspodemsercolocados:seadistribuiodeumapopulao desconhecida e se pretender testar a hiptese de uma distribuio particular paraaquela populao, que fazer? Os testes denominados testes no paramtricos ou testes de distribuio livre constituem umaalternativa para este e outros tipos de problemas. O termo distribuio livre popularmente usado para indicar que os mtodos so aplicveisindependentemente da forma da distribuio.Estes mtodos so, em geral, fceis de aplicar, pois podem ser usados quando as hiptesesexigidas por outras tcnicas no so satisfeitas. Relembramosaquiqueostestesparamtricosestudadosatagoracomportamumadiversidade de suposies fortes a que o seu emprego deve subordinar-se: as observaes devemser extradas de populaes com distribuio normal, as variveis em estudo devem ser medidasem escala intervalar ou de razo, de modo a que seja possvel utilizar operaes aritmticas sobreos valores obtidos das amostras (adio, multiplicao, obteno de mdias, etc.).Apesar de haver certas suposies bsicas associadas maioria das provas no paramtricas,essas suposies so em menor nmero e mais fracas do que as associadas s provas paramtricas. Servem para pequenas amostras e, alm disso, a maior parte das provas no paramtricasaplica-se a dados medidos em escala ordinal e, alguns, a dados em escala nominal.Dentre uma vasta gama de testes no paramtricos disponveis, foram selecionados, paraanlise neste captulo, apenas alguns testes de utilizao freqente ou que complementam, dealguma forma, os testes paramtricos discutidos anteriormente.Em resumo, nos exemplos mencionados anteriormente, os testes aplicados foram baseadosem distribuies de probabilidade, denominado testes paramtricos; contudo, abordaremos nosprximosexemplostestesnoparamtricos,ouseja,testesquenopossuemdistribuiodeprobabilidade. Resposta Contnua ou Discreta: duas amostras independentesO teste de Mann-Whitney a verso no paramtrica do teste t. Sendo assim, o interesse testar se as medianas so iguais ou diferentes entre si.A tabela ao lado exibe a taxa de uria de pacientes renais e sua condio quanto presenade insucincia renal aguda (IRA).Neste tipo de situao, cruzamento de uma varivel quantitativa (uria) com uma variveldicotmica (IRA), vivel empregar o teste de Mann-Whitney.Usando um programa de estatstica adequado, temos que a estatstica de teste foi de -2,76.Este valor corresponde a um valor p = 0,00289. Como o valor-p menor que o nvel de signicnciade5%,logopode-sedizerqueexisteumadiferena,signicativa,entreataxadeuriadeportadores ou no portadores de IRA. Manal deLEITURA CR"TICA_La!ot 16/10/201117:33Page 76LEI TURACR TI CADEARTI GOSCI ENT FI COS | 77Resposta Contnua ou Discreta: trs ou mais amostras independentesO teste de Kruskall Wallis utilizado quando no possvel aplicar a Anova, pois os dadosno seguem distribuio normal. Sendo assim, as hipteses so denidas pela mediana e no pelamdia.A tabela abaixo mostra o ndice de Massa Corporal (IMC) e o grau de estadiamento do cncercolorretal em 18 pacientes submetidos a cirurgia. O objetivo vericar se o grau de estadiamentodesta doena se relaciona o IMC. Usandoumsoftware adequado,temosqueaestatsticadetestefoide0,758.Estevalorcorresponde a um valor-p = 0,685. Como o valor-p maior que o nvel de signicncia de 5%,pode-se dizer que o estadiamento do cncer colorretal no se correlacionou com o ndice de MassaCorporal.Resposta Contnua ou Discreta: duas amostras pareadasO teste de Wilcoxon utilizado quando no possvel aplicar o teste t pareado, pois os dadosno seguem distribuio normal, ou seja, a verso no paramtrica do teste t pareado. Sendoassim, o interesse testar se as medianas so iguais ou diferentes entre si.A tabela abaixo mostra o nvel mximo de concentrao (NMC) de 12 pacientes selecionadosaleatoriamente, antes e depois da ingesto de determinada droga. O objetivo deste estudo eratestar a eccia desta droga em relao capacidade de aprendizado.Tabela 4.9 - Pacientes segundo a taxa de uria (mg/100ml) e a presena ou no de IRAPaciente010203040506070809101112Uria9212068707763263338252115IRASimSimSimSimSimSimNoSimNoNoNoNoFonte: Arango (2005).Tabela 4.10 - IMC de trs grupos de pacientesEstadiamento I22.4127.9919.5719.5619.1522.21Estadiamento II22.2628.2418.3722.107.3322.21Estadiamento III20.8322.3118.2220.8818.7321.27Fonte: Dados FictciosManal deLEITURA CR"TICA_La!ot 16/10/201117:33Page 7778 | LEI TURACR TI CADEARTI GOSCI ENT FI COSUsando um programa de estatstica adequado, temos que a estatstica de teste foi de 1,44.Este valor corresponde a um valor-p = 0,074 para o teste unilateral. Como o valor-p maior que onvel de signicncia de 5%, pode-se dizer que o uso da nova droga no aumenta a capacidade deaprendizado. Recomenda-se fazer o teste com um nmero maior de pacientes para se ter umamelhor concluso sobre o efeito real da droga.Resposta Contnua ou Discreta: trs ou mais amostras pareadasO teste de Friedman uma generalizao do teste de Wilcoxon para situaes de mais deduas opes na comparao de dados. Este teste utilizado quando no possvel aplicar o testeAnova com medidas repetidas, pois os dados no seguem distribuio normal. Sendo assim, ashipteses so denidas pela mediana e no pela mdia.A tabela 4.12 mostra dados ctcios sobre 25 pacientes, com diagnstico de metstase emcoluna vertebral. Para cada paciente, foi aplicado o questionrio VAS (Escala Analgica Visual), emuma escala de 0 a 10, para avaliao de dor no perodo pr-operatrio, ps-operatrio e um anoaps a cirurgia. O objetivo avaliar a evoluo da dor em pacientes com leso metasttica emcoluna vertebral operados por abordagem posterior.Usandoumsoftware adequado,temosqueaestatsticadetestefoide7,96.Estevalorcorresponde a um valor-p = 0,000 para o teste bilateral. Como o valor-p menor que o nvel designicncia de 5%, pode-se dizer que os valores de VAS diferem entre si quando comparadosestatisticamente os perodos pr-operatrio, ps-operatrio e um ano aps a cirurgia. Observe que o teste de Friedman apenas conclui que pelo menos uma situao difere dasdemais.Nestecaso,necessriorealizarcomparaodedoisadoisgruposparaidenticarahierarquia desta diferena.Tabela 4.11 - Nveis mximos de ateno/concentrao, em segundos, em uma amostrade 12 indivduos, antes e depois da ingesto da droga de testePaciente010203040506070809101112NMC Antes9161228533171318122614NMC Depois14221823114015182231198Fonte: Arango (2005).Manal deLEITURA CR"TICA_La!ot 16/10/201117:33Page 78LEI TURACR TI CADEARTI GOSCI ENT FI COS | 79A Tabela 4.13 mostra os resultados da comparao de dois a dois entre Escala Analgica Visual(VAS) para avaliao da dor no pr-operatrio, ps-operatrio e um ano aps cirurgia.Tabela 4.12 - Escala Analgica Visual (VAS) para avaliao da dorno pr-operatrio, ps-operatrio e um ano aps cirurgia, em uma amostra de 25 indivduos Paciente01020304050607080910111213141516171819202122232425VAS pr-operatrio569787963788910841010108878107VAS ps-operatrio10058296378806021008877647VAS um ano aps cirurgia00008196050800021058586087Fonte: Arango (2005).Tabela 4.13 - Teste de comparao mltipla entre a Escala Analgica Visual (VAS) paraavaliao da dor no pr-operatrio, ps-operatrio e um ano aps cirurgiaComparao Mltipla de VASVAS pr-operatrio (1)VAS ps-operatrio (2)VAS pr-operatrio (1)VAS um ano aps cirurgia (3)VAS ps-operatrio (2)VAS um ano aps cirurgia (3)Mediana8.006.008.005.006.005.00Valor p0.000**0.000**0.074Concluso1 > 21 > 32 = 3 Nota: As probabilidades de signicncia (valor p) referem-se ao teste de Wilcoxon Valor p em negrito indica diferena signicativa. Os resultados signicativos foram identicados com asteriscos, de acordo com o nvel de signicncia das comparaesmltiplas, a saber: valor p < 0.0167** .ResultadosManal deLEITURA CR"TICA_La!ot 16/10/201117:33Page 7980 | LEI TURACR TI CADEARTI GOSCI ENT FI COSEm anlise comparativa da Escala Analgica Visual (VAS), vericou-se que a Escala AnalgicaVisual no pr-operatrio maior do que os demais momentos, pois o valor p < 0,05. Enquanto quea Escala visual no ps-operatrio e no ano aps a cirurgia so iguais, valor p > 0,05 (Tabela 4.13).Para as comparaes mltiplas, o nvel de signicncia ca dividido por trs (a/3), por se tratarde comparaes entre 3 grupos, ou seja, ser considerado signicativa aquela comparao cujovalor p for inferior a 0,0167. Para casos em que existamn comparaes o nvel de signicncia ca dividido por n (a/n).Referncias1. Siqueira AL. Teixeira FJS. Introduo a Estatstica Mdica. 2ed. Belo Horizonte: COOPMED, 2002.2. Triola M.Introduo Estatstica. 10ed. Rio de Janeiro: LTC, 2008, p.722-801.3. Arango HG. Bioestatstica: terica e computacional. 2ed.Rio de Janeiro. Guanabara Koogan, 2005.Manal deLEITURA CR"TICA_La!ot 16/10/201117:33Page 80