A estatística nas investigações cientificas em saúde: usos e abusos Ronir Raggio Luiz Instituto de Estudos em Saúde Coletiva (IESC/UFRJ) Faculdade de Medicina

A estatística nas investigações cientificas em saúde: usos e abusos

Ronir Raggio Luiz

Instituto de Estudos em Saúde Coletiva (IESC/UFRJ)

Faculdade de Medicina da UFRJ

USOS: inúmeros, como importantíssima e fundamental “ferramenta”, além de contribuir muito motivando desenvolvimentos teóricos

ABUSOS: alguns, como a interpretação da significância estatística; ou aqueles relacionados aos modelos estatísticos múltiplos (interpretação, diagnóstico, amostras pequenas); ou ainda a simples “diferença” desvio-padrão e erro-padrão

Usos e abusos na área da saúde

Mas qual ferramenta representa melhor a

estatística nas investigações em saúde:

colher de pedreiro ou martelo de juiz?

Símbolos associação de ideias e interpretações

Colher de pedreiro ideia de “construção”

Martelo do juiz (malhete) ideia de “decisão”

Tomada de decisão ERROO papel da estatística

Na clínica Decisão “clínica” diagnóstico e tratamento individual

Nas investigações em saúde dados populacionais conhecimento incerteza conceito de risco

Tomada de decisão ERROO papel da estatística

Decisão e erro na estatística teste de hipóteses

Mas nas investigações em saúde, estamos mais interessados em conhecer parâmetros que caracterizem as condições de saúde de uma população ou estimem efeitos causais Validade e precisão Intervalos de confiança

Revendo Validade e Precisão

Estimativa

Intervalo de confiança (imprecisão)

Parâmetro

Erro (viés ou imprecisão?)

Vieses, confundimento, interação...

Estudos experimentais vs. observacionais

Retomando: mas por que a

supervalorização dos testes

de hipóteses?

1. Caminho ideal: Questão + planejamento metodológico + análise dos dados resultado

2. Caminho mais usual: Dados disponíveis + questão + análise estatística resultado

Os “caminhos” das investigações

O que mais importa, então?

Resultado vs. Questão+método

Mais sobre a supervalorização dos

testes de hipóteses

Revendo os testes de hipóteses estatísticas retomando a ideia

de decisão/erro H0 = hipótese nula (ou de nulidade) e

H1 = hipótese alternativa Significância estatística – p-valor – erro tipo I

Analogias possíveis ou razoáveis:

1) Julgamento (H0=inocente vs H1=culpado)

2) Teste diagnóstico (H0=saudável vs H1=doente)

Óbitos por ano e turno, em um hospital federal de Massachusetts/EUA - 1988 a 1997

0

10

20

30

40

88 89 90 91 92 93 94 95 96 97

Ano

Óbi

tos

T1 = 00:00 às 08:00hs

T2 = 08:00 às 16:00hs

T3 = 16:00 às 24:00hs

Exemplo do “julgamento”:

Significância estatística vs. causalidade

Nas investigações em saúde, onde comumente a intenção é estabelecer

relações causais, o que significa então um resultado estatisticamente significativo?

Mas lembrar: Tamanho do “efeito” Tamanho da amostra Variabilidade

E o erro tipo II (beta): interessa?

ERROS ASSOCIADOS A UM TESTE DE HIPÓTESE

Erro tipo I (a) e erro tipo II ( )b

Decisão Verdade tomada H0 H1

H0 ok b

H1 a

ok

Exemplo simples, mas “simbólico” de um teste estatístico

Como “testar” se um dado é honesto? H0: dado é honesto vs. H1: dado é viciado Suponha 60 lançamentos do dado (n=60) – iid Resultado esperado vs. observado

Face Esperado sob H0

Observado 1 Observado 2

1 10 12 62 10 9 73 10 10 44 10 11 85 10 11 56 10 7 30

Total 60 60 60

P-valor grande ou pequeno?

Se o resultado é o “observado 2” (ou seja, 30 vezes o número 6) duas explicações alternativas

1. Acaso (qual a probabilidade?)

2. Dado não é honesto

Voltando às investigações em saúde

Frequentemente a “pergunta” envolve estudar a associação entre variáveis, com interesse em relações de causa e efeito. Por exemplo, determinada droga tem eficácia (ou efetividade ou eficiência)?

Primeira pergunta: O resultado é válido? E as unidades de análise não são replicações idênticas... Então, mais um explicação alternativa àquelas duas

anteriores 1) vieses (informação e seleção) e 2) confundimento. (E validade de especificação?)

Lembrar, ainda, de interação (modificação de efeito)

Questões teóricas e práticas relacionadas que sempre devem

ser consideradas:

Desenhos de estudo e medidas de efeito Bases de dados já disponíveisAleatoriedade (randomização e amostra

aleatória)Mensuração (qualidade das medidas)E ainda:Relevância prática ou “clínica”

Ilustração de confundimento: exposição vs. desfecho X

EpiInfo Version 6 Statcalc November 1993 + Disease - Analysis of Single Table ┌────────┬────────┐ Odds ratio = 2.67 (1.00 <OR< 7.21)+│ 20 │ 30 │ 50 Cornfield 95% confidence limits for OR ├────────┼────────┤ Relative risk = 2.00 (1.04 <RR< 3.83)-│ 10 │ 40 │ 50 Taylor Series 95% confidence limits for RR └────────┴────────┘ Ignore relative risk if case control study.E 30 70 100x Chi-Squares P-valuesp ─────────── ────────o Uncorrected : 4.76 0.0290963 ◄───s Mantel-Haenszel: 4.71 0.0299130 ◄───u Yates corrected: 3.86 0.0495346 ◄───re F2 More Strata; <Enter> No More Strata; F10 Quit

+ Disease - Analysis of Sigle Table ┌────────┬────────┐ Odds ratio = 1.00 (0.11 <OR< 7.35*)+│ 2 │ 18 │ 20 Cornfield 95% confidence limits for OR ├────────┼────────┤ *Cornfield not accurate. Exact limits preferred.-│ 4 │ 36 │ 40 Relative risk = 1.00 (0.20 <RR< 5.00) └────────┴────────┘ Taylor Series 95% confidence limits for RRE 6 54 60 Ignore relative risk if case control study.xp Chi-Squares P-valueso ─────────── ────────s Uncorrected : 0.00 1.0000000u---------------------------------------------------------------------------------- + Disease - Odds ratio = 1.00 (0.18 <OR< 5.33*) ┌────────┬────────┐ Cornfield 95% confidence limits for OR+│ 18 │ 12 │ 30 *Cornfield not accurate. Exact limits preferred. ├────────┼────────┤ Relative risk = 1.00 (0.56 <RR< 1.79)-│ 6 │ 4 │ 10 Taylor Series 95% confidence limits for RR └────────┴────────┘ Ignore relative risk if case control study.E 24 16 40x Chi-Squares P-valuesp ─────────── ────────o Uncorrected : 0.00 1.0000000s----------------------------------------------------------------------------------

***** Stratified Analysis *****Summary of 2 Tables

Crude odds ratio for all strata = 2.67Mantel-Haenszel Weighted Odds Ratio = 1.00

Crude RR for all strata = 2.00Mantel-Haenszel Weighted Relative Risk of Disease, given Exposure = 1.00

Resumindo

Três alternativas para interpretar um teste estatisticamente significativo (p-valor pequeno):

1) H1 é a verdade e o teste foi capaz de detectá-la.

2) H0 é a verdade, mas por mero ACASO os dados apontaram uma decisão em favor de H1 (p-valor);

3) H0 é a verdade, mas existe algum VIÉS no estudo que gerou uma decisão em favor de H1.

FinalizandoEstatística nas investigações em saúde, especialmente a

partir de teste de hipóteses:

Colher de pedreiro ou martelo do juiz?

Minha resposta: é uma importante ferramenta (colher de pedreiro) que auxilia, e muito, na “construção” do conhecimento em saúde e de avaliações de ações, mas é muito limitada para “decisões”, especialmente aquelas individuais

Na apresentação dos resultados dê preferência aos intervalos de confiança já que estes não só contém indiretamente a informação que se pode extrair da significância estatística do estudo (caso isso interesse), como também apresentam a magnitude do efeito do que se está estudando, permitindo portanto uma avaliação dos “erros” das investigações de forma mais prática.

Documents

A estatística nas investigações cientificas em saúde: usos e abusos Ronir Raggio Luiz Instituto de Estudos em Saúde Coletiva (IESC/UFRJ) Faculdade de Medicina