Transcript
  • Epidemiologia

    Indicadores de Sade

    Profa. Dra. Ivana Maria Saes Busato

  • Epidemiologia | Indicadores de Sade 2

    Ol! O vdeo a seguir mostra os contedos que sero estudados nesta

    aula. Venha conferir!

    Introduo

    A estatstica uma ferramenta imprescindvel a qualquer pesquisador ou

    pessoa que necessite tomar decises. Como disciplina cientfica, inicialmente

    foi utilizada como estratgia mercantil e poltica, destinada a dimensionar as

    doenas e seus efeitos para a Epidemiologia.

    Com isso, iniciaremos esta aula com os conceitos bsicos da Estatstica

    aplicada Epidemiologia, o que dar a base para a compreenso das anlises

    exploratrias de dados (univariada, bivariada e multivariada).

    Conceitos Bsicos em Estatstica

    Ao emitir uma hiptese, o cientista tenta explicar os fatos j conhecidos.

    Para testar a significncia estatstica, a hiptese de pesquisa deve ser

    formulada de modo que categorize a diferena esperada entre grupos de

    estudo.

    Hiptese uma suposio que se faz a respeito de alguma coisa, deve estar

    fundamentada em uma boa questo de pesquisa, a priori, e deve ser

    simples e especfica.

  • Epidemiologia | Indicadores de Sade 3

    Variveis independentes so aquelas manipuladas, enquanto as variveis

    dependentes so apenas medidas ou registradas.

    A hiptese pode ser, ainda:

    Varivel

    Para analisar uma hiptese, necessrio coletar uma varivel uma

    caracterstica de interesse que pode ser medida; as variveis poder ser

    independentes e dependentes.

    As variveis que assumem valores numricos so denominadas

    quantitativas, e as no numricas, qualitativas. Uma varivel qualitativa

    quando seus valores so atributos ou qualidades (sexo, raa, classe social). Se

    tais variveis possuem uma ordenao natural, indicando intensidades

    crescentes de realizao, so classificadas de qualitativas ordinais (classe

    social baixa, mdia ou alta). Se no for possvel estabelecer uma ordem natural

    entre seus valores, so classificadas como qualitativas nominais (sexo

    masculino ou feminino).

  • Epidemiologia | Indicadores de Sade 4

    Ao estudar uma parte da populao (amostra), podemos encontrar o acaso, ou

    seja, um resultado que difere da realidade. Devemos estimar, portanto, a preciso

    estatstica do resultado.

    J as variveis quantitativas podem ser classificadas em discretas ou

    contnuas. As variveis discretas so resultantes de contagens e assumem, em

    geral, valores inteiros (nmero de filhos), enquanto as variveis contnuas

    podem assumir qualquer valor dentro de um intervalo especificado e so,

    geralmente, resultado de uma mensurao (peso, em kg; altura, em metros).

    A validade de um estudo depende da capacidade que as variveis tm

    de representar os fenmenos de interesse. Para isso, devemos considerar:

    Preciso est na capacidade de reproduo, quando maior for a preciso,

    maior o poder estatstico que um determinado tamanho da amostra tem para

    estimar os valores mdios e para testar a hiptese, ou seja, a questo de

    pesquisa. Enfim, uma varivel tem valores semelhantes quando medida

    vrias vezes. A preciso afetada pelo erro aleatrio (acaso) e pode ser

    causada pelo observador, sujeito ou instrumento;

    Acurcia a capacidade de representar realmente o que deveria

    representar, tem influncia na validade interna e externa do estudo. Melhor

    forma de avaliar a acurcia est na comparao com um padro de

    referncia ameaada pelo erro sistemtico (vis) causado pelo observador,

    sujeito ou instrumento.

    Os estudos de diferentes variveis com muita frequncia fazem uso de

    intervalo de confiana, como em estudos descritivos de prevalncia ou

    incidncia. Se nossos estudos avaliassem toda a populao-alvo do estudo,

    teramos plena confiana nos resultados. Contudo, j vimos que isso no

    realizado e, portanto, utilizamos amostras em vez da populao.

  • Epidemiologia | Indicadores de Sade 5

    Podemos realizar 100 estudos da mesma populao, o que traria

    diversos resultados. a variabilidade entre esses resultados que chamamos de

    intervalo de confiana. O intervalo de confiana no nvel 95% (95% IC)

    significa que o resultado est dentro de um intervalo e faz-se a leitura correta

    do intervalo de confiana afirmando que, em 95 de 100 amostras hipotticas, o

    resultado est dentro desse intervalo.

    Quanto mais estreito o intervalo de confiana, mais precisa a

    estimativa e exatamente essa a definio estatstica para preciso a

    capacidade de um resultado se repetir em diferentes medidas da mesma

    realidade. Se a medida em questo possuir um valor que representa a hiptese

    nula, podemos usar o intervalo de confiana para obter a significncia

    estatstica.

    No necessrio fazer 100 estudos para calcular o intervalo de

    confiana, podemos obt-lo com apenas um estudo realizado e o fazemos

    estudando apenas uma amostra e utilizando frmulas estatsticas que levam

    em considerao o tamanho amostral, a variabilidade de uma varivel

    contnua ou a frequncia do desfecho quando a varivel categrica. Essas

    frmulas nos fornecem o erro-padro a medida de incerteza do estudo.

    Plano amostral

    A inferncia estatstica um processo de raciocnio indutivo em que se

    procura tirar concluses partindo do particular para o geral, estudando apenas

    alguns elementos dessa populao, ou seja, uma amostra, que, a partir das

    propriedades verificadas, infere propriedades para a populao, utilizando a

    probabilidade como instrumento.

    Um experimento aleatrio tem que satisfazer algumas condies:

    1. Poder ser repetido indefinidamente;

    2. Ser capaz de descrever todos os possveis resultados do experimento,

    mas no predizer com certeza qual ocorrer;

    3. Obedecer regularidade estatstica.

  • Epidemiologia | Indicadores de Sade 6

    A distribuio normal acontece quando uma varivel aleatria contnua

    normalmente distribuda e seu aspecto grfico tem a forma de um sino. A curva

    representativa dessa distribuio denominada curva normal ou curva de

    Gauss.

    Mtodos aleatrios ou probabilsticos acontecem quando cada elemento

    da populao tem uma probabilidade conhecida de fazer parte da amostra.

    Esses mtodos possibilitam a determinao da distribuio de probabilidade e

    permitem quantificar o erro de amostragem decorrente da utilizao de apenas

    uma parte da populao.

    A probabilidade um nmero entre 0 e 1 e mostra o grau de certeza da

    ocorrncia de um evento associado a um experimento aleatrio. A distribuio

    de probabilidades associa uma probabilidade a cada resultado numrico de um

    experimento.

    As distribuies de probabilidade podem ser: discreta ou contnua.

    Contudo, vamos abordar somente a distribuio de probabilidade contnua

    normal, por ser a mais importante para a Epidemiologia, pois representa as

    distribuies de frequncia observadas nos fenmenos naturais e fsicos.

    Por exemplo: no lanamento de um dado, cada face tem a mesma

    probabilidade de ocorrncia, que 1/6. Como os valores das distribuies

    de probabilidades so apenas probabilidades e como as variveis aleatrias

    devem tomar um de seus valores, temos duas regras, que se aplicam a

    qualquer distribuio de probabilidades:

    - a somatria das ocorrncias possveis igual a 1.

    (1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1)

    - a probabilidade da ocorrncia de um evento est entre 0 a 1.

  • Epidemiologia | Indicadores de Sade 7

    Os dados se concentram em torno de uma mdia e se dispersam

    simetricamente a partir desse ponto central. importante saber que tipo de

    distribuio ocorre com os dados, pois isso poder determinar os testes

    estatsticos.

    Curva de Gauss

    Fonte:

    Como obter uma amostra?

    Chamamos o processo de seleo de uma amostra de amostragem.

    Os mtodos de amostragem so:

    No aleatrios so realizados com a construo da amostra a partir da

    informao sobre a populao estudada, tentando fazer com que a amostra

    seja um espelho fiel dessa populao. Esses mtodos no permitem calcular

    a preciso das estimativas obtidas a partir da amostra; os mais conhecidos

    Amostra um subconjunto de elementos pertencentes a uma populao.

    Para que os resultados retirados da amostra possibilitem inferncias vlidas,

    ela deve ser representativa da populao.

  • Epidemiologia | Indicadores de Sade 8

    so a amostragem orientada, a amostragem por convenincia e a

    amostragem por quotas;

    Aleatrios podem ser realizados de diversas formas, como colocar, um a

    um, todos os nmeros que sero submetidos ao sorteio, retirando alguns s

    cegas; ou ainda, usar os nmeros de loteria sorteados nos ltimos anos ou

    uma tabela de nmeros aleatrios, ou programas de computador para

    selecionar aleatoriamente todos os componentes da amostra. Podem ser

    realizados de algumas formas de amostragem: aleatria simples, aleatria-

    -estratificada, sistemtica e por conglomerados.

    Assista ao vdeo a seguir, em que vamos complementar os conceitos

    sobre amostragem para a Epidemiologia.

    Erro amostral

    No h dvida de que uma amostra no representa perfeitamente uma

    populao. O importante que todas as decises que tomamos questo de

    pesquisa, plano de estudo, populao a ser pesquisada tm inerente um

    determinado erro, que pode ser quantificado em termos probabilsticos. Ou

    seja, quando utilizamos uma amostra, devemos aceitar uma margem de erro

    que denominamos erro amostral. Esse erro a diferena entre um resultado

    amostral e o verdadeiro resultado populacional. Quando isso ocorre, os

    resultados da amostra no refletem a realidade da populao, levando a

    inferncias errneas.

    Acompanhe os tipos de erros:

    I. Erro tipo I (falso positivo) ocorre quando rejeita uma hiptese nula

    que verdadeira na populao;

  • Epidemiologia | Indicadores de Sade 9

    O tamanho da amostra pode evitar erros tipo I e II. Os resultados falso negativo

    e falso positivo tambm podem ocorrer em funo do vis. Esses erros so mais

    difceis de detectar e exigem conhecimentos avanados de estatstica.

    II. Erro tipo II (falso negativo) ocorre quando se deixa rejeitar (aceita-

    -se) uma hiptese nula que no verdadeira na populao.

    Antes de realizar o estudo, o pesquisador determina a probabilidade

    mxima tolerada para os erros tipo I e II. A probabilidade de um erro tipo I

    (rejeitar a hiptese nula quando ela verdadeira) denominado (alfa),

    tambm chamada de nvel de significncia estatstica.

    A probabilidade de um erro tipo II (no rejeitar uma hiptese nula quando

    ela for falsa) denominado (beta). O valor 1 - beta chamado de poder do

    teste e representa a probabilidade de se rejeitar a hiptese nula na amostra

    quando o efeito real na populao se iguala magnitude estimada de efeito.

    Muitos estudos estabelecem como 0,05 e como 0,20 o poder de 0,80

    representa esperar que 80% de probabilidade de encontrar uma associao

    dessa magnitude quando encontrar associao.

    varia de 0,01 a 0,10. Usar alfa baixo quando a questo de pesquisa torna

    importante evitar falso positivo (erro tipo I); ex: eficcia de um medicamento ou

    tratamento.

    varia de 0,05 a 0,20. Usar beta baixo quando quer evitar o falso negativo (erro

    tipo II); ex: opinio pblica quanto a realizar ou no um tratamento novo muito

    invasivo.

    Os erros amostrais resultam de flutuaes amostrais aleatrias. No

    temos a capacidade de evitar a ocorrncia do erro amostral, contudo podemos

    limitar seu valor por meio da escolha de uma amostra de tamanho adequado.

  • Epidemiologia | Indicadores de Sade 10

    Por exemplo: 10% da populao geral com diabetes mellitus; ento, para

    calcularmos amostra na populao da equipe de sade da famlia composta

    por 4000hab, usamos os mesmos 10% (quando no conhecemos essa

    proporcionalidade, usamos 50% como proporo).

    Assim, podemos deduzir que o erro amostral e o tamanho da amostra seguem

    sentidos contrrios: quanto maior o tamanho da amostra, menor o erro

    cometido e vice-versa.

    Podemos calcular a amostra usando a mdia populacional, a partir de

    uma frmula matemtica, visando determinar a amostra com base em

    informaes sobre o grau de confiana desejado (valor crtico = Z/2), o

    desvio-padro populacional da varivel estudada, a margem de erro (ou erro

    mximo de estimativa), que identifica a diferena mxima entre a mdia

    amostral e a verdadeira mdia populacional.

    Conhea os valores crticos mais utilizados na amostra, associados ao

    grau de confiana:

    Grau de Confiana Valor Crtico Z /2

    90% 0,10 1,645

    95% 0,05 1,96

    99% 0,01 2,575

    Podemos determinar o tamanho de uma amostra com base na

    estimativa da proporo populacional, a qual utilizada quando h

    necessidade de determinar a proporo de pessoas de uma populao e que

    tambm faz uso de uma frmula matemtica para seu clculo, aplicada

    proporo j conhecida e populao-alvo para estimar a amostra.

    Em populaes finitas, h a necessidade de outros clculos. As frmulas

    anteriores partem do princpio que a populao de onde se retirava a amostra

  • Epidemiologia | Indicadores de Sade 11

    to grande que podemos consider-la infinita. Na maioria dos estudos, as

    populaes no so to grande em comparao com as amostras e, caso a

    amostra tenha um tamanho maior ou igual a 5% do tamanho da populao,

    considera-se que a populao seja finita. Assim, para calcular a amostra para

    populaes finitas, h a necessidade de se aplicar um fator de correo aos

    clculos que vimos anteriormente.

    Anlise Exploratria de Dados

    A coleta e a organizao dos dados faz parte do planejamento do

    estudo, o qual inclui, por sua vez, a elaborao do instrumento de coleta dos

    dados, com a devida organizao das questes de anlise em variveis que

    possam ser quantificadas e que sero passveis de anlise exploratria dos

    dados.

    Quando terminada a etapa da coleta dos dados, estes devem ser

    arranjados em forma de tabela, para a maior eficincia na anlise. Essa

    disposio deve permitir sua anlise na maioria dos programas estatsticos

    disponveis. Usando uma planilha do Excel, podemos empregar cada coluna

    representando uma varivel (ex: sexo, idade, tamanho, salrios mnimos, taxa

    de mortalidade) e cada linha representa cada unidade de observada (ex:

    indivduos, dentes, casas).

    A anlise exploratria dos dados tem incio com uma primeira

    abordagem do conjunto de dados e com a anlise do perfil de cada varivel

    separadamente chamada de anlise univariada. Para explicar algumas

    hipteses (quando incluem duas variveis), h a necessidade de realizar a

    anlise bivariada e, quando as anlises ficam ainda mais complexas

    (introduo de mais variveis), usa-se a anlise multivariada.

  • Epidemiologia | Indicadores de Sade 12

    A anlise univariada muito utilizada na Epidemiologia porque descreve uma

    doena ou um agravo de sade para compor um perfil epidemiolgico.

    Fonte: Corrar et al., 2007

    Anlise univariada

    A anlise univariada inclui todos os mtodos de estatstica que permitem

    a anlise de cada varivel separadamente, com mtodos de estatstica para

    cada uma.

    Aps a coleta e a digitao de dados em um banco de dados apropriado,

    o prximo passo a anlise exploratria univariada, etapa fundamental, pois

    uma anlise detalhada permite ao pesquisador familiarizar-se com os dados,

    organiz-los e sintetiz-los de forma a obter as informaes necessrias do

    conjunto de dados para responder as questes que esto sendo investigadas.

    Nessa etapa, produzem-se tabelas, grficos, mapas ou ainda resumos em

    medidas numricas ou estatsticas.

    importante conhecer e saber construir os principais tipos de tabelas e

    grficos e calcular as medidas de resumo para realizar uma boa anlise

    descritiva dos dados.

    Quantas variveis so

    analisadas

    simultaneamente?

    Uma Duas Mais de

    duas

    Anlise

    univariada

    Anlise

    bivariada

    Anlise

    multivariada

  • Epidemiologia | Indicadores de Sade 13

    No caso de variveis quantitativas contnuas, que podem assumir infinitos, temos

    que dividir em classes, calculadas por intervalos de classe.

    Vamos tentar entender como os dados se distribuem, onde esto

    centrados, quais observaes so mais frequentes, como a variabilidade etc.,

    tendo em vista responder as principais questes do estudo. Cada ferramenta

    fornece um tipo de informao e o seu uso depende, em geral, do tipo de

    varivel que est sendo investigada.

    As tabelas de frequncia so elaboradas com os valores da varivel e

    suas respectivas contagens, as quais so denominadas frequncias

    absolutas ou simplesmente frequncias. No caso de variveis qualitativas ou

    quantitativas discretas, a tabela de frequncia consiste em listar os valores

    possveis da varivel e fazer a contagem na tabela de dados brutos do nmero

    de suas ocorrncias. Temos a frequncia do valor, a frequncia total, a

    frequncia relativa e, para variveis qualitativas ordinais e quantitativas em

    geral, temos ainda as frequncias acumuladas obtidas pela soma das

    frequncias de todos os valores da varivel, menores ou iguais ao valor

    considerado.

    Medidas de resumo

    As medidas estatsticas de resumo so formas complementares da

    anlise univariada, que podem ser medidas e que informam o centro dos

    dados e a variabilidade dos mesmos em relao ao centro.

    Apresentaremos os dois tipos fundamentais: medidas de posio, ou

    tendncia central, e as medidas de disperso, ou de variabilidade.

  • Epidemiologia | Indicadores de Sade 14

    Medidas de posio

    Visam localizar o centro de um conjunto de dados, ou seja, identificar um

    valor em torno do qual os dados tendem a se agrupar. As mais utilizadas so:

    mdia aritmtica, mediana e moda. possvel calcular direto usando as

    funes de estatstica do Excel.

    A mdia aritmtica a soma de todas as observaes dividida pelo

    nmero de observaes. Sua frmula considera cada observao (x 1, x 2, x 3,

    ...... xn) e o total de observaes (n).

    A moda o valor mais frequente no conjunto de dados. Continuando

    com o mesmo exemplo anterior, nesse caso, a moda 3 o valor que mais se

    repete; ou seja, o nmero de residncias por casa que aparece com maior

    frequncia 3.

    Mediana o valor que ocupa a posio central dos dados ordenados,

    deixando metade dos dados abaixo e metade acima dele. Se o nmero de

    observaes for mpar, a mediana igual mdia aritmtica; se for par, ser a

    mdia aritmtica dos dois valores centrais. Sua frmula considera as

    observaes (x 1, x 2, x 3, ...... xn), sendo que n = total de observaes.

    Mdia aritmtica = . x / n

    Mediana = mdia aritmtica para n impar e para n

    par = n + que indica a posio da mediana.

    Suponha o nmero de moradores por residncia da quadra A da Rua das

    Flores (4, 5, 3, 2, 7, 3, 4, 1, 5, 2, 3, 3); calculemos a mdia aritmtica para

    descobrir o nmero de moradores por residncia:

    4+5+3+2+7+3+4+1+5+2+3+4 /12 = 42/12 = 3,5

  • Epidemiologia | Indicadores de Sade 15

    Alm das medidas de posio que estudamos, h outras que no so

    medidas de tendncia central, mas esto ligadas sua caracterstica de

    separar a srie em duas partes que apresentam o mesmo nmero de valores.

    Vamos estudar os quantis, o quartis, o decis e os percentis medidas que

    so, juntamente com a mediana, conhecidas pelo nome genrico de

    separatrizes.

    Quartis

    Denominamos quartis os valores de uma srie dividida em quatro partes

    iguais. Precisamos, portanto, de 3 quartis (Q1, Q2 e Q3) para dividir a srie em

    quatro partes iguais. O primeiro quartil o valor que deixa um quarto (25%) dos

    valores abaixo e trs quartos (75%) acima dele. O terceiro quartil o valor que

    deixa trs quartos (75%) dos dados abaixo e um quarto (25%) acima dele. O

    segundo quartil (Q2) a mediana (50%).

    O primeiro e o terceiro quartis fazem o mesmo que a mediana

    para as duas metades demarcadas pela mediana.

    Decis

    A definio dos decis obedece ao mesmo princpio dos quartis, com a

    modificao da porcentagem de valores que ficam aqum e alm do decil que

    se pretende calcular. Indicamos os decis (D1, D2, ..., D9), desse modo,

    precisamos de 9 decis para dividirmos uma srie em 10 partes iguais.

    No mesmo exemplo anterior, calculando a mediana, devemos colocar em

    ordem crescente 1, 2, 2, 3, 3, 3, 3, 4, 4, 5, 5, 7. Como par, usamos:

    12+1/2 = 6,5

    As posies seis e sete:

    3+3/2 = 3

    A mediana de 3 mostra que 50% das residncias tm mais do que 3

    moradores e 50% tm menos do que 3 moradores.

  • Epidemiologia | Indicadores de Sade 16

    As medidas de posio fornecem informaes valiosas, mas, em geral, no so

    suficientes para descrever os diferentes conjuntos de dados. As medidas de

    disperso ou variabilidade permitem visualizar a maneira como os dados se

    espalham (ou se concentram) em torno do valor central.

    Percentis

    Denominamos percentis ou centis os 99 valores que separam uma srie

    em 100 partes iguais. Indicamos (P1, P2, ..., P99). evidente que:

    O clculo de um centil segue a mesma tcnica do clculo da mediana,

    do quartil e do decil:

    Para mensurarmos essa variabilidade, podemos utilizar as seguintes

    estatsticas: amplitude total, varincia e desvio padro; estas podem ser

    calculadas direto do Excel. Existem outras medidas de disperso que no nos

    interessam agora; essas so suficientes para a compreenso e a utilizao na

    Epidemiologia.

    Amplitude total

    a diferena entre o maior e o menor valor do conjunto de dados.

    Pegando o mesmo exemplo dos moradores por residncia da quadra A da Rua

    P50 = Mediana P25 = Q1 P75 = Q3

    Mediana = Q2 = D5 = P50

    O mais interessante o quinto decil, que divide o conjunto em duas partes

    iguais. Assim sendo, o quinto decil igual ao segundo quartil, que, por sua

    vez, igual mediana.

  • Epidemiologia | Indicadores de Sade 17

    Convm organizar o conjunto de dados de maneira prtica e racional, e uma das

    formas de representao desse conjunto se faz por meio da apresentao grfica.

    das Flores (4, 5, 3, 2, 7, 3, 4, 1, 5, 2, 3, 3), em que o maior valor 7 e o menor

    1, a amplitude total ser: 7-1 = 6.

    Varincia

    uma medida que expressa um desvio quadrtico mdio do conjunto de

    dados e sua unidade o quadrado da unidade dos dados representada por

    S2.

    Desvio-padro

    raiz quadrada da varincia e sua unidade de medida a mesma que a

    do conjunto de dados. Sua frmula : S= raiz quadrada de S2. No mesmo

    exemplo anterior, S2 = 2,6; ento S = raiz quadrada de 2,6 = 1,6.

    Existem vrias representaes grficas: grfico de barras, diagrama

    circular ou grfico de pizza, histograma, grfico de linha ou sequncia e o

    boxplot. Para facilitar o conhecimento e a utilizao dos grficos e das tabelas,

    S2 = (x1 x)2 /n-1 X = mdia

    Pegando o mesmo exemplo dos moradores por residncia da quadra A da

    Rua das Flores (4, 5, 3, 2, 7, 3, 4, 1, 5, 2, 3, 3), ento:

    X = 3,7

    S2 = (4-3,7) 2 + (5-3,7) 2 + (3-3,7) 2 + (2-3,7) 2 + (7-3,7) 2 + (3-3,7) 2 + (4-3,7) 2

    + (1-3,7) 2 + (5-3,7) 2 + (2-3,7) 2 + (3-3,7) 2 + (3-3,7) 2 / 12 - 1 = 2,6

  • Epidemiologia | Indicadores de Sade 18

    separamos por tipo de varivel as principais possibilidades de anlise

    univariada:

    Varivel qualitativa* Varivel quantitativa

    Tabela de frequncias

    Grfico de barras

    Diagrama circular (pizza)

    Tabela de frequncias

    Histograma, boxplot

    Grfico de linha ou sequncia

    Polgono de frequncias

    Medidas de resumo

    *Essa abordagem tambm pode ser interessante para as variveis quantitativas discretas.

    A anlise univariada como ponto inicial na explorao de dados

    importante para a Epidemiologia. Por isso, aprofunde seu conhecimento,

    assistindo ao vdeo a seguir. Confira!

    Anlise bivariada

    A estatstica bivariada inclui mtodos de anlise de duas variveis,

    podendo ser ou no estabelecida uma relao de causa/efeito entre elas.

    Lembrando que o principal objetivo da pesquisa em sade o estabelecimento

    de uma relao de causa e efeito entre duas variveis, procuramos identificar

    uma associao estatisticamente significativa.

    Os testes estatsticos visam descartar o acaso nessa associao. Por

    isso, devem ser realizados visando avaliar a validade de qualquer associao

    estatstica (acaso, vis, confundimento) e julgar se a associao encontrada

    representa uma relao de causa/efeito.

  • Epidemiologia | Indicadores de Sade 19

    Todo teste estatstico tem como resultado um nmero representando a

    probabilidade desse acaso, chamado de p-valor (ou valor-p). H a

    necessidade de uma hiptese nula bem-definida para a interpretao da

    probabilidade fornecida pelo p-valor. Quando o valor-p pequeno, indica a

    pouca probabilidade da associao ter ocorrido por acaso; assim, podemos

    rejeitar a hiptese nula. A associao observada pode ser devida ao acaso ou

    no, e essa a nica resposta que obtemos ao se estudar a associao entre

    variveis por meio de um teste estatstico adequado, gerando um p-valor.

    Muitos testes estatsticos so elaborados com a premissa de que os

    valores seguem uma distribuio normal e so chamados de testes

    paramtricos, pois se baseiam nos parmetros da distribuio normal, a

    mdia e o desvio-padro. Contudo, quando no podemos perceber ou garantir

    que os valores tenham uma distribuio normal, devemos usar os testes no

    paramtricos. Mesmo se, na ocorrncia de distribuio normal, aplicarmos o

    teste no paramtrico, isso no causar erro, somente pode-se perder o poder

    do teste em relao ao teste paramtrico.

    Assim, torna-se imprescindvel, antes da escolha do teste estatstico

    para dados contnuos, examinar a distribuio dos dados. Se dados contnuos

    apresentam uma distribuio anormal, necessrio escolher um teste no

    paramtrico ou transform-los em uma distribuio normal, aplicando, como

    exemplo, uma transformao logartmica. Existem diversos mtodos para a

    verificao da condio de normalidade nos dados sob anlise:

    Grfico de probabilidade normal;

    Mtodo dos momentos;

    Aplicao do teste W Shapiro-Wilk;

    Aplicao do teste Kolmogorov-Smirnov ou teste de aderncia X.

    As amostras podem ser classificadas como pareadas ou no pareadas.

    Um desenho de estudo comum, usando amostras pareadas, pode ser

  • Epidemiologia | Indicadores de Sade 20

    Quando queremos fazer controle entre os grupos, podemos usar o pareamento,

    considerando que dado pareado constitudo por pareamento, garantindo, assim,

    uma composio rigorosamente equivalente entre os grupos em termos de

    algumas variveis selecionadas.

    constatado quando um grupo de indivduos examinado antes e depois de um

    determinado tratamento. Amostras independentes so constitudas por

    diferentes indivduos compondo cada grupo.

    Vamos diferenciar dados pareados e no pareados, o que bastante

    importante para a aplicao dos testes estatsticos:

    Caracterstica Pareado No pareado

    Distribuio Normal Qualquer uma

    Varincia assumida Homognea Qualquer uma

    Relao entre dados Interdependentes Qualquer uma

    Medidas de localizao

    central normalmente

    usada

    Mdia Mediana

    Os procedimentos estatsticos clssicos no estudo da associao

    bivariada (duas variveis) seguem o tipo de amostra das variveis e da

    dependncia das observaes. No quadro a seguir, mostramos os

    procedimentos estatsticos apropriados:

    Escala de

    mensurao das

    duas variveis

    Procedimento Estatstico

    Para dados no Para dados pareados

  • Epidemiologia | Indicadores de Sade 21

    envolvidas na

    associao

    pareados

    Duas dicotmicas Teste X2 (qui-quadrado)

    Teste Exato de Fisher

    Coeficiente

    RR risco relativo

    (+IC95%)

    OR razo de chance

    (+IC95%)

    Teste X2 de McNemar

    Coeficiente Kappa

    (+IC95%)

    OR pareado razo de

    chance (+IC95%)

    Duas nominais (2x3,

    3x3, 4x2 etc.)

    Teste X2 (qui-quadrado) Apenas em matrizes

    quadrticas (3x3, 4x4 etc.)

    Coeficiente Kappa

    (+IC95%)

    Teste X2 de Start-Maxweel

    Uma ordinal e outra

    dicotmica

    Teste de Mann-Whitney Teste de Wilcoxon

    Uma ordinal e outra

    nominal

    Teste de Krusskall-Wallis

    Anlise Ridit

    Teste de Fridman

    Duas ordinais Coeficiente de Correlao

    de Spearman

    Apenas em matrizes

    quadrticas (3x3, 4x4 etc.)

    Kappa ponderado

    Uma numrica e outra

    dicotmica

    Teste t de Students

    Teste X2 para tendncia

    Teste t pareado

  • Epidemiologia | Indicadores de Sade 22

    Para aprofundar o conhecimento sobre os testes estatsticos e suas frmulas,

    consulte o captulo 15 do livro Epidemiologia e Bioestatstica na pesquisa

    odontolgica, presente nas referncias.

    Uma numrica e outra

    nominal

    ANOVA ANOVA para dados

    repetidos

    Uma numrica e outra

    ordinal

    Nenhum procedimento

    simples

    Nenhum procedimento

    simples

    Duas numricas Coeficiente de Correlao

    de Pearson

    Regresso Linear Simples

    Correlao Interclasse

    Fonte: LUIZ et al., 2005

    Confira, no vdeo a seguir, a anlise bivariada e a definio de alguns

    testes estatsticos mais usados em Epidemiologia. No deixe de assistir!

    Regresso linear simples

    um dos modelos causais mais conhecidos e utilizados e consiste em

    uma varivel dependente relacionada a uma varivel independente por uma

    equao linear. Busca-se a correlao entre as variveis quando uma est

    relacionada a outra; enfim, quando a variao de valor da varivel

    independente provoca uma mudana no valor da varivel dependente.

  • Epidemiologia | Indicadores de Sade 23

    Apenas os mtodos de anlise multivariada permitem que se explore o

    desempenho conjunto das variveis e que se determine a influncia ou a

    importncia de cada uma, estando as restantes presentes.

    Essa correlao apresentada graficamente pelo diagrama de

    disperso, o qual mostra a relao entre duas variveis quantitativas. Os

    valores de uma varivel esto no eixo x (horizontal) para a varivel

    independente, enquanto da outra esto no eixo y (vertical), para a varivel

    dependente; cada ponto representa uma unidade medida. Assim, devemos

    analisar o diagrama observando a direo (crescente ou decrescente), a forma

    (linear, no linear e aglomerados) e os pontos discrepantes.

    Quanto maior for a correlao, mais prximo de 45 (crescente)

    ou 135 (decrescente) ser a distribuio.

    Anlise multivariada

    A anlise multivariada se refere a um conjunto de mtodos estatsticos

    que permite a anlise simultnea de mltiplas variveis para cada unidade

    estudada. Inclui, ainda, as diversas abordagens analticas que consideram o

    comportamento de muitas variveis analisadas em um mesmo momento.

    Temos diversas opes de tcnicas na anlise multivariada.

    Destacamos as mais discutidas e usadas na literatura cientfica: regresso

    linear mltipla, regresso logstica, anlise fatorial e anlise de conglomerados.

    Contudo, nesta aula, vamos abordar apenas a regresso linear mltipla e a

    regresso logstica.

    Regresso linear mltipla

    Tcnica estatstica que analisa a dependncia de uma varivel

    quantitativa em relao a duas ou mais variveis independentes (quantitativas

    ou qualitativas) ou explicativas. Descreve, por meio de um modelo matemtico,

  • Epidemiologia | Indicadores de Sade 24

    Para aprofundar o conhecimento da anlise multivariada, consulte o livro Anlise

    multivariada, de Corrar et al., presente nas referncias.

    a relao entre uma varivel dependente quantitativa e duas ou mais variveis

    independentes qualitativas e quantitativas.

    Seu ponto principal a dependncia estatstica de uma varivel em

    relao a duas ou mais variveis. Tem como objetivos encontrar a relao

    causal entre as variveis e estimar os valores da varivel dependente a partir

    dos valores conhecidos ou fixados das variveis independentes.

    Regresso logstica

    Tcnica de anlise multivariada, que permite estimar a probabilidade

    associada ocorrncia de determinado evento em face de um conjunto de

    variveis.

    No modelo logstico, usamos os valores de uma srie de variveis

    independentes para predizer a ocorrncia da doena (varivel dependente). Na

    regresso logstica, a varivel dependente tem uma varivel qualitativa

    binominal, sendo 0 (ausncia) ou 1 (presena). Assim, todas as variveis

    consideradas no modelo esto controladas entre si.

    Essa tcnica deve ser usada quando a varivel dependente

    dicotmica (qualitativa) e as variveis independentes forem

    quantitativas ou qualitativas.

  • Epidemiologia | Indicadores de Sade 25

    O pacote estatstico SPSS uma ferramenta para anlise de dados que

    utiliza tcnicas estatsticas bsicas e avanadas.

    Assista ao vdeo a seguir para saber mais sobre os tpicos avanados

    em Estatstica. Confira!

    SPSS Statistical Package for Social Sciences

    Existem vrios pacotes estatsticos gratuitos e pagos que possibilitam a

    realizao dos procedimentos estatsticos. O SPSS (Statistical Package for

    Social Sciences) uma dessas opes.

    O SPSS um software de estatstica de fcil manuseio,

    internacionalmente utilizado h muitas dcadas. Para iniciar a anlise de

    dados, necessrio a construo da base de dados, que um conjunto de

    dados registrados em uma planilha, em forma de matriz, com n linhas,

    correspondentes aos casos em estudo, e p colunas, correspondentes s

    variveis em estudo ou itens de um questionrio. O nmero de casos (nmero

    de linhas da matriz) , em geral, maior do que o nmero de variveis em

    estudo (nmero de colunas).

    O SPSS aceita a colagem da planilha do Excel j elaborada, com a

    coluna representando as variveis estudadas e cada linha representando cada

    unidade observada; depois cabe ao pesquisador nominar as colunas,

    classificando o tipo de varivel, o que facilita a anlise dos dados.

  • Epidemiologia | Indicadores de Sade 26

    Para aprofundar o conhecimento sobre o SPSS, consulte o site com o tutorial do

    pacote estatstico, na apostila elaborada pela Universidade Federal do Rio Grande

    do Sul, de autoria de Mundstock et al., presente nas referncias.

    Sntese

    Assista ao vdeo a seguir, no qual apresentaremos uma sntese dos

    assuntos que foram estudados nesta aula. Confira!

  • Epidemiologia | Indicadores de Sade 27

    1. Sobre a classificao das variveis, podemos afirmar que:

    a. Varivel quantitativa contnua presso arterial de idosos do

    ambulatrio de geriatria do hospital Y.

    b. Varivel quantitativa ordinal nmero de bactrias por litro de leite.

    c. Varivel qualitativa discreta taxa de mortalidade infantil.

    d. Varivel qualitativa nominal diviso dos estgios da doena

    tuberculose em inicial, controle e final.

    2. Calcule a mdia (MEDA), a moda (MO), a mediana (MED), o desvio-padro

    (DP), a amplitude (AM) e a varincia (VAR) do conjunto de dados e assinale

    a alternativa correta:

    a. MEDA= 14,5; MO= 17,1; MED= 12,5; DP= 3,4; AM= 2,5 e VAR= 11,2

    b. MEDA= 15,4; MO= 11,7; MED= 14,6; DP= 4,3; AM= 11,2 e VAR= 18,1

    c. MEDA= 15,4; MO= 17,1; MED= 11,7, DP= 4,3; AM= 12,1 e VAR= 12,5

    d. MEDA= 14,1; MO= 11,7; MED= 14,6, DP= 3,4; AM= 11,2 e VAR= 11,2

    Dados: taxa de mortalidade infantil do distrito YY (13,4 - 11,7 - 17,1 -

    15,8 - 22,9 - 11,7).

  • Epidemiologia | Indicadores de Sade 28

    Referncias

    ALMEIDA FILHO N; ROUQUAYROL M. Z. Introduo Epidemiologia. 4.

    ed., rev. e ampliada. Rio de Janeiro: Guanabara Koogan, 2013.

    ALMEIDA FILHO, N; BARRETO, M. L.. Epidemiologia & Sade: fundamentos,

    mtodos, aplicaes. [Reimpr.]. Rio de Janeiro: Guanabara Koogan, 2012.

    BONITA, R. Epidemiologia bsica. 2.ed. So Paulo: Santos, 2010.

    CORRAR, L. J.; PAULO, E.; DIAS FILHO, J. M. (coord). Anlise multivarada:

    para os cursos de Administrao, Cincias Contbeis e Economia. So Paulo:

    Atlas, 2007.

    CZERESNIA, D.; ALBUQUERQUE, M. de F. M. de. Modelos de inferncia

    causal: anlise crtica da utilizao da estatstica na Epidemiologia. Revista

    Sade Pblica, So Paulo, v. 29, n. 5, out. 1995. Disponvel em:

    . Acesso em: 30 jun.2013.

    HULLEY, S. B. et al.. Delineando a pesquisa clnica: uma abordagem

    epidemiolgica. 2. ed. Porto Alegre: Artmed, 2003

    LUIZ, R. R., COSTA, A. J. L., NADANOVSKY, P. Epidemiologia e

    Bioestatstica na pesquisa odontolgica. So Paulo: Atheneu, 2005.

    LUIZ, R. R., STRUCHINER, C. J. Inferncia causal em epidemiologia: o

    modelo de respostas potenciais. Rio de Janeiro: Fiocruz, 2002. 112 p.

    Disponvel em SciELO Books . Acesso em: 29 jun.

    2013.

    MEDRONHO, R. A. et al.. Epidemiologia. So Paulo: Atheneu, 2009.

    MUNDSTOCK, E. et al.. Introduo anlise estatstica: utilizando o SPSS

    13.0. Instituto de Matemtica. Universidade Federal do Rio Grande do Sul,

    Porto Alegre. Cadernos de Matemtica e Estatstica, srie B, n. XX, trabalho de

    apoio didtico, maio 2006. Disponvel em:

  • Epidemiologia | Indicadores de Sade 29

    SPSS/Introdu%E7%E3o%20%E0%20An%E1lise%20Estat%EDstica%20utiliza

    ndo%20o%20SPSS%2013_0.pdf>. Acesso em: 29 jun. 2013.