15
UFFS Universidade Federal da Fronteira Sul Campus Cerro Largo PROJETO DE EXTENSÃO Software R: capacitação em análise estatística de dados utilizando um software livre Fonte: https://www.r-project.org/ Aula 4 Blog do projeto: https://softwarelivrer.wordpress.com/equipe/ Equipe: Coordenadora: Profe. Iara Endruweit Battisti ([email protected]) Colaboradores: Profa. Denize Reis Prof. Erikson Kaszubowski Prof. Reneo Prediger Profa. Tatiane Chassot Bolsista: Jéssica Aguiar aluna de Engenharia Ambiental ([email protected]) MÓDULO 4 – TESTE QUI-QUADRADO 4.1 Para uma variável (aderência) 4.2 Para duas variáveis (associação) 4.3 Medidas de magnitude

Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

  • Upload
    buidieu

  • View
    216

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

UFFS – Universidade Federal da Fronteira Sul

Campus Cerro Largo

PROJETO DE EXTENSÃO

Software R: capacitação em análise estatística de dados utilizando

um software livre

Fonte: https://www.r-project.org/

Aula 4

Blog do projeto:

https://softwarelivrer.wordpress.com/equipe/

Equipe:

Coordenadora: Profe. Iara Endruweit Battisti

([email protected])

Colaboradores: Profa. Denize Reis

Prof. Erikson Kaszubowski

Prof. Reneo Prediger

Profa. Tatiane Chassot

Bolsista: Jéssica Aguiar – aluna de Engenharia Ambiental

([email protected])

MÓDULO 4 – TESTE QUI-QUADRADO

4.1 Para uma variável (aderência)

4.2 Para duas variáveis (associação)

4.3 Medidas de magnitude

Page 2: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

ESTUDO DA RELAÇÃO ENTRE DUAS VARIÁVEIS QUALITATIVAS

Em muitos estudos, há o interesse sobre a relação entre duas ou mais variáveis aleatórias, sejam elas

qualitativas ou quantitativas. O interesse pode ser sobre a existência da relação entre as variáveis, sobre o tipo da

relação, predição de valores e ainda se essa relação é significativa.

Para analisar a relação entre duas variáveis qualitativas utiliza-se o teste de associação e para analisar a

relação entre duas variáveis quantitativas utiliza-se a análise de correlação e a análise de regressão simples. Se

existem mais de duas variáveis quantitativas, pode-se utilizar a análise de regressão múltipla ou outras técnicas

de análise multivariada, esta também aplicada a variáveis qualitativas.

Teste de qui-quadrado para verificar associação entre duas variáveis qualitativas

Quando existem duas variáveis de interesse, a representação tabular das frequências observadas pode

ser feita através de uma tabela de contingência (Tabela 1), também chamada de tabela cruzada ou tabela de

dupla entrada. Cada interseção de uma linha com uma coluna é chamada de casela e o valor que aparece em

cada casela é a frequência observada, nomeada como ijO , em que i corresponde a linha e j corresponde a

coluna. Observando-se a Tabela 1, o valor 33 corresponde ao sexo masculino e a opinião favorável (masculino ∩

favorável), é chamada de 11O .

Exemplo: Suponha uma amostra de 100 pessoas, que foram entrevistadas quanto a suas opiniões sobre

determinado projeto de lei, tendo sido obtidos os resultados dados na Tabela 1. O interesse nessa pesquisa é

verificar se existe relação entre as variáveis qualitativas, ou seja, se as variáveis são ou não independentes. Para

isso definem-se as seguintes hipóteses estatísticas:

H0: as variáveis são independentes (não existe associação entre opinião e sexo)

H1: as variáveis não são independentes (existe associação entre opinião e sexo)

Tabela 1 – Opinião sobre determinado projeto de lei de acordo com o sexo

Sexo Opinião

Total Favorável Desfavorável Indiferente

Masculino 33 12 15

Feminino 7 20 13

Total

Fonte: Dados simulados.

A estatística de teste para testar as hipóteses apresentadas é o 2 (qui-quadrado):

l

i

c

j ij

ijij

calE

EO

1 1

2

2

em que:

l : número de linhas

Page 3: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

c : número de colunas

ijO : frequência observada na linha i e coluna j

ijE : frequência esperada na linha i e coluna j

com grau de liberdade = gl = )1)(1( lc

A frequência esperada de uma casela é obtida pela multiplicação do total da linha pelo total da coluna

dividido pelo total geral. Por exemplo, a frequência esperada 11E é igual ao total da coluna 1 multiplicada pelo total

da linha 1 dividido pelo total geral, ou seja, 100

6040.

Depois que se obtém o valor do qui-quadrado, compara-se com o valor do qui-quadrado tabelado, com um

nível de significância e gl graus de liberdade. Se o valor do qui-quadrado calculado for maior ou igual ao valor

do qui-quadrado tabelado então rejeita-se a 0H . Quando o cálculo é realizado no software estatístico, utiliza-se o

valor P para decidir em rejeitar ou não 0H , conforme Quadro 1.

Quadro 1 – Valor p, interpretação e conclusão do valor p

Valor P Interpretação Conclusão

Inferior a 0,01 Elevada significância

estatística

Rejeita-se 0H , ao nível

de 1% de significância.

0,01 a 0,05 Estatisticamente

significante

Rejeita-se 0H , ao nível

de 5% de significância.

Superior a 0,05 Evidência insuficiente

contra a hipótese nula

Não rejeita-se 0H .

Importante (check list do teste de qui-quadrado):

Quando a tabela é 2x2, deve-se utilizar o teste com correção de continuidade (correção de Yates),

pois a distribuição de frequências observadas é discreta e está sendo aproximada pela

distribuição qui-quadrado, que é contínua (Barbetta, 1998).

Ainda, o cálculo do qui-quadrado deve ser a partir de valores absolutos e não deve ser calculado

quando a frequência esperada em qualquer casela for menor que 5. Neste caso, deve-se usar o

teste exato de Fisher, para garantir o grau de certeza do teste.

Quando as amostras são pareadas (amostras dependentes), utiliza-se o teste de McNemar.

Para avaliar a força da associação entre as duas variáveis utilizam-se:

- coeficiente de contingência

- razão de prevalência

- risco relativo

- razão de chances (odds ratio)

Page 4: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

Teste de qui-quadrado com correção de continuidade (correção de Yates):

l

i

c

j ij

ijij

calE

EO

1 1

2

25,0

Coeficiente de contingência de Pearson:

Caso o teste de qui-quadrado for significativo (rejeita-se 0H ), é aconselhável calcular o coeficiente de

contingência de Pearson para medir a força da relação entre as duas variáveis. O coeficiente varia entre 0 e 1.

𝐶𝑐 = √

2

cal

2

cal + n

Exemplo utilizando o cálculo manual: Realizar o teste de independência para os dados da Tabela 1 ao nível de

1% de significância.

Passo 1) Calcular as frequências esperadas para cada casela:

100

604011

E

100

603212

E 13E

21E 22E 23E

Passo 2) Calcular o 2 calculado:

23

2

2323

22

2

2222

21

2

2121

13

2

1313

12

2

1212

11

2

11112

)()()(

)()()(

E

EO

E

EO

E

EO

E

EO

E

EO

E

EOcal

Passo 3) Encontrar e o 2 tabelado com gl graus de liberdade e nível de significância .

gl = (3-1).(2-1)

=0,01

Tabela da Distribuição de 2 :

= 0,01

gl =2 9,21

Qui–quadrado tabelado

Page 5: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

Passo 4) Comparar o valor do 2 observado com o

2 tabelado (crítico) e concluir sobre a não rejeição de H0

ou rejeição H0 . Também, interpretar de acordo com o problema.

Passo 5) Calcular o Coeficiente de Contingência (CC) e interpretar seu resultado.

Exemplo utilizando os recursos do software R: Realizar o teste de associação para os dados da Tabela 1:

Digitar os dados da tabela cruzada (tabela de contingência) no formato de uma matriz, valor ij,

considerando i=linha e j=coluna, em sequência por coluna (por exemplo, digita-se todos os valores da primeira

coluna, depois digita-se todos os valores da segunda coluna e assim sucessivamente).

Sintaxe no software R:

> dados<-matrix(c(33,7,12,20,15,13),nc=3) > dados [,1] [,2] [,3] [1,] 33 12 15 [2,] 7 20 13

O comando ‘matrix’ indica que os dados serão organizados em uma matriz, ‘nc’ indica o número de

colunas da tabela, o operador ‘<-‘ atribui os valores digitados no nome informado pelo usuário que neste caso é

‘dados’.

O segundo comando ‘dados’, mostra a matriz elaborada, que neste caso represente uma tabela cruzada

de duas linhas e três colunas, conforme a tabela do Exemplo 1.

Primeiramente, deve-se verificar a existência de alguma casela com frequência esperada menor que 5.

> chisq.test(dados)$expected [,1] [,2] [,3] [1,] 24 19.2 16.8 [2,] 16 12.8 11.2

Caso não exista, utiliza-se o teste de qui-quadrado com o comando ‘chisq.test’.

> chisq.test(dados) Pearson's Chi-squared test data: dados X-squared = 15.6696, df = 2, p-value = 0.0003957

Em caso contrário, utiliza-se o teste Exato de Fisher.

> fisher.test(dados)

Page 6: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

Exemplo: Foi feita a análise de 24 indivíduos do sexo masculino e feminino (Tabela 2) e será verificado se

existe diferença entre os gêneros sexuais nas opiniões em relação a redução da maioridade penal, utilizando α =

5%

Tabela 2 – Opinião das pessoas quanto a redução da maioridade penal

Sexo Opinião

Total Favorável Desfavorável Indiferente

Masculino 4 7 2 13

Feminino 3 3 5 11

Total 7 10 7

Hipóteses estatísticas:

H0: as variáveis são independentes (não existe associação entre opinião e sexo)

H1: as variáveis não são independentes (existe associação entre opinião e sexo)

Caso a tabela seja 2x2, então usa-se o teste de qui-quadrado com o comando ‘chisq.test’ acrescido de

‘correct=TRUE’ indicando a utilização da correção de continuidade (correção de Yates).

> chisq.test(dados,correct=TRUE)

maioridade<-matrix(c(4,3,7,3,2,5),nc=3) > maioridade [,1] [,2] [,3] [1,] 4 7 2 [2,] 3 3 5 > chisq.test(maioridade)$expected [,1] [,2] [,3] [1,] 3.791667 5.416667 3.791667 [2,] 3.208333 4.583333 3.208333 Warning message: In chisq.test(maioridade) : Aproximação do qui-quadrado pode estar incorreta fisher.test(maioridade) Fisher's Exact Test for Count Data data: maioridade p-value = 0.265 alternative hypothesis: two.sided

Page 7: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

Exemplo: Numa classe de 35 acadêmicos, comparou-se os mesmos quanto a característica de terem vínculo

empregatício ou não. Os resultados seguem na Tabela 3. O interesse neste caso, é verificar se existe relação

entre as variáveis sexo e vínculo empregatício, ou seja, se as variáveis são ou não independentes.

Tabela 3 – Situação dos estudantes quanto a existência de vínculo empregatício.

Sexo Vínculo empregatício

Total Sim Não

Masculino 5 12 17

Feminino 10 8 18

Total 15 20 35

Fonte: Dados simulados.

Para isso definem-se as seguintes hipóteses estatísticas:

H0: as variáveis são independentes (não existe associação entre o gênero sexual e vínculo empregatício)

H1: as variáveis não são independentes (existe associação entre gênero sexual e vínculo empregatício)

Amostras dependentes:

No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação.

> mcnemar.test(dados1)

Importante para o teste de McNemar: no software R os dados na matriz (tabela de contingência) devem

ser distribuídos da mesma maneira tanto nas linhas quanto nas colunas. Isto é, a e d devem expressar o mesmo

comportamento. Por exemplo: aprovado, desaprovado, aprovado, desaprovado.

> emprego<-matrix(c(5,10,12,8),nc=2) > emprego [,1] [,2] [1,] 5 12 [2,] 10 8 > chisq.test(emprego)$expected [,1] [,2] [1,] 7.285714 9.714286 [2,] 7.714286 10.285714 > chisq.test(emprego,correct=TRUE) Pearson's Chi-squared test with Yates' continuity correction data: emprego X-squared = 1.4893, df = 1, p-value = 0.222

Page 8: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

Antes Depois

Aprovado Desaprovado

Aprovado a b

Desaprovado c d

Exemplo: Uma pesquisa foi realizada para verificar o efeito de uma propaganda sobre a satisfação de um

produto. Para isso foram selecionados aleatoriamente 76 indivíduos com características semelhantes para

avaliarem o produto antes e após a propaganda. Na Tabela 1 é apresentada a satisfação dos indivíduos

pesquisados. Teste a hipótese de que existe diferença na satisfação antes e após a propaganda, considerando

nível de 5% de significância.

Tabela 4 – Efeito de uma propaganda sobre a satisfação de um produto

Antes Depois

MS/S +ou- /I/MI

MS/S 34 2

+ou- /I/MI 25 15

MS=muito satisfeito, S=satisfeito,

+ou-=Mais ou menos satisfeito,

MI=muito insatisfeito,I=Insatisfeito

Hipóteses estatísticas:

H0: As frequências das diferentes categorias ocorrem na mesma proporção (Frequências b e c ocorrem na mesma

proporção, ou seja, ... )

H1: As frequências b e c ocorrem em proporções diferentes, ou seja, as mudanças são significativas.

> prop=matrix(c(34,25,2,15),nc=2) > prop [,1] [,2] [1,] 34 2 [2,] 25 15 > chisq.test(prop)$expected [,1] [,2] [1,] 27.94737 8.052632 [2,] 31.05263 8.947368 > mcnemar.test(prop) McNemar's Chi-squared test with continuity correction data: prop McNemar's chi-squared = 17.9259, df = 1, p-value = 2.297e-05

Page 9: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

ADERÊNCIA A UMA DISTRIBUIÇÃO

Teste de qui-quadrado para verificar aderência a uma distribuição Para verificar se o conjunto de dados segue uma distribuição teórica especificada.

No caso a seguir, verificar se as frequências de clientes são as mesmas ao longo da semana:

> chisq.test(clientes)

Exemplo: Deseja-se verificar se o número de clientes em um pequeno restaurante localizado as margens de uma

rodovia muda conforme o dia da semana. O número de clientes observado para cada dia de uma semana

escolhida aleatoriamente foram:

Tabela 5 - Número de clientes no restaurante/dia da semana

Dia da semana Nº de Clientes

Seg 20

Ter 12

Qua 10

Qui 17

Sex 30

Sab 22

Dom 35

Total 146

Para um nível de significância de 5%, o que pode ser dito?

1)Hipóteses a serem testadas:

Ho: O número de clientes não muda conforme o dia da semana;

H1: Pelo menos um dos dias tem número diferente dos demais.

> clientes<-c(20,12,10,17,30,22,35) > chisq.test(clientes)$expected [1] 20.85714 20.85714 20.85714 20.85714 20.85714 20.85714 20.85714 > chisq.test(clientes) Chi-squared test for given probabilities data: clientes X-squared = 23.8219, df = 6, p-value = 0.0005631

Page 10: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

Exemplo: A tabela a seguir apresenta o número de empresas constituídas no Rio Grande do Sul, no tipo Micro

Empreendedor Individual, nos 10 primeiros meses do ano, cujos atos foram arquivados na JUCERGS.

Tabela 6 – Constituições de empresas

Mês Mei

Jan 6.368

Fev 4.381

Mar 7.783

Abr 8.010

Mai 7.825

Jun 7.660

Jul 7.923

Ago 7.930

Set 7.456

Out 7.202 Fonte: http://www.jucergs.rs.gov.br/p_estatisticas.asp

Verificar as frequências de constituição de novas empresas são as mesmas ao longo dos meses observados.

Exemplo:

Num estudo verifica-se a ocorrência de 4 espécies de moscas, conforme exposto na Tabela 7. Verifique as frequências de quatro espécies de moscas se distribuem de forma igual? Tabela 7 – Ocorrência de espécies de Moscas

Espécie Nº de exemplares

D. autumnalis 24

D. aestivalis 32

D. amphibia 10

D. attica 9 Fonte: adaptado de Beasley ,2004

Ou para verificar se as frequências de espécies de moscas seguem uma distribuição específica, informado em

‘dist’. Lembrando que os valores no vetor ‘dist’ devem estar no formato de proporção (por exemplo, 0.35).

> chisq.test(moscas,p=dist)

> moscas<-c(24,32,10,9) > chisq.test(moscas)$expected [1] 18.75 18.75 18.75 18.75 > chisq.test(moscas) Chi-squared test for given probabilities data: moscas X-squared = 19.9867, df = 3, p-value = 0.0001708

Page 11: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

Exemplo: No caso do exemplo “moscas”

MEDIDAS DE MAGNITUDE

Medidas de associação: avaliar a relação entre fator de risco e o desfecho. Considera-se o delineamento:

transversal, caso-controle e coorte.

Razão de prevalência

Risco relativo

Razão de chance (odds ratio)

Risco: probabilidade de um indivíduo apresentar o desfecho em um determinado período de tempo.

Tabela de dupla entrada para fator (exposição) e desfecho

Fator Desfecho Total

+ -

+ a b

- c d

Total

O teste de qui-quadrado indica se associação entre fator (exposição) e desfecho, porém não fornece a

magnitude dessa associação, neste caso aplica-se uma medida de efeito, como a razão de chances – OR ou risco

relativo – RR ou razão de prevalência – RP, conforme é detalhado a seguir:

Risco Relativo

Estima a magnitude da associação entre a exposição ao fator de risco e desfecho, indicando quantas

vezes a ocorrência do desfecho nos expostos é maior do aquele entre os não-expostos. É utilizado em estudos de

coorte (neste delineamento seleciona-se um determinado número de indivíduos que serão acompanhados um

período de tempo avaliando-se neles a exposição ao potencial fator de risco e a ocorrência do desfecho). 2

É a razão entre a incidência do desfecho nos expostos e a incidência do desfecho nos não-expostos,

como:

moscas<-c(24,32,10,9) > dist<-c(0.25,0.10,0.35,0.3) > chisq.test(moscas)$expected [1] 18.75 18.75 18.75 18.75 > chisq.test(moscas,p=dist) Chi-squared test for given probabilities data: moscas X-squared = 99.6629, df = 3, p-value < 2.2e-16

Page 12: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

)/(

)/(

dcc

baaRR

Para avaliar a significância na população, da magnitude encontrada, utiliza-se o intervalo de confiança,

utilizando o método da transformação logarítmica (descrito em Gardener e Altaman, 1989). Esse método

pressupõe que a distribuição amostral de valores de RR possui uma forma assimétrica do tipo log-normal e com a

transformação logarítmica, obtém-se uma curva aproximadamente normal. Após, aplica-se as fórmulas já

utilizadas de intervalo de confiança para variáveis com distribuição normal, utilizando o logaritmo do RR (ln RR),

conforme abaixo:

)])[ln(.)exp(ln(2

RREPZRRICRR

em que:

dccbaaRREP

1111)][ln(

2

z : limite crítico bilateral da distribuição normal

Obtém-se o anti-logaritmo ( exp[ln] ou RReln

) dos limites encontrados, para expressar o intervalo de

confiança na escala original do RR.

Avalia-se a significância da magnitude do RR observando se o intervalo de confiança inclui o valor 1

(referente a nulidade de associação), concluindo que ao nível de confiança especificado o RR é diferente de 1,

sendo portanto significativo o achado da amostra na população.

Salienta-se aqui, que está sendo avaliado somente um fator com o desfecho, não considerando o efeito de

outros fatores de risco, ou seja, avaliando estimativas não ajustadas para outros fatores.

Razão de Chandes (Odds Ratio)

Também referenciado como “razão de chances”, “razão de produtos cruzados” ou “razão de odds”.

Utiliza-se em estudos de caso-controle, neste delineamento os pacientes são incluídos de acordo com a

presença (casos) ou não (controles) do desfecho e avalia-se a exposição (no passado) a potenciais fatores de

risco nestes grupos 2.

Não é possível estimar diretamente as incidências do desfecho entre expostos e não-expostos em estudos

de caso-controle, pois a proporção casos/controles ou desfecho/não-desfecho é determinada pelo pesquisador,

mas é possível estimar a razão destas incidências. Então, OR é a razão de odds de exposição (possuem fator)

entre os casos (desfecho) e de odds de exposição entre os controles (não desfecho), conforme abaixo:

cb

da

db

caOR

.

.

/

/

Page 13: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

Também, pressupõe-se que valores amostrais de OR apresentam uma distribuição log-normal, que é

normalizada com a transformação logarítmica. O intervalo de confiança de OR é dado conforme abaixo:

)])[ln(.)exp(ln(2

OREPZORICOR

em que:

dcbaOREP

1111)][ln(

2

z : limite crítico bilateral da distribuição normal

Se o desfecho for raro na população (10% ou menos), o RR pode ser estimado através de OR, em

estudos de caso-controle.

Se o RR for menor que 1, indica fator de proteção para a ocorrência do desfecho. Da mesma forma, se o

intervalo de confiança não incluir o valor 1, então o achado é significativo na população.

Razão de Prevalência

É utilizada em estudos transversais, já que estes medem a prevalência, a forma do cálculo da magnitude

da RP e seu intervalo de confiança é igual ao RR, conforme abaixo:

)/(

)/(

dcc

baaRP

Então, a RP é a razão entre a prevalência de desfecho nos expostos e a prevalência de desfecho nos não-

exposto.

Para executar os comandos para calcular medidas de magnitude devemos instalar o pacote ‘Epi.’

> install.packages("epiR") Ou

Page 14: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

E ativa-lo.

> library("epiR", lib.loc="~/R/win-library/3.3") Ou

Exemplo: (Medronho, 2003) Um estudo caso-controle foi conduzido para avaliar a relação entre fatores de risco e

infarto do miocárdio (IM). A informação sobre o hábito de fumar foi coletada de um total de 789 casos e controles.

O tabagismo foi reportado por 157 dos 366 casos e 110 dos 423 controles.

a) Construa uma tabela 2x2 e calcule a medida de associação entre tabagismo e IM.

Primeiramente devemos inserir a tabela cruzada.

Inserir uma tabela 2x2 > epi<-matrix(c(157,209,110,313),nc=2) > epi [,1] [,2] [1,] 157 110 [2,] 209 313

Após poderemos calcular a medida de magnitude apropriada para o caso, lembrando que deve-se definir o delineamento do estudo conforme: Sintaxe para definir o delineamento > epi.2by2(dados,method="definir o delineamento")

cohort.count

case.control

cross.sectional

Page 15: Aula 4 - softwarelivrer.files.wordpress.com · No caso de amostras pareadas (dependentes), utiliza-se o teste de McNemar para testar a associação. > mcnemar.test(dados1) Importante

Comando para calcular medida de magnitude de associação > epi.2by2(epi,method="case.control") Outcome + Outcome - Total Prevalence * Odds Exposed + 157 110 267 58.8 1.427 Exposed - 209 313 522 40.0 0.668 Total 366 423 789 46.4 0.865 Point estimates and 95 % CIs: ------------------------------------------------------------------- Odds ratio (W) 2.14 (1.58, 2.89) Attrib prevalence * 18.76 (11.52, 26.01) Attrib prevalence in population * 6.35 (0.89, 11.81) Attrib fraction (est) in exposed (%) 53.17 (36.14, 65.75) Attrib fraction (est) in population (%) 22.83 (14.26, 30.54) ------------------------------------------------------------------- X2 test statistic: 25.006 p-value: < 0.001 Wald confidence limits * Outcomes per 100 population units

Conclusão: os dados indicam que os fumantes têm 2,14 vezes maior de desenvolver IM do que os não fumantes.

Referências

MEDRONHO, R. A. Epidemiologia. 2. ed. São Paulo: Atheney, 2003