20
Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Aula 11 : Teste Qui-Quadrado: Comparação de Várias Proporções Associação entre duas Variáveis Qualitativas Introdução à Bioestatística Turma Nutrição

Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Inferência Estatística: decidindo na presença de incerteza

Universidade Federal de Minas Gerais

Instituto de Ciências Exatas

Departamento de Estatística

Aula 11:

Teste Qui-Quadrado:

Comparação de Várias Proporções

Associação entre duas Variáveis Qualitativas

Introdução à Bioestatística – Turma Nutrição

Page 2: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Exemplo Inicial: Igualdade de Proporções

A administração de um hospital deseja verificar se luvas de três

marcas (A, B e C) são homogêneas quanto à permeabilidade a

vírus.

Para isto, realizou um experimento, no qual 240 luvas da marca A,

240 luvas da marca B e 300 luvas da marca C foram submetidas à

tensão.

Durante os testes, 151 luvas da marca A (62.9%), 134 luvas da

marca B (55.8%) e 177 luvas da marca C (59.0%) deixaram passar

vírus.

Os dados do experimento apresentam evidências estatísticas

suficientes contra a hipótese de que as três marcas possuem a

mesma permeabilidade?

H0: PA = PB = PC = P

H1: ao menos uma das permeabilidades é diferente das outras

Page 3: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Teste de Igualdade de Proporções

(mais de uma população)

Tabela de valores observados

Marca da

luva

Deixou passar vírus quando

submetida à tensão? Total

Sim Não

A 151 89 240

B 134 106 240

C 177 123 300

Total 462 318 780

Tabela de Classificação Cruzada:

Tabela 3 x 2:

3 linhas x 2 colunas

Page 4: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Marca da

luva

Deixou passar vírus quando submetida

à tensão? Total

Sim Não

A 151 89 240

B 134 106 240

C 177 123 300

Total 462 318 780

H0: PA = PB = PC = P

H1: ao menos uma das permeabilidades é diferente das outras

462ˆ780

P = 0.593 estimativa da permeabilidade comum sob H0

Page 5: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Marca da

luva

Deixou passar vírus quando submetida à tensão? Total

Sim Não

A 151 .................................... 89............................. 240

B 134..................................... 106............................... 240

C 177..................................... 123............................... 300

Total 462 318 780

Se H0 (PA = PB = PC = P) é verdadeira:

quantas luvas que deixam passar o vírus deveríamos esperar

dentre as luvas da marca A ?

E dentre as luvas da marca B ?

E da marca C ?

462ˆ780

P

(240x462/780=142.15)

(240x462/780=142.15)

(300x462/780=177.70)

(240-142.15=97.85)

(240-142.15=97.85)

(300-177.70=122.30)

Valores esperados sob H0= 0.593

Page 6: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Note que os valores esperados sob H0 são calculados como uma

função simples dos totais de linha, coluna e do total geral:

(240x462/780=142.15)

(240x462/780=142.15)

(300x462/780=177.70)

(240x318/780=97.85)

(240x318/780=97.85)

(300x318/780=122.30)

(total de linha) (total de coluna)Valor Esperado da casela

(total geral)

Marca da

luva

Deixou passar vírus quando submetida à tensão? Total

Sim Não

A 151 .................................... 89............................. 240

B 134..................................... 106............................... 240

C 177..................................... 123............................... 300

Total 462 318 780

Page 7: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Marca da

luva

Deixou passar vírus quando submetida à

tensão?

Total

Sim Não

A 151 (142.15) 89 (97.85) 240

B 134 (142.15) 106 (97.85) 240

C 177 (177.70) 123 (122.30) 300

Total 462 318 780

Tabela de Valores Observados

(esperados sob H0 entre parênteses)

Estatística de Teste = “Observado – Esperado sob H0”

Page 8: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Tabela de Valores Observados (esperados sob H0 entre parênteses)

Estatística de Teste = (151-142.15) (89-97.85)

(134-142.15) (106-97.85)

(177-177.70) (123-122.30)

2 2

22

2 2

Marca da

luva

Deixou passar vírus quando submetida à

tensão?

Total

Sim Não

A 151 (142.15) 89 (97.85) 240

B 134 (142.15) 106 (97.85) 240

C 177 (177.70) 123 (122.30) 300

Total 462 318 780

Page 9: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Tabela de Valores Observados (esperados sob H0 entre parênteses)

2 2 2

2 2 2

(151-142.15) (89-97.85) (134-142.15)Estatística de Teste =

142.15 97.85 142.15

(106-97.85) (177-177.70) (123-122.30)

97.85 177.70 122.30

+ +

+

+

+

2X 2.50

Marca da

luva

Deixou passar vírus quando submetida à

tensão?

Total

Sim Não

A 151 (142.15) 89 (97.85) 240

B 134 (142.15) 106 (97.85) 240

C 177 (177.70) 123 (122.30) 300

Total 462 318 780

Page 10: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Valores críticos para X2

O valor de X2 está perto ou longe do zero?

5 g.l.

10 g.l.

0

Valores de Referência para X2 Distribuição de Probabilidade de 2

Distribuição

Qui-quadrado

2

gl

gl: graus de liberdade

gl = (número de linhas -1) x (número de colunas -1)

Page 11: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas
Page 12: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Graus de Liberdade para o Teste Qui-Quadrado

No caso do teste Qui-quadrado, os graus de liberdade da

distribuição de referência equivalem ao

número de caselas livres na tabela

Tabela 2 x 2: 1 casela livre

Grupos Respostas Total

Sim Não

A 151 89 240

B 134 106 240

Total 285 195 480

G.L. = (número de linhas -1) x (número de colunas -1)

No exemplo das luvas: Tabela 3 x 2 G.l. = (3-1) x (2-1) = 2 x 1 = 2

Page 13: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

No exemplo das luvas Valor P = P[χ22> 2.50]

2.50

Valor-p = P[χ22 > 2.50] > 0.25 (>0.05) Não se rejeita H0 para =0.05.

Conclusão: os dados do experimento não mostraram evidências estatísticas

suficientes (=0.05) para a rejeição da hipótese de que as permeabilidades

das luvas das três marcas são iguais.

Valor P = P(obter um valor de X2obs “mais extremo” do que

o valor observado quando H0 é verdadeira)

X2obs

Valor P

Valor P = P[χ2gl > X2

obs]

Page 14: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Teste Qui-Quadrado para Homogeneidade de Proporções

H0: As proporções de sucesso são homogêneas para todas as populações

Ha: Ao menos uma população tem proporção de sucesso diferente das demais

22

1

( )cN

i iobs

i i

O EX

E

L = número de linhas

C = número de colunas

Nc = LxC: número de caselas da tabela

i = 1, 2, 3, …, NC representa cada casela

Oi é o valor observado na casela i

Ei é o valor esperado na casela i

(total de linha) (total de coluna)

(total geral)iE

Valor P = P[χ2gl> X2

obs], onde g.l. = (l-1) x (c-1)

Rejeita-se H0 ao nivel de significância α se valor-p < α.

Page 15: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Teste Qui-Quadrado de Independência

Variável B

Variável A B1 B2 .... Bc Total

A1

A2

A3

AL

Total n

Os n indivíduos de uma amostra são classificados segundo duas

variáveis qualitativas (variável A e variável B):

Page 16: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Cor dos

cabelos

Cor dos olhosTotal

Verde Cinza Azul Castanho

Preto 5 15 20 68 108

Castanho 29 54 84 119 286

Ruivo 14 14 17 26 71

Loiro 16 10 94 7 127

Total 64 93 215 220 592

Exemplo: Distribuição de 592 estudantes de uma universidade

segundo as variáveis cor dos cabelos e cor de olhos.

Pergunta: Existe associação entre a cor de olhos e a cor dos

cabelos de uma pessoa?

Distribuição % das cores de olhos é igual em cada cor de cabelo (e vice-

versa)?

Tabela 4 x 4

Page 17: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

4,63

10,14

19,72

12,60

13,89

18,88

19,72

7,87

18,52

29,37

23,94

74,02

62,96

41,61

36,62

5,51

0,00 10,00 20,00 30,00 40,00 50,00 60,00 70,00 80,00 90,00 100,00

Preto

Castanho

Ruivo

Loiro

Verde

Acinzentado

Azul

Castanho

Distribuição de frequências da cor de olhos

segundo cor dos cabelos

Page 18: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Distribuição de frequências da cor de cabelos

segundo cor de olhos

7,8116,13

9,30

30,91

45,31

58,06

39,07

54,09

21,88

15,05

7,91

11,8225,00

10,75

43,72

3,18

0,00

10,00

20,00

30,00

40,00

50,00

60,00

70,00

80,00

90,00

100,00

Verde Acinzentado Azul Castanho

Loiro

Ruivo

Castanho

Preto

Page 19: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

Valores observados na amostra (valores esperados sob H0):

H0: não existe associação cor de olhos e a cor dos cabelos. (Use α=0.01)

Verde Cinza Azul Castanho TOTAL

Preto 5 15 20 68 108

11.68 16.97 39.22 40.14

Castanho 29 54 84 119 286

30.92 44.93 103.87 106.28

Ruivo 14 14 17 26 71

7.68 11.15 25.79 26.39

Loiro 16 10 94 7 127

13.73 19.95 46.12 47.20

TOTAl 64 93 215 220 592

X2 = 138.29 GL = 9 valor-p = 0.000

Valor-p < 0.01 rejeita-se H0

Conclusão: existe associação entre a cor de olhos e a cor dos cabelos.

Page 20: Inferência Estatística - Departamento de Estatísticaedna/bionutri/NUT-Aula11.pdf · Inferência Estatística: decidindo na presença de incerteza Universidade Federal de Minas

H0: Variável A não está associada à Variável B (A e B são independentes)

HA: Variável A está associada à Variável B (A e B não são independentes)

22

1

( )cN

i iobs

i i

O EX

E

L = número de linhas

C = número de colunas

Nc = LxC: número de caselas da tabela

i = 1, 2, 3, …, NC representa cada casela

Oi é o valor observado na casela i

Ei é o valor esperado na casela i

(total de linha) (total de coluna)

(total geral)iE

Valor P = P[χ2gl> X2

obs], onde g.l. = (l-1) x (c-1)

Teste Qui-Quadrado para Independência

Rejeita-se H0 ao nivel de significância α se valor-p < α.