Upload
barbara-delgado-peixoto
View
235
Download
5
Embed Size (px)
Citation preview
CAPÍTULO 5CAPÍTULO 5
Associação entre duas variáveis:
análise bidimensional
Associação entre duas variáveisAssociação entre duas variáveis
- g rá fic o d e b arras- p rop orç õ es- q u i-q u ad rad o
am b asq u a lita t ivas
- d iag ram a d e d is p ers ã o- coe fic ien te d e c o rre laçã o
am b asq u an tita t ivas
- g rá fico d e m é d ias- b ox-p lo t- tes tes d e m é d ias- tes tes n ã o p aram é tricos
u m a q u an tita tivaou tra q u a lita t iva
N a tu reza d asV ariá ve is
Ambas QualitativasAmbas Qualitativas• Tabela de freqüências: tabelas de dupla entrada “crosstabs” : % por linha, % por coluna, % total
• Gráfico apropriado: gráfico de barras duplas
• Parâmetros a serem comparados: proporções
• Medidas a serem calculadas: qui-quadrado (associação); Kappa (concordância), sensibilidade e especificidade (padrão ouro)
ExemploExemploPara os dados da Feira de Informação profissional da UFES, foram testadas as associações estatisticamente significantes entre pares de variáveis qualitativas.
- Tabelas cruzadas- Gráfico de barras- teste de hipóteses: Foram feitos testes 2 e o teste exato de Fisher (o apropriado em cada caso).
Exemplo 1Exemplo 1Área x Sexo
58 14 7239,2% 6,2% 19,3%
63 135 19842,6% 59,7% 52,9%
27 77 10418,2% 34,1% 27,8%
148 226 374100,0% 100,0% 100,0%
Freqüência% SexoFreqüência% SexoFreqüência% SexoFreqüência% Sexo
Exatas
Humanas
Biomédicas
Área
Total
Masculino Feminino
Sexo
Total
58 14 72
80,6% 19,4% 100,0%
39,2% 6,2% 19,3%
15,5% 3,7% 19,3%
63 135 198
31,8% 68,2% 100,0%
42,6% 59,7% 52,9%
16,8% 36,1% 52,9%
27 77 104
26,0% 74,0% 100,0%
18,2% 34,1% 27,8%
7,2% 20,6% 27,8%
148 226 374
39,6% 60,4% 100,0%
100,0% 100,0% 100,0%
39,6% 60,4% 100,0%
Exatas
Humanas
Biomédicas
Se respondeu não napergunta anterior. Játomou decisão sobre aárea?
Total
Masculino Feminino
Sexo
Total
Exemplo 1Exemplo 1
0
10
20
30
40
50
60
exata humana biomedica
masculinofeminino
Exemplo 2Exemplo 2Turno x Sexo
100 165 26567,6% 70,2% 69,2%
9 19 286,1% 8,1% 7,3%
27 31 5818,2% 13,2% 15,1%
12 20 328,1% 8,5% 8,4%148 235 383
100,0% 100,0% 100,0%
Freqüência% SexoFreqüência% SexoFreqüência% SexoFreqüência% SexoFreqüência% Sexo
Manhã
Tarde
Noite
Integral
Qual seria oturno de suapreferência paraestudar naUFES?
Total
Masculino Feminino
Sexo
Total
Exemplo 2Exemplo 2
manhã tarde noite integral
masculinofeminino0
20
40
60
80
masculinofeminino
Exemplo 3Exemplo 3
teste 1: nhh * teste 2: hbc Crosstabulation
Count
133 7 14026 153 179
159 160 319
não anêmicoanêmico
teste 1:nhh
Total
nãoanêmico anêmico
teste 2: hbc
Total
Kappa = 0,793; p = 0,000 (***)(***) p < 0,001
Ambas QuantitativasAmbas Quantitativas
- diagrama de dispersão
- covariância
- coeficiente de correlação
Diagrama de DispersãoDiagrama de Dispersão
O instrumento adequado para o estudo gráfico da associação entre duas variáveis quantitativas é o Diagrama de Dispersão.
É construído em um eixo cartesiano. O procedimento de construção consiste em escolher de forma conveniente as variáveis que serão plotadas no eixo horizontal(x) e no eixo vertical(y).
Diagrama de DispersãoDiagrama de Dispersão
543210-1-2-3-4
15
10
5
0
Eixo Horizontal
Eixo
Ver
tical
Diagrama de Dispersão
Diagrama de DispersãoDiagrama de Dispersão
Um diagrama de dispersão apresenta correlação positiva entre as variáveis quando, à medida que x aumenta, y também aumenta; a correlação negativa ocorre quando, à medida que x aumenta y diminui e vice-versa. Dependendo da dispersão dos pontos plotados esta correlação pode ser forte ou moderada. Duas variáveis não apresentarão relacionamento quando a nuvem de pontos tem a forma de um círculo.
CovariânciaCovariânciaA covariância é uma medida que resume a tendência e a força da relação linear entre duas variáveis.
Covariância entre X e Y: Covar(X,Y)
1/(n-1) *{ Soma [(X - média(X))*(Y - média(Y))]}
Propriedades da CovariânciaPropriedades da Covariância
• As duas variáveis devem ter o mesmo número de valores;
•A covariância é a média dos produtos dos desvios das duas variáveis, obtida como resultado de dividir a soma dos produtos dos desvios pela quantidade de valores das variáveis menos 1;
•A covariância pode assumir qualquer valor do conjunto dos números reais: = 0, > 0 e < 0.
Coeficiente de CorrelaçãoCoeficiente de CorrelaçãoPara facilitar a relação entre duas variáveis e evitar a unidade de medida da covariância, foi definido o coeficiente de correlação corr(X,Y) ou r(X,Y) como:
r(X,Y) = covar(X,Y) / [DP(X)*DP(Y)]
Propriedades da CorrelaçãoPropriedades da Correlação• Os valores de r(X,Y) estão limitados entre -1 e +1;
• É um valor único para a população ou amostra, tomando o cuidado de utilizar dados coerentes. Ex.: medir associação entre o número de cegonhas e números de bebês nascidos por ano;
• O coeficiente de correlação de uma variável com ela mesma é igual a 1;
IMPORTANTE!!!!IMPORTANTE!!!!
O COEFICIENTE DE CORRELAÇÃO NÃO DETERMINA UMA RELAÇÃO DE CAUSA E EFEITO. É UMA MEDIDA DE TENDÊNCIA E DA FORÇA DA RELAÇÃO LINEAR ENTRE AS VARIÁVEIS X E Y.
RELAÇÃO DE CAUSA E EFEITO: MODELOS DE REGRESSÃO!
Tabelas de correlaçõesTabelas de correlações
É uma matriz de diagonal principal 1 e simétrica.
r(X,Y) = r (Y,X).
Usada com um conjunto grande de variáveis.
Tabelas de correlaçõesTabelas de correlações
Pressão (mbar)
Umidade (%)
Radiação (W/m2)
Vel. vento (m/s)
r = 0,346r = 0,346
IDADE
7060504030
Col
este
rol
500
400
300
200
100
r = - 0,486r = - 0,486
Vegetação
5,55,04,54,03,53,02,52,01,5
Mac
hos
8
6
4
2
0
-2
r = 0,788r = 0,788
Total Noite
50403020100
Tota
l Dia
70
60
50
40
30
20
10
0
Quantitativa e qualitativaQuantitativa e qualitativa
- gráficos box-plot e gráficos de médias
- os parâmetros a serem comparados são médias, medianas, desvios padrões
- fazer tabelas das medidas em cada grupo da variável qualitativa (fatores)
- em geral, a variável de estudo é a variável quantitativa
- fazer testes de hipóteses apropriados
Exemplo 1Exemplo 1
Estudar as concentrações de metais (variável quantiativa) em ostras e sururus (fator espécie) medidas em diferentes locais (fator estuário) e em diferentes períodos (fator estação)
Fator estaçãoFator estação
12061127106N =
Estação
invernooutonoverãoprimavera
Méd
ia +
- 1
Des
vio
Padr
ão -
FE
300
200
100
0
-100
Fator estaçãoFator estação
12061127106N =
Estação
invernooutonoverãoprimavera
FE600
500
400
300
200
100
0
-100
Fator espécieFator espécie
192222N =
Espécie
SUOS
Méd
ia +
- 1
Des
vio
Padr
ão -
FE
400
300
200
100
0
Fator espécieFator espécie
192222N =
Espécie
SUOS
FE600
500
400
300
200
100
0
-100
Fator estuárioFator estuário
147131126N =
Estuário
SMBUAR
Méd
ia +
- 1
Des
vio
Padr
ão -
FE
300
200
100
0
Fator estuárioFator estuário
147131126N =
Estuário
SMBUAR
FE600
500
400
300
200
100
0
-100
Exemplo 2: TartarugasExemplo 2: Tartarugas
Comparar o número de ninhos de tartarugas (variável quantitativa) em diferentes praias (variável qualitativa).
Foi realizada uma Análise de Variância para verificar se há diferença entre os Números de Ninhos nas diferentes praias.
Exemplo 2: TartarugasExemplo 2: Tartarugas
Estatísticas Descritivas
Ninho=CD
14 9,57 3,11 4 1514 5,14 2,51 2 1116 5,44 3,39 0 1116 11,50 6,03 1 2660 7,95 4,83 0 26
PNTUANTTTotal
N MédiaDesvioPadrão Mínimo Máximo
Exemplo 2: TartarugasExemplo 2: Tartarugas
16161414N =
Praias
TTANTUPN
Méd
ia +
- 1
Des
vio
Padr
ão20
10
0