48
DELINEAMENTOS DELINEAMENTOS CORRELACIONAIS CORRELACIONAIS Stephanie Santana Pinto Stephanie Santana Pinto

DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Embed Size (px)

Citation preview

Page 1: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

DELINEAMENTOS DELINEAMENTOS

CORRELACIONAISCORRELACIONAIS

Stephanie Santana PintoStephanie Santana Pinto

Page 2: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

O que a pesquisa correlacional investiga?

Investiga o grau do relacionamento entre duas variáveis ou mais.

Page 3: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

Avaliar se existe Avaliar se existe ASSOCIAÇÃO ASSOCIAÇÃO entre entre

duas características quantitativas é objetivo duas características quantitativas é objetivo

de muitos estudos em ciências da saúde!de muitos estudos em ciências da saúde!

Por exemplo...Por exemplo...

* Quando se pode demonstrar que duas variáveis

quantitativas variam juntas, diz-se que as mesmas estão

correlacionadas.

Page 4: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

Existe correlação entre o tempo dedicado ao estudo e o desempenho dos alunos em determinada disciplina?

N = 8 alunosN = 8 alunos x (horas)x (horas) y (nota)y (nota)

AA 88 1010

BB 77 88

CC 66 44

DD 33 88

EE 33 66

FF 66 99

GG 55 77

HH 22 44

Page 5: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

Diagrama de dispersão

Para avaliar a correlação entre características

quantitativas → dados representados em gráfico

cartesiano de pontos → diagrama de pontos ou diagrama

de dispersão.

0

2

4

6

8

10

12

0 2 4 6 8 10

Horas de estudo (x)

No

ta (

y)

Page 6: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

Diagrama de dispersão

Para avaliar a correlação entre características

quantitativas → dados representados em gráfico

cartesiano de pontos → diagrama de pontos ou diagrama

de dispersão.

0

2

4

6

8

10

12

0 2 4 6 8 10

Horas de estudo (x)

No

ta (

y)

Page 7: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

Diagrama de dispersão

Para avaliar a correlação entre características

quantitativas → dados representados em gráfico

cartesiano de pontos → diagrama de pontos ou diagrama

de dispersão.

0

2

4

6

8

10

12

0 2 4 6 8 10

Horas de estudo (x)

No

ta (

y)

Page 8: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

Diagrama de dispersão

Para avaliar a correlação entre características

quantitativas → dados representados em gráfico

cartesiano de pontos → diagrama de pontos ou diagrama

de dispersão.

0

2

4

6

8

10

12

0 2 4 6 8 10

Horas de estudo (x)

No

ta (

y)

Associação não é perfeita!

Page 9: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

Coeficiente de correlação produto-momento (r)

Outra forma de se avaliar a correlação é usar um

COEFICIENTE, que tem a vantagem de ser um número

puro, o qual é independente da unidade de medida das

variáveis.

** Medida da intensidade de associação entre 2 variáveis Medida da intensidade de associação entre 2 variáveis

quantitativas!quantitativas!

Fórmula de cálculo proposta por Karl Pearson em 1896 →

coeficiente de correlação de Pearson!

Page 10: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

Variação no coeficiente de correlação

O coeficiente de correlação pode variar entre -1 e +1!

Page 11: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Quando não existe correlação entre x e y → pontos se

distribuem em nuvens circulares!

Associações de grau intermediário apresentam nuvens

inclinadas elípticas → mais estreitas maior a correlação!

Page 12: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Nuvem elíptica paralela a um dos eixos do gráfico, a

correlação é nula!

Pontos formam nuvem cujo eixo principal é uma curva →

r não mede corretamente a associação entre as variáveis!

Page 13: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

Teste de hipóteses sobre a correlação

Raciocínio do teste

Quando se calcula o coeficiente r em uma amostra

Estimando associação verdadeira entre x e y existente

na população!

Exemplo da correlação entre horas de estudo e nota

da prova, foi obtido um r = 0,58.

Entretanto...

Não existe a certeza de que na população de alunos haja,

efetivamente, correlação entre horas de estudo e nota na prova,

pois foi estudada apenas uma parte da população!

Page 14: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

Para realizar um teste de hipóteses sobre a

existência de correlação, usa-se um raciocínio análogo

ao dos testes de hipóteses sobre médias.

Além disso...

Avaliar significância do coeficiente de correlação

Testa-se a H0!

Utilizando para tanto a distribuição t.

Page 15: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

Etapas do teste de hipóteses da correlação

(1) Elaboração das hipóteses

H0: ρ = 0

HA: ρ ≠ 0

(2) Escolha do nível de significância

α = 0,05

(3) Determinação do valor crítico do teste:

tα;gl = t0,05;6 = 2,447 (gl = n – 2, n é o número de pares de valores x,y)

(4) Determinação do valor calculado de t:

tcalc = tcal = 1,74 para r = 0,58

(5) Como tcal = 1,74 < t0,05;6 = 2,45, não se rejeita H0

r√1 – r2

n - 2

Page 16: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

(6) Conclusão:

Não existe evidência de correlação entre tempo dedicado ao

estudo e o desempenho obtido na prova. O valor de r foi

casual.

Correlação linear simplesCorrelação linear simples

Suponha que existam razões para se acreditar que

essa conclusão não espelha a realidade. Como interpretar o

resultado obtido?

* Teste estatístico não apóia a existência de correlação

populacional, isso pode ser explicado:

- Não existe correlação entre x e y e o valor de r foi um

resultado casual;

- Existe correlação entre x e y, entretanto não foi possível

mostrar esta associação pelo pequeno tamanho da amostra.

Page 17: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

Avaliação qualitativa de r quanto à intensidade

rr A correlação é ditaA correlação é dita

00 NulaNula

0 – 0,30 – 0,3 FracaFraca

0,3 ├ 0,60,3 ├ 0,6 RegularRegular

0,6 ├ 0,90,6 ├ 0,9 ForteForte

0,9 ├ 10,9 ├ 1 Muito ForteMuito Forte

11 Plena ou perfeitaPlena ou perfeita

Page 18: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

Coeficiente de determinação

É o quadrado do coeficiente de correlação e informa

que fração da variabilidade de uma característica é

explicada estatisticamente pela outra variável.

r2 = 0,64

Durante caminhada na água, Durante caminhada na água,

64% da variação que se 64% da variação que se

observa na amostra em relação observa na amostra em relação

a FC explica-se porque a a FC explica-se porque a

mesma amostra varia também mesma amostra varia também

em relação ao VOem relação ao VO22!!

Page 19: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

Requisitos ao estudo da correlação (Pearson)

Tanto a variável x quanto a y têm distribuição normal;

O grau de variação em torno dos diferentes valores de

x e y é o mesmo (homocedasticidade);

Coeficiente de correlação mede uma ASSOCIAÇÃO ASSOCIAÇÃO e não um

relação de causa e efeito!

Page 20: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Correlação linear simplesCorrelação linear simples

SSE x VO2

r2 = 0,14556

8

10

12

14

16

18

20

0,6 0,8 1 1,2 1,4 1,6 1,8

VO2 (l.min-1)

SS

E

r = 0,432

p = 0,012

Coeficiente de correlação de Spearman

* Variáveis medidas em escala ordinal;

* Variáveis quantitativas não satisfazem as exigências para o

teste de correlação de Pearson (distribuição normal).

Page 21: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Reprodução de uma medida (dias diferentes) e Repetição de uma medida

(mesmo dia)

RMS rectus femoris in water and on dry land

0

50

100

150

200

250

300

0 50 100 150 200 250 300

RMS RF water (mV)

RM

S R

F d

ry l

and

(m

V)

p = 0.001 ICC = 0.924

Page 22: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Reprodução de uma medida (dias diferentes) e Repetição de uma medida

(mesmo dia)

Force production of hip flexors in water and on dry land

0,91

1,11,21,31,41,51,61,71,8

1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8

Log10 HFL water

Lo

g10

HF

L d

ry l

and

ICC = 0.920 p < 0.001

Page 23: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto
Page 24: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear simplesRegressão linear simplesAplica-se àquelas situações em que há razões

para supor uma relação de causa-efeito entre duas

variáveis quantitativas e se deseja expressar

matematicamente essa relação.

Chama-se...Chama-se...

y depende de x (coloquial)y depende de x (coloquial) y é função de x (matemática)y é função de x (matemática)

Existe regressão de y sobre x (estatística)Existe regressão de y sobre x (estatística)

Page 25: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear simplessimples

Em um estudo de regressão...Em um estudo de regressão...

Valores da variável independente (x) geralmente são escolhidos;

Para cada valor escolhido observa-se o valor de y correspondente!

Por exemplo...Por exemplo...

Estudar a forma pela qual a PA depende da idade. Estudar a forma pela qual a PA depende da idade.

Estudar indivíduos com x = 30, 35, 40, 45, etc., anos de idade e Estudar indivíduos com x = 30, 35, 40, 45, etc., anos de idade e

então medir suas PA. Para que resultados sejam fidedignos, então medir suas PA. Para que resultados sejam fidedignos,

indivíduos deverão ser sorteados de uma subpopulação com indivíduos deverão ser sorteados de uma subpopulação com

idades correspondentes.idades correspondentes.

Page 26: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear simplessimples

Avaliar possível dependência de y em relação a x;

Expressar matematicamente esta relação (equação).

Análise de regressão simples

Descrevem fenômenos em que há uma variável independente!

Page 27: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear simplessimples

A reta de regressão linearA reta de regressão linear

A equação da reta pode ser dada por:

y = A + Bxy = A + Bx

onde

y = variável dependente;

A = coeficiente linear (valor de y quando x = 0)

B = coeficiente angular (inclinação da reta)

x = variável independente

Page 28: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear simplessimples

Obtenção da reta de regressãoObtenção da reta de regressão

Mais comum é estudar a regressão entre x e y

utilizando uma amostra da população. Os valores a e b

(estimativas dos valores A e B) são obtidos pelo método dos

mínimos quadrados.

Garante que reta obtida é aquela que se tem as menores Garante que reta obtida é aquela que se tem as menores

distâncias entre os valores observados (x) e a própria reta!distâncias entre os valores observados (x) e a própria reta!

Page 29: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear simplessimples

Teste de significância da regressão

Raciocínio do teste

Quando não existe dependência de y em relação a x, o

coeficiente de regressão populacional, B, é igual a zero.

No entanto, valores de b obtidos em amostras

aleatórias da população devem variar, ao acaso, ao redor do

zero.

Page 30: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Etapas do teste de hipóteses da regressão

(1) Elaboração das hipóteses

H0: B = 0

HA: B ≠ 0

(2) Escolha do nível de significância

α = 0,05

(3) tcal > t0,05, rejeita-se H0

(4) Admite-se que existe regressão de y sobre x (α = 0,05)

Regressão linear Regressão linear simplessimples

Page 31: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear simplessimples

Utilidades da reta de regressão

A reta de regressão permite:

Representar a dependência de uma variável quantitativa em

relação à outra por meio de uma equação simples;

Prever valores para variável dependente y de acordo com

valores determinados (inclusive não-observados) da variável

independente x.

Page 32: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear simplessimples

Requisitos ao uso da regressão linear

A variável y deve ter distribuição normal ou

aproximadamente normal;

O grau de variação em torno dos diferentes valores de

x e y é o mesmo (homocedasticidade);

Pontos do gráfico devem apresentar uma tendência

linear;

Valores de y foram obtidos ao acaso da população e

são independentes um dos outros;

Variável x medida sem erro. Pressupor que os erros

ao se medir x são desprezíveis.

Page 33: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear simplessimples

Exemplo prático

Pode-se concluir que a RPE

depende da FC da seguinte forma:

Para cada valor de FC (x)Para cada valor de FC (x)

Estima-se um índice de esforço Estima-se um índice de esforço

percebido (y)!percebido (y)!r2 = 0,99

Page 34: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear múltiplaRegressão linear múltiplaConsiste em...Consiste em...

Uso de mais do que uma variável independente usualmente Uso de mais do que uma variável independente usualmente

aumenta a precisão da predição!aumenta a precisão da predição!

Page 35: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear múltiplamúltipla

Coeficiente de correlação múltipla (r) Coeficiente de correlação múltipla (r)

Indica a relação entre o fenômeno estudado e a soma de

diferentes pesos das variáveis independentes (explicativas)!

Coeficiente de determinação (RCoeficiente de determinação (R22) )

Quantidade de variância do fenômeno que é explicada ou

considerada pelas variáveis independentes (explicativas)

combinadas!

Page 36: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear múltiplamúltipla

Deseja-se encontrar a melhor combinação de

variáveis que darão a predição mais precisa do fenômeno!

Quanto cada variável independente contribui para a

variação total explicada!

Existem vários procedimentos de seleção utilizados para Existem vários procedimentos de seleção utilizados para

esse propósito.esse propósito.

Page 37: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear múltiplamúltipla

Regressão múltipla de seleção progressiva (stepwise)

Uma nova variável independente (explicativa) é adicionada a Uma nova variável independente (explicativa) é adicionada a

cada passo.cada passo.

Primeira variável selecionada é aquela que tem a maior

correlação com o fenômeno.

Cada passo subseqüente uma variável é Cada passo subseqüente uma variável é

adicionada àquela, com uma ou mais já escolhidas, adicionada àquela, com uma ou mais já escolhidas,

resultando em uma melhor predição!resultando em uma melhor predição!

Page 38: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear múltiplamúltipla

É importante ressaltar que para adicionar variáveis

independentes no modelo, as mesmas não devem apresentar

relações entre elas, pois podem prejudicar na predição!

Regressão múltipla de seleção progressivaRegressão múltipla de seleção progressiva

Variáveis são introduzidas conforme a sua importância e

processo pára quando não existe mais uma contribuição

significativa para predição!

Page 39: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear múltiplamúltipla

Regressão múltipla de seleção regressiva (enter)

Variáveis independentes são eliminadas por sua falta de Variáveis independentes são eliminadas por sua falta de

importância para explicar o fenômeno estudado!importância para explicar o fenômeno estudado!

Isto é...Isto é...

Inicia-se testando o modelo de predição com todas

variáveis independentes e de acordo com os seus respectivos

graus de significância, excluem-se aquelas variáveis que não

contribuem para predição e conseqüentemente explicação do

fenômeno.

Page 40: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear múltiplamúltipla

Método do R quadrado máximo

Melhor de todos os modelos possíveis de uma

única variável é selecionado, assim como o melhor

modelo de duas variáveis, o melhor modelo de três

variáveis e assim por diante.

Modelo avaliado de acordo com o valor de RModelo avaliado de acordo com o valor de R22!!

Page 41: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear múltiplamúltipla

Procedimento de regressão gradativa

Variação da técnica progressiva, exceto pelo fato de que

cada vez que uma nova variável independente é introduzida no

modelo é reavaliado se as variáveis que já estão no mesmo

continuam contribuindo significativamente para explicação do

fenômeno.

Maioria dos casos...

Page 42: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear múltiplamúltipla

Equações de predição de regressão múltipla

A equação de predição da regressão múltipla é

basicamente aquela do modelo de regressão de duas

variáveis, y = A + Bx. Única diferença é que existe mais do

que uma variável x:

y = A + By = A + B11xx1 1 +B+B22xx2 2 + ... + B+ ... + Biixxii

Page 43: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear múltiplamúltipla

Page 44: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto
Page 45: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear múltiplamúltipla

Page 46: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

Regressão linear Regressão linear múltiplamúltipla

Page 48: DELINEAMENTOS CORRELACIONAIS Stephanie Santana Pinto

0,01*0,01*±15,70±15,70132,80132,80± 14,80± 14,80118,00118,00FC (bpm)FC (bpm)

0,002*0,002*±28,40±28,40148,40148,40± 25,20± 25,20102,40102,40GE (kcal)GE (kcal)

0,002*0,002*± 0,90± 0,904,604,60± 0,80± 0,803,203,20GE (kcal GE (kcal .. min min-1-1))

0,002*0,002*± 2,80± 2,8015,5015,50± 2,70± 2,7010,7010,70VOVO22 (ml (ml .. kg kg-1 .-1 . min min-1-1))

0,002*0,002*± 0,18± 0,180,920,92± 0,16± 0,160,630,63VOVO22 (l (l .. min min-1-1))

Sig.Sig.DPDPMédiaMédiaDPDPMédiaMédia

IntervaladoIntervaladoContínuoContínuo