19
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br Professor Mauricio Lutz 1 CORRELAÇÃO Em muitas situações, torna-se interessante e útil estabelecer uma relação entre duas ou mais variáveis. A matemática estabelece vários tipos de relações entre variáveis, por exemplo, as relações funcionais e as correlações. Relações Funcionais São relações matemáticas expressas por sentenças matemáticas, como por exemplo: • Área do retângulo (A=a.b) é a relação entre os lados do retângulo; • Densidade de massa (dm= m/v) é a relação entre a massa e o volume de um corpo; • Perímetro de uma circunferência (C=2πR) é a relação entre o comprimento da circunferência e o valor do raio. Relações Estatísticas e Correlações São relações estabelecidas após uma pesquisa. Com base nos resultados da pesquisa, são feitas comparações que eventualmente podem conduzir (ou não) à ligação entre as variáveis. Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de uma pessoa e o número de viagens por ela realizado. No estudo estatístico, a relação entre duas ou mais variáveis denomina- se correlação. A utilidade e importância das correlações entre duas variáveis podem conduzir à descoberta de novos métodos, cujas estimativas são vitais em tomadas de decisões. Em outras palavras quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe correlação entre elas. 1) Diagrama de dispersão O diagrama de dispersão é um gráfico cartesiano em que cada um dos eixos corresponde às variáveis correlacionadas. A variável dependente (Y) situa-se no eixo vertical e o eixo das abscissas é reservado para a variável independente (X). Os pares ordenados formam uma nuvem de pontos. A configuração geométrica do diagrama de dispersão pode estar associada a uma linha reta (correlação linear), uma linha curva (correlação curvilínea) ou, ainda, ter

Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

  • Upload
    lexuyen

  • View
    219

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

1

CORRELAÇÃO

Em muitas situações, torna-se interessante e útil estabelecer uma

relação entre duas ou mais variáveis. A matemática estabelece vários tipos de

relações entre variáveis, por exemplo, as relações funcionais e as correlações.

Relações Funcionais

São relações matemáticas expressas por sentenças matemáticas, como

por exemplo:

• Área do retângulo (A=a.b) é a relação entre os lados do retângulo;

• Densidade de massa (dm= m/v) é a relação entre a massa e o volume de um

corpo;

• Perímetro de uma circunferência (C=2πR) é a relação entre o comprimento da

circunferência e o valor do raio.

Relações Estatísticas e Correlações

São relações estabelecidas após uma pesquisa. Com base nos

resultados da pesquisa, são feitas comparações que eventualmente podem

conduzir (ou não) à ligação entre as variáveis.

Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a

classe social de uma pessoa e o número de viagens por ela realizado.

No estudo estatístico, a relação entre duas ou mais variáveis denomina-

se correlação. A utilidade e importância das correlações entre duas variáveis

podem conduzir à descoberta de novos métodos, cujas estimativas são vitais em

tomadas de decisões.

Em outras palavras quando duas variáveis estão ligadas por uma

relação estatística, dizemos que existe correlação entre elas.

1) Diagrama de dispersão

O diagrama de dispersão é um gráfico cartesiano em que cada um dos

eixos corresponde às variáveis correlacionadas. A variável dependente (Y) situa-se

no eixo vertical e o eixo das abscissas é reservado para a variável independente

(X). Os pares ordenados formam uma nuvem de pontos.

A configuração geométrica do diagrama de dispersão pode estar associada a uma

linha reta (correlação linear), uma linha curva (correlação curvilínea) ou, ainda, ter

Page 2: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

2

os pontos dispersos de maneira que não definam nenhuma configuração linear;

nesta última situação, não há correlação.

Correlação Linear Correlação Curvilínea

2) Correlação Linear

Correlação linear é uma correlação entre duas variáveis, cujo gráfico

aproxima-se de uma linha. É uma linha de tendência, porque procura acompanhar

a tendência da distribuição de pontos, que pode corresponder a uma reta ou a uma

curva. Por outro lado, é, também, uma linha média, porque procura deixar a mesma

quantidade de pontos abaixo e acima da linha.

Correlação linear positiva Correlação linear negativa

Não há correlação

Para definir se a correlação entre as variáveis corresponde a uma linha

reta ou a uma curva, pode-se utilizar modos qualitativos ou quantitativos.

No modo qualitativo, vai imperar o “bom senso” do pesquisador para

verificar qual o grau de intensidade na correlação entre as variáveis; isso significa o

estabelecimento de uma relação numérica que medirá o nível da correlação.

0

50

100

0 5 10

0

50

100

0 5 10

Page 3: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

3

3) Coeficiente de Correlação Linear

O instrumento empregado para a medida da correlação linear é o

coeficiente de correlação. Este coeficiente deve indicar o grau de intensidade de

correlação entre duas variáveis e, ainda, o sentido dessa correlação (positiva ou

negativa). Uma das formas de medir o coeficiente de correlação linear foi

desenvolvido por Pearson e recebe o nome de coeficiente de correlação de

Pearson. O coeficiente de correlação de Pearson mede o grau de ajustamento dos

valores em torno de uma reta.

Coeficiente de Correlação de Pearson (r):

( )( )( )[ ] ( )[ ]2222 .

.

ååååååå--

-=

iiii

iiii

yynxxn

yxyxnr

onde temos:

r é o coeficiente de Pearson;

né o número de observações;

ix é a variável independente;

iy é a variável dependente.

O valor do coeficiente de correlação r tem a variação entre +1 e –1, ou

seja, está limitado entre os valores do Intervalo[–1,+1].

• r = +1 (correlação positiva entre as variáveis);

• r = –1 (correlação perfeita negativa entre as variáveis);

• r = 0 (não há correlação entre as variáveis ou, ainda, a correlação não é linear,

caso exista).

Quanto mais próximo o valor de r estiver do valor “1”, mais forte a

correlação linear.

Quanto mais próximo o valor de r estiver do valor “0”, mais fraca a

correlação linear.

Em geral, multiplica-se o valor de r por 100; dessa forma, o resultado

passa a ser expresso em porcentagem. Na prática, estabelecem-se critérios para

verificar os diversos níveis do fraco ao forte, chegando até o perfeito:

• 0 < |r| < 0,3 : a correlação é fraca e fica difícil estabelecer relação entre as

variáveis. Em porcentagem: 0% < |r| < 30%;

Page 4: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

4

• 0,3 ≤ |r| < 0,6 : a correlação é fraca, porém, podemos considerar a existência de

relativa correlação entre as variáveis. Em porcentagem: 30% ≤ |r| < 60%;

• 0,6 ≤ |r| < 1 : a correlação é de média para forte; a relação entre as variáveis é

significativa, o que permite coerência com poucos conflitos na obtenção das

conclusões. Em porcentagem: 60% ≤ |r| ≤ 100%.

4) Teste de hipótese para a existência de correlação

Para aplicar o teste de hipótese para existência de correlação linear, é

necessário que as variáveis populacionais (X, Y) tenham distribuição normal

bivariada. Quando as amostras forem superiores a 30, a hipótese de normalidade

das duas variáveis é razoavelmente atendida.

O coeficiente de correlação linear da população (X, Y) é designado ρ (ler

Rô). Se o teste indicar a rejeição da hipótese 0=r , poderemos concluir que existe

correlação entre as variáveis ao nível de significância admitido. Eis o procedimento

para realizar o teste:

(1) H0: 0=r

H1: 0¹r

(2) Fixar ∝ e escolher uma distribuição t de Student com 2-= nj graus

de liberdade.

(3) Determinar as regiões de rejeição e aceitação para H0, com auxilio

da tabela t de Student.

(4) Calculo do valor da variável: 21

2

r

nrtcal

-

-=

(5) Conclusão:

Page 5: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

5

Se 2

attcal > ou 2

attcal -> , rejeita-se H0, concluindo, com risco ∝, que há

correlação entre as variáveis.

Se 22

aa ttt cal ££- , não se pode rejeita-se H0, concluindo que há

correlação entre as variáveis.

Exemplos: a) Uma pesquisa pretende verificar se há correlação significativa entre o

peso total do lixo descartado, por dia, numa empresa com o peso do papel contido

nesse lixo.

Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10

Peso total 10,47 19,85 21,25 24,36 27,38 28,09 33,61 35,73 38,33 49,14

Peso do papel 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43

De acordo com os dados, fazemos a representação gráfica. Os pares

ordenados formam o diagrama de dispersão.

Correlação entre o peso total do lixo descartado e o peso do papel contido nesse

lixo

Para se verificar o grau de correlação entre as variáveis, calcula-se o

coeficiente de correlação linear pela fórmula do coeficiente de correlação de

Pearson:

( )( )( )[ ] ( )[ ]2222 .

.

ååååååå--

-=

iiii

iiii

yynxxn

yxyxnr

Page 6: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

6

Para facilitar o cálculo construímos a seguinte tabela:

Peso total ( ix ) Peso do papel ( iy ) ii yx . 2ix 2

iy

H1 10,47 2,43 25,44 109,62 5,90

H2 19,85 5,12 101,63 394,02 26,21

H3 21,25 6,88 146,20 451,56 47,33

H4 24,36 6,22 151,52 593,41 38,69

H5 27,38 8,84 242,04 749,66 78,15

H6 28,09 8,76 246,07 789,05 76,74

H7 33,61 7,54 253,42 1129,63 56,85

H8 35,73 8,47 302,63 1276,63 71,74

H9 38,33 9,55 366,05 1469,19 91,20

H10 49,14 11,43 561,67 2414,74 130,64

å 288,21 75,24 2396,68 9377,52 623,47

( )( )( )[ ] ( )[ ]

( )[ ] ( )[ ]

[ ] [ ]9206,0

57,247883,2281

06,56617,6234830652,93775

)9,21684()8,23966(

24,7547,6231021,28852,937710

)24,7521,288()68,239610(

.

.

22

2222

==--

-=

--

-=

--

-=

ååååååå

xr

xxx

xxr

yynxxn

yxyxnr

iiii

iiii

9206,0=r ou %06,92=r

Observamos, assim: 0,6 ≤ r ≤ 1 . Esse resultado indica que há uma forte

correlação entre as variáveis ou, ainda, que a correlação entre as duas variáveis é

bastante

significativa. Nesse caso, podemos concluir haver coerência na afirmação de que

existe correlação entre o peso total do lixo descartado e o peso do papel contido

nesse lixo.

Realizando o teste de hipótese com um ∝=5% temos:

(1) H0: 0=r

H1: 0¹r

(2) %5=a e Graus de liberdade: 82102 =-=-= nj

Page 7: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

7

(3) Regiões de rejeição e aceitação para H0.

(4) Cálculo do valor da variável: 6679,63905,06039,2

)9206,0(1

2109206,0

1

222

==-

-=

-

-=

r

nrtcal

(5) Conclusão: Como 3060,2>calt , rejeita-se H0, concluindo, com riso de 5%, que

há correlação entre o peso total de lixo descartada com o peso total de papel

contido neste lixo, ou ainda, existe uma correlação positiva entre X e Y, significa

que as variáveis são diretamente proporcionais, portando quanto maior o lixo

produzido maior será a quantidade de papel contida neste lixo.

b) Consideremos uma amostra aleatória, formada por dez dos 98 alunos de uma

classe da faculdade A e pelas notas obtidas por eles em matemática e estatística:

Números Notas

Matemática ( ix ) Estatística ( iy )

01 5,0 6,0

08 8,0 9,0

24 7,0 8,0

38 10,0 10,0

44 6,0 5,0

58 7,0 7,0

59 9,0 8,0

72 3,0 4,0

80 8,0 6,0

92 2,0 2,0

Vamos verificar a correlação primeiro fazendo um diagrama de

dispersão:

Page 8: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

8

Correlação entre as notas de matemática e estatística

Números Notas

ii yx . 2ix 2

iy Matemática ( ix ) Estatística ( iy )

01 5,0 6,0 30 25 36

08 8,0 9,0 72 64 81

24 7,0 8,0 56 49 64

38 10,0 10,0 100 100 100

44 6,0 5,0 30 36 25

58 7,0 7,0 49 49 49

59 9,0 8,0 72 81 64

72 3,0 4,0 12 9 16

80 8,0 6,0 48 64 36

92 2,0 2,0 4 4 4

å 65 65 473 481 475

( )( )( )[ ] ( )[ ]

( )[ ] ( )[ ]

[ ] [ ]9112,0

18,554505

525585

505

4225475042254810

)4225()4730(

65475106548110

)6565()47310(

.

.

22

2222

===--

-=

--

-=

--

-=

ååååååå

xxr

xxx

xxr

yynxxn

yxyxnr

iiii

iiii

Portanto 9112,0=r ou %12,92=r , o que resulta uma correlação positiva

altamente significativa entre as duas variáveis.

Realizando o teste de hipótese com um ∝=5% temos:

(1) H0: 0=r

H1: 0¹r

Page 9: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

9

(2) %5=a e Graus de liberdade: 82102 =-=-= nj

(3) Regiões de rejeição e aceitação para H0.

(4) Cálculo do valor da variável: 2560,64120,05773,2

)9112,0(1

2109112,0

1

222

==-

-=

-

-=

r

nrtcal

(5) Conclusão: Como 3060,2>calt , rejeita-se H0, concluindo, com riso de 5%, que

há correlação entre as notas de matemática e estatística, ou ainda, existe uma

correlação positiva entre X e Y, significa que as variáveis são diretamente

proporcionais, portando quanto maior a nota de matemática maior será a nota de

estatística.

Exercícios

1)Complete o esquema de cálculo do coeficiente de correlação para os valores das

variáveis ix e iy :

ix 4 6 8 10 12

iy 12 10 8 12 14

Temos:

ix iy ii yx . 2ix 2

iy

4 12 48 16 144

........ ........ ........ ........ ........

........ ........ ........ ........ ........

........ ........ ........ ........ ........

12 14 168 144 196

........å= ........å= ........å= ........å= ........å=

Page 10: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

10

Logo:

[ ] [ ]

[ ] [ ]........

........

........

................

........

................................

................

................................................

........)(................)(........

===--

-=

---

=

xxr

xxx

xxr

Donde 42,0=r . A correlação linear entre as variáveis x e y é positiva,

porém fraca.

2) Correlacionar os valores de produção leiteira e o teor de gordura de animais bovinos da fazenda Pica Pau Amarelo.

Produção (kg) Teor de Gordura (%)

10 6,0

12 5,7

14 5,3

17 5,2

19 5,0

22 4,7

25 4,5

3) Para os dados abaixo:

a) Desenhe o diagrama de dispersão; b) Calcule o coeficiente de correlação de Pearson e interprete.

c) Teste o coeficiente encontrado na letra b).

Concentração Protombina no Plasma (x) Tempo de coagulação em segundos (y)

5 70

10 40

20 27

30 22

40 18

50 16

60 15

70 14

80 13

90 12

Page 11: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

11

4) Uma amostra revelou o coeficiente de correlação entre o salário e o número de

anos de escolaridade para um grupo de 60 pessoas é de 0,78. Teste a hipótese de

existência de correlação entre essas variáveis, ao nível de 5%.

5) Sessenta e quatro estudantes foram submetidos a dois testes: raciocínio lógico e

quantitativo e conhecimentos gerais. Dos escores obtidos, foram calculadas as

somas:

å =169X ; å = 327Y ; å =14502X ; å = 23042Y ; å = 837XY .

a)Determine o coeficiente de correlação.

b) Ao nível de significância de 5%, testar a existência de correlação.

6) A tabela a seguir expressa os pesos e as alturas de 30 crianças:

Peso (kg) 30 32 24 30 26 35 25 23 35 31 29 28 25 29 30

Altura (cm) 145 150 125 157 127 140 132 107 155 145 140 142 130 135 138

Peso (kg) 31 32 33 25 26 28 29 30 31 35 34 33 32 28 30

Altura (cm) 140 150 157 144 145 147 150 152 150 160 149 150 129 130 140

Ao nível de 5%, podemos afirmar que há correlação entre os pesos e as alturas?

7) Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos.

Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se a tabela:

Peso Real 18 30 42 62 73 97 120

Peso Aparente 10 23 33 60 91 98 159

Calcule o índice de correlação. 8) Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos da escola A:

ix 11 14 19 19 22 28 30 31 34 37

iy 13 14 18 15 22 17 24 22 24 25

a) Verifique, pelo diagrama, se existe correlação retilínea. b) Em caso afirmativo, calcule o coeficiente de correlação. c) Escreva em poucas linhas, as conclusões a que chegou sobre a relação entre essas variáveis. d) Ao nível de significância de 5%, testar a existência de correlação.

Page 12: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

12

Gabarito

1)Complete o esquema de cálculo do coeficiente de correlação para os valores das

variáveis ix e iy :

ix 4 6 8 10 12

iy 12 10 8 12 14

Temos:

ix iy ii yx . 2ix 2

iy

4 12 48 16 144

6 10 60 36 100

8 8 64 64 64

10 12 120 100 144

12 14 168 144 196

40å= 56å= 460å= 360å= 648å=

Logo:

( )[ ] ( )[ ]

[ ] [ ]42,0

22,14460

104200

60

3136324016001800

22402300

566485403605

)5640()4605(22

===--

-=

--

-=

xxr

xxx

xxr

Donde 42,0=r . A correlação linear entre as variáveis x e y é positiva,

porém fraca.

2) Correlacionar os valores de produção leiteira e o teor de gordura de animais

bovinos da fazenda Pica Pau Amarelo.

Produção (kg) Teor de Gordura (%) ii yx .

2ix

2iy

10 6,0 60 100 36

12 5,7 68,4 144 32,49

14 5,3 74,2 196 28,09

17 5,2 88,4 289 27,04

19 5,0 95 361 25

22 4,7 103,4 484 22,09

25 4,5 112,5 625 20,25

119å= 4,36å= 9,601å= 2199å= 96,190å=

Page 13: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

13

( )[ ] ( )[ ]

[ ] [ ]9828,0

37,1203,118

76,111232

3,118

96,132472,13361416115393

6,43313,4213

4,3696,190711921997

)4,36119()9,6017(22

-=-

=-

=--

-=

--

-=

xxr

xxx

xxr

Existe uma forte correlação negativa entre x e y, significa que as

variáveis são inversamente proporcionais, ou seja, quanto mais leite produz a vaca

menor o teor de gordura do leite.

3) Para os dados abaixo:

a) Desenhe o diagrama de dispersão;

b) Calcule o coeficiente de correlação de Pearson e interprete.

c) Teste o coeficiente encontrado na letra b).

Concentração Protombina no

Plasma (x)

Tempo de coagulação

em segundos (y) ii yx .

2ix

2iy

5 70 350 25 4900

10 40 400 100 1600

20 27 540 400 729

30 22 660 900 484

40 18 720 1600 324

50 16 800 2500 256

60 15 900 3600 225

70 14 980 4900 196

80 13 1040 6400 169

90 12 1080 8100 144

455å= 247å= 7470å= 28525å= 9027å=

a)

Page 14: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

14

b)

( )[ ] ( )[ ]

[ ] [ ]7877,0

89,4784237685

2926178225

37685

6100090270207025285250

11238574700

2479027104552852510

)247455()747010(22

-=-

=-

=--

-=

--

-=

xxr

xxx

xxr

Existe uma correlação negativa entre x e y, significa que as variáveis são

inversamente proporcionais, ou seja, quanto maior a concentração de protombina

menor é o tempo de coagulação.

c) Realizando o teste de hipótese com um ∝=5% temos:

(1) H0: 0=r

H1: 0¹r

(2) %5=a e Graus de liberdade: 82102 =-=-= nj

(3) Regiões de rejeição e aceitação para H0.

(4) Cálculo do valor da variável: 6163,36162,02279,2

)7877,0(1

2107877,0

1

222

-=-

=--

--=

-

-=

r

nrtcal

(5) Conclusão: Como 3060,2>calt , rejeita-se H0, concluindo, com riso de 5%, que

há correlação entre a concentração protombina no plasma e tempo de coagulação.

4) Uma amostra revelou o coeficiente de correlação entre o salário e o número de

anos de escolaridade para um grupo de 60 pessoas é de 0,78. Teste a hipótese de

existência de correlação entre essas variáveis, ao nível de 5%.

Realizando o teste de hipótese com um ∝=5% temos:

(1) H0: 0=r

H1: 0¹r

(2) %5=a e Graus de liberdade: 582602 =-=-= nj

Page 15: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

15

(3) Regiões de rejeição e aceitação para H0.

(4) Cálculo do valor da variável: 4926,96258,09403,5

)78,0(1

26078,0

1

222

==-

-=

-

-=

r

nrtcal

(5) Conclusão: Como 0017,2>calt , rejeita-se H0, concluindo, com riso de 5%, que

há correlação entre o salário e o número de anos de escolaridade.

5) Sessenta e quatro estudantes foram submetidos a dois testes: raciocínio lógico e

quantitativo e conhecimentos gerais. Dos escores obtidos, foram calculadas as somas:

å =169X ; å = 327Y ; å =14502X ; å = 23042Y ; å = 837XY .

a)Determine o coeficiente de correlação.

b) Ao nível de significância de 5%, testar a existência de correlação. a)

( )[ ] ( )[ ]

[ ] [ ]%322,3

03322,06607,51023

1695

4052764239

1695

1069291474562856192800

5526353568

327230464169145064

)327169()83764(22

-=

-=-

=-

=--

-=

--

-=

r

xxr

xxx

xxr

Realizando o teste de hipótese com um ∝=5% temos:

(1) H0: 0=r

H1: 0¹r

(2) %5=a e Graus de liberdade: 622642 =-=-= nj

(3) Regiões de rejeição e aceitação para H0.

Page 16: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

16

(4) Cálculo do valor da variável:

2617,099945,026157,0

)03322,0(1

26403322,0

1

222

-=-

=--

--=

-

-=

r

nrtcal

(5) Conclusão: Como 0017,2<calt , aceita-se H0, concluindo, com riso de 5%, que

não há correlação entre os testes raciocínio lógico e quantitativo e conhecimentos gerais.

6) A tabela a seguir expressa os pesos e as alturas de 30 crianças:

Peso (kg) 30 32 24 30 26 35 25 23 35 31 29 28 25 29 30

Altura (cm) 145 150 125 157 127 140 132 107 155 145 140 142 130 135 138

Peso (kg) 31 32 33 25 26 28 29 30 31 35 34 33 32 28 30

Altura (cm) 140 150 157 144 145 147 150 152 150 160 149 150 129 130 140

Ao nível de 5%, podemos afirmar que há correlação entre os pesos e as

alturas?

Peso

(x)

Altura

(y) ii yx .

2ix

2iy Peso (x) Altura (y)

ii yx . 2ix

2iy

30 145 4350 900 21025 31 140 4340 961 19600

32 150 4800 1024 22500 32 150 4800 1024 22500

24 125 3000 576 15625 33 157 5181 1089 24649

30 157 4710 900 24649 25 144 3600 625 20736

26 127 3302 676 16129 26 145 3770 676 21025

35 140 4900 1225 19600 28 147 4116 784 21609

25 132 3300 625 17424 29 150 4350 841 22500

23 107 2461 529 11449 30 152 4560 900 23104

35 155 5425 1225 24025 31 150 4650 961 22500

31 145 4495 961 21025 35 160 5600 1225 25600

29 140 4060 841 19600 34 149 5066 1156 22201

28 142 3976 784 20164 33 150 4950 1089 22500

25 130 3250 625 16900 33 129 4257 1089 16641

29 135 3915 841 18225 28 130 3640 784 16900

30 138 4140 900 19044 30 140 4200 900 19600

890å=

4261å=

127164å=

26736å=

609049å=

Page 17: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

17

Ao nível de significância de 5%, testar a existência de correlação.

a)

( )[ ] ( )[ ] [ ] [ ]

667,008811,33929

22630

115499980

22630

1815612118271470792100802080

37922903814920

4261609049308902673630

)4261890()12716430(22

===

---

=--

-=

xr

xxxx

xxr

Realizando o teste de hipótese com um ∝=5% temos:

(1) H0: 0=r

H1: 0¹r

(2) %5=a e Graus de liberdade: 282302 =-=-= nj

(3) Regiões de rejeição e aceitação para H0.

(4) Cálculo do valor da variável: 7371,47451,05294,3

)667,0(1

230667,0

1

222

==-

-=

-

-=

r

nrtcal

(5) Conclusão: Como 0484,2>calt , rejeita-se H0, concluindo, com riso de 5%, que

há correlação linear entre os pesos e as alturas das 30 crianças avaliadas.

7) Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos.

Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se a

tabela:

Peso Real 18 30 42 62 73 97 120

Peso Aparente 10 23 33 60 91 98 159

Calcule o índice de correlação.

Page 18: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

18

Peso real (x) Peso aparente (y) ii yx .

2ix

2iy

18 10 180 324 100

30 23 690 900 529

42 33 1386 1764 1089

62 60 3720 3844 3600

73 91 6643 5329 8281

97 98 9506 9409 9604

120 159 19080 14400 25281

442å= 474å= 41205å= 35970å= 48484å=

( )[ ] ( )[ ] [ ] [ ]

9810,0336,8045

78927

11471256426

78927

224676339288195364251790

209508288435

474484847442359707

)474442()412057(22

===

---

=--

-=

xr

xxxx

xxr

8) Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos da escola A:

ix 11 14 19 19 22 28 30 31 34 37

iy 13 14 18 15 22 17 24 22 24 25

a) Verifique, pelo diagrama, se existe correlação retilínea. b) Em caso afirmativo, calcule o coeficiente de correlação.

c) Escreva em poucas linhas, as conclusões a que chegou sobre a relação entre

essas variáveis.

d) Ao nível de significância de 5%, testar a existência de correlação.

ix iy ii yx .

2ix

2iy

11 13 143 121 169

14 14 196 196 196

19 18 342 361 324

19 15 285 361 225

22 22 484 484 484

28 17 476 784 289

30 24 720 900 576

31 22 682 961 484

34 24 816 1156 576

37 25 925 1369 625

245å= 194å= 5069å= 6693å= 3948å=

Page 19: Correlaçãoiffmauricio.pbworks.com/w/file/fetch/59898760/Correlação.pdf · Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de

Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo

Alegrete - RS Fone/Fax: (55) 3421-9600

www.al.iffarroupilha.edu.br

Professor Mauricio Lutz

19

a)

b)

( )[ ] ( )[ ] [ ] [ ]

8856,0308,3568

3160

18446905

3160

3763694806002566930

4753050690

194394810245669310

)194245()506910(22

===

---

=--

-=

xr

xxxx

xxr

c) Existe uma correlação positiva entre os testes x e y, significa que as variáveis

são diretamente proporcionais.

d) Realizando o teste de hipótese com um ∝=5% temos:

(1) H0: 0=r

H1: 0¹r

(2) %5=a e Graus de liberdade: 82102 =-=-= nj

(3) Regiões de rejeição e aceitação para H0.

(4) Cálculo do valor da variável: 3924,54645,05048,2

)8856,0(1

2108856,0

1

222

==-

-=

-

-=

r

nrtcal

(5) Conclusão: Como 3060,2>calt , rejeita-se H0, concluindo, com riso de 5%, que

há correlação entre os teste x e y.