Upload
lexuyen
View
219
Download
1
Embed Size (px)
Citation preview
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
1
CORRELAÇÃO
Em muitas situações, torna-se interessante e útil estabelecer uma
relação entre duas ou mais variáveis. A matemática estabelece vários tipos de
relações entre variáveis, por exemplo, as relações funcionais e as correlações.
Relações Funcionais
São relações matemáticas expressas por sentenças matemáticas, como
por exemplo:
• Área do retângulo (A=a.b) é a relação entre os lados do retângulo;
• Densidade de massa (dm= m/v) é a relação entre a massa e o volume de um
corpo;
• Perímetro de uma circunferência (C=2πR) é a relação entre o comprimento da
circunferência e o valor do raio.
Relações Estatísticas e Correlações
São relações estabelecidas após uma pesquisa. Com base nos
resultados da pesquisa, são feitas comparações que eventualmente podem
conduzir (ou não) à ligação entre as variáveis.
Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a
classe social de uma pessoa e o número de viagens por ela realizado.
No estudo estatístico, a relação entre duas ou mais variáveis denomina-
se correlação. A utilidade e importância das correlações entre duas variáveis
podem conduzir à descoberta de novos métodos, cujas estimativas são vitais em
tomadas de decisões.
Em outras palavras quando duas variáveis estão ligadas por uma
relação estatística, dizemos que existe correlação entre elas.
1) Diagrama de dispersão
O diagrama de dispersão é um gráfico cartesiano em que cada um dos
eixos corresponde às variáveis correlacionadas. A variável dependente (Y) situa-se
no eixo vertical e o eixo das abscissas é reservado para a variável independente
(X). Os pares ordenados formam uma nuvem de pontos.
A configuração geométrica do diagrama de dispersão pode estar associada a uma
linha reta (correlação linear), uma linha curva (correlação curvilínea) ou, ainda, ter
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
2
os pontos dispersos de maneira que não definam nenhuma configuração linear;
nesta última situação, não há correlação.
Correlação Linear Correlação Curvilínea
2) Correlação Linear
Correlação linear é uma correlação entre duas variáveis, cujo gráfico
aproxima-se de uma linha. É uma linha de tendência, porque procura acompanhar
a tendência da distribuição de pontos, que pode corresponder a uma reta ou a uma
curva. Por outro lado, é, também, uma linha média, porque procura deixar a mesma
quantidade de pontos abaixo e acima da linha.
Correlação linear positiva Correlação linear negativa
Não há correlação
Para definir se a correlação entre as variáveis corresponde a uma linha
reta ou a uma curva, pode-se utilizar modos qualitativos ou quantitativos.
No modo qualitativo, vai imperar o “bom senso” do pesquisador para
verificar qual o grau de intensidade na correlação entre as variáveis; isso significa o
estabelecimento de uma relação numérica que medirá o nível da correlação.
0
50
100
0 5 10
0
50
100
0 5 10
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
3
3) Coeficiente de Correlação Linear
O instrumento empregado para a medida da correlação linear é o
coeficiente de correlação. Este coeficiente deve indicar o grau de intensidade de
correlação entre duas variáveis e, ainda, o sentido dessa correlação (positiva ou
negativa). Uma das formas de medir o coeficiente de correlação linear foi
desenvolvido por Pearson e recebe o nome de coeficiente de correlação de
Pearson. O coeficiente de correlação de Pearson mede o grau de ajustamento dos
valores em torno de uma reta.
Coeficiente de Correlação de Pearson (r):
( )( )( )[ ] ( )[ ]2222 .
.
ååååååå--
-=
iiii
iiii
yynxxn
yxyxnr
onde temos:
r é o coeficiente de Pearson;
né o número de observações;
ix é a variável independente;
iy é a variável dependente.
O valor do coeficiente de correlação r tem a variação entre +1 e –1, ou
seja, está limitado entre os valores do Intervalo[–1,+1].
• r = +1 (correlação positiva entre as variáveis);
• r = –1 (correlação perfeita negativa entre as variáveis);
• r = 0 (não há correlação entre as variáveis ou, ainda, a correlação não é linear,
caso exista).
Quanto mais próximo o valor de r estiver do valor “1”, mais forte a
correlação linear.
Quanto mais próximo o valor de r estiver do valor “0”, mais fraca a
correlação linear.
Em geral, multiplica-se o valor de r por 100; dessa forma, o resultado
passa a ser expresso em porcentagem. Na prática, estabelecem-se critérios para
verificar os diversos níveis do fraco ao forte, chegando até o perfeito:
• 0 < |r| < 0,3 : a correlação é fraca e fica difícil estabelecer relação entre as
variáveis. Em porcentagem: 0% < |r| < 30%;
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
4
• 0,3 ≤ |r| < 0,6 : a correlação é fraca, porém, podemos considerar a existência de
relativa correlação entre as variáveis. Em porcentagem: 30% ≤ |r| < 60%;
• 0,6 ≤ |r| < 1 : a correlação é de média para forte; a relação entre as variáveis é
significativa, o que permite coerência com poucos conflitos na obtenção das
conclusões. Em porcentagem: 60% ≤ |r| ≤ 100%.
4) Teste de hipótese para a existência de correlação
Para aplicar o teste de hipótese para existência de correlação linear, é
necessário que as variáveis populacionais (X, Y) tenham distribuição normal
bivariada. Quando as amostras forem superiores a 30, a hipótese de normalidade
das duas variáveis é razoavelmente atendida.
O coeficiente de correlação linear da população (X, Y) é designado ρ (ler
Rô). Se o teste indicar a rejeição da hipótese 0=r , poderemos concluir que existe
correlação entre as variáveis ao nível de significância admitido. Eis o procedimento
para realizar o teste:
(1) H0: 0=r
H1: 0¹r
(2) Fixar ∝ e escolher uma distribuição t de Student com 2-= nj graus
de liberdade.
(3) Determinar as regiões de rejeição e aceitação para H0, com auxilio
da tabela t de Student.
(4) Calculo do valor da variável: 21
2
r
nrtcal
-
-=
(5) Conclusão:
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
5
Se 2
attcal > ou 2
attcal -> , rejeita-se H0, concluindo, com risco ∝, que há
correlação entre as variáveis.
Se 22
aa ttt cal ££- , não se pode rejeita-se H0, concluindo que há
correlação entre as variáveis.
Exemplos: a) Uma pesquisa pretende verificar se há correlação significativa entre o
peso total do lixo descartado, por dia, numa empresa com o peso do papel contido
nesse lixo.
Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10
Peso total 10,47 19,85 21,25 24,36 27,38 28,09 33,61 35,73 38,33 49,14
Peso do papel 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43
De acordo com os dados, fazemos a representação gráfica. Os pares
ordenados formam o diagrama de dispersão.
Correlação entre o peso total do lixo descartado e o peso do papel contido nesse
lixo
Para se verificar o grau de correlação entre as variáveis, calcula-se o
coeficiente de correlação linear pela fórmula do coeficiente de correlação de
Pearson:
( )( )( )[ ] ( )[ ]2222 .
.
ååååååå--
-=
iiii
iiii
yynxxn
yxyxnr
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
6
Para facilitar o cálculo construímos a seguinte tabela:
Peso total ( ix ) Peso do papel ( iy ) ii yx . 2ix 2
iy
H1 10,47 2,43 25,44 109,62 5,90
H2 19,85 5,12 101,63 394,02 26,21
H3 21,25 6,88 146,20 451,56 47,33
H4 24,36 6,22 151,52 593,41 38,69
H5 27,38 8,84 242,04 749,66 78,15
H6 28,09 8,76 246,07 789,05 76,74
H7 33,61 7,54 253,42 1129,63 56,85
H8 35,73 8,47 302,63 1276,63 71,74
H9 38,33 9,55 366,05 1469,19 91,20
H10 49,14 11,43 561,67 2414,74 130,64
å 288,21 75,24 2396,68 9377,52 623,47
( )( )( )[ ] ( )[ ]
( )[ ] ( )[ ]
[ ] [ ]9206,0
57,247883,2281
06,56617,6234830652,93775
)9,21684()8,23966(
24,7547,6231021,28852,937710
)24,7521,288()68,239610(
.
.
22
2222
==--
-=
--
-=
--
-=
ååååååå
xr
xxx
xxr
yynxxn
yxyxnr
iiii
iiii
9206,0=r ou %06,92=r
Observamos, assim: 0,6 ≤ r ≤ 1 . Esse resultado indica que há uma forte
correlação entre as variáveis ou, ainda, que a correlação entre as duas variáveis é
bastante
significativa. Nesse caso, podemos concluir haver coerência na afirmação de que
existe correlação entre o peso total do lixo descartado e o peso do papel contido
nesse lixo.
Realizando o teste de hipótese com um ∝=5% temos:
(1) H0: 0=r
H1: 0¹r
(2) %5=a e Graus de liberdade: 82102 =-=-= nj
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
7
(3) Regiões de rejeição e aceitação para H0.
(4) Cálculo do valor da variável: 6679,63905,06039,2
)9206,0(1
2109206,0
1
222
==-
-=
-
-=
r
nrtcal
(5) Conclusão: Como 3060,2>calt , rejeita-se H0, concluindo, com riso de 5%, que
há correlação entre o peso total de lixo descartada com o peso total de papel
contido neste lixo, ou ainda, existe uma correlação positiva entre X e Y, significa
que as variáveis são diretamente proporcionais, portando quanto maior o lixo
produzido maior será a quantidade de papel contida neste lixo.
b) Consideremos uma amostra aleatória, formada por dez dos 98 alunos de uma
classe da faculdade A e pelas notas obtidas por eles em matemática e estatística:
Números Notas
Matemática ( ix ) Estatística ( iy )
01 5,0 6,0
08 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0
Vamos verificar a correlação primeiro fazendo um diagrama de
dispersão:
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
8
Correlação entre as notas de matemática e estatística
Números Notas
ii yx . 2ix 2
iy Matemática ( ix ) Estatística ( iy )
01 5,0 6,0 30 25 36
08 8,0 9,0 72 64 81
24 7,0 8,0 56 49 64
38 10,0 10,0 100 100 100
44 6,0 5,0 30 36 25
58 7,0 7,0 49 49 49
59 9,0 8,0 72 81 64
72 3,0 4,0 12 9 16
80 8,0 6,0 48 64 36
92 2,0 2,0 4 4 4
å 65 65 473 481 475
( )( )( )[ ] ( )[ ]
( )[ ] ( )[ ]
[ ] [ ]9112,0
18,554505
525585
505
4225475042254810
)4225()4730(
65475106548110
)6565()47310(
.
.
22
2222
===--
-=
--
-=
--
-=
ååååååå
xxr
xxx
xxr
yynxxn
yxyxnr
iiii
iiii
Portanto 9112,0=r ou %12,92=r , o que resulta uma correlação positiva
altamente significativa entre as duas variáveis.
Realizando o teste de hipótese com um ∝=5% temos:
(1) H0: 0=r
H1: 0¹r
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
9
(2) %5=a e Graus de liberdade: 82102 =-=-= nj
(3) Regiões de rejeição e aceitação para H0.
(4) Cálculo do valor da variável: 2560,64120,05773,2
)9112,0(1
2109112,0
1
222
==-
-=
-
-=
r
nrtcal
(5) Conclusão: Como 3060,2>calt , rejeita-se H0, concluindo, com riso de 5%, que
há correlação entre as notas de matemática e estatística, ou ainda, existe uma
correlação positiva entre X e Y, significa que as variáveis são diretamente
proporcionais, portando quanto maior a nota de matemática maior será a nota de
estatística.
Exercícios
1)Complete o esquema de cálculo do coeficiente de correlação para os valores das
variáveis ix e iy :
ix 4 6 8 10 12
iy 12 10 8 12 14
Temos:
ix iy ii yx . 2ix 2
iy
4 12 48 16 144
........ ........ ........ ........ ........
........ ........ ........ ........ ........
........ ........ ........ ........ ........
12 14 168 144 196
........å= ........å= ........å= ........å= ........å=
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
10
Logo:
[ ] [ ]
[ ] [ ]........
........
........
................
........
................................
................
................................................
........)(................)(........
===--
-=
---
=
xxr
xxx
xxr
Donde 42,0=r . A correlação linear entre as variáveis x e y é positiva,
porém fraca.
2) Correlacionar os valores de produção leiteira e o teor de gordura de animais bovinos da fazenda Pica Pau Amarelo.
Produção (kg) Teor de Gordura (%)
10 6,0
12 5,7
14 5,3
17 5,2
19 5,0
22 4,7
25 4,5
3) Para os dados abaixo:
a) Desenhe o diagrama de dispersão; b) Calcule o coeficiente de correlação de Pearson e interprete.
c) Teste o coeficiente encontrado na letra b).
Concentração Protombina no Plasma (x) Tempo de coagulação em segundos (y)
5 70
10 40
20 27
30 22
40 18
50 16
60 15
70 14
80 13
90 12
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
11
4) Uma amostra revelou o coeficiente de correlação entre o salário e o número de
anos de escolaridade para um grupo de 60 pessoas é de 0,78. Teste a hipótese de
existência de correlação entre essas variáveis, ao nível de 5%.
5) Sessenta e quatro estudantes foram submetidos a dois testes: raciocínio lógico e
quantitativo e conhecimentos gerais. Dos escores obtidos, foram calculadas as
somas:
å =169X ; å = 327Y ; å =14502X ; å = 23042Y ; å = 837XY .
a)Determine o coeficiente de correlação.
b) Ao nível de significância de 5%, testar a existência de correlação.
6) A tabela a seguir expressa os pesos e as alturas de 30 crianças:
Peso (kg) 30 32 24 30 26 35 25 23 35 31 29 28 25 29 30
Altura (cm) 145 150 125 157 127 140 132 107 155 145 140 142 130 135 138
Peso (kg) 31 32 33 25 26 28 29 30 31 35 34 33 32 28 30
Altura (cm) 140 150 157 144 145 147 150 152 150 160 149 150 129 130 140
Ao nível de 5%, podemos afirmar que há correlação entre os pesos e as alturas?
7) Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos.
Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se a tabela:
Peso Real 18 30 42 62 73 97 120
Peso Aparente 10 23 33 60 91 98 159
Calcule o índice de correlação. 8) Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos da escola A:
ix 11 14 19 19 22 28 30 31 34 37
iy 13 14 18 15 22 17 24 22 24 25
a) Verifique, pelo diagrama, se existe correlação retilínea. b) Em caso afirmativo, calcule o coeficiente de correlação. c) Escreva em poucas linhas, as conclusões a que chegou sobre a relação entre essas variáveis. d) Ao nível de significância de 5%, testar a existência de correlação.
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
12
Gabarito
1)Complete o esquema de cálculo do coeficiente de correlação para os valores das
variáveis ix e iy :
ix 4 6 8 10 12
iy 12 10 8 12 14
Temos:
ix iy ii yx . 2ix 2
iy
4 12 48 16 144
6 10 60 36 100
8 8 64 64 64
10 12 120 100 144
12 14 168 144 196
40å= 56å= 460å= 360å= 648å=
Logo:
( )[ ] ( )[ ]
[ ] [ ]42,0
22,14460
104200
60
3136324016001800
22402300
566485403605
)5640()4605(22
===--
-=
--
-=
xxr
xxx
xxr
Donde 42,0=r . A correlação linear entre as variáveis x e y é positiva,
porém fraca.
2) Correlacionar os valores de produção leiteira e o teor de gordura de animais
bovinos da fazenda Pica Pau Amarelo.
Produção (kg) Teor de Gordura (%) ii yx .
2ix
2iy
10 6,0 60 100 36
12 5,7 68,4 144 32,49
14 5,3 74,2 196 28,09
17 5,2 88,4 289 27,04
19 5,0 95 361 25
22 4,7 103,4 484 22,09
25 4,5 112,5 625 20,25
119å= 4,36å= 9,601å= 2199å= 96,190å=
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
13
( )[ ] ( )[ ]
[ ] [ ]9828,0
37,1203,118
76,111232
3,118
96,132472,13361416115393
6,43313,4213
4,3696,190711921997
)4,36119()9,6017(22
-=-
=-
=--
-=
--
-=
xxr
xxx
xxr
Existe uma forte correlação negativa entre x e y, significa que as
variáveis são inversamente proporcionais, ou seja, quanto mais leite produz a vaca
menor o teor de gordura do leite.
3) Para os dados abaixo:
a) Desenhe o diagrama de dispersão;
b) Calcule o coeficiente de correlação de Pearson e interprete.
c) Teste o coeficiente encontrado na letra b).
Concentração Protombina no
Plasma (x)
Tempo de coagulação
em segundos (y) ii yx .
2ix
2iy
5 70 350 25 4900
10 40 400 100 1600
20 27 540 400 729
30 22 660 900 484
40 18 720 1600 324
50 16 800 2500 256
60 15 900 3600 225
70 14 980 4900 196
80 13 1040 6400 169
90 12 1080 8100 144
455å= 247å= 7470å= 28525å= 9027å=
a)
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
14
b)
( )[ ] ( )[ ]
[ ] [ ]7877,0
89,4784237685
2926178225
37685
6100090270207025285250
11238574700
2479027104552852510
)247455()747010(22
-=-
=-
=--
-=
--
-=
xxr
xxx
xxr
Existe uma correlação negativa entre x e y, significa que as variáveis são
inversamente proporcionais, ou seja, quanto maior a concentração de protombina
menor é o tempo de coagulação.
c) Realizando o teste de hipótese com um ∝=5% temos:
(1) H0: 0=r
H1: 0¹r
(2) %5=a e Graus de liberdade: 82102 =-=-= nj
(3) Regiões de rejeição e aceitação para H0.
(4) Cálculo do valor da variável: 6163,36162,02279,2
)7877,0(1
2107877,0
1
222
-=-
=--
--=
-
-=
r
nrtcal
(5) Conclusão: Como 3060,2>calt , rejeita-se H0, concluindo, com riso de 5%, que
há correlação entre a concentração protombina no plasma e tempo de coagulação.
4) Uma amostra revelou o coeficiente de correlação entre o salário e o número de
anos de escolaridade para um grupo de 60 pessoas é de 0,78. Teste a hipótese de
existência de correlação entre essas variáveis, ao nível de 5%.
Realizando o teste de hipótese com um ∝=5% temos:
(1) H0: 0=r
H1: 0¹r
(2) %5=a e Graus de liberdade: 582602 =-=-= nj
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
15
(3) Regiões de rejeição e aceitação para H0.
(4) Cálculo do valor da variável: 4926,96258,09403,5
)78,0(1
26078,0
1
222
==-
-=
-
-=
r
nrtcal
(5) Conclusão: Como 0017,2>calt , rejeita-se H0, concluindo, com riso de 5%, que
há correlação entre o salário e o número de anos de escolaridade.
5) Sessenta e quatro estudantes foram submetidos a dois testes: raciocínio lógico e
quantitativo e conhecimentos gerais. Dos escores obtidos, foram calculadas as somas:
å =169X ; å = 327Y ; å =14502X ; å = 23042Y ; å = 837XY .
a)Determine o coeficiente de correlação.
b) Ao nível de significância de 5%, testar a existência de correlação. a)
( )[ ] ( )[ ]
[ ] [ ]%322,3
03322,06607,51023
1695
4052764239
1695
1069291474562856192800
5526353568
327230464169145064
)327169()83764(22
-=
-=-
=-
=--
-=
--
-=
r
xxr
xxx
xxr
Realizando o teste de hipótese com um ∝=5% temos:
(1) H0: 0=r
H1: 0¹r
(2) %5=a e Graus de liberdade: 622642 =-=-= nj
(3) Regiões de rejeição e aceitação para H0.
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
16
(4) Cálculo do valor da variável:
2617,099945,026157,0
)03322,0(1
26403322,0
1
222
-=-
=--
--=
-
-=
r
nrtcal
(5) Conclusão: Como 0017,2<calt , aceita-se H0, concluindo, com riso de 5%, que
não há correlação entre os testes raciocínio lógico e quantitativo e conhecimentos gerais.
6) A tabela a seguir expressa os pesos e as alturas de 30 crianças:
Peso (kg) 30 32 24 30 26 35 25 23 35 31 29 28 25 29 30
Altura (cm) 145 150 125 157 127 140 132 107 155 145 140 142 130 135 138
Peso (kg) 31 32 33 25 26 28 29 30 31 35 34 33 32 28 30
Altura (cm) 140 150 157 144 145 147 150 152 150 160 149 150 129 130 140
Ao nível de 5%, podemos afirmar que há correlação entre os pesos e as
alturas?
Peso
(x)
Altura
(y) ii yx .
2ix
2iy Peso (x) Altura (y)
ii yx . 2ix
2iy
30 145 4350 900 21025 31 140 4340 961 19600
32 150 4800 1024 22500 32 150 4800 1024 22500
24 125 3000 576 15625 33 157 5181 1089 24649
30 157 4710 900 24649 25 144 3600 625 20736
26 127 3302 676 16129 26 145 3770 676 21025
35 140 4900 1225 19600 28 147 4116 784 21609
25 132 3300 625 17424 29 150 4350 841 22500
23 107 2461 529 11449 30 152 4560 900 23104
35 155 5425 1225 24025 31 150 4650 961 22500
31 145 4495 961 21025 35 160 5600 1225 25600
29 140 4060 841 19600 34 149 5066 1156 22201
28 142 3976 784 20164 33 150 4950 1089 22500
25 130 3250 625 16900 33 129 4257 1089 16641
29 135 3915 841 18225 28 130 3640 784 16900
30 138 4140 900 19044 30 140 4200 900 19600
890å=
4261å=
127164å=
26736å=
609049å=
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
17
Ao nível de significância de 5%, testar a existência de correlação.
a)
( )[ ] ( )[ ] [ ] [ ]
667,008811,33929
22630
115499980
22630
1815612118271470792100802080
37922903814920
4261609049308902673630
)4261890()12716430(22
===
---
=--
-=
xr
xxxx
xxr
Realizando o teste de hipótese com um ∝=5% temos:
(1) H0: 0=r
H1: 0¹r
(2) %5=a e Graus de liberdade: 282302 =-=-= nj
(3) Regiões de rejeição e aceitação para H0.
(4) Cálculo do valor da variável: 7371,47451,05294,3
)667,0(1
230667,0
1
222
==-
-=
-
-=
r
nrtcal
(5) Conclusão: Como 0484,2>calt , rejeita-se H0, concluindo, com riso de 5%, que
há correlação linear entre os pesos e as alturas das 30 crianças avaliadas.
7) Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos.
Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se a
tabela:
Peso Real 18 30 42 62 73 97 120
Peso Aparente 10 23 33 60 91 98 159
Calcule o índice de correlação.
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
18
Peso real (x) Peso aparente (y) ii yx .
2ix
2iy
18 10 180 324 100
30 23 690 900 529
42 33 1386 1764 1089
62 60 3720 3844 3600
73 91 6643 5329 8281
97 98 9506 9409 9604
120 159 19080 14400 25281
442å= 474å= 41205å= 35970å= 48484å=
( )[ ] ( )[ ] [ ] [ ]
9810,0336,8045
78927
11471256426
78927
224676339288195364251790
209508288435
474484847442359707
)474442()412057(22
===
---
=--
-=
xr
xxxx
xxr
8) Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos da escola A:
ix 11 14 19 19 22 28 30 31 34 37
iy 13 14 18 15 22 17 24 22 24 25
a) Verifique, pelo diagrama, se existe correlação retilínea. b) Em caso afirmativo, calcule o coeficiente de correlação.
c) Escreva em poucas linhas, as conclusões a que chegou sobre a relação entre
essas variáveis.
d) Ao nível de significância de 5%, testar a existência de correlação.
ix iy ii yx .
2ix
2iy
11 13 143 121 169
14 14 196 196 196
19 18 342 361 324
19 15 285 361 225
22 22 484 484 484
28 17 476 784 289
30 24 720 900 576
31 22 682 961 484
34 24 816 1156 576
37 25 925 1369 625
245å= 194å= 5069å= 6693å= 3948å=
Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo
Alegrete - RS Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Professor Mauricio Lutz
19
a)
b)
( )[ ] ( )[ ] [ ] [ ]
8856,0308,3568
3160
18446905
3160
3763694806002566930
4753050690
194394810245669310
)194245()506910(22
===
---
=--
-=
xr
xxxx
xxr
c) Existe uma correlação positiva entre os testes x e y, significa que as variáveis
são diretamente proporcionais.
d) Realizando o teste de hipótese com um ∝=5% temos:
(1) H0: 0=r
H1: 0¹r
(2) %5=a e Graus de liberdade: 82102 =-=-= nj
(3) Regiões de rejeição e aceitação para H0.
(4) Cálculo do valor da variável: 3924,54645,05048,2
)8856,0(1
2108856,0
1
222
==-
-=
-
-=
r
nrtcal
(5) Conclusão: Como 3060,2>calt , rejeita-se H0, concluindo, com riso de 5%, que
há correlação entre os teste x e y.