View
141
Download
11
Category
Preview:
Citation preview
Estatística e ProbabilidadeEstatística e Probabilidade
• CORRELAÇÃO E REGRESSÃO LINEAR 1.
• Exercícios.
•1. CORRELAÇÃO E REGRESSÃO LINEAR
• Quando considera-se as observações de duas variáveis que podem estar relacionadas como causa e efeito, ou variável independente e variável independente, os procedimentos conformam as teorias da correlação e da regressão linear.
• Duas ou mais variáveis relacionadas podem ser analisadas por um procedimento similar, a regressão múltipla
• Nesta disciplina, estudaremos a correlação e a regressão linear entre duas variáveis.
• Esta pode ser simples, de um par de variáveis, uma condicionadora ou independente e outra dependente, ou ainda múltipla, onde há duas ou mais variáveis condicionadoras.
•1. CORRELAÇÃO E REGRESSÃO• Quaisquer hipóteses de correlação podem ser observadas inicialmente nos diagramas de dispersão, a representação gráfica das variáveis no eixo “x” (independente) e eixo “y” (dependente). Por exemplo, uma amostra aleatória, de dez dos 98 alunos de uma classe da Universidade A: notas obtidas Matemática e Estatística:
•
•1. CORRELAÇÃO E REGRESSÃO
• Representando os pares ordenados (x,y), obtemos uma nuvem de pontos que denominamos diagrama de dispersão.
• Esse diagrama nos fornece uma idéia grosseira, porém útil da correlação existente.
• Quais as análises estatísticas que se pode desenvolver sobre a significância desta correlação?
• Por definição, correlação é a relação entre duas variáveis que expressam a relação de causa e efeito ou que variam concomitantemente. São variáveis consideradas correlacionadas.
• O grau de relacionamento para dados amostrais é dado pelo coeficiente de correlação linear, r .
•
•1. CORRELAÇÃO E REGRESSÃO
• Posteriormente à análise da significância da correlação, procede-se na análise matemática e gráfica desta correlação, construindo-se a equação da reta entre x e y, na etapa da regressão linear.
• A análise da regressão linear permite a projeção de valores de y a partir dos valores reais de x. Permite portanto a previsão de resultados.
• Como se calcula r e como se analisa a sua significância?
•
•2. COEFICIENTE DE CORRELAÇÃO LINEAR
• O grau de relacionamento para dados amostrais é dado pela seguinte expressão:•
• • • •
•
•2. COEFICIENTE DE CORRELAÇÃO LINEAR
• Onde: n é o número de observações e r é o coeficiente de correlação linear para uma amostra. Esta equação pode ser simplificada em duas etapas como (VER LIVRO TEXTO):• • r = Σ (x- ) (y- ) • ------------------• √ Σ (x- )2 Σ (y- )2
• • e finalmente,
•2. COEFICIENTE DE CORRELAÇÃO LINEAR
•
•EXEMPLOS:
• Desenvolva o primeiro exercício do livro ;
• A seguir encontre o coeficiente de correlação r para os dados da tabela anterior (acima) usando a equação simplificada.
(X) (Y) XY X2 Y2
5 6 30 25 368 9 72 64 817 8 56 49 6410 10 100 100 1006 5 30 36 257 7 49 49 499 8 72 81 643 4 12 9 168 6 48 64 362 2 4 4 465 65 473 481 475
•3. Propriedades do coeficiente r .
• Propriedades do coeficiente r: • O valor de r está sempre entre –1 e 1. • O valor de r não varia se todos os valores de qualquer uma das variáveis são convertidos para uma escala diferente.• O valor de r não é afetado pela escolha de x ou y.• O r mede a intensidade, ou grau, de um relacionamento linear. Não serve para medir a intensidade de um relacionamento não-linear.
•
•4. Coeficiente de determinação r2:
• O coeficiente de determinação r2 indica aproximadamente o percentual de variação na série atribuído à variável independente;
• Da mesma forma 1- r2 indica o percentual de variação atribuído a outros fatores.
• Todos os programas estatísticos calculam o r, r2 e a significância de r.
• Como avaliar-se a significância de r ?
•5. Significância do coeficiente de correlação linear.
• A significância de r está baseada no seu afastamento de zero.
• Uma aplicação do teste t é geralmente utilizada para a avaliação da significância de r.
• Justifica-se como a observação da diferença do r calculado de zero, que indica a inexistência de qualquer correlação. A equação e os graus de liberdade (pares na série) usados são:
•
•6. CORRELAÇÃO POSITIVA E NEGATIVA.
• CORRELAÇÃO POSITIVA: • Caso as variáveis x e y cresçam no mesmo sentido, isto é, quando x cresce, y também cresce, diz-se que as duas variáveis têm correlação positiva.
• As notas de matemática e notas de estatística dos alunos tem correlação positiva, porque quando uma das variáveis cresce, a outra , em média, também cresce.
• CORRELAÇÃO NEGATIVA: caso as variáveis x e y variem em sentido contrário, isto é, quando x cresce, em média y decresce, diz-se que as duas variáveis têm correlação negativa.
•7. INTENSIDADE DA CORRELAÇÃO.
•
•8. Exemplo final.
• Observe os dados da tabela a seguir e discuta:
• Qual é o coeficiente de correlação da série?
• O que significa?:
•8. Exemplo final•
Recommended