Correlação e Regressão

Embed Size (px)

DESCRIPTION

Análise de Regressão

Citation preview

  • Correlao e Regresso

  • Associao &Variveis QuantitativasSituao 1: Deseja-se realizar uma investigao sobre a ocorrncia de anemia e infeco em uma comunidade. Seria interessante poder estimar a concentrao de hemoglobina e a contagem de eritrcitos e leuccitos no sangue pela medida do hematcrito. Para verificar a possibilidade de se usar tal procedimento, conduzido um estudo-piloto a partir dos resultados da rotina de um laboratrio de hematologia.Como verificar se essas variveis esto associadas?

  • Testes de Hipteses? Estabelecem se existe associao entre duas variveis, mas... No quantificam a fora da associao; e No permitem representar a relao existente sob uma forma funcional.

  • Associao &Variveis Quantitativas possvel fazer um grfico das variveis de interesse e analisar a existncia de uma relao a partir da anlise desse grfico.

    Plan1

    ExameLeuccitoEritrcitoHemoglobinaHematcrito

    (103/mm3)(106/mm3)(g/dl)(%)

    16.84.5014.641

    29.75.2015.647

    34.34.5514.441

    47.94.6514.441

    57.44.4013.840

    67.64.4014.040

    72.84.3013.640

    87.84.6013.842

    95.54.9015.244

    104.64.1013.039

    118.05.0017.046

    127.05.1716.047

    137.14.2011.735

    ...............

    13810.54.5013.439

    1396.94.5014.240

    14013.54.4513.640

    1418.33.7011.033

    1427.04.3012.738

    1434.34.6714.043

    1442.74.4012.739

    14511.24.4013.338

    1475.94.4011.937

    14812.34.2410.031

    Plan2

    Plan3

  • Associao &Variveis QuantitativasDiagrama de Disperso Representao grfica que permite a visualizao do comportamento conjunto das duas variveis. grfico sobre o qual cada medida individual representada por um ponto, sendo que a posio de cada ponto determinada pelos valores observados em um indivduo, para as duas caractersticas medidas (por exemplo, hematcrito e hemoglobina). denominado, tambm, de grfico XY.

  • Diagrama de DispersoAnlise Parece no haver uma relao entre o valor do hematcrito e o valor do leuccito.

  • Diagrama de DispersoAnlise H uma relao crescente entre o valor do hematcrito e o valor de hemoglobina. Esta relao parece ser linear.

  • Diagrama de DispersoAnlise H uma relao crescente entre o valor do hematcrito e o valor do eritrcito. Esta relao parece ser linear.

  • Diagramas de DispersoA anlise no alterada, se trocamos as variveis X e Y, ou seja, a existncia ou no da relao no depende de qual varivel considerada independente. O modelo matemtico, porm, ser alterado a depender de quem X.

  • Associao &Variveis QuantitativasCoeficiente de correlao linear de Pearson Valor numrico que mede a intensidade da associao linear existente entre as duas variveis, medida a partir de uma srie de observaes.Karl Pearson (1857 1936)

  • Coeficiente de Correlao LinearMedindo a Fora da Associao

  • Coeficiente de Correlao LinearInterpretando o valor de rr - assume valores entre 1 e + 1 inclusive.

  • Coeficiente de Correlao Linear

  • Teste de Hipteses sob o Coeficiente de Correlao Linear

  • Coeficiente de Correlao Linear Teste de HiptesesExemplo 1: Vamos calcular o coeficiente de Pearson entre as variveis hemoglobina e hematcrito.H correlao entre hematcrito e hemoglobina.

  • Exemplo 2: Vamos calcular o coeficiente de Pearson entre as variveis leuccito e hematcrito.No h correlao entre hematcrito e leuccito.Coeficiente de Correlao Linear Teste de Hipteses

  • Associao &Variveis QuantitativasModelos de Regresso Modelo matemtico para a relao linear analisada. Permite a predio de uma varivel em funo de outra.

  • Modelos LinearesSituao 2: Uma vez verificada a existncia de uma relao entre a quantidade de hemoglobina e o nmero de hematcritos, desejamos desenvolver um modelo para estimar a medida de hemoglobina (varivel y) a partir da medida de hematcrito (varivel x).Qual a reta que melhor se ajusta a estes dados?

  • Modelos LinearesEquao da RetaIntercepto yaa e b - parmetros da retab

    Grf1

    Viso Geral

    Livro de Exerccios - Dados sobre Lojas de Remessa de Carga

    Objetivo:Ponto de partida para os exemplos do Excel das Sees 11.6.2 e 11.7.

    Referncia:Sees 11.6.3, 11.7

    Contedo do Livro de Exerccios (duas planilhas):

    Planilha Viso GeralResumo deste livro de exerccios.

    Planilha DadosDados sobre o nmero de clientes e vendas semanais para uma amostra

    de 20 lojas de remessa de carga.

    VarivelIntervaloValores

    Nmero da LojaA2:A21

    ClientesB2:B21

    VendasC2:C21semanais, em milhares de dlares

    &L&F/&A

    Dados

    LojaClientesVendasLojaClientesVendas ($1000)LojaClientesVendas

    190711.20190711.20116797.63

    292611.05292611.05128729.43

    35066.8435066.84139249.46

    47419.2147419.21146077.64

    57899.4257899.42154526.92

    688910.08688910.08167298.95

    78749.4578749.45177949.33

    85106.7385106.731884410.23

    95297.2495297.2419101011.77

    104206.12104206.12206217.41

    116797.63

    128729.43

    139249.46

    146077.64LojaClientesVendas ($1000)

    154526.92116797.63

    167298.95128729.43

    177949.33139249.46

    1884410.23146077.64

    19101011.77154526.92

    206217.41167298.95

    177949.33

    1884410.23

    19101011.77

    206217.41

    &L&F/&A

    Dados

    Vendas

    Nmero de clientes

    Quantidade de vendas ($1000)

    Diagrama de Disperso - Dados das 20 empresas

  • Regresso Linear SimplesMtodo dos Mnimos QuadradosO objetivo minimizar a soma do quadrado dos erros:Obtendo os valores de e que minimizam a equao acima.

  • Regresso Linear SimplesMtodo dos Mnimos Quadrados

  • Reta de Regresso & EstimativaEstimativa da Medida de Hemoglobina AnliseO valor de homoglobina mdia estimada, para um valor observado de hematcrito igual a 40%, de 13,97 g/dl.

  • Suponha que desejemos considerar o hematcrito como varivel dependente. Neste caso, podemos calcular outra reta de regresso, pelo mtodo dos mnimos quadrados, considerando a hemoglobina como varivel x (independente) e o hematcrito como varivel y (dependente).Reta de Regresso & EstimativaEstimativa da Medida de Hematcrito O valor de hematcrito mdio estimado, para um valor observado de hemoglobina Hb = 13,97 g/dl, de 40,54%. Note que a reta, para Ht, no a inversa da obtida para Hb.

  • Exemplo 1:Encontre a linha de regresso dos mnimos quadrados para os dados sobre renda e gasto com alimentao nos sete domiclios apresentados na tabela abaixo. Utilize renda como uma varivel independente e gasto com alimentao como uma varivel dependente.

    Renda xGasto com Alimentao yxyx235931512254915735240121714744139114291521155752252882247842592256252126421507222

  • Qualidade do Ajuste na Regresso Coeficiente de DeterminaoR2 = proporo da variabilidade de y que explicada pelo modelo (reta de regresso)Se R2 = 0,90 significa que 90% da variao em y pode ser explicada pela equao obtida.

  • Qualidade do Ajuste na Regresso Coeficiente de DeterminaoQuando fazemos uma regresso linear, os valores observados (x,y) esto espalhados ao redor da reta de regresso. Quanto menor for este espalhamento, melhor a reta de regresso representa o conjunto de valores observados. A varincia amostral total, como estimador do espalhamento, pode ser decomposta da seguinte forma:

  • Qualidade do Ajuste na Regresso Coeficiente de DeterminaoExemplo 2:Para os dados da tabela do exemplo 1, sobre rendas mensais e gastos mensais com alimentao de sete domiclios, calcule o coeficiente de determinao.b=0,2642SQxy=211,7143SQyy=60,8571