Regressão Linear

Embed Size (px)

DESCRIPTION

Estudo sobre estatistica

Citation preview

  • Estatstica Prof. Ricardo Lus Rocha

    Regresso Linear

    Unidade 3

  • Estatstica Prof. Ricardo Lus Rocha

    Ementa

    3.1 Reta dos mnimos quadrados

    3.2 Ajuste da reta de regresso linear simples

    Unidade 3 Regresso Linear

  • Estatstica Prof. Ricardo Lus Rocha

    Na unidade anterior estudamos a medida da

    intensidade de correlao entre duas variveis.

    Se chegarmos concluso de que h uma grande

    correlao linear entre as variveis, devemos

    determinar qual relao essa.

    A determinao da relao linear entre duas

    variveis chamada de regresso linear.

    Unidade 3 Regresso Linear

  • Estatstica Prof. Ricardo Lus Rocha

    Dada uma coleo de dados amostrais

    emparelhados, a equao de regresso

    descreve a relao entre as duas variveis. O grfico

    da equao de regresso chamado de reta de

    regresso (ou reta de melhor ajuste, ou reta de

    mnimos quadrados).

    xbby 10

    Unidade 3 Regresso Linear

  • Estatstica Prof. Ricardo Lus Rocha

    Esta equao descreve a relao entre x (chamada

    varivel independente ou varivel preditora) e

    (chamada varivel dependente ou varivel

    resposta).

    Na equao, b0 chamado de intercepto y e b1 o

    coeficiente angular.

    Para o clculo de b0 e b1, utilizamos as frmulas a

    seguir.

    y

    Unidade 3 Regresso Linear

  • Estatstica Prof. Ricardo Lus Rocha

    Repare que os dados necessrios para o clculo de b0e b1 so os mesmos para o clculo do coeficiente de

    correlao linear r, o que torna a determinao de

    uma reta de regresso muito simples aps o clculo

    do coeficiente de correlao.

    221

    xxn

    yxxynb

    n

    xbyb

    1

    0

    Unidade 3 Regresso Linear

  • Estatstica Prof. Ricardo Lus Rocha

    Variao marginal:

    Ao trabalharmos com duas variveis relacionadas

    por uma equao de regresso, a variao marginal

    em uma delas o quanto ela varia quando a outra

    varivel sofre uma variao de exatamente uma

    unidade. A variao marginal igual ao valor do

    coeficiente angular da reta b1.

    Unidade 3 Regresso Linear

  • Estatstica Prof. Ricardo Lus Rocha

    Outliers:

    Em um diagrama de disperso, um ponto extremo

    (outlier) um ponto que est muito afastado dos

    demais pontos.

    Pontos de influncia:

    Os dados amostrais emparelhados podem conter um

    ou mais pontos de influncia, que so pontos que

    afetam fortemente o grfico da reta de regresso.

    Unidade 3 Regresso Linear

  • Estatstica Prof. Ricardo Lus Rocha

    Predies:

    As equaes de regresso podem ser teis quando

    usadas para predizer o valor de uma varivel, dado

    um valor determinado da outra varivel.

    Se a reta de regresso se ajusta bem aos dados, ento

    tem sentido utilizar uma equao para fazer

    predies.

    Unidade 3 Regresso Linear

  • Estatstica Prof. Ricardo Lus Rocha

    Na ausncia de correlao linear significativa, no

    podemos usar a equao de regresso para projetar

    ou predizer.

    Em vez disso, a melhor estimativa da segunda

    varivel simplesmente a sua mdia.

    Devemos tambm lembrar que no podemos

    extrapolar os valores da varivel independente, pois

    no sabemos o comportamento da varivel

    dependente y para valores no determinados de x.

    Unidade 3 Regresso Linear

  • Estatstica Prof. Ricardo Lus Rocha

    Exemplo:

    Os pesos de ursos machos podem ser determinados

    pelo seu comprimento?

    Como visto anteriormente, h uma correlao entre o

    peso e o comprimento dos ursos.

    Determine agora a reta de regresso que relacione o

    peso dos ursos com o seu comprimento.

    Comprimento em pol (x) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0

    Peso em libras (y) 80 344 416 348 262 360 332 34

    Unidade 3 Regresso Linear

  • Estatstica Prof. Ricardo Lus Rocha

    Resoluo: Como visto anteriormente, este o

    grfico de disperso dos dados.

    0

    50

    100

    150

    200

    250

    300

    350

    400

    450

    0 10 20 30 40 50 60 70 80

    Unidade 3 Regresso Linear

  • Estatstica Prof. Ricardo Lus Rocha

    Calculando agora o valor de b0 e b1:

    221

    xxn

    yxxynb

    659,975,9433

    91128

    5,51675,345258

    21765,516151879821

    b

    66,3518

    5,516659,921760

    b

    n

    xbyb

    1

    0

    Equao da reta: = 9,659x 351,66y

    Unidade 3 Regresso Linear

  • Estatstica Prof. Ricardo Lus Rocha

    A reta de regresso ser:

    0

    50

    100

    150

    200

    250

    300

    350

    400

    450

    0 10 20 30 40 50 60 70 80

    Unidade 3 Regresso Linear

  • Estatstica Prof. Ricardo Lus Rocha

    Desta forma, podemos agora prever quanto pesar

    um urso macho que mea 71,0 polegadas:

    = 9,659x 351,66

    = 9,659.71 351,66

    = 334,13 libras

    A variao marginal de 9,659, que diz que para

    cada polegada de tamanho que o urso cresa, ele

    pesar mais 9,659 libras.

    yyy

    Unidade 3 Regresso Linear

  • Estatstica Prof. Ricardo Lus Rocha

    Unidade 3 Regresso Linear

    - Qualidade do modelo de regresso linear:

    Definies:

    Desvio total: distncia vertical yy

    Desvio explicado: distncia vertical yy

    Desvio no-explicado: distncia vertical ,

    tambm chamado de resduo.

    yy

    y = valor observadoy = mdia dos valores observadosy = valor predito pela equao de regresso

  • Estatstica Prof. Ricardo Lus Rocha

    Unidade 3 Regresso Linear

    a: Desvio Total: Valor Real Mdia

    a

    c: Desvio No Explicado: Valor Real Predito

    c

    b: Desvio Explicado: Valor

    Predito Mdia

    b

    yy

    yy

    yy

    y

    y

    y

    y

  • Estatstica Prof. Ricardo Lus Rocha

    Unidade 3 Regresso Linear

    Mais definies:

    Variao total: soma dos quadrados dos desvios

    totais2)( yy

    Variao explicada: soma dos quadrados dos desvios

    explicados2)( yy

    2)( yy

    Variao no-explicada: soma dos quadrados dos

    desvios no-explicados

  • Estatstica Prof. Ricardo Lus Rocha

    Unidade 3 Regresso Linear

    (d. Total) = (d. explicado) + (d. no-explicado)

    yy = yy + yy

    (v. total) = (v. explicada) + (v. no-explicada)

    De maneira anloga:

    2)( yy =2)( yy + 2)( yy

    Relaes entre os desvios:

  • Estatstica Prof. Ricardo Lus Rocha

    Unidade 3 Regresso Linear

    Coeficiente de determinao:

    Definio: Valor da variao de y que explicado

    pela reta de regresso.

    totalvariao

    explicada variao2 r

    2

    2

    2

    )(

    )(

    yy

    yyr

    Obs.: Podemos calcular r2 tanto pela definio

    acima, como simplesmente elevando ao quadrado o

    coeficiente de correlao linear r

    r2 sempre assumir valores entre 0 e 1

    ou

  • Estatstica Prof. Ricardo Lus Rocha

    Exerccio:

    Os dados emparelhados abaixo consistem nos pesos

    totais (y) de plstico descartados e tamanhos de

    residncias (x).

    Determine a equao de regresso, a variao

    explicada, a variao no explicada, a variao total

    e o coeficiente de determinao.

    Peso 0,27 1,41 2,19 2,83 2,19 1,81 0,85 3,05

    Tamanho 2 3 3 6 4 2 1 5

    Unidade 3 Regresso Linear