Tópicos Especiais em Reconhecimento de Padrões … · Problemas I Presen˘ca de valores extremos...

Preview:

Citation preview

Sylvio Barbon Jrbarbon@uel.br

Topicos Especiais emReconhecimento de Padroes

[2COP329]Mestrado em Ciencia da

Computacao

(2/27)

Tema

AulaAnalise de Regressao

1 Introducao

2 Regressao Linear Univariada

3 Exemplo

4 Avaliacao da Estimativa

5 Estudo de Caso 1

6 Regressao Linear Multipla

7 Regressao Linear Multivariada

8 Referencias

Introducao (4/27)

Regressao

I A analise de regressao visa descrever por meio de um modelomatematico, a relacao existente entre variaveis, a partir de nobservacoes ou exemplos.

I A ideia e generalizar (induzir) um modelo onde a variavel Y(dependente, alvo ou saıda) tem relacao com X(independente, explicativas ou regressoras).

I Entre os modelos possıveis, temos:

1. Modelo linear simples, por meio de uma equacao de retadescreve o comportamento entre duas variaveis;

2. Modelo linear multiplo preditores, onde uma equacao de retadescreve o comportamento de mais de duas variaveis;

3. Outros: nao linear simples, nao linear multipla, logıstica,polinomial, linear univariada e multivariada.

Introducao (5/27)

Regressao

I Os tipos de regressao podem ser divididos considerando:

1. Numero de variaveis independentes;2. Numero de variaveis dependentes;3. Formato ou tipo de funcao regressora;4. Tipo de variaveis dependentes;

Linear Logıstica Polinomial

Regressao Linear Univariada (6/27)

Simples

I Relacao entre duas variaveis: X e Y.

I A relacao e expressa por:

y = β0 + β1x + ε (1)

I , onde:I y = variavel desejada (saıda, independente);I β0 = intercepto (valor esperado para y quando x for 0);I β1 = coeficiente angular (variacao esperada de x quando y

variar;I x = variavel de entradaI ε = erro do modelo (erro aleatorio, erro do modelo)

Regressao Linear Univariada (7/27)

Regressao

Regressao Linear Univariada (8/27)

Mınimos Quadrados

I Precisamos encontrar β0 e β1, buscando um ε mınimo.Podemos considerar β0 como a variavel associada a vendas eβ1 a youtube.

I Podem ser utilizados diferentes metodos, como por exemplometodos de tentativa e erro, forca bruta ou metodosestatısticos.

I Um metodo dos metodos utilizados para encontrar os valoresde β0 e β1 e o chamado Mınimos Quadrados e tem asseguintes caracterısticas:

1. A soma dos desvios verticais dos pontos e relacao a reta e zero;2. A soma dos quadrados destes desvios e mınima, isto e,

nenhuma outra reta daria menor soma de quadrados de taisdesvios;

Regressao Linear Univariada (9/27)

Mınimos Quadrados

I β1 =∑

x .y−∑

x.∑

yn∑

x2− (∑

x)2

n

I β0 = y − β1.xI Sendo que:

I y =∑n

i=1 yin

I x =∑n

i=1 xin

Exemplo (10/27)

Descricao

I O custo de producao de um lote de um equipamento dependedo numero de unidades produzidas, ou seja, do tamanho dolote. Em uma amostra de 6 lotes diferentes, observou-se osseguintes resultados.

Exemplo (11/27)

Resultado

I Usando Mınimos Quadrados obteve-se:

Avaliacao da Estimativa (12/27)

Erro padrao

I Quanto foi precisa a estimativa do modelo?

I A determinante principal da precisao e a quantidade dedispersao na populacao, ou seja, quanto maior a dispersaomenor a precisao das estimativas.

I Erro padrao (Se) do modelo e calculado como:

Se =√∑

(yo−yr )2

n−2 , onde yo e o valor obtido pelo modelo e oyr e o valor real do problema.

Avaliacao da Estimativa (13/27)

Coeficiente de Correlacao

I Pode-se medir o grau de correlacao (r) entre duas populacoesusando a Correlacao de Pearson. O coeficiente de correlacao re um valor entre -1 e + 1. Sendo 0 a nao correlacao.

I r =∑

xy−∑

x.∑

yn√∑

x2− (∑

(x)2)n

.∑

y2− (∑

(y)2)n

Avaliacao da Estimativa (14/27)

Coeficiente de Correlacao

Avaliacao da Estimativa (15/27)

Resultado

I Aplicando a margem de erro Se . O r obtido foi de 0.99:

Avaliacao da Estimativa (16/27)

Problemas

I Presenca de valores extremos (outliers) influenciamdiretamente na qualidade do modelo. Assim, tecnicas pararemocao deste tipo de comportamento sao necessarias.

Estudo de Caso 1 (17/27)

Projeto

I Considere uma empresa que deseja compreender (analisar)sobre o impacto no investimento em marketing no youtube,facebook e newspaper com relacao as vendas (sales).

I Qual seria o melhor investimento?

I Justifique qual o melhor investimento por meio da suamodelagem.

I Demonstre os resultados de forma grafica, apontando o erro ecorrelacao dos modelos obtidos.

I A base de dados esta disponıvel no site.

Regressao Linear Multipla (18/27)

Regressao Linear Multipla

I No ajuste de modelos de Regressao Linear Multipla, saotratadas um conjunto de variaveis preditoras (X ) .

I Assim, X = (X1, ...,XP), onde P sao as variaveis preditorasnao aleatorias que modelam um Y .

I Y = β0 + β1x1 + β2x2 + ...+ βpxp + ε

I Para o Estudo de Caso 1, agora vamos considerar os tresinvestimentos em marketing, em conjunto, para predizermos avendas.

Regressao Linear Multipla (19/27)

Estudo de Caso

Regressao Linear Multipla (20/27)

Estudo de Caso

Regressao Linear Multipla (21/27)

Estudo de Caso

Regressao Linear Multipla (22/27)

Estudo de Caso

Regressao Linear Multipla (23/27)

Estudo de Caso

Regressao Linear Multipla (24/27)

Estudo de Caso

Regressao Linear Multipla (25/27)

Estudo de Caso

Regressao Linear Multivariada (26/27)

Regressao Linear Multivariada

I No ajuste de modelos de Regressao Linear Multivariada,temos um conjunto de variaveis de resposta (Y ).

I Assim, Y = (Y1, ...,YP), onde P sao as variaveis preditorasnao aleatorias.

I Yj = βjXj + εJ , onde j = 1, ..., p

Referencias (27/27)

Lista de Referencias

1. C.M. Bishop, ”Pattern Recognition and Machine Learning”,Springer, 2006

2. R. Duda, P. Hart, D. Stork, ”Pattern Classification”, secondedition, 2000.

3. T. Hastie, R. Tibshurani, and J.H. Friedman, ”The Elementsof Statistical Learning: Data Mining, Inference, andPrediction”, Spinger Series in Statistics, 2001.

4. N. Cristianini and J. Shawe-Taylor, ”An Introduction toSupport Vector Machines”, Cambridge Univ. Press, 2000.

5. B. D. Ripley, “Pattern Recognition and Neural Networks”,Cambridge University Press, 1996.

Recommended