2012 - Tese - Análise multivariada e filtros de graham

  • Published on
    05-Jun-2015

  • View
    200

  • Download
    1

Embed Size (px)

DESCRIPTION

Apresentao da defesa de tese sobre a aplicao de tcnicas de reconhecimento de padres no mercado acionrio brasileiro.

Transcript

<ul><li> 1. ANLISE MULTIVARIADA E FILTROS DEANLISE MULTIVARIADA E FILTROS DE GRAHAM: reconhecimento de padresGRAHAM: reconhecimento de padres aplicado aos fundamentos do mercadoaplicado aos fundamentos do mercado acionrio brasileiro para o perodo deacionrio brasileiro para o perodo de 1999-20091999-2009 Alysson Ramos Artuso 2012 Tese de Doutorado (Programao Matemtica) </li></ul><p> 2. Apresentao Introduo Filtros de Graham Risco e Retorno de Aes Anlise Multivariada Teoria da Informao Metodologia Principais resultados Consideraes Finais 3. Introduo Bolsa de Valores Estabilizao econmica (1994), regulamentao do mercado (2001) e longo perodo de alta (2002-2007) crescimento no investimento em renda varivel Assunto comea a ser explorado nos trabalhos de ps-graduao 4. Introduo Bolsa de Valores 5. Introduo Bolsa de Valores Anlise de valor Graham e Dodd Princpios centrais: A ao representa uma parte de um negcio real, com um valor intrnseco que independe do seu preo O mercado um pndulo entre o otimismo insustentvel e o pessimismo injustificvel Retorno depende do preo pago Margem de segurana e diversificao 6. Introduo Filtros de Graham Uma empresa potencialmente um bom investimento se: For boa (crescimento consistente, financiamento conservador etc) For barata (patrimnio lquido elevado, lucro elevado etc em comparao ao preo) Filtros de Graham formas de identificar uma empresa boa e barata 7. Introduo Reconhecimento de Padres Programao Matemtica Data Mining Redes Neurais rvores de Deciso Mtodos Baysianos... Tcnicas Estatsticas Anlise Multivariada: Anlise Fatorial Anlise Discriminante Regresso Logstica... 8. Introduo Risco/Retorno Analisar retorno deve envolver uma medida de risco: Comparao com um ndice de mercado Ibovespa Baseados em mdia/varincia ndice de Sharpe Baseado em coeficientes de regresso Alfa de Jensen Hiptese do Mercado Eficiente Erros de precificao so aleatrios e no h correlao dos desvios com qualquer varivel no h estratgias consistentes 9. Objetivo Geral Propor e analisar tcnicas baseadas em Mtodos Estatsticos Multivariados e na Teoria da Informao para ranquear as empresas de acordo com seus mltiplos e ndices econmico- financeiros comuns da Anlise Fundamentalista, visando construo de portflios com uma rentabilidade acima da de mercado. 10. Objetivos Especficos Testar a aplicabilidade dos filtros de Graham e dos conceitos que os sustentam no mercado acionrio nacional. Identificar e interpretar fatores explicativos da maior parte da variabilidade dos dados. Construir modelos de discriminao das empresas de acordo com sua rentabilidade e testar o poder preditivo desses modelos. Apontar indcios sobre a eficincia do 11. Justificativas Tema: Vem se popularizando no Brasil Poucas pesquisas acadmicas nacionais Suporte terico de Graham: Estabeleceu um rigoroso mtodo de avaliao Sua escola de investimento uma das principais evidncias contrrias Hiptese do Mercado Eficiente Pouco explorado nas pesquisas brasileiras (nenhuma testando profundamente seus conceitos) 12. Justificativas Tcnicas Estatsticas: Fundamentais para avaliar risco/retorno Tratadas superficialmente na maioria dos trabalhos da rea Trazem somente comparaes simples de carteiras baseadas em mltiplos Anlise Multivariada: Interesse crescente Problemas de diversificao e proposio de modelos Inovao na forma de aplicao aos fundamentos contbeis 13. Histrico de pesquisas Muitos dos estudos desconsideram ajustes ao risco Baseados em estratgias utilizadas no passado modificaes no mercado e disseminao da prtica Aes de valor x aes de crescimento e Mltiplos de Mercado (mas quase nunca com critrios mltiplos) 14. Filtros de Graham So 10 filtros baseados em Mltiplos de mercado Indicadores econmicos e financeiros Mercado norte-americano entre as dcadas de 1930-70 Abordagem de Graham Reconhecimento de Padres identificar variveis relevantes e superfcies de separao 15. Filtros de Graham 1. ndice Lucro/Preo superior ao dobro da taxa livre de risco 2. P/L menor que 40% do P/L mdio do mercado (5 anos) 3. DY maior que 2/3 da taxa livre de risco 4. Preo inferior a 2/3 do VCT 5. Preo inferior a 2/3 do CGL 16. Filtros de Graham 6. Dvida total menor que VCT 7. Liquidez Corrente maior que 2 8. LGM maior que 2 9. Crescimento do lucro maior que 7% ao ano nos ltimos 10 anos 10. No mais do que 2 anos de lucros em declnio nos ltimos 10 anos 17. Filtros de Graham Avaliao bastante conservadora poucas empresas satisfazem os 10 critrios (7 podem ser suficiente) Carteira deve ter pelo menos 10 ativos (recomendado 30) Usando os qualificadores originais no seria possvel formar carteiras no mercado brasileiro nos ltimos 10 anos 18. Risco/Retorno Risco Desvio padro Diversificao diminui o risco (diminui a oscilao) 19. Risco/Retorno Medidas utilizadas: Comparao dos retornos logartmicos (Ibovespa como carteira de mercado) ndice de Sharpe Alfa de Jensen fE(r) r IS = ( )f f E(r) r . E(r) r = + 20. Anlise Multivariada Estudo simultneo de muitas variveis: Reduo de dados ou simplificao estrutural Classificao e agrupamento; Investigao de dependncia entre variveis Predio Teste e construo de hipteses 21. Anlise Multivariada Componentes Principais Investigar quais variveis mais contribuem para a variabilidade dos dados Transformar um conjunto de variveis correlacionada em um novo conjunto de variveis no-correlacionadas Usada tambm para o descarte de outliers 22. Anlise Multivariada Componentes Principais A j-sima componente amostral dada por onde so os autovalores e autovetores de S, Y e X e X ... e X pj 1j 1 pj2j 2 = = + + + ' e Xj 1 2 pp1 2 ( , ),( , ),...,( , ) e e e = =j j i j V(Y ) Cov(Y,Y ) 0e 23. Anlise Multivariada Anlise Fatorial Agrupar as variveis em fatores explicativos no-correlacionados Identificar fatores de forma a compreender melhor o funcionamento do evento estudado Classificar as observaes de acordo com o escore fatorial 24. Anlise Multivariada Anlise Fatorial No modelo fatorial se pressupes que as p variveis X sejam linearmente dependentes sobre m variveis aleatrias no- observveis F chamadas fatores comuns X LF = + 25. Anlise Multivariada Anlise Fatorial Estimao dos pesos e varincias especficas pelo mtodo das componentes principais = = 1/2 L CD ; S LL' e e e 111 1p12 e e e 1/221 22 2p 2C D e e e p1 p2 pp p = = L L M M M M O L 26. Anlise Multivariada Anlise Fatorial Os escores fatoriais estimados para as variveis padronizados so dados por: Escore bruto de cada observao ponderado pelos autovalores: ( ) 1 F L'L L'z = k k j j i i i 1 i 1 E f '. / ' = = = 27. Anlise Multivariada Teste T2 de Hotelling Teste multivariado para diferena entre as mdias Constatar se dois grupos previamente selecionados possuem diferenas significativas ( ) ( ) 1 2 1 2 0 p 1 2 0 1 2 1 1 T x x ' S x x n n = + ( ) ( ) ( )1 2 2 1 2 p,n n p 1 1 2 n n p 1 T ~ F 1 n n 2 p + + + 28. Anlise Multivariada Anlise Discriminante Determinar quais variveis melhor segregam os grupos Utilizar essas variveis para criar regras de classificao, alocando novos objetos nos grupos previamente definidos 29. Anlise Multivariada Mtodo de Fisher Transformar as observaes multivariadas X em observaes univariadas Y, tal que os Ys dos grupos sejam separados tanto quanto possvel. 30. Anlise Multivariada Mtodo de Fisher Funo Discriminante Linear de Fisher aloca uma nova observao se Y m para um grupo ou para outro (Y &lt; m). 1 Y ( )'Sp = = ' C X X X X1 2 Y Y1 1 1 2m ( )'S ( )p2 2 + = + =X X X X1 2 1 2 31. Anlise Multivariada Regresso Logstica Descrever a relao entre uma varivel resposta e as variveis explicativas Resposta dicotmica utilizada para a classificao Estimao dos parmetros via mtodos iterativos 32. Anlise Multivariada Regresso Logstica Regresso Linear: E(Y/x) = 0 + 1X Regresso Logstica: + = = + + x 10eE(Y/x) (x) x 101 e = = + (x)g(x) ln x 101 (x) 0 E(Y/x) 1 33. Anlise Multivariada Mtodo stepwise Acrscimo (forward) ou retirada (backward) de varivel de acordo com algum critrio (p. ex.: capacidade de previso do modelo). Manter a qualidade da previso usando um menor nmero de variveis 34. Teoria da Informao Originalmente desenvolvida para sinais em cabos de comunicao (Shannon, 1948) Capacidade de identificar variveis relevantes por meio de: Entropia: quantifica a incerteza relacionada com o valor de uma v.a. Informao mtua: quantifica o quanto conhecer uma varivel diminui a incerteza sobre outra. 35. Teoria da Informao Entropia: origem na Fsica Semelhanas: Expresso matemtica Interpretao probabilstica Diferenas: Entropia fsica est relacionada com o sentido de processos estabelece um princpio fsico (2 Lei da Termodinmica) Entropia fsica no faz referncia a distribuies de probabilidade especficas 36. Teoria da Informao Entropia de Shannon: Entropia condicional: Informao mtua: ( ) n i i i 1 H p log p = = ( ) ( ) ( ) ( ) ( ) ( ) i j j i H Y | X p i p j | i logp j | i p j,i logp j | i= = ( ) ( ) ( ) ( ) ( ) ( ) i j I Y,X H Y H Y | X p i,j I X,Y p i,j log p(i).p(j) = = 37. Teoria da Informao 38. Teoria da Informao Entropia de Rnyi famlia de medidas de entropia da qual a de Shannon um caso particular: Informao mtua de Rnyi obtida a partir da divergncia de CS: n i i 1 1 H log p 1 = = ( ) ( )( ) ( ) ( ) ( ) ( ) CS CS XY X Y CS 2 XY X Y 2 XY 2 X Y I X,Y D f x,y ;f (x)f (y) 1 1 I X,Y H f f f H f H f f 2 2 = = 39. rvore de Deciso Objetivo de categorizar dados e gerar regras de classificao facilmente interpretveis. Estrutura em forma de rvore: Cada n indica um teste Cada ramo apresenta um resultado do teste Cada n final corresponde a uma classificao 40. rvore de Deciso 41. rvore de Deciso Algoritmo C4.5 (Quinlan, 1993): Construo da rvore: seleciona a varivel que melhor separa os grupos pela maior reduo da entropia absoluta (informao mtua) e relativa. Separao binria dos ramos: pesquisa exaustiva Poda da rvore combater overfitting reduo de ns por error based pruning 42. rvore de Deciso Estimao da entropia quadrtica de Rnyi pela Janela de Parzen com kernel gaussiano: com dado pela regra de Silvermann: ( ) ( ) N N 2 j i2 2 i 1 j 1 1H X log G x x N = = = ( )( ) 1 11 d 4 X 4N 2d 1 + = + 43. Avaliao dos mtodos de classificao Taxa aparente de erro (APER) Matriz Confuso Abordagem de Lachenbruch equivale a ter um grupo com n observaes para ajuste e outro grupo (tambm de tamanho n) para testar a eficincia do procedimento 44. Metodologia Populao Amostrada: Todas as empresas de capital aberta no-financeiras e de negociao diria (cerca de 350 empresas) Dados retirados dos relatrios contbeis CVM e Economtica Dados de 31/03 Retiradas as que no apresentavam dados completos (sobrando cerca de 200) 45. Metodologia Variveis utilizadas: Indicadores Financeiros: 8 Indicadores de Rentabilidade: 5 (6) Mltiplos de Mercado: 7 Medidas de Risco/Retorno: 3 NALD includa somente nos Filtros de Graham 46. Metodologia Abordagem de carteira Avaliao dos Filtros de Graham Contribuio com novos indicadores Anlise Fatorial Identificao e interpretao de fatores Estratgia de ranqueamento Reconhecimento de Padres Anlise dos modelos: FDLF, MRLM, ADS e ADR. 47. Metodologia Filtros de Graham Levantamento de dados Construo das carteiras Clculo das rentabilidades Testes de hiptese e anlise dos resultados Proposio de novos qualificadores quartis desenvolvimento de filtros brasileiros 48. Metodologia Anlise Fatorial Levantamento de dados Descarte de outliers Testes de viabilidade da AF Componentes Principais e extrao dos fatores Rotao varimax Clculo do escore Construo das carteiras 49. Metodologia Anlise Discriminante Separao de grupos (S/F) Testes de viabilidade da AD Uso de variveis originais e mtodo forward stepwise (separao dos grupos) FDFL e MRLM Avaliao da classificao Construo das carteiras Anlise dos resultados 50. Metodologia rvore de Deciso Mesmos grupos da AD Algoritmo C4.5 adaptado para utilizar a entropia quadrtica de Rnyi Anlise da classificao (Lachenbruch) Construo das carteiras Anlise dos resultados 51. Metodologia Contribuies Originalidade Aplicao de mtodos no utilizados na bibliografia levantada Desenvolvimento de novas metodologias de classificao e seleo de ativos financeiros (Escores fatoriais, entropia quadrtica de Rnyi) No-trivialidade Extenso e complexidade do estudo 52. Metodologia Contribuies Contribuio cientfica Discusso dos conceitos de entropia para a Fsica e para a Teoria da Informao Proposio de filtros brasileiros Ranqueamento de ativos via escores fatoriais da AF Desenvolvimento e avaliao de modelos de classificao 53. Metodologia Contribuies Contribuio social Contribuio na compreenso do mercado acionrio brasileiro Proposio de modelos prticos para o pequeno investidor pessoa fsica 54. Principais resultados Filtros de Graham Rentabilidade acima do mercado (ambos os casos) Indicadores originais: Preceitos so vlidos Baixa diversificao (mdia de 5 aes em carteira) Qualificadores propostos: Mais adequados realidade brasileira Mdia de 12 aes em carteira Melhores retornos 55. Principais resultados Anlise Fatorial Elimina o problema de diversificao Interpretao da influncia das variveis Fator 1: Liquidez (LS, LC, LI) Fator 2: Preo (P/VC, P/VCT) Fator 3: Rentabilidade (ROA, ROE) Fator 4: Endividamento (GE, GEM) Estabilidade dos fatores Rentabilidade superior ao mercado 56. Principais resultados Anlise Discriminante Variveis de destaque: Preo de Mercado (PM) Dividend Yield (DY) Preo por Valor Contbil (P/VC) Caracterstica dos ativos selecionados: grandes companhias, que pagam altos dividendos e so negociados a um baixo mltiplo P/VC Aes de valor Graham Resultados prximos entre FDLF e MRLM 57. Principais resultados Anlise Discriminante ndice de acerto aproximado: Total: 83%; Fracasso: 97%; Sucesso: 20% Problema de diversificao: grande oscilao no nmero de ativos Seleo de somente 12 ativos com base no valor de sada do modelo. Retornos superiores ao mercado, mas nem sempre com valores significativos 58. Principais resultados rvores de Deciso Variveis de destaque: Preo de Mercado (PM) Mdia de Crescimento dos Lucros (MCL) Preo por Valor Contbil Tangvel (P/VCT) Dividend Yield (DY) ndice de acerto aproximado: Total: 86%; Fracasso: 98%; Sucesso: 40% Retornos superiores ao mercado, mas nem sempre com valores significativos Shannon melhor que Rnyi 59. Principais resultados Estratgias Filtros de Graham originais (a.p) Filtros de Graham modificados (a.p) Anlise Fatorial (a.p.) FDLF 12 Stepwise 1 ano *39,61% *39,78% *38,05% 23,89% 2 anos 55,05% *...</p>