Métodos para Previsão de Séries Temporais e Suas Tendências

  • Upload
    rogers

  • View
    234

  • Download
    0

Embed Size (px)

Citation preview

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    1/29

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    2/29

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    3/29

    Responsvel por publicaes:

    Ricardo ChorenIME Seo de Engenharia de ComputaoPraa General Tibrcio 80, Praia Vermelha22290-270, Rio de Janeiro/RJ, BrasilTel. +55 21 2546-7090E-mail: [email protected]

    iii

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    4/29

    1 Introduo

    A importncia da anlise e previso de sries temporais na cincia, engenharia, e neg-

    cios tem crescido e continua como interesse atual de engenheiros e cientistas. De formaobjetiva, [Silva et al., 2007] descrevem uma srie temporal como sendo um conjunto deobservaes discretas, realizadas em perodos eqidistantes e que apresentam uma de-pendncia serial entre essas observaes . De forma ilustrativa, a Figura 01 exibeexemplos de sries temporais.

    (a) (b)

    Figura 01: (a) Srie Dow Jones (Wessa, 2006). (b) Srie Laser (Wan, 2006).

    Conhecer previamente um valor futuro pode significar a diferena entre o sucesso eo fracasso em determinadas ocasies. Diversos Sistemas de Apoio Deciso (SAD) em-pregam mtodos que envolvem previses de fatos e situaes futuras. Dentre eles, po-dem ser citados: previso de vendas para planejamento de produo industrial, de-

    mandas de energia eltrica, previses de temperaturas mdias e da altura das mars,estimativa de preos de aes na bolsa de valores.

    Para que seja possvel prever os valores futuros com base em valores passados, ne-cessrio que se disponha de uma memria histrica de dados ocorridos anteriormente.Todavia, o conjunto de dados, por si s, no permite a previso dos valores futuros.Para isso, necessria a utilizao de algoritmos, tcnicas ou mtodos de previso desries temporais, que podem envolver clculos simples ou procedimentos complexos .

    Existem diversos mtodos para auxiliar na tarefa de previso de sries temporais,como por exemplo: modelos de Suavizao Exponencial, modelos auto-regressivos(AR), de mdias mveis (MA) e Modelos ARIMA. Tecnologias de inteligncia compu-tacional, tais como redes neurais, lgica nebulosa e algoritmos genticos, proporcio-nam a criao de metodologias avanadas de previso.

    Os conceitos e definies descritos anteriormente podem ser observados em maio-res detalhes em [Palit e Popovic, 2005] [Ribeiro et al., 2008] [Silva et al., 2007] [Moret-tin e Toloi, 2006].

    As capacidades e restries individuais de tecnologias de inteligncia computacio-nal tm sido a motivao principal por trs de suas fuses para a criao de sistemashbridos inteligentes, capazes de solucionar muitos problemas complexos.

    Assim, alternativas para combinao de mtodos de previso vm sendo pesquisa-das. Entre elas existe a abordagem de combinao pela criao de comits de mquinas

    de aprendizado. Comit de mquinas de aprendizado uma abordagem que trata dafuso do conhecimento adquirido por especialistas (mtodos de previso ou simples-

    1

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    5/29

    mente previsores) para atingir uma deciso global que visa ser superior quela alcan-vel por qualquer um deles atuando isoladamente [Haykin, 2001].

    Este trabalho tem por objetivo apresentar algumas das tcnicas citadas para a previ-so de sries temporais, bem como as tendncias atuais de pesquisa nessa rea. A orga-nizao desse trabalho segue em mais 3 Sees. A Seo 2 descreve as bases tericas re-

    ferentes previso de sries temporais. Na Seo 3 so apresentados alguns mtodosaplicados na previso de sries temporais e as tendncias nessa rea. Finalizando o tra-balho, a Seo 4 contm um resumo e as suas concluses.

    2 Conceitos Bsicos

    Esta seo descreve os conceitos bsicos sobre sries temporais e apresenta duas dasmais importantes tecnologias de inteligncia artificial que servem de base para a cria-o de diversos algoritmos e mtodos de previso de sries temporais: redes neurais elgica nebulosa.

    2.1 Sries Temporais

    Uma srie temporal pode ser conceituada simplesmente como qualquer conjunto deobservaes ordenadas no tempo [Morettin e Toloi, 2006]. Pode-se expressar uma srietemporal por:

    1,2,3...N}t|{ZZ tt ==

    Onde t um ndice temporal, e N o nmero de observaes. Considerando a exis-tncia de observaes de uma srie temporal at o instante t, a previso no instante t+h denotada por t(h), cuja origem t e o horizonte de previso h. As previses em

    Z(t+1), Z(t+2), ... Z(t+h) podem ser ilustradas por meio do exemplo contido na Figura02.

    . . . ..

    .. . x x

    x

    t t+1 t+2 t+h Tempo (t).....

    Z(t)^

    Z(1)Z(2)

    Z(h)^

    ^

    Figura 02: Observaes de uma srie temporal com previses de origem te horizontesde previso iguais a um, dois e h (adaptado de [Morettin e Toloi, 2006])

    2

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    6/29

    Alm do horizonte de previso, outro parmetro usado pelo processo de previso o nmero de elementos histricos anteriores ao horizonte de previso. Ele chamadode janela de previso e est presente em boa parte dos mtodos de previso de sriestemporais [Silva et al., 2007]. A janela de previso utilizada para formar o exemplos(padres) nos quais alguns mtodos de previso realizam a extrao do conhecimento

    (aprendizado) para aplicao na previso de valores futuros. O elemento que segueimediatamente janela de previso constitui o alvo, ou seja, o elemento que se desejaprever. A srie temporal normalmente dividida em dois conjuntos de elementos: oprimeiro destinado ao mtodo de previso para a obteno do aprendizado (conjuntode treino) e o segundo usado para verificao de seu desempenho na previso de va-lores futuros (conjunto de teste). A Figura 03 mostra um exemplo da definio dessescomponentes para previso de uma srie temporal: a diviso da srie em conjuntospara treinamento e teste, uma janela de previso que possui cinco elementos e o hori-zonte de previso de um elemento (o alvo).

    Figura 03: Exemplo de uma janela de previso com cinco entradas e horizonte de previ-so igual a um

    2.2 Redes Neurais Artificiais

    Em termos intuitivos, redes neurais artificiais (RNAs) so modelos matemticos ins-pirados nos princpios de funcionamento dos neurnios biolgicos e na estrutura docrebro [Goldschmidt e Passos, 2005].

    RNAs so unidades de processamento numrico, cuja arquitetura em camada pro-duz um fluxo de informaes com ou sem realimentao, possuindo uma estrutura de

    processamento de sinais com grande poder de adaptao e capacidade de representa-o de processos no lineares [Silva,2003].

    Entre as aplicaes usuais das RNAs tm-se: reconhecimento e classificao de pa-dres, clustering ou agrupamento, previso de sries temporais, aproximao de fun-es, otimizao, processamento de sinais, anlise de imagens e controle de processos.

    Uma rede neural se assemelha ao crebro em dois aspectos [Haykin, 2001]:

    O conhecimento adquirido pela rede a partir de seu ambiente atravs de umprocesso de aprendizagem; e

    Foras de conexo entre neurnios, conhecidas como pesos sinpticos, so utili-

    zados para armazenar o conhecimento adquirido.

    3

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    7/29

    No processo de aprendizagem, generalizao significa que a rede neural produziruma sada desejada para valores de entrada no utilizados durante tal processo, sendoeste constitudo, geralmente, por meio de exemplos.

    O elemento bsico de construo de uma RNA o neurnio artificial, cuja descrio o estgio inicial para o entendimento dos conceitos associados s estruturas de redes

    existentes.

    2.2.1 Neurnio Artificial

    Um neurnio uma unidade de processamento de informao que fundamental paraa operao de uma rede neural. O modelo de um neurnio ilustrado na Figura 04 esua estrutura descrita a seguir com base nos conceitos definidos em [Haykin, 2001].Outras informaes complementares podem ser obtidas em [Goldschmidt e Passos,2005] e [Rezende, 2003].

    A estrutura de um neurnio permite um conjunto de valores como entradas (x 1,

    x2, ..., xm) para a produo de uma sada nica (yk). Tais entradas so ponderadas porrespectivos pesos sinpticos (wk1, wk2, ...wk3) e somadas ao valor de um bias bk aplica-

    do externamente. O bias bktem o efeito de aumentar ou diminuir a entrada lquida da

    funo de ativao, dependendo se ele positivo ou negativo. Em seguida uma funode ativao (.) utilizada para restringir a amplitude do sinal de sada.

    (a) (b)

    Figura 04: Modelos de um neurnio. (a) Modelo no-linear de um neurnio; (b) Grafo

    de fluxo de sinal de um neurnio. fonte: [Haykin, 2001]

    Tipicamente, o intervalo normalizado da sada de um neurnio descrito como ointervalo unitrio fechado [0,1] ou alternativamente [-1,1]. Considerando vk como o po-

    tencial de ativao ou campo local induzido, o neurnio pode ser descrito pelas se-guintes equaes:

    j

    m

    jkjkxwv =

    = 0

    )(vy kk =

    4

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    8/29

    A funo de ativao pode apresentar caractersticas lineares ou no-lineares, deter-minando a sada de um neurnio a partir do seu potencial de ativao. Dentre aquelasque possuem comportamento linear destacam-se a funo linear e a funo de limiar(referida normalmente na literatura de engenharia comofuno de Heaviside, funo de-grau ou degrau unipolar). Em geral, uma funo no-linear simula com maior preciso

    os neurnios biolgicos, sendo a funo sigmide uma das mais utilizadas. A funosigmide pode ser definida por:

    vev

    +=1

    1)(

    As funes de ativao descritas anteriormente se estendem de zero a +1. Para a uti-lizao de valores negativos, na forma correspondente de uma funo sigmide, pode-se empregar a funo tangente hiperblicadefinida por:

    )tanh()( vv =

    A Figura 05 ilustra os tipos de grficos representados por meio das funes de ati-

    vao mencionadas.

    Figura 05: Tipos de funo de ativao: (a) funo de limiar. (b) funo linear. (c) fun-o sigmide. (d) funo tangente hiperblica

    2.2.2 Arquitetura de uma Rede Neural Artificial

    A estrutura da rede neural, composta de interconexes de neurnios, pode variarquanto ao nmero de camadas, neurnios em cada camada, funo de ativao dosneurnios em uma camada e a forma como as camadas so conectadas (totalmente ouparcialmente). Os detalhes de tal estrutura podem ser verificados em [Haykin, 2001][Rezende, 2003] e [Silva, 2003]. A utilizao dessas informaes para aplicaes empreviso de sries temporais podem ser encontradas em [Palit e Popovic, 2005].

    Existem basicamente trs tipos de arquitetura: redes feedforward de camada nica,

    redesfeedforward de mltiplas camadas e redes recorrentes.

    5

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    9/29

    As redesfeedforward de camada nica so formadas por uma camada de entrada dens fonte projetada sobre uma camada de sada de neurnios, mas no vice-versa.

    Um exemplo de Redes Feedforward Multicamadas so as redes fundamentadas emperceptron de multicamadas (estas conhecidas como redes MLP, do ingls MultilayerPerceptron). Perceptron um modelo de rede de um nvel capaz somente de classificar

    padres que sejam linearmente separveis. As redes MLP possuem uma ou mais cama-das escondidas (ocultas), alm das camadas de entrada e de sada, cuja estrutura des-sas redes supre as deficincias das redes do tipoperceptron.

    Tipicamente, os neurnios em cada camada de uma rede MLP tm como suas entra-das apenas os sinais de sada da camada precedente. As redes MLP so geralmenteusadas para determinar um mapeamento entre dois conjuntos de dados. A Figura 06ilustra um exemplo de uma rede MLP.

    Figura 06: Grafo arquitetural de umperceptron de mltiplas camadas com duas cama-das ocultas. fonte: [Haykin, 2001]

    Uma rede neural recorrente se distingue de uma redefeedforward por ter pelo menosum lao de realimentao. Em funo dessa caracterstica, tambm so chamadas deRNAs com memria, respondendo a estmulos dinamicamente, isto , aps aplicaruma nova entrada, a sada calculada e ento realimentada para modificar a entrada.Exemplos desse tipo de rede so as redes Elman e as Redes Hopfield descritas em .

    Diversas arquiteturas de rede so utilizadas para previso de sries temporais, me-

    recendo destaque: redes MLP, redes de funo de base radial (ou RBF, do ingls RadialBasis Function) e redes recorrentes. As arquiteturas MLP constituem os modelos de re-des neurais artificiais mais utilizados e conhecidos. A inerente capacidade de sua es-trutura de rede em trs camadas promove qualquer mapeamento de entrada-sada,qualificando as redes MLP para uma previso eficiente de sries temporais.

    A escolha da estrutura da rede neural determina diretamente a qualidade do mode-lo obtido. Mesmo para uma estrutura definida, pode haver um nmero elevado oumesmo infinito de solues possveis.

    Diversas atividades so necessrias para a definio da arquitetura de uma redeneural para a qual um problema especfico dever ser resolvido de forma tima. Aps

    a determinao do tipo de arquitetura de rede que ser empregada, conforme opes

    6

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    10/29

    exemplificadas anteriormente, diversas atividades so necessrias para a montagemda estrutura da rede, sendo algumas delas descritas adiante.

    Na maior parte das aplicaes de previso, somente uma camada oculta usada,embora algumas situaes excepcionais justifiquem um nmero maior.

    O nmero de neurnios nas camadas de entrada e de sada depende da dimensio-nalidade dos dados, enquanto que o nmero de neurnios nas camadas intermediriasdepende da complexidade do problema. Quanto maior o nmero de neurnios nas ca-madas intermedirias, mais complexas so as funes mapeadas com a RNA.

    Para o caso de previso de valores futuros onde seja empregado o conceito de janelade previso, a quantidade de ns de entrada da rede diretamente determinada pelotamanho dessa janela. A Figura 07 ilustra a quantidade de neurnios de entrada para apreviso do prximo valor (previso tambm conhecida como um passo a frente, do in-gls one-step-ahead prediction) em uma rede MLP, considerando-se o valor atual x(t) euma janela de previso de n elementos. Nessa configurao ilustrada, o nmero deneurnios necessrios para a camada de sada apenas um.

    Outra etapa de configurao das camadas de rede a seleo das funes de ativa-o dos neurnios, as quais sero idnticas para todos os neurnios de uma mesma ca-mada.

    Figura 07: Nmero de neurnios de entrada para um horizonte de previsoigual a um. fonte: [Palit e Popovic, 2005]

    O padro de interconexo dos neurnios da rede neural refere-se a forma como a

    sada de cada neurnio de uma camada est conectada com a entrada de cada neur-nio da camada subseqente. Uma RNA dita completamente conectada (full interco-nection) quando cada neurnio de uma camada, com exceo da camada de entrada,possui suas entradas ligadas s sadas de todos os neurnios da camada que a antece-de. Se esta condio no for atendida, a RNA dita parcialmente conectada.

    2.2.3 Metodologia de Previso

    A metodologia de previso geralmente compreendida como um conjunto de aborda-gens, mtodos e ferramentas para coleta de dados de sries temporais para serem usa-das em previso de valores futuros, baseados em valores passados [Palit e Popovic,

    2005]. Os passos operacionais definidos por esses autores so: preparao de dados;

    7

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    11/29

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    12/29

    aprendizagem, cujos algoritmos de aprendizagem diferem entre si pela forma como formulado o ajuste de um peso sinptico de um neurnio [Palit e Popovic, 2005].

    Tais algoritmos ajustam iterativamente os pesos das conexes entre os neurnios atque os pares desejados de informaes de entrada(s) e sada(s) sejam obtidos e as rela-es de causa e efeito possam ser estabelecidas [Leone Filho, 2006].

    Os algoritmos de aprendizado podem ser classificados em trs paradigmas distin-tos: aprendizado supervisionado, aprendizado no-supervisionado e aprendizado porreforo. Seguem adiante algumas noes extradas de [Rezende, 2003].

    A aprendizagem supervisionada, tambm conhecida como aprendizagem com umprofessor, caracteriza-se pela existncia de um professor ou supervisor, externo redeque tem a funo de monitorar a resposta da mesma para cada vetor de entrada.

    No aprendizado no-supervisionado a rede autnoma, ela no necessita de umprofessor, sendo o processo direcionado por correlaes existentes nos dados de en-trada.

    O aprendizado por reforo pode ser considerado um paradigma intermedirio entreo aprendizado supervisionado e o no-supervisionado. O conjunto de treinamento formado apenas pelos vetores de entrada, mas existe um crtico externo em substitui-o ao supervisor do aprendizado supervisionado.

    2.3 LGICA NEBULOSA

    A lgica nebulosa, tambm conhecida como lgica fuzzy (do ingls fuzzy logic), umateoria matemtica que permite modelar o modo aproximado do raciocnio humano,imitando assim a habilidade de tomada de deciso em ambientes de incerteza e impre-ciso [Goldschmidt e Passos, 2005].

    Sistemas de apoio deciso, algoritmos para aproximao de funes e sistemas decontrole esto entre as formas mais populares de utilizao dos conceitos relacionadoscom a lgica fuzzy [Rezende, 2003]. Esses conceitos viabilizam a construo de siste-mas inteligentes que lidem com informaes imprecisas e subjetivas, tais como: inves-timento de alto risco, temperatura alta, presso mdia, produo baixa, demanda ele-vada, dentre outras.

    Um sistema baseado em Lgica Fuzzy nico com relao ao fato de possuir habili-dade para tratar simultaneamente dados numricos e conhecimento lingstico, repre-sentando um mapeamento no-linear de um vetor de dados de entrada em uma sadaescalar. O estabelecimento desse mapeamento proporcionado atravs da teoria de

    conjuntos fuzzy e da lgica fuzzy [Mendel, 1995].A Lgica Fuzzy foi inicialmente construda semelhana dos conceitos j estabeleci-

    dos da lgica clssica e da tradicional Teoria dos Conjuntos. Para uma melhor compre-enso desses fundamentos, uma breve descrio ser introduzida.

    2.3.1 Conjuntos Nebulosos

    Na teoria clssica dos conjuntos, o conceito de pertinncia de um elemento a um dadoconjunto A em um universo de discurso X (que prov o conjunto de valores permitidospara uma varivel), associa a cada elemento deste universo X um valor binrio. Dessa

    forma indicado se tal elemento pertence ou no pertence quele conjunto A. Istopode ser expresso pela funo caractersticafA:

    9

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    13/29

    fA(x) = {Axsesomente ,0

    Axsesomente ,1

    No mundo real existem propriedades que so vagas, incertas ou imprecisas e, por-tanto, impossveis de serem caracterizadas por predicados da lgica clssica bivalente.

    A teoria dos conjuntos fuzzy foi criada para tratar graus de pertinncia intermediriosentre a pertinncia total e a no-pertinncia de elementos de um universo de discursocom relao a um dado conjunto [Rezende, 2003].

    Na lgica fuzzy a funo caracterstica foi generalizada, de forma que ela pudesseassumir um nmero infinito de valores no intervalo [0,1]. Um conjunto fuzzy A em umuniverso X definido por uma funo de pertinncia A(x): X [0,1], onde A(x) de-

    nominado como o grau de pertinncia do elemento x ao conjunto A, indicando o quan-to x compatvel com o conjunto A.

    Na Figura 08.a so ilustrados dois conjuntos ordinrios (crisp), baixa e alta,que categorizam a estatura de uma pessoa. Observa-se que uma pessoa com altura de1.79m seria classificada como baixa. Em contraste, uma pessoa que possui 1.8m seriaconceituada alta. Pode-se notar que existe uma transio abrupta de conceitos, vistoque uma diferena mnima de 0.01m pode ocasionar uma mudana no enquadramentodo conjunto que classifica a estatura da pessoa. De forma similar, a Figura 08.b de-monstra o exemplo de dois conjuntos fuzzy que definem os mesmos tipos de conceitos,baixa e alta, buscando introduzir uma transio mais suave nos citados concei-tos. Nesses conjuntos uma pessoa considerada baixa se a sua estatura for igual ou in-ferior a 1.5m, possuindo dessa forma um grau de pertinncia 1.0 em relao ao conjun-to baixa. Para o caso de uma pessoa com 1.8m de altura, esta pertence categoriabaixa com grau de pertinncia 0.5 e ao mesmo tempo tambm considerada altacom grau de pertinncia 0.5. Esse ltimo caso demonstra que um determinado elemen-

    to pode pertencer a mais de um conjunto fuzzy, geralmente com diferentes graus depertinncia.

    Figura 08: (a) Conjuntos ordinrios (crisp). (b) Conjuntos fuzzyfonte: adaptada de [Palit e Popovic, 2005]).

    Existem diversos formatos para a representao dos conjuntos nebulosos. A escolhade um determinado formato deve ser norteada pela compatibilidade do formato com oconceito que se deseja representar. As Figuras 09 e 10 mostram exemplos dos formatosde conjuntos triangular e trapezoidal e suas respectivas frmulas descritas abaixo[Goldschmidt e Passos, 2005]:

    Conjunto Triangular

    10

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    14/29

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    15/29

    fonte: [Goldschmidt e Passos, 2005].

    2.3.2 Variveis Lingsticas

    Uma varivel lingstica definida como uma entidade utilizada para representar demodo impreciso e, portanto, lingstico, um conceito ou uma varivel de um dadoproblema. Ela admite como valores apenas expresses lingsticas (freqentementechamadas de termos primrios), como frio, muito grande, aproximadamentealto etc [Rezende, 2003].

    Por exemplo, a temperatura de um determinado processo pode ser uma varivellingstica assumindo valores Muito Baixa, Baixa, Agradvel, Alta e MuitoAlta, sendo estes descritos por intermdio de conjuntos fuzzy, conforme Figura 11.

    Figura 11: Partio fuzzy de uma varivel lingstica representando a Temperatura.fonte: [Rezende, 2003].

    2.3.3 Operaes Nebulosas Bsicas

    De forma anloga ao que ocorre na clssica Teoria de Conjuntos, diversas operaespodem ser realizadas envolvendo conjuntos fuzzy. Apresentam-se aqui as mais rele-vantes para uma apresentao do assunto.

    SendoA e B dois conjuntos nebulosos do universo de discurso U, podem ser defini-das as seguintes funes de pertinncia para cada operao [Rezende, 2003]:

    Interseo

    A funo de pertinncia do operador nebuloso de interseo entre conjuntos fuzzypode ser generalizada por meio de famlias especficas de funes, chamadas de nor-mas T. Dois dos exemplos mais usuais so:

    (Mnimo) ( ) ( ) ( ){ }xxx BABA ,min=

    (Produto)

    ( ) ( ) ( )xxx

    BABA *=

    12

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    16/29

    Assim como na Lgica Clssica, a operao de interseo corresponde ao operadorlgico de conjuno E.

    Unio

    Similarmente, a funo de pertinncia do operador nebuloso de unio entre conjun-

    tos fuzzy pode ser generalizada por meio de famlias especficas de funes, chamadasde normas S. Essas funes, tambm denominadas como T-Conorm, podem ser expres-sas, dentre outras formas, como:

    (Mximo) ( ) ( ) ( ){ }xxx BABA ,max=

    (Soma limitada) ( ) ( ) ( ){ }xxx BABA += ,1min Assim como na Lgica Clssica, a operao de unio corresponde ao operador lgi-

    co de disjuno OU. Complemento

    A funo do operador nebuloso de complemento pode ser definida por:

    ( ) ( )xxAA

    = 1

    A operao de complemento corresponde ao operador lgico de negao No.

    2.3.4 Regras Nebulosas

    A maneira mais comum de armazenar informaes em uma Base de Conhecimento

    fuzzy a representao por meio de regras de produo fuzzy [Rezende, 2003]. Umaregra de produo (ou regra nebulosa) expressa por uma implicao do tipo:

    SE ENTO

    O antecedente formado por condies nebulosas que, quando satisfeitas, determi-nam o processamento do conseqente por um mecanismo de inferncia nebuloso. Essanoo descrita de forma prtica em [Goldschmidt e Passos, 2005], onde exemplifica-do um sistema para definio do valor de aplice de seguro de vida de clientes de umaseguradora a partir dos valores de idade e de presso desses clientes. Algumas regraspossveis so:

    SE idade meia-idadeE presso baixaENTO seguro baixo

    SE idade jovemE presso altaENTO seguro alto

    2.3.5 Inferncia Fuzzy

    A arquitetura geral de um sistema nebuloso pode ser representada graficamente pelaFigura 12. A etapa de fuzzificao mapeia nmeros (valores crisp) em conjuntos fuzzy.Isso necessrio de forma a ativar regras que esto no formato de variveis lingsti-cas, as quais possuem conjuntos fuzzy associadas com elas. A inferncia nebulosa aresponsvel por processar as regras nebulosas existentes na base de conhecimento, ge-rando um conjunto fuzzy de sada a partir da composio de todas as regras dispara-

    das.

    13

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    17/29

    Por uma regra disparada, entende-se uma regra cujo processamento do antecedentepara as entradas atuais gerou graus de pertinncia no-nulos [Rezende, 2003]. Na fasefinal, a defuzzificao realiza a transformao de conjuntos nebulosos em sadas numri-cas.

    Dentre vrios modelos de Inferncia Fuzzy, o modelo Mamdani foi durante muitos

    anos um padro para a aplicao dos conceitos de Lgica Nebulosa em processamentodo conhecimento [Goldschmidt e Passos, 2005].

    Figura 12: Arquitetura geral de um sistema nebuloso.fonte: [Silva, 2006].

    No modelo Mandami o processamento de inferncias denominado infernciaMax-Min que corresponde s operaes de unio e interseo fuzzy (operadores mxi-mo e mnimo). Os antecedentes de cada regra so processados por meio da interseofuzzy, gerando um grau de disparo que limitar os valores mximos dos conjuntos desada. A composio de todas as regras disparadas (ou ativadas) realizada atravs daoperao de unio fuzzy. Existem diversos mtodos para realizar a transformao dosconjuntos fuzzy de sada em valores numricos, tais como a Mdia dos Mximos e oCentro de Massa (tambm denominado Centro de Gravidade ou Centride), esse ex-presso pela frmula

    ( )

    ( )

    =

    ==m

    iiC

    m

    iiiC

    y

    yy

    y

    1

    '

    1

    ''

    '

    *

    onde m o nmero de intervalos da sada, y'i o valor da varivel de sada para ointervalo i e C(y'i ) o grau de pertinncia da varivel y'i no conjunto C.

    14

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    18/29

    3 Mtodos de Previso de Sries Temporais

    Um conjunto diversificado de mtodos de previso de sries temporais esto dispon-veis. As modelagens existentes vo desde modelos estatsticos [Box e Jenkins, 1976] ataquelas derivadas de tecnologias de inteligncia computacional, cuja teoria destas lti-

    mas pode ser verificada com maiores detalhes em [Palit e Popovic, 2005] . Alm disso,tais modelagens podem ser combinadas, tanto na forma de sistemas hbridos como emcomits.

    A escolha dos algoritmos e modelagens aqui descritas teve como escopo principal ouso de algumas tcnicas de inteligncia artificial, tais como lgica nebulosa e redesneurais artificiais. Essas tcnicas permitem a criao de mquinas de aprendizado, queconstituem sistemas capazes de adquirir conhecimento de forma automtica.

    Como exemplos de mtodos que utilizam tcnicas de inteligencia computacionalso descritos: o algoritmo de Wang-Mendel [Wang e Mendel, 1992], que prov ummeio de obteno de regras lingsticas a partir de pares de dados numricos, gerando

    uma base de conhecimento para mapear o espao de entrada no espao de sada, e; ummtodo baseado no algoritmo de aprendizado Backpropagation [Rumelhart e Mcclel-land, 1986], que empregado para a previso de sries a partir da utilizao de janelasde previso como exemplos para a etapa de treinamento de uma rede neural MLP.

    Na abordagem de comits, busca-se fundir o conhecimento adquirido por mtodosde previso construdos, basicamente, por mquinas de aprendizado, no intuito deatingir uma deciso global que visa ser superior quela alcanvel por qualquer umdeles atuando isoladamente [Haykin, 2001]. Para essa abordagem a literatura utilizauma gama de termos, tais como, comit, ensembles, combinador, classifier fusion, agrega-o e outros para denominar conjuntos de mquinas de aprendizado que trabalhamacoplados para solucionar um problema de aprendizado de mquina [Valentini e Ma-sulli, 2002]. Visando englobar as variaes de nomenclaturas e conceitos referentes aoscitados mtodos de combinao, este trabalho adotar a expresso comit de aprendi-zado para descrever algumas estratgias associadas.

    3.1 Algoritmo de Wang-Mendel

    O algoritmo original de Wang-Mendel [Wang e Mendel, 1992] prov um mtodo gen-rico de gerao de regras nebulosas (fuzzy) que combina informaes numricas e lin-gsticas para uso, inclusive, em previso de sries temporais.

    O mtodo sugere uma seqncia de 5 passos para gerao de regras fuzzy: 1) Divi-

    so dos dados de entrada e de sada em conjuntos fuzzy; 2) Gerao das Regras Fuzzy;3) Definio de um grau para cada regra gerada; 4) Composio da Base de Conheci-mento; e 5) Defuzzificao (Previso de valores futuros). Os quatro primeiros passosso responsveis pela gerao da base de conhecimento e compem a chamada etapade treinamento. O quinto passo realiza, a partir da base de conhecimento gerada, apreviso dos dados propriamente dita.

    Considerando-se como exemplo um vetor de entrada (X1, X2, ..., Xn) que representadados de uma srie temporal, a Figura 13 ilustra a diviso do domnio em intervalosde mesmo tamanho para realizao do primeiro passo do mtodo. Os intervalos sodivididos em 2N+1 conjuntos fuzzy. N definido pelo usurio para cada varivel. Oconjunto CE (Center) representa o intervalo de valores que situa-se no ponto mdio dodomnio da varivel do vetor de entrada. Os conjuntos denominados SN (Small N) re-ferem-se aos elementos que esto abaixo do conjunto CE e BN (Big N) para aqueles que

    15

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    19/29

    esto acima. Cada conjunto associado a uma funo de pertinncia, nesse caso trian-gular, e tem por funo mapear o vetor de entrada. Desse mapeamento sero defini-dos, posteriormente, os pares de dados que representaro a entrada (janela de previ-so) e a sada (alvo). Os conjuntos citados so sobrepostos, como ilustrado na Figura13.

    CE{{{{

    {{S1

    B1B2

    S2

    B3

    {S3

    U+

    U-

    X

    U+U-

    S3 S2 S1 CE B1 B2 B3

    X

    (X)

    t

    Srie Temporal

    7 regies(N = 3)

    Figura 13: Diviso dos Intervalos de domnio em conjuntos fuzzy.

    fonte: adaptada de [Wang e Mendel, 1992].

    Para cada varivel de entrada e sada, o mtodo calcula o grau de ativao da fun-

    o de pertinncia correspondente e seleciona a maior delas. A gerao de regras nebu-losas (passo 2) realizada por meio de sentenas do tipo Se Ento, onde as variveis de entrada so designadas como antecedentes e avarivel de sada como conseqente. Para o exemplo proposto na Figura 14, a Tabe-la. 01 mostra a regra gerada a partir da escolha dos maiores graus de pertinncia.

    CE

    {

    {{{

    {{S1

    B1B2

    S2

    B3

    {S3

    U+

    U-

    X

    U+U-

    S3 S2 S1 CE B1 B2 B3

    X

    (X)

    t

    Registros de Treino(antecedentes)

    Janela = 4

    Registro deTreino

    (conseqente)

    t1t2

    t3t4

    t5

    x1x2x3x4

    0,1

    0,30,40,6

    0,9

    0,70,8

    0,2

    x5 Figura 14: Mapeamento das Variveis de Entrada e Sada para uma Janela de Previso

    igual a 4

    16

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    20/29

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    21/29

    =

    =p

    i

    ijij nynwnv0

    )()()(

    ondep o nmero total de entradas aplicadas ao neurnio j, wij(n) o peso sinpti-

    co que conectada o neurnio i ao neurnioj, e yi(n) o sinal de entrada do neurnio j

    (ou de forma equivalente, o sinal funcional na sada do neurnio i). O sinal de erropara oj-simo neurnio da camada de sada definido por:

    onde dj(n) a resposta desejada. O clculo desses sinais de erro encerra a fase de

    propagao do algoritmo.

    No processamento realizado pela retropropagao, o ajuste dos pesos realizadopelo mtodo do gradiente e pode ser descrito pela equao a seguir:

    Onde:

    o parmetro da taxa de aprendizado (que define a magnitude de atualizao dospesos) e E/wji a derivada parcial do erro E em relao ao peso wij.

    A equao anterior conhecida como Regra Delta. Outra forma de representar esseajuste dos pesos expressa por:

    sendo o gradiente local j (n) definido por:))((')()( nvnen jjjj =

    Esta ltima equao demonstra que o gradiente local j (n) para o neurnio de sada

    j igual ao produto do respectivo sinal de erro pela derivada 'j(vj(n)) da funo de

    ativao relacionada. A Figura 15 ilustra um diagrama da implementao desse treina-mento para um neurnio de sada.

    18

    )()()( nyndne jjj =

    )()(ji

    ji

    w

    Enw

    =

    (n)(n)y(n)w ijji =

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    22/29

    ProdutoAlgoritmo deTreinamento

    kv )( kv

    )( kv

    Taxa de aprendizado

    pesos sinpticos

    biasW0

    W1

    Wn

    W2

    sada

    ky

    sadadesejada

    kd

    +

    X0 = 1

    X1

    X2

    Xn

    .

    .

    .

    .

    entrada

    s

    Figura 15: Aplicao do treinamento de um simples neurnio localizado na camada desada de uma rede MLP. fonte: traduzida e adaptada de [Palit e Popovic, 2005]

    Para o caso de um neurnioj localizado em uma camada oculta, o sinal de erro ej(n)

    no pode ser obtido diretamente, pois no existe uma resposta desejada especificadapara aquele neurnio. Nessa situao o clculo do citado sinal de erro deve ser deter-minado de forma recursiva, em termos dos sinais de erro de todos os neurnios aosquais o neurnio oculto est diretamente conectado. Dessa forma, o clculo do gradi-ente local redefinido para:

    =k

    kjkjjj nwnnv'n )()())(()(

    onde o ndice k se refere a um neurnio que se encontra em uma camada direitado neurnioj, quando este pertence a uma camada oculta.

    Uma alternativa para aumentar a taxa de aprendizagem evitando causar a instabi-lidade da rede a incluso do termo de momento na regra delta, estendendo-a como:

    )()()1()( nynnwnw ijjiji +=

    Esta equao chamada de regra delta generalizada, pois inclui a regra delta como

    um caso especial onde = 0. O termo de momento representa o valor memorizado doltimo incremento e, dessa forma, a prxima mudana no peso mantida aproximada-mente na mesma direo da ltima [Palit e Popovic, 2005].

    O emprego do algoritmo Backpropagation na previso de sries realizada a partirda utilizao de janelas de previso, as quais formaro os exemplos para a etapa detreinamento supervisionado em uma rede neural MLP. Uma ilustrao de configura-o para uma rede MLP destinada previso de valores futuros foi exibida na figura07. Os parmetros bsicos para configurao do algoritmo backpropagation so: a taxade aprendizagem, o termo momento e o nmero de pocas.

    19

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    23/29

    3.3 Comits de Aprendizado

    Um comit de aprendizado representa a agregao de mais de uma mquina de apren-dizado na produo de uma nica soluo computacional para um determinado prob-lema [Lima, 2004]. Estas mquinas se referem, basicamente, aos mtodos de previso

    provenientes de tcnicas de inteligncia artificial, mas pode incluir outras derivadas daestatstica, por exemplo. Algumas destas tcnicas foram apresentadas nas sees ante-riores.

    A Figura 16 ilustra a estrutura de um comit que combina a sada de 4 previsores(mquinas de aprendizado). Segue adiante uma descrio do processo global [LeoneFilho, 2006]:

    Cada previsor recebe os dados de entrada do problema, que podem no ser osmesmos para previsores distintos;

    Cada previsor (mtodo base) faz um mapeamento f:Rm R da sada a partir dem entradas;

    Cada sada de cada previsor multiplicada por um peso, onde o somatrio de to-dos os pesos impostos s sadas deve ser igual a 1;

    As sadas so selecionadas para formar o comit, de tal forma que nem todas assadas dos previsores so combinadas, mas somente aquelas que melhoram o de-sempenho do comit; e

    As sadas selecionadas e ponderadas so somadas para compor a soluo do co-mit.

    Entradas

    Previsor 1

    Entradas Entradas Entradas

    Previsor 2 Previsor 3 Previsor 4

    (Sada 1)*W1

    (Sada 2)*W2

    (Sada 3)*W3

    (Sada 4)*W4

    COMIT=

    =4

    1

    1I

    iW

    =

    4

    1IiiWSadaSada Combinada

    Figura 16: Estrutura de um comit de previsores, considerando 4 componentes.fonte: [Leone Filho, 2006].

    20

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    24/29

    Aps a etapa de seleo dos membros do comit, a combinao dos resultados indi-viduais de cada um destes pode ser feita por diversas maneiras. As mais comuns sovotao mltipla ou votao majoritria para a tarefa de classificao de padres e m-dia aritmtica ou mdia ponderada para a tarefa de regresso [Leone Filho, 2006].

    Em um contexto mais amplo e no relacionado necessariamente previso de sries

    temporais, pode-se descrever tarefas de classificao e regresso como definidos em[Rezende, 2003]: uma tarefa de classificao consiste na predio de um valor categri-co como, por exemplo, predizer se o cliente bom ou mau pagador. Na regresso, oatributo a ser previsto consiste em um valor contnuo, como por exemplo, predizer olucro ou a perda em um emprstimo.

    Bagging [Breiman, 1994] e boosting [Freund e Schapire, 1997] so mtodos popula-res de comits de aprendizado e podem ser usados como algoritmos de lote dentro deoutros comits. [Oza, 2001] descreve que estes mtodos processam repetidamente oconjunto inteiro de exemplos de treinamento e requerem no mnimo uma passagematravs dos dados para cada modelo base que ser gerado. Este ltimo autor props

    uma abordagem onde os mtodos citados processam uma nica vez o citado conjunto,viabilizando a utilizao de grandes bases de dados. Algumas formas de comit sobrevemente descritas adiante.

    3.3.1 Combinao Linear

    A estratgia mais simples de combinao aplicar um somatrio ponderado das sadasindividuais dos membros do comit. A equao descrita a seguir representa essa estra-tgia definida como combinao linear:

    =

    =M

    iiicfwf

    1

    Ondefc a sada combinada,M o nmero de mtodos base,fi a sada individualde cada mtodo base e wi um peso positivo associado a essa sada, sendo a soma des-tes pesos iguais a 1 [Wichard e Ogorzalek, 2004] [Brown, 2003]. Algumas abordagenspara obteno dessas ponderaes, em busca de combinaes lineares timas, soapresentadas em [Perrone, 1993] [Hashem, 1993]. Quando os pesos so idnticos, acombinao mencionada como mdia simples, sendo expressa por:

    =

    =M

    i

    icf

    Mf

    1

    1

    3.3.2 Combinao No-Linear

    Nessa estratgia de combinao as sadas individuais dos mtodos base so interrela-cionadas de forma no-linear. Esse mapeamento no-linear pode ser realizado pormeio de implementaes isoladas de tecnologias de inteligncia artificial, tais como re-des neurais, lgica nebulosa e abordagem hbrida [Palit e Popovic, 2000]. A equaoabaixo exibe uma representao adaptada de [Lai, 2006]:

    )...,,,,(321 nc

    fffff =

    Onde fc a sada combinada, (f1, f2, f3,..., fn) a sada individual de cada mtodobase e (.) uma funo no-linear.

    21

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    25/29

    3.3.3 Bagging

    Bagging [Breiman, 1994] um mtodo para gerao de verses mltiplas de previsorese us-los para obter um previso agregada. Essa agregao realiza a mdia dessasverses quando prev um valor numrico e faz um voto majoritrio quando prev

    uma classe. As verses mltiplas so formadas pelo uso de tcnicas de bootstrap [Efrone Tibshirani, 1993] que replicam o conjunto de treinamento para formao de novosconjuntos de treinamento.

    3.3.4 Boosting

    Boosting [Schapire, 1990] uma abordagem diferente da anterior, onde os conjuntos detreinamento da primeira no so gerados a partir de uma amostragem uniforme comreposio. Os membros do comit so treinados seqencialmente, e o treinamento deum membro em particular dependente do treinamento e do desempenho dos mem-bros treinados previamente.

    Uma limitao prtica dessa abordagem que requer freqentemente uma grandeamostra de treinamento. AdaBoost [Freund e Schapire, 1996] uma variante de boos-ting sendo provavelmente a mais difundida.

    3.3.5 Mistura de Especialistas (ME)

    O princpio que rege a arquitetura de Mistura de Especialistas [Jacobs, 1991] que v-rios previsores (redes neurais) estaro aptos a especializar partes especficas do espa-o de entrada. Uma rede de passagem (gating network) recebe as mesmas entradas e responsvel por aprender a combinao apropriada de pesos para modular as sadasde cada rede neural especialista.

    3.3.6 Mistura Hierrquica de Especialistas (MHE)

    O modelo de Mistura Hierrquica de Especialistas (MHE) [Jordan, 1994] uma exten-so natural da abordagem Mistura de Especialistas (ME). Esse modelo similar a umarvore, na qual as redes de passagem esto em vrios pontos no-terminais da rvore eos especialistas se encontram nas folhas das rvores. Tal modelo se diferencia na medi-da em que o espao de entrada dividido em conjuntos aninhados de subespaos, coma informao sendo combinada e redistribuda entre os especialistas sob o controle devrias redes de passagem arranjadas de forma hierrquica [Haykin, 2001].

    3.4 Tendncias de Desenvolvimento

    Na ltima dcada, observa-se o crescente interesse em algumas abordagens tais como:mquinas de vetores-suporte (SVM, do ingls support sector machines), wavelet neuralnetworks e fractally configured neural networks. Essas tcnicas sero apresentadasadiante.

    Quanto s tcnicas baseadas em lgica fuzzy, merecem destaque aquelas direciona-das extrao de conhecimento a partir dos dados ou data understanding, por meio douso de sistemas baseados em regras [Duch et al., 2004].

    22

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    26/29

    3.4.1 Mquinas de Vetores-Suporte (Support Vector Machines)

    Baseada em uma abordagem computacional nomeada como princpio da minimizaodo risco estrutural, formulada por [Vapnik, 1992], os conceitos sobre mquinas de ve-tores-suporte foram fundamentados. Esses conceitos representam uma metodologia

    inovativa para o desenvolvimento de redes neurais para aplicaes em aproximaode funes, processamento de sinal, reconhecimento de padres e previso de sriestemporais.

    Algumas potencialidades advindas da abordagem SVM com aquelas da abordagemde comits so exploradas conjuntamente em [Lima, 2004]. Nesse trabalho, vrias ex-tenses e novas configuraes de comits, tendo mquinas de vetores-suporte comocomponentes, so propostas e implementadas.

    3.4.2 Wavelet Neural Networks

    Uma nova e poderosa classe de redes neurais denominada Wavelet Neural Networks.

    Essas redes preservam todas os aspectos comuns s redes neurais, porm, em adio,possui rigorosos fundamentos matemticos. Elas possuem wavelets como funes deativao e constituem uma alternativa para uso de redes com funes de ativao sig-mide [Alarcon-Aquino, 2005].

    Diversas representaes estruturais de redes wavelet tm sido desenvolvidas combase na abordagem de decomposio wavelet. O conceito wavelet deriva de uma exten-so sobre a teoria da transformada de Fourier [Palit e Popovic, 2005].

    3.4.3 Fractally Configured Neural Networks

    Como uma ferramenta para solucionar problemas envolvendo processos em alto nvelou funes cognitivas que, por exemplo, redes neurais convencionais no podem reso-lver, redes denominadas como fractal networks tm sido propostas. Essas redes so es-truturadas em forma de rvores construdas a partir de agrupamentos (clusters) de sub-redes distribudas hierarquicamente [Palit e Popovic, 2005].

    4 Concluses

    Diversas modelagens so empregadas para a previso de sries temporais, estenden-do-se desde os modelos clssicos da estatstica at aqueles baseados em tcnicas de in-

    teligencia artificial. O problema geral quando se faz previso de sries temporais queno existe um nico modelo que seja eficaz em todos os tipos de sries temporais [Leo-ne Filho, 2006]. A utilizao de sistemas hbridos ou comits busca o aproveitamentodos recursos individuais de diferentes mtodos para tratar um determinado problema.

    Diante das inmeras abordagens possveis para criao de mtodos de previso, opresente trabalho teve por objetivo apresentar algumas das mais importantes tecnolo-gias de inteligncia computacional que so amplamente utilizadas para a construode modelos para aplicao em previso de sries temporais: redes neurais e lgica ne-bulosa. Este trabalho apresentou ainda diversas formas de combinao de mtodos depreviso e algumas tendncias de desenvolvimento nessa rea.

    23

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    27/29

    5 Referncias

    ALARCON-AQUINO, V., GARCA-TREVIO, E. S., ROSAS-ROMERO, R.,GUERRERO-OJEDA, L. G. Learning and approximation of chaotic time series usingwavelet-networks. In: Sixth Mexican International Conference on Computer Science,

    ENC 2005.BOX, G. E., JENKINS, G. M., Time series analysis forecasting and control. SoFrancisco, Califrnia: Holden-Day, 1976.

    BREIMAN, L., Bagging predictors, Technical Report Tech. rep. 421, Department ofStatistics, University of California, Berkeley, 1994.

    BROWN, G. Diversity in Neural Network Ensembles. 2003. Tese (Doctor ofPhilosophy in Computer Science) - University of Birmingham, 2003.

    DUCH, W., SETIONO, R., ZURADA, J. M. Computational Intelligence Methods, for

    Rule-Based Data Understanding. Proceedings of the IEEE 92(5): pp. 771-805. 2004.FREUND, Y., SCHAPIRE, R. E, Experiments with a new boosting algorithm, InMachine Learning: Proceedings of the Thirteenth International Conference, 1996.

    GOLDSCHMIDT, R. R., PASSOS, E. Data Mining: Um Guia Prtico. 1. ed. Rio deJaneiro: Campos, 2005. 261p.

    HASHEM, S. Optimal Linear Combinations of Neural Networks. 1993. Tese (Doctorof Philosophy) Purdue University, 1993.

    HAYKIN, S., Redes Neurais princpios e prtica. 2. ed. Porto Alegre: Bookman,

    2001. 900p.

    JACOBS, R. A., JORDAN, M. I., NOWLAN, S. J., HINTON, G. E. Adaptive mixtures oflocal experts. Neural Computation, vol. 3, no 1, pp. 79-87, 1991.

    JORDAN, M. I., JACOBS, R. A. Hierarchical Mixtures of experts and the EMalgorithm. In: Proceedings of 1993 International Joint Conference on Neural Networks,pp. 1339-1344. 1993.

    LAI, K. K., et al. A Novel Nonlinear Neural Network Ensemble Model for FinancialTime Series Forecasting. V.N. Alexandrov et al. (Eds.): ICCS 2006, Part I, LNCS 3991,

    pp. 790 793, 2006.

    LEONE FILHO, M. de A., Previso de carga de curto prazo usando ensembles deprevisores selecionados e evoludos por algoritmos genticos. 2006. Dissertao(Mestrado em Engenharia Eltrica) - Universidade Estadual de Campinas, Faculdadede Engenharia Eltrica e de Computao, 2006.

    LIMA, C. A. de M., Comit de mquinas: uma abordagem unificada empregandomquinas de vetores-suporte. 2004. Tese (Doutorado em Engenharia Eltrica) -Universidade Estadual de Campinas, 2004.

    MENDEL, J. M.: Fuzzy Logic Systems for Engineering: a Tutorial. In: Proc. IEEE, V. 83,No. 3, pp. 345-377 (1995)

    24

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    28/29

    MORETTIN, P. A., TOLOI, C. M. C. Anlise de Sries Temporais. 2. ed. So Paulo:Edgard Blcher, 2006. 538p.

    OZA, N. C. Online Ensemble Learning. 2001. Tese (Doctor of Philosophy inComputer Science) - University of California at Berkeley, 2001.

    PALIT, A. K., POPOVIC, D. Computational Intelligence in Time Series Forecasting.1. ed. Londres: Springer-Verlag, 2005. 372p.

    PERRONE, MICHAEL P., COOPER, LEON N., When Networks Disagree: EnsembleMethods for Hybrid Neural Networks, 1993.

    REZENDE, S. O. Sistemas Inteligentes: Fundamentos e Aplicaes. 1. ed. So Paulo:Manole, 2003. 525p.

    RIBEIRO, C. V., GOLDSCHMIDT, R. R., CHOREN, R., Uma Proposta de MtodoHbrido Fuzzy para Previso de Sries Temporais, 5 CONTECSI - Universidade deSo Paulo, Junho de 2008.

    RUMELHART, D. E., MCCLELLAND, J. L. Parallel Distributed Processing:Explorations in the Microstructure of Cognition, Volume 1: Foundations, The MITPress, 1986.

    SCHAPIRE, R. E., et al. Boosting the margin: A new explanation for the effectivenessof voting methods. The Annals of Statistics, 26(5):16511686, 1998.

    SILVA, C. S. da, Previso Multivariada da Demanda Horria de gua em SistemasUrbanos de Abastecimento. 2003. Tese (Doutorado em Engenharia Civil),

    Universidade Estadual de Campinas, 2003.

    SILVA, P. O. M. P., Previso de Sries Temporais Utilizando Lgica Nebulosa.Trabalho de concluso de curso de Bacharelado em Cincia da Computao, CentroUniversitrio da Cidade do Rio de janeiro, 2006.

    SILVA, P. O. M. P., GOLDSCHMIDT, R. R., SOARES, J. A., FERLIN, C., Previso deSries Temporais Utilizando Lgica Nebulosa, 4 CONTECSI - Universidade deSo Paulo, 2007.

    VALENTINI, G., MASULLI, F. Ensembles of Learning Machines. In 13th Italian

    Workshop on Neural Nets, 2002, Volume 2486 of Lecture Notes in Computer Science.Berlin/Heidelberg: Springer, pp. 319. 2002

    VAPNIK, V. N. Principles of risk minimisation for learning theory, Advances inNeural Information Processing Systems, 4:831-838. Morgan Kaufmann, San Mateo, CA.1992.

    WAN, E. A, Time Series Data, Oregon Health & Science University. Disponvel em:. Acesso em: 3 jun. 2006.

    WANG, J., LEU, J. Stock Market Trend Prediction Using ARIMA-based NeuralNetworks. 1996.

    WANG, L., MENDEL, J. M., 1992, Generating Fuzzy Rules by Learning from

    25

  • 8/6/2019 Mtodos para Previso de Sries Temporais e Suas Tendncias

    29/29

    Example. IEEE Transactions on System, Man and Cybernetics, Vol. 22, N. 6, 1992.

    WICHARD, J. D., OGORZALEK, M. Time Series Prediction with Ensemble Models.2004.

    WESSA. P., Free Statistics Software, Office for Research Development and Education,verso 1.1.18. Disponvel em: .Acesso em: 18 mar. 2006.