12
Previs˜ ao de Curto Prazo para a Gerac ¸˜ ao de Energia E ´ olica usando um Modelo Ensemble de M ´ aquinas de Aprendizado Rafael Giordano Vieira 1 , Fernando Jos´ e Von Zuben 1 e Rosangela Ballini 2 1 Faculdade de Engenharia El´ etrica e de Computac ¸˜ ao – FEEC Universidade Estadual de Campinas – UNICAMP Campinas – SP – Brasil 2 Instituto de Economia – IE Universidade Estadual de Campinas – UNICAMP Campinas – SP – Brasil {giordano, vonzuben}@dca.fee.unicamp.br, [email protected] Abstract. The increasing use of the wind as a primary source of energy produc- tion has led to new challenges on how to properly integrate the current wind farms to conventional energy systems. One of the most important issues related to this process is the development of strategies to predict the power generation of these farms, thus avoiding widespread losses in scenarios with large fluctu- ations and intermittency in energy production. In this way, this paper proposes a model that explores the use of multilayer perceptrons, radial basis function networks and support vector machines combined in an ensemble, as a way to increase the model’s predictive potential and at the same time to provide more robust and consistent results. Simulations show the good performance of the proposed model related to other approaches. Resumo. A crescente utilizac ¸˜ ao do vento como fonte prim´ aria para a gerac ¸˜ ao de energia el´ etrica tem levado a novos desafios sobre como integrar adequada- mente os atuais parques e´ olicos aos sistemas de energia convencionais. Uma das quest˜ oes de maior relevˆ ancia nesse contexto est´ a na delimitac ¸˜ ao de es- trat´ egias para a previs˜ ao do potencial de gerac ¸˜ ao de energia para esses par- ques, evitando que per´ ıodos em que h´ a grandes flutuac ¸˜ oes e intermitˆ encias na produc ¸˜ ao de energia levem a preju´ ızos para todos os demais integrantes do sistema. Nesse sentido, este trabalho prop˜ oe um modelo que explora a utilizac ¸˜ ao de perceptrons de m´ ultiplas camadas, redes com func ¸˜ oes de base ra- dial e m´ aquinas de vetores-suporte combinadas em um ensemble, como forma de ampliar o potencial preditivo do modelo e ao mesmo tempo prover resul- tados mais robustos e consistentes. As simulac ¸˜ oes realizadas mostram o bom desempenho do modelo utilizado em relac ¸˜ ao a outras abordagens. 1. Introduc ¸˜ ao Nos ´ ultimos anos, a gerac ¸˜ ao de energia mediante aproveitamento do vento vem tendo um apido crescimento, resultado do desenvolvimento de novas tecnologias para a fabricac ¸˜ ao de turbinas e´ olicas e de incentivos por parte dos governos para a disseminac ¸˜ ao de fontes renov´ aveis de energia el´ etrica [Islam et al. 2013]. Somente no ano de 2015, houve um XIII Encontro Nacional de Inteligˆ encia Artificial e Computacional SBC ENIAC-2016 Recife - PE 349

Previs ao de Curto Prazo para a Gerac¸ ao de Energia E ... · desses parques em sistemas de energia existentes est a na criac¸´ ao de modelos que consi- gam prever de maneira ecaz

Embed Size (px)

Citation preview

Previsao de Curto Prazo para a Geracao de Energia Eolicausando um Modelo Ensemble de Maquinas de Aprendizado

Rafael Giordano Vieira1, Fernando Jose Von Zuben1 e Rosangela Ballini2

1Faculdade de Engenharia Eletrica e de Computacao – FEECUniversidade Estadual de Campinas – UNICAMP

Campinas – SP – Brasil

2Instituto de Economia – IEUniversidade Estadual de Campinas – UNICAMP

Campinas – SP – Brasil

{giordano, vonzuben}@dca.fee.unicamp.br, [email protected]

Abstract. The increasing use of the wind as a primary source of energy produc-tion has led to new challenges on how to properly integrate the current windfarms to conventional energy systems. One of the most important issues relatedto this process is the development of strategies to predict the power generationof these farms, thus avoiding widespread losses in scenarios with large fluctu-ations and intermittency in energy production. In this way, this paper proposesa model that explores the use of multilayer perceptrons, radial basis functionnetworks and support vector machines combined in an ensemble, as a way toincrease the model’s predictive potential and at the same time to provide morerobust and consistent results. Simulations show the good performance of theproposed model related to other approaches.

Resumo. A crescente utilizacao do vento como fonte primaria para a geracaode energia eletrica tem levado a novos desafios sobre como integrar adequada-mente os atuais parques eolicos aos sistemas de energia convencionais. Umadas questoes de maior relevancia nesse contexto esta na delimitacao de es-trategias para a previsao do potencial de geracao de energia para esses par-ques, evitando que perıodos em que ha grandes flutuacoes e intermitenciasna producao de energia levem a prejuızos para todos os demais integrantesdo sistema. Nesse sentido, este trabalho propoe um modelo que explora autilizacao de perceptrons de multiplas camadas, redes com funcoes de base ra-dial e maquinas de vetores-suporte combinadas em um ensemble, como formade ampliar o potencial preditivo do modelo e ao mesmo tempo prover resul-tados mais robustos e consistentes. As simulacoes realizadas mostram o bomdesempenho do modelo utilizado em relacao a outras abordagens.

1. IntroducaoNos ultimos anos, a geracao de energia mediante aproveitamento do vento vem tendo umrapido crescimento, resultado do desenvolvimento de novas tecnologias para a fabricacaode turbinas eolicas e de incentivos por parte dos governos para a disseminacao de fontesrenovaveis de energia eletrica [Islam et al. 2013]. Somente no ano de 2015, houve um

XIII Encontro Nacional de Inteligencia Artificial e Computacional

SBC ENIAC-2016 Recife - PE 349

acrescimo de 2, 75 GW de potencia eolica na matriz energetica brasileira, tornando oBrasil o quarto paıs do mundo onde essa fonte de energia mais cresce, atras apenas daChina, dos Estados Unidos e da Alemanha [EPE 2016].

Para que seja efetivamente aproveitada, a energia gerada pelas turbinas eolicasdeve ser integrada aos sistemas de energia eletrica, onde sao empregados mecanismos queregulam continuamente a oferta e a demanda agregada de energia [Heier 2014]. No en-tanto, a natureza estocastica do vento faz com que o processo de geracao de energia eolicaapresente perıodos de flutuacao e de intermitencia, fatores estes que levam a um desbalan-ceamento entre a quantidade de energia requerida e disponıvel para despacho nos parqueseolicos, aumentando os riscos de falhas na distribuicao de energia [Jabr and Pal 2009].

Nesse sentido, uma das questoes mais importantes relacionadas com a integracaodesses parques em sistemas de energia existentes esta na criacao de modelos que consi-gam prever de maneira eficaz o potencial de geracao eolica de um determinado parqueem um instante de tempo [Foley et al. 2012]. Como o problema de prever a geracao deenergia eolica pode ser interpretado como um problema de previcao de series temporais[Box et al. 2008], uma grande variedade de modelos ja consolidados na literatura pode serutilizada com sucesso para esse proposito [Chang 2013, Chen et al. 2014, Li et al. 2015],consequentemente reduzindo os riscos financeiros e tecnicos associados a incerteza daproducao de energia eolica aos participantes do mercado de energia eletrica.

Como constatado em [Shamshad et al. 2005], a serie temporal definida pelo con-junto de amostras de geracao eolica possui comportamento essencialmente nao-linear,e seus valores sao resultados de uma composicao de diversas variaveis, tanto meteo-rologicas quanto relativas a aerodinamica das turbinas eolicas. Como muitas dessasvariaveis possuem uma dinamica de elevada complexidade, torna-se desejavel empre-gar modelos hıbridos ou modulares, em que um conjunto de abordagens alternativas podeser utilizado e seus resultados combinados, de maneira a lidar com as nao-linearidadespresentes na serie de forma mais robusta e consistente.

Com base na problematica apresentada, este artigo tem como objetivo especificar,implementar e avaliar um modelo de previsao de curto prazo para a geracao de ener-gia eolica, por meio de um ensemble de modelos baseados em Redes Neurais Articiais(RNAs) dos tipos perceptrons de multiplas camadas (MLPs) e com funcoes de base radial(RBFs) e maquinas de vetores-suporte (SVMs), combinadas por uma abordagem constru-tiva [Islam et al. 2003, Haykin 2009]. A utilizacao desses tipos de abordagens em proble-mas de previsao de series temporais e largamente utilizada na literatura, principalmentequando essas series caracterizam um sistema nao-linear.

O restante do artigo esta organizado da seguinte maneira: a Secao 2 apresenta adelimitacao da proposta desse trabalho e as pesquisas relacionadas. A Secao 3 especificao modelo de previsao baseado no ensemble de maquinas de aprendizado. A Secao 4 avaliao modelo proposto em uma aplicacao para previsao de series temporais. Por fim, a Secao5 resume as principais conclusoes obtidas e comenta sobre os trabalhos futuros.

2. Delimitacao da Proposta e Trabalhos Relacionados

Em areas relacionadas a inteligencia artificial e computacional, um ensemble pode serentendido como um modelo de aprendizado de maquina, podendo ser supervisionado ou

XIII Encontro Nacional de Inteligencia Artificial e Computacional

SBC ENIAC-2016 Recife - PE 350

nao-supervisionado, que combina dois ou mais componentes de forma a obter, para umdado problema, uma capacidade de generalizacao superior aquela fornecida, na media,pelos seus componentes individualmente [Hansen and Salamon 1990]. Os componentesde um ensemble podem tanto pertencer a uma mesma classe de modelos como a clas-ses distintas, por exemplo, envolvendo modelos lineares e nao-lineares, assim como acombinacao entre eles pode ocorrer a partir de diferentes abordagens.

Os ensembles vem sendo cada vez mais citados na literatura como alternativa paraa solucao de problemas de elevada complexidade, onde modelos individuais nao tem sidocapazes de generalizar de forma consistente [Sharkey 2012]. A melhora proporcionadapelos ensembles se baseia em dois fatores: na diversidade do erro apresentado pelos seuscomponentes e no desempenho dos componentes de forma individual [Perrone 1993]. Pordiversidade de erro, entende-se que os componentes do ensemble divirjam no conjunto dedados de entrada que conduzem o erro na saıda de cada modelo, permitindo assim queo modelo combinado minimize as falhas que possam ocorrer nos modelos individuais.Por outro lado, componentes com desempenhos superiores possuem maior capacidade degeneralizacao, o que reduz o erro total do ensemble [Perrone and Cooper 1992].

A Figura 1 apresenta de modo geral o funcionamento de um modelo ensemble. Apartir de um conjunto X de dados de entrada, as yN diferentes solucoes provenientes dosN componentes sao combinadas de forma a produzir uma unica solucao yens com maiorcapacidade de generalizacao. Vale ressaltar que os componentes utilizados para gerar umamelhor solucao devem ser selecionados de acordo com criterios bem definidos, de formaque a utilizacao de cada um deles aumente o desempenho do ensemble.

Figura 1. Estrutura geral de um ensemble.

Diversos trabalhos na literatura exploram a utilizacao de ensembles no contextode previsao de series temporais, particularmente em series de geracao eolica. Por exem-plo, [Lee and Baldick 2014] desenvolveram um modelo de previsao de curto prazo deenergia eolica utilizando um ensemble contendo 52 RNAs e cinco processos gaussia-nos. Em [Li et al. 2015], um ensemble foi desenvolvido utilizando RNAs, transforma-das de wavelet e estrategias como forward selection e o metodo dos quadrados mınimosparciais, sendo aplicado para prever a geracao de energia de um parque eolico. Ja[de Aquino et al. 2014] apresentam propostas de ensembles para melhorar os resultadosobtidos por modelos que utilizam RNAs no contexto de previsao de geracao eolica, emespecıfico aquelas que possuam reservatorio de dinamicas em sua estrutura.

Outras pesquisas referentes a mesma problematica incluem o trabalho desenvol-

XIII Encontro Nacional de Inteligencia Artificial e Computacional

SBC ENIAC-2016 Recife - PE 351

vido em [Bossavy et al. 2013], que aborda importantes questoes referentes a utilizacaode ensembles para a previsao das chamadas “rampas” de producao de energia eolica.Uma outra linha de investigacao referente a previsao de geracao eolica e especificadaem [Taylor et al. 2009], onde sao empregados ensembles em que seus componentes saoformados por modelos de previsao baseados em variaveis atmosfericas.

A partir da pesquisa bibliografica realizada, verificou-se que a criacao de novasabordagens para lidar com a previsao de geracao eolica esta sendo ativamente perseguidapor varios centros de pesquisa ao redor do mundo, como forma de melhorar a gestaodos sistemas de energia eletrica. No entanto, a utilizacao dos modelos ensembles paraesse proposito ainda e pouco explorada na literatura, e uma grande variedade de aborda-gens e modelos estao disponıveis para gerar diversidade no processo de criacao dessesensembles. Nesse sentido, as principais caracterısticas que diferenciam o atual trabalhodos demais pesquisados na literatura sao: a utilizacao de uma abordagem construtiva paraa selecao dos componentes do ensemble e a utilizacao de um algoritmo de otimizacao,baseado em busca aleatoria, para gerar diversidade entre tais componentes.

3. O Modelo Ensemble

A Figura 2 ilustra o modelo proposto neste trabalho. Inicialmente, parte-se de um con-junto de dados de entrada, os quais devem estar devidamente normalizados e segmen-tados em tres subconjuntos distintos: treinamento, selecao e validacao. O subconjuntoque contem os dados de treinamento serve para gerar o conjunto inicial de componentescandidatos a fazerem parte do ensemble. O subconjunto com os dados de selecao e em-pregado para realizar a escolha dos candidatos necessarios e que contribuem de alguma

Geração&

Treinamento

SeleçãoSeleção ValidaçãoValidaçãoTreinamentoTreinamento

MLPs RBFs SVMs

C . . . . . . . . .

. . .

Erro Quadrático Médio

Seleção&

Combinação Seleção construtivua

Ensemble formuado

Ensemble

Figura 2. Procedimento para a construcao do ensemble proposto.

XIII Encontro Nacional de Inteligencia Artificial e Computacional

SBC ENIAC-2016 Recife - PE 352

forma ao serem inseridos como componentes do ensemble. Por fim, o subconjunto comos dados de validacao e responsavel por avaliar a eficiencia do resultado final do ensem-ble ja formado. As proximas subsecoes especificam a realizacao de cada uma das etapasmencionadas.

3.1. Geracao e treinamento dos componentesO conjunto inicial de componentes candidatos a compor o ensemble proposto nesse tra-balho e formado por c1 redes neurais do tipo perceptron de multiplas camadas, c2 redesneurais com funcoes de base radial e c3 maquinas de vetores-suporte. E valido ressaltarque a delimitacao dessas tres quantidades consistem em parametros do modelo e devemser definidos a priori pelo projetista. Alem disso, a utilizacao de tais modelos para com-por o ensemble se da pelo fato de todos eles possuırem: capacidade de aproximacaouniversal, carater essencialmente nao-linear e alto grau de generalizacao. Suas principaiscaracterısticas sao:

• Perceptron com multiplas camadas: As MLPs sao modelos nao-lineares formadospor um conjunto de unidades basicas de processamento global com conexoesponderadas entre si, denominadas neuronios. Esses neuronios estao dispostosem tres camadas: camada de entrada com tamanho igual a dimensao da amostra,camada intermediaria responsavel por realizar o mapeamento nao-linear dosdados para um espaco de caracterısticas e camada de saıda que agrega o resultadodo mapeamento realizado pela camada intermediaria.

• RNAs com funcao de base radial: As RBFs consistem em modelos nao-linearesque se assemelham as MLPs quanto a sua estrutura. No entanto, o processamentodas informacoes pelos neuronios, em uma RBF, ocorre de forma local e e realizadapor uma funcao de base radial. Alem disso, os pesos das conexoes na camadade saıda sao otimizados a partir de uma combinacao linear, podendo ser utili-zado algum fator de regularizacao para penalizar a escolha de determinados pesos.

• Maquinas de vetores-suporte: As SVMs sao modelos baseados na teoria do apren-dizado estatıstico, ou seja, visam a minimizacao do risco estrutural do problema.De modo geral, as SVMs realizam um mapeamento nao-linear das amostras de en-trada para um espaco de caracterısticas de dimensao elevada, onde um hiperplanootimo e construıdo para separar linearmente os dados em duas classes. Assim,quando a separacao dos dados e possıvel, o hiperplano otimo no espaco de carac-terısticas e definido como aquele que apresenta a maior margem de separacao.

Como descrito na Secao 2, para que o ensemble resultante apresente um desempe-nho superior, e fundamental assegurar que duas condicoes sejam satisfeitas. A primeiradelas afirma que os componentes precisam ser eficientes quando analisados individual-mente. Isso significa que os parametros que definem cada um dos modelos necessitamestar configurados de forma que cada componente generalize o problema de maneira efe-tiva. Por outro lado, a segunda condicao afirma que os erros de cada componente devemser complementares entre si. Nesse caso, o comportamento preditivo de cada componentedeve ser distinto de forma que a diversidade seja mantida.

Como alternativa para satisfazer ambas as condicoes, optou-se, nesse trabalho,por criar diversidade nos componentes empregando o algoritmo de meta-otimizacao de-

XIII Encontro Nacional de Inteligencia Artificial e Computacional

SBC ENIAC-2016 Recife - PE 353

nominado busca aleatoria [Bergstra and Bengio 2012]. A busca aleatoria alia eficienciaa um custo computacional relativamente baixo, sendo especialmente util nessa situacao,pois atua nos parametros de projeto dos modelos de aprendizado como forma de proverdiversidade. Alem disso, seu mecanismo de otimizacao e baseado em um numero deiteracoes k, em que k → 0 representa a geracao aleatoria dos parametros e k → ∞ aotimizacao maxima dos mesmos. Assim, definindo um numero adequado para k, pode-segerar previsores de alto desempenho e suficientemente diversos entre si.

Nesse sentido, a Tabela 1 especifica os parametros que serao otimizados para cadatipo de maquina de aprendizado candidata a compor o ensemble.

Tabela 1. Parametros que serao otimizados para cada componente do ensembleClasse do componente Descricao do parametro Domınio de analise

Numero de neuronios de 2 a 50Multilayer Perceptron Funcao de ativacao tanh, logistic, ReLU

Numero de iteracoes de 1 a 1000Numero de neuronios de 2 a 50

Radial Basis Function Coeficiente L1 de 0,01 a 1,00Raio da gaussiana de 0,01 a 1,00Funcao de kernel linear, radial

Support Vector Machine C de 1 a 1000γ (kernel radial) de 0,01 a 1,00

3.2. Selecao e combinacao dos componentesApos a determinacao dos componentes candidatos a compor um ensemble, a proximaetapa tem como objetivo maximizar o desempenho de generalizacao do modelo ensemblepor meio da selecao de um subconjunto de componentes dentre o total de candidatosgerados. A selecao pode ser considerada como uma etapa de competicao entre os modeloscandidatos a compor um ensemble, ja que nem todos os componentes irao participar oucontribuir favoravelmente para o desempenho global.

Para se atingir esse objetivo, optou-se nesse trabalho por adotar a abordagemconstrutiva com exploracao [Islam et al. 2003, Hashem 1997]. A abordagem construtivae analoga a estrategia de forward selection [Guyon and Elisseeff 2003], onde, a partirde um conjunto vazio, adicionam-se novos componentes iterativamente em funcao doquanto eles contribuem para a melhora do desempenho do ensemble. Tal abordagem, emcomparacao com outras abordagens para a criacao de ensembles, apresenta as seguintesvantagens: definicao automatica da arquitetura final do ensemble; manutencao da diver-sidade entre os componentes individuais; e uma boa capacidade de generalizacao dosconjuntos criados. O metodo construtivo pode ser resumido pelos seguintes passos:

1. Iniciar o ensemble sem nenhum componente.2. Adicionar no ensemble o componente com o menor erro de treinamento.3. Para o restante dos componentes, faca recursivamente:

(a) Verificar se o componente contribui para a reducao do erro de treinamentodo ensemble ao ser adicionado ao mesmo.

(b) Caso contribua, incluir o componente ao ensemble. Caso contrario,avancar para o Passo 4.

XIII Encontro Nacional de Inteligencia Artificial e Computacional

SBC ENIAC-2016 Recife - PE 354

4. Fim do processo.

Vale ressaltar que o criterio empregado para combinar os componentes consiste namedia entre todos eles. Assim, apos todos os componentes serem analisados, o ensembletera sua estrutura definida e a analise de desempenho podera ser realizada, a partir dosdados do subconjunto de teste.

4. Previsao de Energia Eolica

Essa secao apresenta os procedimentos de avaliacao e os resultados obtidos, que foramalcancados mediante as simulacoes realizadas com diferentes modelos para a previsao degeracao de energia eolica. Os procedimentos de avaliacao foram conduzidos medianterealizacao de dois elementos metodologicos: estudo de simulacao do ensemble proposto,levando em conta a determinacao dos possıveis cenarios no qual o mesmo podera serutilizado; e desenvolvimento de um sistema computacional que possibilite replicar, comcerta similaridade, os resultados obtidos.

4.1. Analise dos dados

As amostras de geracao de energia eolica utilizadas para construir as series temporais fo-ram obtidas do projeto Western Wind and Solar Integration Study (WWSIS) que pertenceao Laboratorio Nacional de Energia Renovavel (do ingles, NREL) [Potter et al. 2008], omais importante centro de pesquisa e desenvolvimento de energias renovaveis e eficienciaenergetica dos Estados Unidos. O projeto WWSIS tem como principal objetivo estimar, apartir de uma modelagem meteorologica em grande escala, a viabilidade de novos parqueseolicos em uma determinada regiao.

A partir do mapeamento dos dados, foi constatado que 32.043 regioes (de 2km2

cada) mostraram-se adequadas para comportar a implantacao de turbinas e de parqueseolicos, totalizando uma capacidade de geracao superior a 960GW [Kramer et al. 2013].Alem disso, cada turbina possui medicoes de geracao de energia eolica intervaladas a cada10 minutos entre os anos de 2004 e 2006, constituindo um total de 157.680 amostras.

Devido ao elevado volume de dados, optou-se nesse trabalho em concentrar assimulacoes nos dois parques eolicos de maior representatividade [Kramer et al. 2013]:Tehachapi e Yucca Valley, ambos situados no estado da California, EUA. Os dados dosdois parques eolicos foram coletados para o perıodo entre 01/01/2004 e 31/12/2006 uti-lizando discretizacoes de 20 minutos. Por uma questao de simplicidade, a producao deenergia de todas as turbinas de cada parque foi agregada em duas diferentes series tempo-rais, cada qual correspondendo a producao total de energia de cada parque. Essas seriesforam posteriormente normalizadas em um intervalo que varia entre −1 e +1.

4.2. Estrategia de simulacao

As simulacoes foram conduzidas por meio de um cenario de teste que buscou avaliar odesempenho que o ensemble proposto apresenta quando comparado com versoes otimi-zadas de cada classe de componentes utilizada para compor o mesmo, ou seja, uma MLP,uma RBF e uma SVM. Essa analise e de grande importancia, pois permite verificar se acombinacao de N componentes de cada classe em um ensemble resulta em um potencialpreditivo maior do que se consideradas versoes otimizadas desses componentes de forma

XIII Encontro Nacional de Inteligencia Artificial e Computacional

SBC ENIAC-2016 Recife - PE 355

isolada. Alem disso, busca-se verificar se essa combinacao resulta em valores de previsaomais consistentes, ou seja, menor desvio-padrao na media das simulacoes.

A analise comparativa considera a variacao no horizonte de previsao dos dados,ou seja, quando sao considerados n passos alem do instante atual. Essa condicao buscaverificar se a taxa de crescimento do erro no ensemble e inferior aquelas apresentadaspelos modelos individuais. Para possibilitar essa analise de forma a minimizar os errosde validacao, duas variaveis devem ser corretamente definidas: o numero de observacoespassadas µ e o numero de passos futuros λ.

Nesse trabalho, considera-se o valor µ = 5 atrasos, que esta dentro de uma mar-gem aceitavel de acordo com os resultados fornecidos por [Kramer et al. 2013] para osdados das duas regioes analisadas. Tais valores foram tambem validados pelos autoresatraves de uma analise da funcao de autocorrelacao para as duas series temporais, ondeverificaram-se valores superiores a 0, 9 para 5 atrasos. O horizonte de previsao foi de-finido de acordo como λ ∈ [1, 18], ate 6 horas, com intervalos de 20 minutos, que, deacordo com a literatura, caracteriza um curto prazo de analise.

A previsao de geracao de energia eolica com n passos a frente ao instante atualt se baseia em uma estrategia direta de previsao [Clark and McCracken 2005], onde omapeamento de um conjunto de valoresX que sao obtidos no intervalo de tempo [t−µ, t],como por exemplo, µ valores historicos de geracao eolica para um valor y no tempo t+λ.Esse procedimento e realizado N vezes, onde N representa o numero de padroes entrada-saıda da base de dados. A Figura 3 ilustra o funcionamento dessa estrategia.

tt-2t-3 t-1 t+4t+2t+1 t+3... ...

μ = 2 λ = 3

yXMapeamento

Figura 3. Esquematizacao da estrategia de previsao com multiplos passos.

A tecnica utilizada para regularizar os modelos de previsao utilizados nesse traba-lho e a holdout, a qual divide os dados em conjunto de treinamento, selecao e validacao,que correspondem aos dados de geracao eolica para os anos de 2004, 2005 e 2006, res-pectivamente. Adotou-se a tecnica de holdout em funcao do grande volume de dados etambem pelo baixo custo computacional atrelado a essa tecnica.

Para fins de simulacao, o conjunto de componentes candidatos a compor o ensem-ble foi iniciado com 450 maquinas de aprendizado, sendo 150 para cada um dos tres tiposde maquinas consideradas nesse trabalho. De todas elas, o ensemble foi formado por 29maquinas, das quais 10 sao redes neurais do tipo perceptron de multiplas camadas, 7 saoredes neurais com funcao de base radial e 12 sao maquinas de vetores-suporte. O numerode iteracoes utilizado no algoritmo de busca aleatoria para otimizar os parametros de cadamaquina de aprendizado foi definido randomicamente em um intervalo k ∈ [5, 10]. Japara as versoes otimizadas de cada classe de componentes apresentam k = 200.

Quanto as especificacoes tecnicas, as simulacoes foram realizadas por um perıodode 297 minutos, ou seja, aproximadamente 5 horas, em um computador AMD FX-9370

XIII Encontro Nacional de Inteligencia Artificial e Computacional

SBC ENIAC-2016 Recife - PE 356

com 8 processadores de 4.7GHz cada, 32 GB de memoria RAM e utilizando o sistemaoperacional FreeBSD versao 10.3, 64 bits. Todas as rotinas relacionadas a aplicacaotais como, desenvolvimento dos previsores, pre-processamento dos dados, geracao dosresultados, dentre outros, foram desenvolvidas utilizando a linguagem Python 2.7.

4.3. Analise dos Resultados

Os resultados sao apresentados nas Figuras 4(a) e 4(b), os quais compreendem acomparacao entre o desempenho do ensemble proposto e das tres classes de componentescandidatos para cada uma das duas regioes analisadas. O domınio de analise esta apresen-tado no eixo horizontal e representa o horizonte de previsao discretizado em 18 passos,com intervalos de 20 minutos cada, enquanto que o eixo vertical representa o valor doerro quadratico medio para cada modelo.

(a) Parque de Tehachapi (b) Parque de Yucca Valley

Figura 4. Comparacao entre o ensemble e modulos individuais de cada classede modulos candidatos.

A partir da analise desses resultados, as seguintes verificacoes podem ser consta-tadas:

• As comparacoes apresentadas na Figura 4 apontam para uma convergencia na taxade crescimento do erro quadratico medio de todos os modelos ao longo dos 18passos. Uma hipotese para justificar esse comportamento e de que a forma comoos dados foram utilizados para prever diferentes horizontes de tempo se baseouna estrategia direta de previsao. Essa estrategia tira proveito da correlacao entre ovalor atual e os cinco valores passados da serie para inferir um valor futuro. Nessecaso, a taxa de erro de todos os previsores tende a crescer proporcionalmentea taxa de decaimento do nıvel de correlacao entre os atrasos da serie e o valor atual.

• Para ambas as regioes analisadas na Figura 4, o desempenho apresentado peloensemble foi superior ao apresentado pelas classes de componentes simulados demaneira individual. Essa diferenca de desempenho mostra-se mais visıvel para osperıodos mais longos (por exemplo, entre os perıodos 24 ate 36 da Figura 4(b)),pois a diminuicao na correlacao dos dados apresenta menor impacto ao ensembleproposto com relacao aos demais modelos. No entanto, pode-se notar que em

XIII Encontro Nacional de Inteligencia Artificial e Computacional

SBC ENIAC-2016 Recife - PE 357

muitos perıodos nao houve significativa diferenca entre os seus desempenhos, emparticular nos primeiros passos.

• Considerando valores absolutos, o ensemble proposto apresentou desempenho su-perior medio de aproximadamente 19% e 16% em relacao a media de desempenhoapresentada pelos outros tres modelos para os parques de Tehachapi e Yucca Val-ley, respectivamente. O ensemble tambem foi o que apresentou menor varianciapara ambos os cenarios, quando comparado com os demais modelos.

5. ConclusaoAtualmente, o estudo de mecanismos que auxiliam na previsao de curto prazo para ageracao de energia em parques eolicos tem se mostrado crıtico para assegurar o corretofuncionamento dos sistemas de energia tradicionais. De fato, com a crescente insercaode fontes eolicas na matriz energetica, a definicao de estrategias que visam anteciparcom relativa confiabilidade potenciais episodios de intermitencia na geracao de energia– que ocorrem em grande parte devido a natureza estocastica do vento – previne essessistemas de eventuais prejuızos relacionados ao desbalanceamento entre oferta e demandade energia, proporcionando assim maior seguranca e estabilidade para todos os agentes.

Nesse sentido, esse trabalho explorou a utilizacao de conceitos de sistemas inteli-gentes para delinear um modelo de previsao de series temporais. O modelo e definido porum ensemble composto por tres diferentes classes de previsores: redes neurais artificiaisdos tipos MLP, RBF e maquinas de vetores-suporte (SVM). Um conjunto de simulacoesfoi realizado como forma de avaliar o desempenho do ensemble em termos de capacidadepreditiva, quando comparado com o desempenho individual de versoes otimizadas paracada classe de previsores que o compos.

Os resultados apresentados mostraram a relativa eficacia do ensemble paracenarios de menor variancia nos dados e tambem a robustez de seus resultados quandosubmetido a cenarios com horizontes de previsao elevados. Quando comparado comversoes otimizadas das tres classes de previsores, o modelo ensemble se mostrou superiorpara a maioria dos cenarios. O ensemble tambem apresentou menor desvio-padrao namaioria das simulacoes, quando comparado com os demais modelos.

De maneira semelhante, a adocao das estrategias de geracao e selecao de com-ponentes para compor o ensemble se mostrou bastante vantajosa em relacao a modelostradicionais de previsao empregados na literatura. A correta calibragem do numero deiteracoes no algoritmo de busca aleatoria, bem como a quantidade adequada de compo-nentes de cada classe, possibilitou criar diversidade, ao mesmo tempo em que especializoucada componente na analise de previsao. A abordagem construtiva, por sua vez, possibi-litou selecionar o conjunto de previsores que melhor previu as amostras de dados, alemde fornecer um mecanismo automatico de selecao de componentes para o ensemble.

Porem, e valido mencionar que outras classes de modelos podem ser incorpora-das ao processo de criacao do ensemble, como forma de propiciar maior diversidade eassim melhorar seu desempenho. Pode-se tambem empregar diferentes estrategias paraa obtencao de resultados em ensembles, como as abordagens heurısticas ou de poda[Polikar 2006]. Nesse sentido, trabalhos futuros visam realizar estudos comparativos en-tre a eficacia de diferentes arquiteturas de ensembles, bem como estender a analise compa-

XIII Encontro Nacional de Inteligencia Artificial e Computacional

SBC ENIAC-2016 Recife - PE 358

rativa utilizando abordagens autoadaptativas e online para a previsao de series temporais,em especial, series de geracao de energia eolica.

Agradecimentos

Este trabalho recebeu suporte financeiro e tecnico do grupo AES e cooperadas no escopodo projeto de pesquisa e desenvolvimento “SMART-SEN: um modelo de simulacao dosistema eletrico nacional com presenca de geracao de renovaveis intermitentes”.

Referencias

Bergstra, J. and Bengio, Y. (2012). Random search for hyper-parameter optimization.Journal of Machine Learning Research, 13(1):281–305.

Bossavy, A., Girard, R., and Kariniotakis, G. (2013). Forecasting ramps of wind powerproduction with numerical weather prediction ensembles. Wind Energy, 16(1):51–63.

Box, G., Jenkins, G., and Reinsel, G. (2008). Time Series Analysis – Forecasting andControl. John Wiley & Sons.

Chang, W.-Y. (2013). Short-term wind power forecasting using the enhanced particleswarm optimization based hybrid method. Energies, 6(9):4879–4896.

Chen, N., Qian, Z., Nabney, I. T., and Meng, X. (2014). Wind power forecasts usingGaussian processes and numerical weather prediction. IEEE Transactions on PowerSystems, 29(2):656–665.

Clark, T. E. and McCracken, M. W. (2005). Evaluating direct multistep forecasts. Eco-nometric Reviews, 24(4):369–404.

de Aquino, R. R., Ludermir, T. B., Ferreira, A. A., Nobrega Neto, O., Souza, R. B., Lira,M., and Carvalho, M. A. (2014). Improving reservoir based wind power forecastingwith ensembles. In Proceeding of the IEEE International Conference on Systems, Manand Cybernetics (SMC), pages 946–952. IEEE.

EPE (2016). Balanco energetico nacional 2015. Relatorio final, MME - Ministerio deMinas e Energia, Rio de Janeiro, RJ.

Foley, A., Leahy, P., Marvuglia, A., and McKeogh, E. (2012). Current methods andadvances in forecasting of wind power generation. Renewable Energy, 37(1):1–8.

Guyon, I. and Elisseeff, A. (2003). An introduction to variable and feature selection.Journal of Machine Learning Research, 3:1157–1182.

Hansen, L. and Salamon, P. (1990). Neural network ensembles. IEEE Transactions onPattern Analysis and Machine Intelligence, 12(10):993–1001.

Hashem, S. (1997). Optimal linear combinations of neural networks. Neural Networks,10(4):599–614.

Haykin, S. (2009). Neural Networks and Learning Machines. Pearson Education, Inc,New Jersey.

Heier, S. (2014). Grid Integration of Wind Energy: Onshore and Offshore ConversionSystems. John Wiley & Sons Ltd, Chichester, UK.

XIII Encontro Nacional de Inteligencia Artificial e Computacional

SBC ENIAC-2016 Recife - PE 359

Islam, M., Mekhilef, S., and Saidur, R. (2013). Progress and recent trends of wind energytechnology. Renewable and Sustainable Energy Reviews, 21(1):456–468.

Islam, M. M., Yao, X., and Murase, K. (2003). A constructive algorithm for trai-ning cooperative neural network ensembles. IEEE Transactions on Neural Networks,14(4):820–834.

Jabr, R. and Pal, B. (2009). Intermittent wind generation in optimal power flow dispat-ching. IET Generation, Transmission & Distribution, 3(1):66–74.

Kramer, O., Gieseke, F., and Satzger, B. (2013). Wind energy prediction and monitoringwith neural computation. Neurocomputing, 109:84–93.

Lee, D. and Baldick, R. (2014). Short-term wind power ensemble prediction based onGaussian processes and neural networks. IEEE Transactions on Smart Grid, 5(1):501–510.

Li, S., Wang, P., and Goel, L. (2015). Wind power forecasting using neural network en-sembles with feature selection. IEEE Transactions on Sustainable Energy, 6(4):1447–1456.

Perrone, M. P. (1993). Improving regression estimation: Averaging methods for vari-ance reduction with extensions to general convex measure optimization. PhD thesis,Citeseer.

Perrone, M. P. and Cooper, L. N. (1992). When networks disagree: Ensemble methodsfor hybrid neural networks. Technical report, DTIC Document.

Polikar, R. (2006). Ensemble based systems in decision making. IEEE Circuits andSystems Magazine, 6(3):21–45.

Potter, C., Lew, D., McCaa, J., Cheng, S., Eichelberger, S., and Grimit, E. (2008). Crea-ting the dataset for the western wind and solar integration study (U.S.A.). Wind Engi-neering, 32(4):325–338.

Shamshad, A., Bawadi, M. B., Wan Hussin, W., Majid, T., and Sanusi, S. (2005). Firstand second order Markov chain models for synthetic generation of wind speed timeseries. Energy, 30(5):693–708.

Sharkey, A. J. (2012). Combining artificial neural nets: ensemble and modular multi-netsystems. Springer Science & Business Media.

Taylor, J. W., McSharry, P. E., and Buizza, R. (2009). Wind power density forecastingusing ensemble predictions and time series models. IEEE Transactions on EnergyConversion, 24(3):775–782.

XIII Encontro Nacional de Inteligencia Artificial e Computacional

SBC ENIAC-2016 Recife - PE 360