59
Ciência da Computação Apresentação Final do TCC Predição de Nível no Canal de Fuga da Usina de Itaipu Empregando Técnicas de Mineração de Dados

Apresentação final do TCC

Embed Size (px)

Citation preview

Ciência da ComputaçãoApresentação Final do TCC

Predição de Nível no Canal de Fuga da Usina de

Itaipu Empregando Técnicas de Mineração de

Dados

TERESINHA ARNAUTS HACHISUCAOrientadora

PAULO NEISCo-Orientador

WELLINTHON MEURER RONFIMAcadêmico/Estagiário

ÍNDICEContexto

Motivação

Objetivo

Modelo Atual

Proposta

Experimentos Realizados

Conclusões

Trabalhos Futuros

Rio Iguaçu

Rio Paraná

Rio Acaray

Monday

R11

ContextoCanal de Fuga

Rio Iguaçu

Rio Paraná

Rio Acaray

Monday

R11

Contexto

Variação Horária: 50 cm

Variação Diária: 2 m

Vel. Sup. Max: 2 m/s

Canal de Fuga

Motivação

Cálculo daDisponibilidade Energética

Planejamento hidro-energético daUsina de Itaipu

NívelCanal de Fuga

+ Exata

7

Objetivo

Obter  modelos  computacionais  de  predição  

horária  de  nível  no  canal  de  fuga  da    

Usina  de  Itaipu

8

Modelo Utilizado Atualmente• Proposto em 2005: Melhorar predição;

• Vazão Vertida (VV);• Vazão Turbinada (VT);• Vazão em Monday (R11);• Nível no Canal de Fuga (CF);

• Dados Horários de 1991 à 2004.

CF = 𝑎0 + 𝑎1 * 𝑉𝑉 + 𝑎2 * 𝑉𝑇 + 𝑎3 * 𝑅11 + 𝑎4 * 𝑉𝑉2 + 𝑎5 * 𝑉𝑇1/2 + 𝑎6 * 𝑅111/2 + 𝑎7 * 𝑅11

VV = 0 𝑚3/𝑠

VV < 3000 𝑚3/𝑠

VV >= 3000 𝑚3/𝑠

Fonte: Relatório Técnico: Referência das Grandezas Hidroenergéticas.

Modelo Atual: Regressão

9

Erro MáximoAbsoluto

Modelo AntigoOcorrência

(%)

Modelo AtualOcorrência

(%)

20 cm 18% 91%

10 cm 8% 65%

Fonte: Relatório Técnico: Referência das Grandezas Hidroenergéticas.

Modelo Atual x Antigo

10

Fonte: Relatório Técnico: Referência das Grandezas Hidroenergéticas.

Modelo Atual x Antigo

Modelo AntigoModelo Atual

11

Proposta

13

1

Regressão Linear

LinearRegression

Proposta

14

2

Árvore de Regressão

M5P Tree

1

Regressão Linear

LinearRegression

3

Redes Neurais

MultilayerPerceptron

Proposta

15

2

Árvore de Regressão

M5P Tree

1

Regressão Linear

LinearRegression

Proposta

16

2

Árvore de Regressão

M5P Tree

1

Regressão Linear

LinearRegression

3

Redes Neurais

MultilayerPerceptron

Proposta

17

2

Árvore de Regressão

M5P Tree

1

Regressão Linear

LinearRegression

3

Redes Neurais

MultilayerPerceptron

Proposta

18

2

Árvore de Regressão

M5P Tree

1

Regressão Linear

LinearRegression

3

Redes Neurais

MultilayerPerceptron

Proposta

Fonte: [FAYYAD] From data mining to knowledge discovery in databases.

19

Knowledge Discovery in Databases (KDD)

20

Ferramentas

Python

PréProcessamento

WEKAJAVA

Extração de Padrões

PósProcessamento

Python

PréProcessamento

22

Escopo do Pré-Processamento

Fonte: [FAYYAD] From data mining to knowledge discovery in databases.

23

Nível horário Canal de Fuga da Usina de Itaipu

Data 01:00 02:00 03:00 … 23:00 24:00

01/02/2006 103.19 103.08 102.91 … 103.08 103.19

02/02/2006 103.08 103.08 102.91 … 103.19 103.08

… … … … … … …

04/08/2013 104.77 104.17 103.9 … 104.37 104.33

1

2.742 x 24 = 65.808

Arquivo CSV• Dados horários de 2006 à 2013 • Fornecidos pela OPSH (Hidrologia)

24

Distribuição dos Dados

25

Dados de Monday

26

Outliers e Nulos = 0

769 ≈ 1%valores com problemas

27

103.19 103.08 102.91 NULL NULL NULL NULL 103.08 103.19

103.19 103.08 102.91 NULL NULL NULL NULL 103.08 103.19

Média = (103.08-102.91) / 4Média = 0.0425

103.19 103.08 102.91 102.95 102.99 NULL NULL 103.08 103.19

Algoritmo de Interpolação

28

Dados Pré-Processados

Experimentos

29

30

Escopo dos Experimentos

Fonte: [FAYYAD] From data mining to knowledge discovery in databases.

Experimento 1Seleção de Atributos

Variáveis AtributosTURBINADA 0 à 24MONDAY 0 à 24VERTIDA 0 à 24CANAL DE FUGA 0 à 24

100

32

Modelo ARFF

33

Experimento

Coeficiente de Correlação 0,9997Erro Médio Absoluto 0,0534Raiz do Erro Quadrático Médio 0,076

Raiz do Erro Quadrático Relativo 2,3058%

2Regressão Linear

LinearRegression

+WEKA1

1 n

i ii

t on =

−∑ 2

1

1 n

i ii

t on =

−∑2

12

1

n

i iin

ii

t o

t t

=

=

34

Atributos Selecionados

Variáveis AtributosTURBINADA 0 e 1MONDAY 0 e 1VERTIDA 0, 1 e 2CANAL DE FUGA 0 à 24

32

Experimento 2Extração de Padrões

36

Modelo ARFF

Variáveis AtributosTURBINADA 0 e 1MONDAY 0 e 1VERTIDA 0, 1 e 2CANAL DE FUGA 0 à 8

16

Linear Regression

- 0.0097 * CANAL_FUGA_8H + 0.0071 * CANAL_FUGA_7H + - 0.0081 * CANAL_FUGA_6H + - 0.0076 * CANAL_FUGA_5H + - 0.0554 * CANAL_FUGA_4H + - 0.1569 * CANAL_FUGA_3H + 0.2995 * CANAL_FUGA_2H + 0.9155 * CANAL_FUGA_1H + 1.4122

CANAL_FUGA_0H = - 0.0004 * TURBINADA_1H + 0.0004 * TURBINADA_0H +

- 0.0001 * VERTIDA_2H + - 0.0001 * VERTIDA_1H + 0.0002 * VERTIDA_0H +

- 0.0002 * MONDAY_1H + 0.0002 * MONDAY_0H +

M5P Tree

38

Multilayer Perceptron

39

40

Análise do Treinamento

M5PTree

LinearRegression

MultilayerPerceptron

Coeficiente de Correlação 0,9997 0,9997 0,9996

Erro Médio Absoluto 0,0532 0,0563 0,0660

Raiz do Erro Quadrático Médio 0,0749 0,0800 0,0881

Raiz do Erro Quadrático Relativo 2,2732% 2,4291% 2,6738%

41

Nível horário Canal de Fuga da Usina de Itaipu

Data 01:00 02:00 03:00 … 23:00 24:00

01/02/2006 103.19 103.08 102.91 … 103.08 103.19

02/02/2006 103.08 103.08 102.91 … 103.19 103.08

… … … … … … …

04/08/2013 104.77 104.17 103.9 … 104.37 104.33

1

(96 x 24) - 8 = 2.296 casos de teste

Dados de TesteDados horários de

01-Mai-2013 à 08-Ago-2013

42

Conjunto de Teste

Teste 1

Conjunto de Testesestá contido no

Conjunto de Treinamento

Erro Máximo

AbsolutoAtual M5P

TreeLinear

RegressionMultiLayerPerceptron

20 cm 58,32% 96,82% 94,34% 95,21%

10 cm 32,58% 81,08% 79,14% 76,83%

Modelo Atual x Propostos

44

Erros Observados

Distribuição KDE

Predições

Teste 2

Conjunto de Testes não está contido no

Conjunto de Treinamento

Predições

Erros Observados

Distribuição KDE

52

Conclusão• É conveniente que Itaipu atualize

constantemente seu modelo;• Árvore Regressão obteve resultados

melhores;• RNA pode não ser eficiente em

cheias não registradas.

Trabalhos Futuros

54

Trabalhos Futuros

• Interface integrada com os dados de Itaipu, para realizar predições;

• Ampliar os estudos, buscando outras

informações relevantes aos modelos.

55

Trabalhos Futuros

• Simulação Hidrodinâmica;• Estudar métodos de substituição de

valores;• Ampliar o conjunto de treinamento e

testes.

Referências Bibliográficas[1] LIMA, C. A. B. et al. Referência das Grandezas Hidroenergéticas. [S.l.], 2012;

[2] MENDONÇA, J. E. C. S. de; VENANCIO, J. D. V.; PAUL, L. G. Atos Oficiais da Itaipu Binacional. Curitiba - PR: Itaipu Binacional, 2005;

[3] SÓRIA, M. A. Z. Usina de Itaipu Integração energética entre Brasil e Paraguai. 1. ed. Curitiba - PR: Editora da Universidade Federal do Paraná, 2012;

[4] ITAIPU. Nossa História. 2014. Disponível em: <www.itaipu.gov.br>;

[5] DOSUALDO, D. G.; REZENDE, S. O. Análise de Precisão de Métodos de Regressão. São Carlos - SP, 2003;

[6] HENRIQUES, C. Análise de Regressão Linear Simples e Múltipla. [S.l.], 2011;

[7] PICHILIANI, M. Data Mining na Prática: Árvores de Decisão. 2006;

[8] WITTEN, I. H.; FRANK, E. Data Mining: Pratical Machine Learning Tools and Techniques. 2. ed. [S.l.]: Elsevier, 2005;

[9] HAND, D.; MANNILA, H.; SMYTH, P. Principles of Data Mining. [S.l.]: The MIT Press, 2001;

[10] FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to knowledge discovery in databases. AIMagazine,1996;

[11] JAMES, G. et al. An Introduction to Statistical Learning. New York: Springer, 2013;

Referências Bibliográficas

Obrigado!

Wellinthon Meurer Ronfim [email protected]

Teresinha Arnauts Hachisuca [email protected]

Paulo Neis [email protected]