Controle de processos da indústria de petróleo e gás ... S... · engenharia de processos tem se beneficiado de estratégias de controle avançadas, como, por exemplo, controle

UNIVERSIDADE FEDERAL DE SANTA CATARINA

CURSO DE GRADUAÇÃO EM ENGENHARIA QUÍMICA

Controle de processos da indústria de petróleo e gás utilizando técnicas de

inteligência artificial

Larissa Scherer Severo

Florianópolis, Agosto de 2004

Programa: PRH-ANP/MCT N0 34

Formação de Engenheiros nas Áreas de Automação, Controle

e Instrumentação para a Indústria do Petróleo e Gás

Universidade Federal de Santa Catarina

1

LARISSA SCHERER SEVERO

MONOGRAFIA DE INICIAÇÃO CIENTÍFICA

CONTROLE DE PROCESSOS DA INDÚSTRIA DE PETRÓLEO E GÁS

UTILIZANDO TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL

Orientador: Prof. Ricardo A. F. Machado, Dr. Sc.

FLORIANÓPOLIS

2004





2

CONTROLE DE PROCESSOS DA INDÚSTRIA DE PETRÓLEO E

GÁS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL

Larissa Scherer Severo Aluna de Graduação Ricardo Antônio Francisco Machado Professor, Dr. Sc. Orientador Reinaldo Marcolla Aluno de Pós-graduação Co-orientador

Monografia submetida ao

Programa PRH-ANP/MCT No 34

para avaliação de final de curso.





3

SUMÁRIO

LISTA DE FIGURAS..........................................................................................................................................4

RESUMO ...............................................................................................................................................................6

INTRODUÇÃO .....................................................................................................................................................8

1.2 – CONTROLE DE PROCESSOS NA INDÚSTRIA PETROQUÍMICA ............................................................11

1.3 – APRESENTAÇÃO DO TRABALHO ..........................................................................................................13

REVISÃO BIBLIOGRÁFICA..........................................................................................................................14

2.1 – INTRODUÇÃO ..........................................................................................................................................14

2.2 – REDES NEURAIS ARTIFICIAIS ...............................................................................................................14

2.2.1 - Benefícios das redes neurais ..................................................................................................16

2.2.2 - Cérebro Humano.........................................................................................................................20

2.2.3 - Modelos de um Neurônio ..........................................................................................................22

2.2.4 - Tipos de Função de Ativação ..................................................................................................26

2.2.5 - Arquitetura da Rede ..................................................................................................................29

2.2.6 - Inteligência Artificial e Redes Neurais..................................................................................34

2.2.7 - O “Aprendizado” da Rede ........................................................................................................34

2.2.8 - Algoritmo de Retropropagação de Erro.................................................................................37

2.3 - MODELAGEM DE PROCESSOS QUÍMICOS UTILIZANDO CONHECIMENTO PRÉVIO DE REDES

NEURAIS............................................................................................................................................................38

2.4 – CONSIDERAÇÕES FINAIS .......................................................................................................................41

METODOLOGIA................................................................................................................................................42

3.1 - UNIDADES EXPERIMENTAIS ..................................................................................................................42

3.2 - PROCEDIMENTO EXPERIMENTAL ...........................................................................................................46

RESULTADOS E DISCUSSÕES....................................................................................................................53

4.1 – RESULTADOS DO TREINAMENTO DA REDE NEURAL ...........................................................................53

4.2 – RESULTADOS DO CONTROLE EM MALHA FECHADA..............................................................................56

CONCLUSÕES .....................................................................................................................................................61

REFERÊNCIAS BIBLIOGRÁFICAS..............................................................................................................63





4

LISTA DE FIGURAS

FIGURA 1.01: ILUSTRAÇÃO DAS GERAÇÕES EXISTENTES NA INDÚSTRIA PETROQUÍMICA. .............................9

FIGURA 1.02: PROCESSAMENTO MENSAL DE PETRÓLEO NAS REFINARIAS DO BRASIL................................10

FIGURA 2.01: REPRESENTAÇÃO EM DIAGRAMA EM BLOCOS DO SISTEMA NERVOSO................................20

FIGURA 2.02: ORGANIZAÇÃO ESTRUTURAL DOS NÍVEIS DO CÉREBRO. ..........................................................22

FIGURA 2.03: MODELO NÃO-LINEAR DE UM NEURÔNIO. .................................................................................23

FIGURA 2.04: TRANSFORMAÇÃO AFIM PRODUZIDA PELA PRESENÇA DE UM BIAS. ........................................25

FIGURA 2.05: OUTRO MODELO NÃO-LINEAR DE UM NEURÔNIO. ....................................................................26

FIGURA 2.06: FUNÇÃO DE TRANSFERÊNCIA SIGMÓIDE. ..................................................................................27

FIGURA 2.07: FUNÇÃO DE TRANSFERÊNCIA TANGENTE HIPERBÓLICA. ..........................................................28

FIGURA 2.08: FUNÇÃO DE TRANSFERÊNCIA GAUSSIANA.................................................................................29

FIGURA 2.09: REDE ALIMENTADA ADIANTE OU ACÍCLICA COM UMA ÚNICA CAMADA DE NEURÔNIO. ..........31

FIGURA 2.10: REDE ALIMENTADA ADIANTE OU ACÍCLICA TOTALMENTE CONECTADA COM UMA CAMADA

OCULTA E UMA CAMADA DE SAÍDA. ...........................................................................................................32

FIGURA 2.11: REDE RECORRENTE SEM LAÇOS DE AUTO-REALIMENTAÇÃO E SEM NEURÔNIOS OCULTOS.33

FIGURA 2.12: PREVISÃO DA TEMPERATURA APÓS UM INTERVALO DE TEMPO ΔT. ........................................35

FIGURA 2.13: FLUXO DE INFORMAÇÕES PARA O AJUSTE DOS PESOS APÓS CADA PADRÃO. ........................36

FIGURA 3.01: ESQUEMA DA UNIDADE PILOTO DE POLIMERIZAÇÃO [MAZZUCCO, 2003].............................43

FIGURA 3.02: DETALHES DO REATOR DE POLIMERIZAÇÃO.[MAZZUCCO, 2003]. .........................................44

FIGURA 3.03 : TELA PRINCIPAL DO SOFTWARE DE AQUISIÇÃO DE DADOS E CONTROLE (MALHA FECHADA).

......................................................................................................................................................................46

FIGURA 3.04: FLUXOGRAMA DO PROCEDIMENTO EXPERIMENTAL..................................................................47

FIGURA 3.05: PERTURBAÇÕES APLICADAS NAS VÁLVULAS DE CONTROLE PARA O LEVANTAMENTO DE

DADOS PARA ETAPA DE TREINAMENTO. .....................................................................................................48

FIGURA 3.06: RESPOSTA DA TEMPERATURA DO REATOR PARA AS PERTURBAÇÕES APLICADAS NA FIGURA

3.05. ............................................................................................................................................................48

FIGURA 3.07: PERTURBAÇÕES APLICADAS NAS VÁLVULAS DE CONTROLE PARA O LEVANTAMENTO DE

DADOS PARA ETAPA DE VALIDAÇÃO. ..........................................................................................................49

FIGURA 3.08: RESPOSTA DA TEMPERATURA DO REATOR PARA AS PERTURBAÇÕES APLICADAS NA FIGURA

3.07. ............................................................................................................................................................50





5

FIGURA 3.09: MENU GERADO PELO PROGRAMA MATLAB PARA CONFIGURAÇÃO DA REDE NEURAL. ........51

FIGURA 4.01: RESULTADO DO TREINAMENTO PARA 6 NEURÔNIOS NA CAMADA ESCONDIDA E 50.000

ÉPOCAS.........................................................................................................................................................53

FIGURA 4.02/4.03: RESULTADO DO TREINAMENTO PARA 6 NEURÔNIOS NA CAMADA ESCONDIDA

E 100.000 ÉPOCAS....................................................................................................................................54

FIGURA 4.04: RESULTADO DA VALIDAÇÃO DA REDE.........................................................................................55

FIGURA 4.05: TOPOLOGIA DA REDE....................................................................................................................56

FIGURA 4.06: SOFWARE EM OPERAÇÃO. MUDANÇA DE SETPOINT DE 30 PARA 50OC. ..................................57

FIGURA 4.07: MUDANÇA DE SETPOINT DE 50 PARA 70OC. ..............................................................................58

FIGURA 4.08: RESPOSTA DAS VARIÁVEIS CONTROLADA E MANIPULADA, MANTIDO

UM SETPOINT DE 70OC.................................................................................................................................59

FIGURA 4.09: PERTURBAÇÃO DE CARGA EM DESTAQUE. .................................................................................60





6

RESUMO

A maioria dos processos químicos é caracterizada por não linearidades,

tempo morto muito elevado, processo restritivos e condições de operação em

constante mudança. Unidades petroquímicas estão repletas destes

processos: colunas de destilação em refinarias, reatores, torres de extração e

absorção, etc. O preço do petróleo está associado ao valor que se pode

agregar a ele sendo função da densidade e ponto de ebulição. Processos sob

rigoroso controle, mantendo os produtos dentro das especificações

desejadas, é de extremo interesse para esse segmento.

Controladores clássicos a parâmetros constantes, nestes casos,

apresentam desempenho limitado e, para transpor essas dificuldades a

engenharia de processos tem se beneficiado de estratégias de controle

avançadas, como, por exemplo, controle preditivo baseado em modelo (MPC).

Sistemas inteligentes são extremamente atraentes para problemas complexos

de controle, pois esses são capazes de aproximar as relações dinâmicas entre

as variáveis de causa e efeito. Estratégias utilizando técnicas combinadas de

inteligência artificial são avanços que ainda possuem grande potencial de

exploração.

Este trabalho consiste na implementação e avaliação de desempenho

de uma estratégia de controle baseado no conhecimento prévio do modelo,

para isso utiliza-se uma rede neural treinada como modelo empírico do

processo. Este documento reflete apenas uma parcela do trabalho

desenvolvido no Programa PRH34 e consiste do cumprimento da última

relativa a formação de Engenheiro Químico especialista em Petróleo e Gás.





7

Ensaios experimentais foram conduzidos em escala piloto de

laboratório, objetivando controle de temperatura de um reator. O modelo

empírico foi representado por uma rede neural feedforward, com treinamento

off-line. Os resultados demonstram que a estratégia apresenta desempenho

satisfatório para mudanças entre set points e perturbações de carga,

mantendo a variável controlada na referência desejada.





8

INTRODUÇÃO

1.1 - A indústria petroquímica: conceituação

Petróleo e gás natural são normalmente percebidos pelo grande

público como sendo essencialmente fontes primárias de combustíveis, seja

para uso em meios de transporte na forma de gasolina, diesel ou mesmo gás,

seja para geração de energia para uso industrial por combustão em fornos e

caldeiras. Todavia, nem todos têm presente que é também do processamento

inicial desses mesmos recursos naturais que provêm às matérias-primas

básicas de um dos pilares do sistema industrial moderno, a indústria

petroquímica. Partindo geralmente ou da nafta, que é uma fração líquida do

refino do petróleo, ou do próprio gás natural tratado, os sofisticados

processos petroquímicos são capazes de quebrar, recombinar e transformar

as moléculas originais dos hidrocarbonetos presentes no petróleo ou no gás,

gerando, em grande escala, uma diversidade de produtos, os quais, por sua

vez, irão constituir a base química dos mais diferentes segmentos da

indústria em geral. Atualmente, é possível identificar produtos de origem

petroquímica na quase totalidade dos itens industriais consumidos pela

população tais como embalagens e utilidades domésticas de plástico, tecidos,

calçados, alimentos, brinquedos, materiais de limpeza, pneus, tintas, eletro-

eletrônicos, materiais descartáveis e muitos outros.

Tipicamente, podem ser distinguidos três estágios, ou gerações,

industriais na cadeia da atividade petroquímica, como pode-se observar na

Figura 1.01: (1) indústrias de 1a geração, que fornecem os produtos

petroquímicos básicos, tais como eteno, propeno, butadieno, etc; (2)

indústrias de 2a geração, que transformam os petroquímicos básicos nos





9

chamados petroquímicos finais, como polietileno (PE), polipropileno (PP),

polivinilcloreto (PVC), poliésteres, óxido de etileno etc.; (3) indústrias de 3a

geração, onde produtos finais são quimicamente modificados ou

conformados em produtos de consumo. A indústria do plástico é o setor que

movimenta a maior quantidade de produtos fabricados com materiais

petroquímicos.

FIGURA 1.01: ILUSTRAÇÃO DAS GERAÇÕES EXISTENTES NA INDÚSTRIA PETROQUÍMICA.

Em geral, a competitividade da indústria petroquímica está

criticamente associada a fatores como grau de verticalização empresarial,

grandes economias de escala, disponibilidade e garantia de fornecimento de

matéria-prima, altos investimentos em tecnologia e logística de distribuição

de produtos. Tais fatores fazem com que o segmento petroquímico seja um

campo onde jogam apenas empresas de grande porte, as mais importantes

com elevado grau de internacionalização das atividades.

A manutenção da competitividade exige que as modernas indústrias

petroquímicas estejam em freqüente modernização para corresponder às

exigências mercadológicas de produção com menor custo e elevada

qualidade.

Hoje, no Brasil, temos três pólos petroquímicos:

- O Pólo Petroquímico de São Paulo está localizado nas cidades de Santo

André e Cubatão, no estado de São Paulo. A Petroquímica União (São Paulo)





10

iniciou suas operações em 1972, tem a capacidade de produção instalada de

500 mil toneladas por ano de eteno e tem quarenta indústrias de segunda

geração.

- O Pólo Petroquímico de Camaçari está localizado em Camaçari, na

Bahia. A COPENE (Companhia Petroquímica do Nordeste) iniciou suas

operações em 1978, tem a capacidade de produção instalada de 1,2 milhão

de toneladas por ano de eteno e tem 423 indústrias de segunda geração.

- O Pólo Petroquímico do Sul está localizado na cidade de Triunfo, no

Rio Grande do Sul. A COPESUL (Companhia Petroquímica do Sul) iniciou

suas operações em 1982, tem a capacidade de produção instalada de 1,135

milhão de toneladas por ano de eteno e tem oito indústrias de segunda

geração.

01.000.0002.000.0003.000.0004.000.0005.000.0006.000.0007.000.0008.000.0009.000.000

10.000.000

Jane

iro

Feverei

roMarç

oAbri

lMaio

Junh

oJu

lho

Agosto

Setembro

Outubro

Novem

bro

Dezem

bro

Ano

m3

2000 2001 2002 2003 2004

FIGURA 1.02: PROCESSAMENTO MENSAL DE PETRÓLEO NAS REFINARIAS DO BRASIL.

Fonte: Agênica Nacional de Petróleo.





11

Na Figura 1.02 consta dados da Agência Nacional de Petróleo referente

ao processamento de petróleo nas Refinarias Brasileiras entre o período de

janeiro de 2000 a março de 2004.

1.2 – Controle de Processos na Indústria Petroquímica

O preço do petróleo está associado ao valor que pode agregar a ele

sendo função da densidade e ponto de ebulição. Processos sob rigoroso

controle, mantendo os produtos dentro das especificações desejadas, são de

extremo interesse para esse segmento.

Unidades petroquímicas abrangem processos físico-químicos de

transformação que apresentam fortes não-linearidades, além de múltiplos

estados de equilíbrio. Ainda, para processos contínuos, alguns destes

estados de equilíbrio são instáveis em malha aberta. Mesmo assim, grande

parte dos estudos realizados em controle de processos de aplicações

industriais são tipicamente feitos por controladores lineares baseados em

modelos linearizados, ou ainda em controladores clássicos, como o PID.

Contudo, sabe-se que teorias de controle linear são válidas somente para as

vizinhanças de um ponto operacional e, para sistemas com fortes não-

linearidades, como é o caso da maioria dos processos químicos, a fronteira

de aplicação do modelo linear em torno de um ponto torna-se muito

pequena, ou seja, métodos baseados em controle linear podem não

apresentar bons resultados (CANCELIER et al., 2004).

O sistema de controle baseado em modelos tem demonstrado ser

bastante eficiente em processos químicos, especialmente em processos com

fortes interações entre entrada e saída, tempo morto elevados, além de

restrições físicas em suas variáveis (GARCÍA et al., 1989). Por exemplo,

reatores de polimerização onde a temperatura possui grande influência sobre





12

a cinética de reação e distribuição dos pesos moleculares do polímero, ou

seja, possui efeito direto sobre suas propriedades, portanto, esta é uma

variável que se deseja controlar.

Para o propósito da aplicação de estratégias de controle, os modelos

matemáticos de processos podem ser apresentados em diferentes formatos,

contanto que possam se utilizados para prover previsões úteis, significantes

e fidedignas do comportamento do processo. É bem estabelecido já que

modelos fenomenológicos normalmente fornecem uma descrição mais precisa

do processo, especialmente para extrapolações e que modelos empíricos são

de mais fácil obtenção e manipulação durante aplicações on line em tempo

real, principalmente quando a obtenção de dados experimentais é facilitada

(VIEIRA et al., 2003). Por esta razão, algumas aplicações exigem uma

otimização/adaptação do modelo desenvolvido e eventualmente o uso de

estruturas híbridas, que levam em consideração o conhecimento empírico

mais o conhecimento fenomenológico, podem sem consideradas.

De forma a superar as dificuldades no desenvolvimento de modelos

mecanísticos, modelos empíricos baseados em redes neurais estão sendo

utilizados, tanto para fins de modelagem e otimização de processos, quanto

para a construção de estratégias de controle (CANCELIER et al., 2004).

Principalmente quando o sistema tratado possui fortes não linearidades, as

redes neurais tem encontrado grande aplicação para sua identificação e

modelagem. O único inconveniente para a aplicação de redes neurais é a

necessidade de grande número de dados experimentais para o seu

treinamento. Quando se possui limitado número de pontos experimentais,

geralmente o treinamento convencional tende levar ao sobretreinamento, o

que faz com que a rede tenha pouca capacidade de.





13

1.3 – Apresentação do trabalho

Conforme supracitado, a necessidade de sistemas de controle

complexos e a grande interação existente entre os processos encontrados em

uma refinaria ou unidades petroquímicas, motiva o desenvolvimento do

presente trabalho.

Para facilidade de apresentação, este documento está dividido em

introdução, uma revisão bibliográfica cuja finalidade é apresentar as

propostas de aplicação de estratégias de controle baseados em modelos

neurais, a metodologia da análise experimental, os resultados encontrados e

as conclusões pertinentes.

A metodologia foi estabelecida de modo a simular um operação de uma

estratégia de controle baseado em modelo, representado neste trabalho por

um rede neural, em um sistema de aquecimento/resfriamento de um tanque

típicos da indústria petroquímica: um reator operando sob regime de

batelada.





14

REVISÃO BIBLIOGRÁFICA

2.1 – Introdução

Neste capítulo descreve-se uma revisão sobre redes neurais,

abrangendo conceituação, propriedades e aplicações industriais. Ainda,

sobre algoritmos de treinamento. Objetiva-se detalhar a proposta de controle

a ser trabalhada nos capítulos subseqüentes e argumentar seu pretexto.

2.2 – Redes Neurais Artificiais

O trabalho em redes neurais artificiais, usualmente denominadas

“redes neurais”, tem sido motivado desde o começo pelo reconhecimento de

que o cérebro humano processa informações de uma forma inteiramente

diferente do computador digital convencional. O cérebro é um computador

(sistema de processamento de informação) altamente complexo, não-linear e

paralelo (HAYKIN,1999). Ele tem a capacidade de organizar seus

constituintes estruturais, conhecidos como neurônios, de forma a realizar

certos processamentos (p. ex., reconhecimento de padrões, percepção e

controle motor) muito mais rapidamente que o mais rápido computador

digital hoje existente.

Um neurônio em “desenvolvimento” é sinônimo de um cérebro plástico:

a plasticidade permite que o sistema nervoso em desenvolvimento se adapte

ao meio ambiente. Assim como a plasticidade parece ser essencial para o

funcionamento dos neurônios como unidades de processamento de

informação do cérebro humano, também ela o é com relação às redes neurais

construídas com neurônios artificiais. Na sua forma mais geral uma rede





15

neural é uma máquina que é projetada para modelar a maneira como o

cérebro realiza uma tarefa particular ou função de interesse.

HAYKIN, 1999, fornece a seguinte definição de rede neural:

“Uma rede neural é um processador maciça e paralelamente distribuído

constituído de unidades de processamento simples, que têm a propensão

natural para armazenar conhecimento experimental e torná-lo disponível para

o uso.”

A Rede neural se assemelha ao cérebro em dois aspectos:

i. O conhecimento é adquirido pela rede a partir de seu ambiente

através de um processo de aprendizagem.

ii. Forças de conexão entre neurônios, conhecidas como pesos

sinápticos, são utilizados para armazenar o conhecimento adquirido.

O procedimento utilizado para realizar o processo de aprendizagem é

chamado de algoritmo de aprendizagem, cuja função é modificar os pesos

sinápticos da rede de uma forma ordenada para alcançar um objetivo de

projeto desejado. Geralmente objetiva a minimização de uma função de erro

quadrático.

A modificação dos pesos sinápticos é o método tradicional para o

projeto de redes neurais. Esta abordagem é bastante próxima da teoria dos

filtros adaptativos lineares, que já está bem estabelecida e foi aplicada com

sucesso em diversas áreas (WIDROW e STEARNS, 1985; HAYKIN,1996).

Entretanto, é possível também para uma rede neural modificar sua própria

topologia, o que é motivado pelo fato de os neurônios no cérebro humano

poderem morrer e que novas conexões sinápticas possam crescer.





16

2.2.1 - Benefícios das redes neurais

É evidente que uma rede neural extrai seu poder computacional

através, primeiro, de sua estrutura maciçamente paralelamente distribuída

e, segundo, de sua habilidade de aprender e, portanto de generalizar. A

generalização se refere ao fato de a rede neural produzir saídas adequadas

para entradas que não estavam presentes durante o treinamento

(aprendizagem). Estas duas capacidades de processamento de informação

tornam possível para as redes neurais resolver problemas complexos que são

atualmente intratáveis. Na prática, contudo, as redes neurais não podem

fornecer uma solução trabalhando individualmente. Em vez disso, elas

precisam ser integradas em uma abordagem consistente de engenharia de

sistemas. Especificamente, um problema complexo de interesse é decomposto

em um número de tarefas relativamente simples, e atribui-se a redes neurais

um subconjunto de tarefas que coincidem com as suas capacidades

inerentes.

O uso de redes neurais oferece as seguintes propriedades úteis:

1. Não-linearidade. Um neurônio artificial pode ser linear ou não-linear.

Uma rede neural, constituída por conexões de neurônios não-lineares é ela

mesma não-linear. Além disso, a não linearidade é de um tipo especial, no

sentido de ela ser distribuída por toda a rede. A não-linearidade é uma

propriedade muito importante, particularmente se o mecanismo físico

responsável pela geração do sinal de entrada for inerentemente não-linear;

2. Mapeamento de entrada-saída. Apresenta-se para a rede um exemplo

escolhido ao acaso do conjunto, e os pesos sinápticos (parâmetros livres) da

rede são modificados para minimizar a diferença entre a resposta desejada e

a resposta real da rede, produzida pelo sinal de entrada, de acordo com um

critério estatístico apropriado. O treinamento da rede é repetido para muitos





17

exemplos do conjunto até que a rede alcance um estado estável onde não

haja mais modificações significativas nos pesos sinápticos.(O treinamento e

aprendizado da rede é tratado seção 2.2.7);

3. Adaptabilidade. As redes neurais têm uma capacidade inata de adaptar

sues pesos sinápticos a modificação do meio ambiente. Em particular, uma

rede neural treinada para operar em um ambiente específico pode ser

facilmente retreinada para lidar com pequenas modificações nas condições

operativas do ambiente. Além disso, quando está operando em um ambiente

não-estacionário (i.e., onde as estatísticas mudam com o tempo), uma rede

neural pode ser projetada para modificar seus pesos sinápticos em tempo

real. A arquitetura natural de uma rede neural para classificação de padrões,

processamento de sinais e aplicações de controle, aliada à capacidade de

adaptação da rede, a torna uma ferramenta muito útil para classificação

adaptativa de padrões, processamento adaptativo de sinais e controle

adaptativo. Como regra geral, pode-se dizer que quanto mais adaptativo se

fizer um sistema, assegurando-se de que o sistema se mantenha estável,

mais robusto tenderá a ser o seu desempenho quando o sistema for exigido a

operar em um ambiente não-estacionário. Contudo, deve ser enfatizado, que

adaptabilidade nem sempre resulta em robustez; na verdade pode resultar

no contrário. Um sistema adaptativo com constantes de tempo pequenas, por

exemplo, pode se modificar rapidamente e assim tender a responder a

perturbações não legítimas, causando uma drástica degradação no

desempenho do sistema. Para aproveitar todos os benefícios da

adaptabilidade, as constantes de tempo principais do sistema devem ser

grandes o suficiente para que o sistema ignore perturbações espúrias, mas

ainda assim serem suficientemente pequenas para responder a mudanças

significativas no ambiente;





18

4. Resposta a evidências. No contexto de classificação de padrões, uma

rede neural pode ser projetada para fornecer informação não somente sobre

qual padrão particular selecionar, mas também sobre a confiança ou crença

na decisão tomada. Esta última informação pode ser utilizada para rejeitar

padrões ambíguos, caso eles estejam presentes, e com isso melhorar o

desempenho de classificação da rede;

5. Informação contextual. O conhecimento é representado pela própria

estrutura e estado de ativação de uma rede neural. Cada neurônio de rede é

potencialmente afetado pela atividade de todos os outros neurônios da rede.

Conseqüentemente, a informação contextual é tratada naturalmente pela

rede neural;

6. Tolerância a falhas. Uma rede neural, implementada na forma física

(em hardware), tem o potencial de ser inerentemente tolerante a falhas, ou

capaz de realizar computação robusta, no sentido de que seu desempenho se

degrada suavemente sob condições de operação adversas. Se um neurônio

ou suas conexões é danificado, por exemplo, a recuperação de um padrão

armazenado é prejudicada em qualidade. Contudo, devido à natureza

distribuída da informação armazenada na rede, o dano deve ser extenso para

que a resposta global da rede seja degradada seriamente. Assim, a princípio,

uma rede neural exibe uma degradação suave do desempenho em vez de

apresentar uma falha catastrófica;

7. Implementação em VLSI. A natureza maciçamente paralela de uma

rede neural a faz ser potencialmente rápida na computação de certas tarefas.

Esta mesma característica torna uma rede neural adequada para





19

implementação utilizando tecnologia de integração em escala muito ampla.

Uma virtude benéfica particular da tecnologia VLSI (very-large-scale-

integration) é que ela fornece um meio de captar comportamentos realmente

complexos de uma forma altamente hierárquica;

8. Uniformidade de análise e projeto. Basicamente, as redes neurais

desfrutam de universalidade de como processadores de informação. Dizemos

isso no sentido de que a mesma notação é utilizada em todos os domínios

envolvendo a aplicação de redes neurais. Esta característica se manifesta de

diferentes modos:

Os neurônios de uma forma ou de outra representam um ingrediente

comum a todas as redes neurais;

Esta uniformidade torna possível compartilhar teorias e algoritmos de

aprendizagem em aplicações diferentes de redes neurais;

Redes modulares podem ser construídas através de uma integração

homogênea de módulos;

9. Analogia Neurobiológica. O projeto de uma rede neural é motivado pela

analogia com o cérebro, que é uma prova viva de que o processamento

paralelo tolerante a falhas é não somente possível fisicamente, mas também

rápido e poderoso. Os neurobiólogos olham para as redes neurais (artificiais)

como uma ferramenta de pesquisa para a interpretação de fenômenos

neurobiológicos. Por outro lado, os engenheiros olham para a neurobiologia

procurando novas idéias para resolver problemas mais complexos do que

aqueles baseados em técnicas convencionais de projeto por conexões fixas.





20

2.2.2 - Cérebro Humano

O sistema nervoso pode ser visto como um sistema de três estágios,

como mostrado no diagrama em blocos na Figura 2.1. O centro do sistema é

o cérebro, representado pela rede neural (nervosa), que recebe continuamente

informação, percebe-a e toma decisões apropriadas. Dois conjuntos de setas

são mostrados na Figura 2.1. Aquelas que apontam da esquerda para a

direita indicam a transmissão para frente do sinal portador de informação no

sistema. Os receptores convertem estímulos do corpo humano ou do

ambiente externo em impulsos elétricos que transmitem informação para a

rede neural (cérebro). Os atuadores convertem impulsos elétricos gerados

pela rede neural em respostas discerníveis como saídas do sistema.

FIGURA 2.01: REPRESENTAÇÃO EM DIAGRAMA EM BLOCOS DO SISTEMA NERVOSO.

As sinapses são unidades estruturais e funcionais elementares que

medeiam as interações entre os neurônios. A maioria dos neurônios codifica

suas saídas como uma série de pulsos breves de tensão. Estes pulsos,

usualmente conhecidos como potenciais de ação ou impulsos, originam-se

no corpo celular de neurônios, e então se propagam através dos neurônios

individuais a velocidade e amplitude constantes. As razões para o uso de

Estímulo

Receptores Rede neural

Atuadores

Resposta





21

potenciais de ação para a comunicação entre neurônios se baseiam na física

dos axônios. O axônio de um neurônio é muito longo e fino e é caracterizado

por uma alta resistência elétrica e uma capacitância muito grande. Estes

dois elementos estão distribuídos ao longo do axônio. O axônio pode assim

ser modelado como uma linha de transmissão RC, daí o uso comum da

“equação de linha” como termologia para descrever a propagação do sinal ao

longo do axônio.

No cérebro há organizações anatômicas tanto em pequena escala e em

grande escala, e funções diferentes ocorrem nos níveis mais baixos e nos

mais altos. A Figura 2.02 mostra uma hierarquia de níveis entrelaçados de

organização, emergente do extenso trabalho sobre a análise de regiões

localizadas no cérebro. As sinapses representam o nível mais fundamental,

dependente de moléculas e íons para sua ação. Nos níveis seguintes, temos

os microcircuito neural se refere a um agrupamento de sinapses organizadas

em padrões de conectividade para produzir uma operação funcional de

interesse.

É importante reconhecer que os níveis estruturais de organização

descritos aqui são uma característica única do cérebro. Eles não são

encontrados em lugar algum em um computador digital, e não estamos

próximos de recriá-los com redes neurais artificiais. Apesar disso, HAYKIN,

2001, diz estarmos avançando gradualmente no caminho de uma hierarquia

de níveis computacionais similar àquela descrita na Figura 2.02. Os

neurônios artificiais que utilizamos para construir nossas redes neurais são

realmente primitivos em comparação com aqueles encontrados no cérebro.





22

FIGURA 2.02: ORGANIZAÇÃO ESTRUTURAL DOS NÍVEIS DO CÉREBRO.

Fonte: HYAKIN, 2001.

2.2.3 - Modelos de um Neurônio

Um neurônio é uma unidade de processamento de informação que é

fundamental para a operação de uma rede neural. O diagrama de blocos da

Figura 2.03 mostra o modelo de um neurônio, que forma a base para o

Sistema Nervoso Central

Circuitos Inter-regionais

Circuitos Locais

Neurônios

Árvores Dendritais

Microcircuitos Neurais

Sinapses

Moléculas





23

projeto de redes neurais (artificiais). Aqui só se identificam três elementos

básicos do modelo neuronal:

FIGURA 2.03: MODELO NÃO-LINEAR DE UM NEURÔNIO.

1. Um conjunto de sinapses ou elos de conexão, cada uma caracterizada

por um peso ou força própria.Especificamente, um sinal xj na entrada

da sinapse j conectada ao neurônio k é multiplicado pelo peso

sináptico. É importante notar a maneira como são escritos os índices

do peso sináptico wkj. O primeiro índice se refere ao neurônio em

questão e o segundo se refere ao terminal de entrada da sinapse à qual

o peso se refere. Ao contrário de uma sinapse do cérebro, o peso

sináptico de um neurônio artificial pode estar em um intervalo que

valores negativos bem como positivos.

2. Um somador para somar os sinais de entrada, ponderados pelas

respectivas sinapses do neurônio; as operações descritas aqui

constituem um combinador linear.

3. Uma função de ativação para restringir a amplitude da saída de um

neurônio. A função de ativação é também referida como função





24

restritiva já que restringe (limita) o intervalo permissível de amplitude

do sinal de saída a um valor finito (Seção 2.2.4 detalhada melhor as

funções de ativação mais utilizadas).

Tipicamente, o intervalo normalizado da amplitude da saída de um

neurônio é escrito como o intervalo unitário fechado [0,1] ou

alternativamente [-1,1].

O modelo neuronal da Figura 2.3 inclui também um bias aplicado

externamente, representado por bk. O bias bk tem o efeito de aumentar ou

diminuir a entrada líquida da função de ativação, dependendo se ele é

positivo ou negativo, respectivamente.

Em termos matemáticos, podemos descrever um neurônio k escrevendo o

seguinte par de equações temos (2.1 e 2.2):

∑=

=m

jjkjk xwu

1

(2.1)

)( kkk buy += ϕ (2.2)

onde: x1,x2,...xm são os sinais de entrada; wk1,wk2,...wkm são os pesos

sinápticos do neurônio k; uk é a saída do combinador linear devido aos sinais

de entrada; bk é o bias; φ é a função de ativação; e yk é o sinal de saída do

neurônio. O uso de bias bk tem o efeito de aplicar uma transformação afim à

saída uk do computador linear no modelo da Figura 2.3 como mostrado pela

Equação (2.3):

kkk buv += (2.3)

Em particular, dependendo se o bias bk é positivo ou negativo, a

relação entre o campo local induzido ou potencial de ativação, vk, do neurônio

k e a saída do combinador linear uk é modificada na forma ilustrada da





25

Figura 2.4. Note que como resultado desta transformação afim, o gráfico de

vk em função de uk não passa mais pela origem.

FIGURA 2.04: TRANSFORMAÇÃO AFIM PRODUZIDA PELA PRESENÇA DE UM BIAS.

Note que vk = bk em uk = 0.

O bias bk é um parâmetro externo do neurônio artificial k. Podemos

considerar a sua presença como na Equação (2.2). Equivalentemente,

podemos formular a combinação das Equações (2.1) até (2.3) como segue:

∑=

=m

jjkjk xwv

0 (2.4)

)( kk vy ϕ= (2.5)

Na Equação. (2.4) adiciona-se uma nova sinapse. A sua entrada é

escrita pela Equação (2.6), enquanto seu peso, pela Equação (2.7).

10 +=x (2.6)

kk bw =0 (2.7)





26

Podemos, portanto, reformular o modelo do neurônio k como na Figura

2.04. Nesta figura, o efeito do bias é levado em conta de duas maneiras: (1)

adicionando-se um novo sinal de entrada fixo em + 1 e (2) adicionando-se

um novo peso sináptico igual ao bias bk. Embora os modelos da Figuras 2.03

e 2.05 sejam diferentes na aparência, eles são matematicamente

equivalentes.

FIGURA 2.05: OUTRO MODELO NÃO-LINEAR DE UM NEURÔNIO.

2.2.4 - Tipos de Função de Ativação

A capacidade de processamento de um neurônio está ligada ao modo

como as informações são processadas. Um neurônio j em uma camada l

recebe um estímulo, Xl,j, e gera uma saída Yl,j. O estímulo recebido pelo

neurônio j é a reunião de todas as saídas dos neurônios na camada l-1. Esta

reunião é, normalmente, representada pela soma das saídas (Y) dos i

neurônios na camada l-1. Finalmente, o neurônio j processa o sinal Xl,j,

através da função de ativação (também denominada função de transferência)

e sua saída é enviada a todos os neurônios na camada l+1.





27

A escolha da função de ativação deve obedecer aos requisitos de

continuidade, diferenciabilidade e monotonicidade.

Algumas das funções de ativação mais utilizadas são listadas a seguir.

a) Função Sigmoidal:

)(11)(

XEXPxfY

−+== (2.8)

Cuja derivada é descrita pela equação 2.9:

( ) ( )YYxfxfdx

xdfdxdY

−=−== 1)(1)()( (2.9)

A Figura 2.06 mostra como a função sigmoidal responde a um estímulo x.

0

0.5

1

-6 -4 -2 0 2 4 6x

f(x)

-∞ +∞

FIGURA 2.06: FUNÇÃO DE TRANSFERÊNCIA SIGMÓIDE.

A função sigmoidal é limitada entre zero e um, apresentando poucas

variações quando seu valor se aproxima de um ou zero. Para evitar esta

saturação, normalmente, o intervalo de trabalho é limitado entre 0,2 e 0,8.

b). Função Tangente Hiperbólica, equação 2.10:





28

)(1)(1)tanh()(

XEXPXEXPxxf

−+−−

== (2.10)


( )2)(1)( xfdx

xdf−= (2.11)

A função tangente hiperbólica possui propriedades semelhantes a

sigmoidal, contudo seus limites são [–1,1] ao invés de [0,1].

Na Figura 2.07, a seguir, a função tangente hiperbólica é apresentada.

FIGURA 2.07: FUNÇÃO DE TRANSFERÊNCIA TANGENTE HIPERBÓLICA.

c) Função Gaussiana, representada pela equação 2.12:

)()( 2XEXPxf −= (2.12)


-1

-0.5

0

0.5

1

-3 -1 1 3

x

f(x)

-∞ +∞





29

)(2)( xxfdx

xdf−= (2.13)

A função Gaussiana é uma função de base radial limitada no intervalo

[0,1]. O valor da f(x) (Figura 2.08) diminui à medida que x se distancia, tanto

com valores positivos como negativos, a partir da origem do sistema

Cartesiano.

Podem ser formadas variações destas funções, ou novas funções,

mantendo-se as restrições necessárias para as funções de ativação, contudo

as funções listadas são as mais utilizadas, das quais a função sigmoidal é a

que possui maior número de implementações de sucesso.

FIGURA 2.08: FUNÇÃO DE TRANSFERÊNCIA GAUSSIANA.

2.2.5 - Arquitetura da Rede

Dentro das propriedades das redes neurais, um fator importantíssimo a

ser considerado é a definição de seu tamanho. O tamanho é tecnicamente

denominado arquitetura ou topologia. A arquitetura de uma rede

compreende o número de camadas de neurônios, a função de ativação

utilizada e a disposição das conexões entre os neurônios em cada camada e

0

0.5

1

-3 -1 1 3x

f(x)

-∞ +∞





30

entre as camadas. A capacidade de armazenamento de informações de uma

rede depende da arquitetura utilizada (HAYKIN, 2001):

a) Camada de Entrada: responsável apenas por receber os padrões e

transferi-los para a segunda camada, não é realizado processamento.

Os neurônios desta camada, por apenas distribuir informações, são

denominados neurônios inativos. Em uma rede neural artificial

alimentada adiante, exceto os neurônios na camada de entrada, todos

os demais são ativos.

b) Camada(s) intermediária(s): responsáveis por processar as informações

da camada anterior. Cada neurônio na segunda camada recebe as

saídas da primeira camada multiplicadas pelos pesos, procede a

somatória e em seguida o valor obtido é passado pela função de

ativação. O resultado obtido é então passado à camada seguinte.

c) Camada de Saída: na camada de saída são realizados os últimos

processamentos e os resultados finais são obtidos.

Em geral podemos identificar três classes de arquiteturas de rede de

fundamentalmente diferentes:

a) Redes Alimentadas Adiante com Camada Única

Em uma rede neural em camadas, os neurônios estão organizados na

forma de camadas. Na forma mais simples de uma rede em camadas, temos

uma camada de entrada de nós de fonte (fornecem sinais de entrada) que se

projeta sobre uma camada de saída de neurônios (nós computacional), mas

não vice-versa. Em outras palavras, esta rede é estritamente do tipo

alimentada adiante ou acíclica (em inglês, feedforward). Ela é ilustrada na

Figura 2.9 para o caso de quatro nós tanto na camada de entrada como na

de saída. Esta rede é chamada de rede de camada única, sendo que a





31

designação “camada única” se refere à camada de saída de nós

computacionais (neurônios). Não contamos a camada de entrada de nós de

fonte, porque lá não é realizada qualquer computação.

FIGURA 2.09: REDE ALIMENTADA ADIANTE OU ACÍCLICA COM UMA ÚNICA CAMADA DE

NEURÔNIO.

b) Redes Alimentadas Diretamente com Múltiplas Camadas

A segunda classe de uma rede neural alimentada adiante se distingue

pela presença de uma ou mais camadas ocultas, cujos nós computacionais

são chamados correspondentemente de neurônios ocultos ou unidades

ocultas. A função dos neurônios ocultos é intervir entre a entrada externa e a

saída da rede de maneira útil. Adicionando-se uma ou mais camadas

ocultas, torna-se a rede capaz de extrair estatísticas de ordem elevada. Em

um sentido bastante livre, a rede adquire uma perspectiva global apesar da

sua conectividade local, devido ao conjunto extra de conexões sinápticas e da

dimensão extra de interações neurais. A habilidade dos neurônios ocultos





32

extraírem estatísticas de ordem elevada é particularmente valiosa quando o

tamanho da camada de entrada

FIGURA 2.10: REDE ALIMENTADA ADIANTE OU ACÍCLICA TOTALMENTE CONECTADA COM UMA

CAMADA OCULTA E UMA CAMADA DE SAÍDA.

Os nós de fonte da camada de entrada da rede fornecem os respectivos

elementos do padrão de ativação (vetor de entrada), que constituem os sinais

de entrada aplicados aos neurônios (nós computacionais) na segunda

camada (i.e., a primeira camada oculta). Os sinais de saída da segunda

camada são utilizados como entradas para a terceira camada, e assim por

diante para o resto da rede. Tipicamente, os neurônios em cada camada da

rede têm como suas entradas apenas os sinais de saída da camada

precedente. O conjunto de sinais de saída dos neurônios da camada de saída

(final) da rede constitui a resposta global da rede para o padrão de ativação





33

fornecido pelos nós de fonte da camada de entrada (primeira). A Figura 2.10

mostra uma arquitetura de rede neural de múltiplas camadas.

c) Redes Recorrentes

Uma rede neural recorrente se distingue de uma rede neural

alimentada adiante por ter pelo menos um laço de realimentação. Uma rede

recorrente pode consistir, por exemplo, de uma única camada de neurônios

com cada neurônio alimentando seu sinal de saída de volta para as entradas

de todos os outros neurônios, como ilustrado na Figura 2.11. Na estrutura

representada nesta figura, não há laços de auto-alimentação na rede; auto-

alimentada para a sua própria entrada.

FIGURA 2.11: REDE RECORRENTE SEM LAÇOS DE AUTO-REALIMENTAÇÃO E SEM NEURÔNIOS

OCULTOS.





34

2.2.6 - Inteligência Artificial e Redes Neurais

O objetivo da inteligência artificial (IA) é o desenvolvimento de

paradigmas ou algoritmos que requeiram máquinas para realizar tarefas

cognitivas, para as quais os humanos são altamente melhores.

Um sistema de IA deve ser capaz de três coisas: (1) armazenar

conhecimento, (2) aplicar o conhecimento armazenado para resolver

problemas e (3) adquirir novo conhecimento através da experiência. Um

sistema IA tem três componentes fundamentais: representação, raciocínio e

apredizagem:

a) Representação. Provavelmente, a característica mais distintiva da IA

seja o uso difundido de uma linguagem de estruturas simbólicas para

representar tanto o conhecimento genérico sobre um domínio do

problema de interesse como o conhecimento específico sobre a solução

do problema;

b) Raciocínio. Na sua forma mais básica, raciocínio é a habilidade de

resolver problemas;

c) Aprendizagem. No modelo de aprendizagem de máquina, o ambiente

fornece alguma informação para um elemento de aprendizagem. Este

utiliza, então, esta informação para aperfeiçoar a base de

conhecimento, e finalmente o elemento de desempenho utiliza a base de

conhecimento para executar a sua tarefa.

2.2.7 - O “Aprendizado” da Rede

O aprendizado da rede caracteriza o método como os pesos (WL) são

ajustados para que um determinado grupo de entradas seja mapeado no

grupo de saídas desejado. A idéia que circunda o chamado aprendizado, para

esta classe de redes, é a idéia de associação. Por exemplo, um indivíduo





35

aquecendo um frasco com água tenta prever a temperatura em intervalos

regulares de tempo. Este mesmo indivíduo, imagina que exista uma relação

linear entre a temperatura e o tempo de aquecimento d’água, e portanto

prevê o valor futuro da temperatura a partir de um valor passado. Então o

indivíduo começa o experimento e anota dados do “Valor Previsto” e

“Temperatura Correta” nos devidos intervalos de tempo. Vamos considerar

que este indivíduo tem interesse nas temperaturas entre 10 e 100°C. Ao final

do processo o indivíduo observa os valores reais de temperatura e corrige seu

modo de pensar baseado no erro entre o valor previsto e o correto.

A correção dos pesos da rede é equivalente a corrigir “o modo de

pensar” desta. A Figura 2.12 mostra uma rede feedforward com três

camadas para realizar a tarefa à que o indivíduo mencionado se propôs.

...

Tt+Δt

L1W1

W2

Tt

L3

FIGURA 2.12: PREVISÃO DA TEMPERATURA APÓS UM INTERVALO DE TEMPO ΔT.

Para facilitar a compreensão, apenas três camadas de neurônios são

mostradas nas Figuras 2.12 e 2.13. O aumento no número de camadas não

aumenta a complexidade do algoritmo, visto que o processo de correção dos





36

pesos é idêntico para cada camada. A base para correção dos pesos é o erro

entre a saída da rede e a saída desejada (valor correto).

O método mais adotado na solução de problemas com rede neurai

artificial feedforward – FANN – em engenharia química, tanto para a

identificação/modelagem quanto para controle de processos é o algoritmo

retropropagação de erro (backpropagation), que pelo uso extensivo dá nome a

uma arquitetura própria, embora possua algumas limitações. Como

principais vantagens do método pode-se citar sua fácil implementação e

dedução, apresentando um paralelismo inerente às redes neurais, além de

produzir bons resultados em diversas aplicações. Em contrapartida, esta

metodologia tem sérios problemas de convergência por mínimos locais, é

lenta no período de treinamento e possui uma certa dificuldade em se

estabelecer o número de neurônios que cada camada intermediária de uma

FANN deve conter.

FIGURA 2.13: FLUXO DE INFORMAÇÕES PARA O AJUSTE DOS PESOS APÓS CADA PADRÃO.

Entrada, Camada L1

Pesos W1

Camada L2

Pesos W2

Camada L3

Saída

Saídadesejada

Novos Pesos

Novos Pesos

Erro

CorrigirW1

CorrigirW2





37

2.2.8 - Algoritmo de Retropropagação de Erro

As redes neurais de múltiplas camadas alimentadas adiante

(feedforward network), consistem de um conjunto de unidades sensoriais

(nós de fonte) que representam a camada de entrada, uma ou mais camadas

ocultas de nós computacionais e uma camada de saída, como supracitado na

seção 2.2.5. O sinal de entrada se propaga para frente através da rede,

camada por camada.Estas redes neurais são também chamadas de

perceptrons de múltiplas camadas (MLP, multilayer perceptron).

Os perceptrons de múltiplas camadas têm sido aplicados com sucesso

para resolver diversos problemas difíceis, através do seu treinamento de

forma supervisionada com um algoritmo muito conhecido como algoritmo de

retropropagação de erro (error backpropagation). Este algoritmo é baseado na

regra de aprendizagem por correção de erro. Como tal pode ser visto como

uma generalização de um algoritmo de filtragem adaptativa igualmente

conhecido: o onipresente algoritmo de mínimo quadrado médio (LMS) para o

caso especial de um único neurônio linear.

Basicamente, a aprendizagem por retropropagação de erro consiste de

dois passos através das diferentes camadas da rede: um passo para frente, a

propagação, e um passo para trás, a retropropagação. No passo para frente,

um padrão de atividade (vetor de entrada) é aplicado aos nós sensoriais de

rede e seu efeito se propaga através da rede, camada por camada.

Finalmente, um conjunto de saídas é produzido como a resposta real da

rede. Durante o passo de propagação, os pesos sinápticos da rede são todos

fixos. Durante o passo para trás, por outro lado, os pesos sinápticos são

todos ajustados de acordo com uma regra de correção de erro.

Especificamente, a resposta real da rede é subtraída de uma resposta

desejada (alvo) para produzir um sinal de erro. Este sinal de erro é então

propagado para trás através da rede, contra a direção das conexões





38

sinápticas – vindo daí o nome de “retropropagação de erro”. Os pesos

sinápticos são ajustados para fazer com que a resposta real de rede se mova

para mais perto da resposta desejada, em um sentido estatístico. O algoritmo

de retropropagação de erro é também referido na literatura como algoritmo

de retropropagação (backpropagation). O processo de aprendizagem realizado

como algoritmo é chamado de aprendizagem por retropropagação.

2.3 - Modelagem de Processos Químicos utilizando conhecimento prévio

de Redes Neurais

Não linearidades, tempo morto e parâmetros que variam com o tempo

são fatores que caracterizam a maioria dos processos químicos. Aliado a

essas dificuldades intrínsecas ao processo tem-se, ainda, a exigência

mercadológica de produção com menor custo e elevada qualidade. Esses

fatores têm contribuído para que as indústrias optem por estratégias de

controle preditivo e adaptativo, pois controladores clássicos a parâmetros

constantes, nestes casos, apresentam desempenho limitado.

Em grande parte dos processos industriais o uso dos procedimentos

padrões de projeto de controladores preditivos apresentam dificuldades, pois

dependem da modelagem matemática do processo que, em muitos casos, não

é simples ou apresenta problemas na incorporação de informações

disponíveis, a partir do conhecimento de especialistas. Nestes casos, técnicas

de identificação baseadas em redes neurais têm sido aplicadas.

Por causa da habilidade de aproximar funções complexas, as redes

neurais artificiais (ANNs) têm sido explorada como modelo de processos

químicos (THOMPSON, 1994). A vantagem principal de modelos de redes

neurais é que elas podem ser sintetizadas sem conhecimento detalhado do





39

processo em questão. Apenas após apresentação das informações, a rede

neural se comporta conforme especificação do processo em particular. Esta

propriedade é comum a uma grande classe de modelos de forma funcional

flexíveis, conhecidos como modelos não-paramétricos que incluem ANNs e

série de Fourier, por exemplo. Porém, a grande dificuldade da utilização de

uma ANN é a necessidade de um conjunto relativamente grande de dados de

entrada/saída do processo para seu treinamento e que nem sempre estão

disponíveis ou passíveis de obtenção.

Neste trabalho, como modelo empírico para processo de reação em

batelada, utilizou-se uma rede neural feedforward (FANN). Este tipo de rede

está entre as mais estudadas em processos de engenharia, principalmente

por ser de fácil compreensão e implementação computacional, com uma

simples definição matemática e com grande capacidade para aplicações em

identificação/modelagem e controle de processos.

Considerando especificamente a aplicação da FANN para a

modelagem/identificação empírica de sistemas, o número de neurônios da

camada de entrada da rede depende do número de variáveis relevantes para

representar o processo. O número de neurônios da camada de saída depende

do número de variáveis que se deseja avaliar, que correspondem, na maioria

das vezes, nas saídas processo que devem ser determinadas. Para o processo

que se deseja modelar, reator em batelada sob agitação constante, a função

que representa a rede pode ser descrita pela Equação 2.14:

( ) ( ) ( ) ( ) ( )[ ]2211 ,;1,1 dkUdkUkykyfky −−−=+ (2.14)

onde f é a função que considera todos os processamentos da rede. U1(k-d1) e

U2(k-d2) são, respectivamente, as entradas 1 e 2 do processo, com d1 e d2

sendo o tempo morto em relação a cada variável de entrada. y(k) e y(k-1) são,





40

respectivamente, as saídas do processo nos instantes k e k-1, de um sistema

MISO (Multiple Input / Single Output). No sistema “reator batelada” estudado,

a variável de saída de interesse é a temperatura de reação, y, sendo esta

controlada pela manipulação das aberturas das válvulas de controle de vazão

de vapor, U1, e de controle de descarte de água quente da camisa e

alimentação de água fria, U2. Ainda, o sistema está sujeito às restrições

descritas pelas Equações 2.15 e 2.16.

⎩⎨⎧

≤≤≤≤

voltsUvoltvoltsUvolt

5151

2

1 (2.15)

MáximaaTemperaturyMínimaaTemperatur ≤≤ (2.16)

Quando a abertura das válvulas for selecionada em 1 volt, significa que

esta se encontra completamente fechada e 5 volts indicam 100% de abertura

para as válvulas de controle de vazão. As restrições na temperatura

obedecem aos limites físicos do sistema. Considerando que este não é dotado

de sistema de refrigeração, a menor temperatura que se consegue é o

equilíbrio com a temperatura ambiente, sendo a maior o ponto de ebulição

da água, meio contínuo utilizado na polimerização em suspensão do

estireno.





41

2.4 – Considerações finais

Levando-se em consideração as dificuldades existentes na obtenção de

modelos que descrevam adequadamente o processo em todas as suas

possíveis faixas de operação, este trabalho apresenta aplicações de uma

rede neural. Como modelo empírico para o controle de temperatura de um

reator de mistura em regime de batelada.





42

METODOLOGIA

3.1 - Unidades Experimentais

Os experimentos foram desenvolvidos junto ao Laboratório de Controle

de Processos do Departamento de Engenharia Química e Engenharia de

Alimentos da Universidade Federal de Santa Catariana (EQA/CTC/UFSC). A

implementação de um sistema de controle de temperatura foi realizada em

um sistema piloto com um reator de aço, ilustrado na Figura 3.1.

Essa unidade de reação é constituída, basicamente, de um reator

encamisado em aço inox 316L, marca Suprilab Ltda, com capacidade de 5

litros e pressão máxima de 15 kgf/cm2, provido de um sistema de agitação

com acionamento por software, com um motor trifásico marca Eberle com

saída reduzida em 1:5, um controlador de freqüência da marca Siemens e

um agitador do tipo turbina dupla, centrada, que se estende até a base do

reator. As trocas térmicas necessárias ao reator são realizadas por um

trocador de calor a placas com correntes cruzadas, marca Alfa Laval, uma

bomba centrífuga de ¼ cv, marca Schneider, modelo 02.01, além de duas

válvulas pneumáticas do tipo igual porcentagem ar-abre/falha-fecha, da

marca Badge Meter Inc, que são responsáveis pela dosagem das correntes

quente e fria. Também faz parte do sistema um termopar do tipo J da marca

Ecil em conjunto com um amplificador/transmissor, além de um reservatório

de nitrogênio gasoso. A Figura 3.01 mostra o esquema da planta piloto

utilizada para as reações de polimerização em suspensão do estireno e

estudo/aplicação da estratégia de controle desenvolvida. Maiores detalhes

sobre o reator podem ser observados na Figura 3.02.





43

FIGURA 3.01: ESQUEMA DA UNIDADE PILOTO DE POLIMERIZAÇÃO [MAZZUCCO, 2003].

1 – Reator de aço encamisado; 2 – Trocador de calor a placas; 3 – Bomba centrífuga;

4 – Motor para agitação e controlador de freqüência

A freqüência de agitação, que pode variar de 0-700 rpm, é manipulada

remotamente por um sinal de 1-10 VDC. O controlador de freqüência requer

um sinal de 12VDC para que possa ser iniciada a manipulação remota.





44

FIGURA 3.02: DETALHES DO REATOR DE POLIMERIZAÇÃO[MAZZUCCO, 2003].

O sistema de troca térmica é iniciado pelo acionamento da bomba

centrífuga, que faz com que a pressão na camisa do reator seja de

aproximadamente 2 kgf/cm2. A válvula V2 é responsável pela circulação de

vapor no trocador de calor a placas, através do qual é gerada a corrente

quente para o aquecimento do reator. Com a válvula V1 mantida fechada,

apenas a corrente quente circula no reator, recebendo a cada passagem pelo

trocador de calor mais energia, podendo atingir, desta forma, elevadas

temperaturas em um intervalo de tempo relativamente curto. A abertura da

válvula V1 diminui a pressão na camisa do reator, bem como em toda linha

de circulação, fazendo com que a corrente fria circule nesta. Como V1 e V2





45

são válvulas proporcionais, é possível obter a temperatura ótima para a

reação.

O vapor é fornecido por uma caldeira com aquecimento elétrica, marca

SIMILI, tipo SIM-HE, com capacidade de produção de 100 Kg/h de vapor e

pressão de trabalho de 8,4 Kgf/cm2. Devido ao seu sistema de controle,

fornece vapor a uma pressão que pode variar de 3 a 7 Kgf/cm2,

caracterizando uma forte fonte de perturbação ao sistema de polimerização.

A água, para refrigeração, é proveniente da própria rede hidráulica do

laboratório, estando sempre a temperatura ambiente.

O acionamento das válvulas pneumáticas é realizado através de

conversores eletropneumáticos, marca Helix, com sinal de entrada de 4-20

mA e saída de 3-15 psi, a partir de uma alimentação contínua de 20 psi,

obtida por um filtro regulador de pressão, marca Hélix - tipo F11-11, que

suporta uma pressão de alimentação de até 250 psi.

Esta unidade possui um sistema remoto de controle de temperatura e

freqüência de agitação realizado através de microcomputador PC-Intel

Pentium III 500MHz, uma placa de aquisição de dados AD/DA marca Data

Translation modelo DT2812 e software para processamento em tempo real

desenvolvido no próprio laboratório. A Figura 3.3 mostra a tela principal do

software desenvolvido por CANCELIER (2004) para a aplicação das

estratégias de controle e aquisição de dados.

O software foi desenvolvido em linguagem Object-Pascal, utilizando-se

o ambiente integrado para desenvolvimento Borland Delphi 5.0®. Este

ambiente dispõe de ferramentas de grande utilidade para agilizar a

escrita/manutenção do código e rastreamento de erros de sintaxe e lógica,

facilitando o projeto da interface com o usuário. A codificação dos módulos

de aquisição de dados, algoritmos de controle e algoritmos de otimização foi





46

feita utilizando-se a técnica de programação orientada a objetos, desta forma

proporcionando maior compreensão do código e maior agilidade.

FIGURA 3.03 : TELA PRINCIPAL DO SOFTWARE DE AQUISIÇÃO DE DADOS E CONTROLE (MALHA

FECHADA).

3.2 - Procedimento experimental

Um fluxograma ilustrativo do procedimento experimental adotado pode

ser visto na Figura 3.4. O primeiro passo consiste em obter informações

referente ao sistema de interesse. Dois grupos de dados foram levantados:

um para treinamento da rede neural e outro para teste (validação da rede).

Os grupos de dados foram coletados em malha aberta para o sistema com o





47

reator contendo apenas água, num intervalo de amostragem de 5 s. O grupo

de dados utilizado no treinamento foi obtido efetuando-se perturbações

degrau, entre 1 e 5 volts, no sinal enviado às válvulas de controle. Estes

limites correspondem aos estados de completamente fechado e aberto da

válvula de controle.

FIGURA 3.04: FLUXOGRAMA DO PROCEDIMENTO EXPERIMENTAL.

Na Figura 3.05 e 3.06 mostra-se o grupo de dados formado pelas

perturbações aplicadas nas válvulas de controle e a temperatura do reator,

OBTENÇÃO DE DADOS REPRESENTATIVOS DO SISTEMA

– CONTROLE EM MALHA ABERTA –

TREINAMENTO DA REDE

NEURAL (OFF-LINE)

VALIDAÇÃO DA REDE

NEURAL (OFF-LINE)

APLICAÇÃO DA ESTRATÉGIA

– CONTROLE EM MALHA FECHADA –





48

respectivamente. Observa-se que as perturbações efetuadas produziram

variações na temperatura entre 35 e 100 oC, aproximadamente.

0

10

20

30

40

50

60

70

80

90

100

0 4 8 13 17 21 25 29 33 38 42 46 50 54 58 63 67 71 75 79 83 88 92

Tempo (min)

Abe

rtur

a da

vál

vula

(%)

Valve[1]Valve[2]

FIGURA 3.05: PERTURBAÇÕES APLICADAS NAS VÁLVULAS DE CONTROLE PARA O

LEVANTAMENTO DE DADOS PARA ETAPA DE TREINAMENTO.

0

20

40

60

80

100

120

0 10 20 30 40 50 60 70 80 90 100

Tempo (min)

Tem

pera

tura

(oC

)

FIGURA 3.06: RESPOSTA DA TEMPERATURA DO REATOR PARA AS PERTURBAÇÕES APLICADAS

NA FIGURA 3.05.





49

Para garantir que a rede identifique bem o sistema é importante que se

tenha perturbações aleatórias, aplicadas em toda a faixa de trabalho. Cabe

ressaltar que, como as válvulas estão desacopladas, a princípio qualquer

combinação de abertura das válvulas para as perturbações poderia ser

aplicada, entretanto como se objetiva estabelecer uma lei de controle de

modo a proporcionar economia no consumo de vapor, principalmente, os

dados para treinamento também devem ser obtidos de modo a considerar

esta premissa.

1

2

3

4

5

100 200 300 400 500 600 700 800 900 1000

Tempo (min)

Abe

rtur

a da

vál

vula

(%)

Uaq(Volts)Uresf(Volts)

25

0

50

75

100

FIGURA 3.07: PERTURBAÇÕES APLICADAS NAS VÁLVULAS DE CONTROLE PARA O

LEVANTAMENTO DE DADOS PARA ETAPA DE VALIDAÇÃO.

Para a obtenção do grupo de dados de validação da rede, o mesmo

procedimento foi seguido. Nas Figuras 3.07 e 3.08 mostram-se o grupo de

dados formado pelas perturbações aplicadas nas válvulas de controle e a

temperatura do reator, respectivamente. É possível observar, principalmente

por comparação entre as perturbações feitas, Figura 3.05 e Figura 3.07, que

o grupo de dados obtido para o teste da rede difere bastante daquele obtido





50

para o treinamento, o que confere uma boa prova para o desempenho do

modelo empírico.

0

20

40

60

80

100

120

100 200 300 400 500 600 700 800 900 1000

Tempo (min)

Tem

pera

tura

(ºC

)

FIGURA 3.08: RESPOSTA DA TEMPERATURA DO REATOR PARA AS PERTURBAÇÕES APLICADAS

NA FIGURA 3.07.

O treinamento e validação da rede foram feitos através do programa

MATLAB R12; os scripts de treinamento e validação da rede foram

desenvolvidos previamente por CLAUMANN, 1999. Utilizou-se a função de

ativação tangente hiperbólica sob um fator de aprendizagem de 0,0005, como

vemos na Figura 3.09. A Tabela 3.01 apresenta diferentes arquiteturas de

rede utilizadas.

O número de neurônios na camada escondida depende da qualidade

que se deseja para a aproximação da rede sendo, na grande maioria dos

casos, determinado de forma empírica. Este número não pode ser pequeno

demais para haver uma aproximação pobre e nem grande demais, a fim de

gerar perda da generalidade da rede, fazendo com que até os ruídos sejam

modelados.





51

FIGURA 3.09: MENU GERADO PELO PROGRAMA MATLAB PARA CONFIGURAÇÃO DA REDE

NEURAL.

TABELA 3.01: ARQUITETURA DE REDE UTILIZADA NA ETAPA DE TREINAMENTO.

Neurônios da camada

escondida

Número de épocas

6 50.000

6 100.000

8 50.000

Após concluída etapa de treinamento selecionou-se uma das três

configurações apresentadas na Tabela 1, para realização da validação da





52

rede.Partiu-se, então para a realização do controle em malha fechada da

temperatura do reator, ainda contendo apenas água sob agitação.





53

RESULTADOS E DISCUSSÕES

4.1 – Resultados do Treinamento da Rede Neural

O resultado para o treinamento da rede com o conjunto de dados

representados através da Figura 3.05 e da Figura 3.06 é demonstrado nas

Figuras 4.01, 4.02 e 4.03. Para seis neurônios na camada escondida e a

função tangente hiberbólica com função de ativação, obteve-se correlações

aproximadas para o treinamento de 50 mil épocas e 100 mil, sendo estas de

98,56 e 98,70, respectivamente, como podemos observar na Figura 4.01 e

Figura 4.02.

FIGURA 4.01: RESULTADO DO TREINAMENTO PARA 6 NEURÔNIOS NA CAMADA ESCONDIDA E

50.000 ÉPOCAS.





54

FIGURA 4.02: RESULTADO DO TREINAMENTO PARA 6 NEURÔNIOS NA CAMADA ESCONDIDA E

100.000 ÉPOCAS.

Figura 4.03: Resultado do treinamento para 8 neurônios na camada

escondida e 50.000 épocas.





55

A Figura 4.03 traz o resultado do treinamento para oito neurônios na

camada escondida e 50 mil épocas. A Correlação foi de 98,69.

Para os pesos e bias constituintes da rede treinada com seis neurônios

na camada escondida e 50 mil épocas foi realizado a validação desta, com os

dados representados na Figura 3.07 e na Figura 3.08. A correlação obtida foi

de 97,89, indicando boa aproximação entre os valores de entrada e saída da

rede.

FIGURA 4.04: RESULTADO DA VALIDAÇÃO DA REDE.

As outras configurações foram desprezadas partindo do princípio

que demandaria mais tempo para execução do treinamento com um número

maior de padrões ou neurônios na camada escondida, e não se obteria um

aumento significativo nas correlações. A topologia da rede emprega,

portanto, pode ser visualizada na Figura 4.05.





56

FIGURA 4.05: TOPOLOGIA DA REDE.

4.2 – Resultados do controle em malha fechada

Conforme metodologia, depois de treinada e validada a rede procedeu-

se à análise experimental em reator piloto contendo água sob rigorosa

agitação. O controle da temperatura em malha fechada foi realizado após

“carregar” os pesos e bias resultantes do treinamento da rede no software de

trabalho. As mesmas condições e intervalos de grandezas devem ser

Neurônio da camada de entrada Neurônio da camada de saída

Bias

e

i

s

1 Neurônio da camada intermediária (escondida)

e

e

e

e

i

i

i

i

i

i

sY(k+1)

1 1

Y(k)

Y(k+1)

U1(k-d1)

U2(k-d2)





57

obedecidos no controle em malha fechada e malha aberta, ou seja,

amostragem de 5s e valores de temperatura entre 35 e 100oC.

A Figura 4.06 ilustra o software em operação quando inicialmente

partiu-se de um setpoint de 30oC e estipula-se outro de 50oC. A temperatura

inicialmente estava em torno de 48oC, e o controlador age a fim de resfriar o

reator até 30oC, porém quando atinge temperaturas menores que 35oC a rede

se perde a capacidade de representação, pois não foi treinada para limites

inferiores a 35oC. Quando a temperatura começa a subir devido à mudança

do referencial, logo o controle se restabelece.

FIGURA 4.06: SOFWARE EM OPERAÇÃO. MUDANÇA DE SETPOINT DE 30 PARA 50OC.





58

Na Figura 4.07 está ilustrado o comportamento da temperatura

quando uma mudança de setpoint de 50 a 70 oC é aplicada ao sistema.

Nota-se um delay na reposta do controlador (círculo amarelo),atraso este

devido ao circuito elétrico de transmissão de sinal, quando procede ação logo

alcança o setpoint. O círculo vermelho representa um ruído de sinal na linha.

FIGURA 4.07: MUDANÇA DE SETPOINT DE 50 PARA 70OC.





59

A Figura 4.08 comprova o bom desempenho do controlador quando se

mantém fixo a valor de referência por um período de tempo mais longo.

Próximo à amostragem 1240, efetuou-se uma perturbação, adicionado ao

sistema cubos de gelo, resultado numa variação de aproximadamente 3oC. O

controlador rapidamente acionou as variáveis manipuladas a fim de

restabelecer o setpoint.

FIGURA 4.08: RESPOSTA DAS VARIÁVEIS CONTROLADA E MANIPULADA, MANTIDO UM SETPOINT

DE 70OC.





60

FI

FIGURA 4.09: PERTURBAÇÃO DE CARGA EM DESTAQUE.





61

CONCLUSÕES

• Neste trabalho foi avaliada uma estratégia de controle utilizando

técnicas combinadas de inteligência artificial, especificamente rede neural

artificial.

• Uma rede neural feedforward foi utilizada como modelo interno do

sistema de controle, levando a boas previsões do comportamento da

temperatura do reator. O algoritmo backpropagation foi utilizado para o

treinamento off-line da rede. A arquitetura que apresentou melhores

resultados foi de quatro neurônios na camada de entrada, seis na camada

escondida e um na camada de saída.

• Para o sistema em estudo, seis neurônios na camada escondida

mostraram-se adequados para tarefa exigida. Um número maior apenas

prolonga o tempo computacional do treinamento e não replica uma

correlação significativamente superior.

• O sistema de controle opera apenas nos limites de treinamento da rede

neural o que a torna falha durante a dinâmica do processo e interpéres. Para

tal faz-se necessário uma metodologia para a adaptação dos peso e bias da

rede durante a execução, ou seja, on-line, para melhor representação da

dinâmica do processo.

• Do ponto de vista da teoria de controle, a habilidade das redes neurais

de lidar com sistemas não lineares é, talvez, a mais significativa. A grande





62

diversidade dos sistemas não lineares é a primeira razão porque nenhuma

sistemática e teoria aplicada geral para projeto de controle não linear tenha

evoluído, ainda. Uma variedade de métodos “tradicionais” para análise e

síntese de controladores não lineares para classes específicas de sistemas

não lineares existentes: técnicas de linearização e funções descritivas, são

dois expemplos.

• Neste trabalho, portanto foi demostrado a capacidade das redes

neurais de representar um modelo não linear o qual é uma característica a

ser prontamente explorada na síntese de controladores não lineares.





63

REFERÊNCIAS BIBLIOGRÁFICAS

CANCELIER, A. Otimização e controle do processo de produção do poliestireno em suspensão, 2004. Tese (Doutorado em Engenharia de Produção) - Programa de Pós-graduação em Engenharia de Produção, Universidade Federal de Santa Catarina - UFSC. Florianópolis.

CANCELIER A, CLAUMANN. C. A., MACHADO, R .A. F, BOLZAN A. Uma Estratégia Não-Linear Para Controle De Temperatura De Um Tanque Encamisado Piloto

CLAUMANN, C. A. Modelagem dinâmica e controle de processos não lineares: Uma aplicação de algoritmos genéticos para treinamento de redes neurais recorrentes. 1999. Dissertação (Mestrado em engenharia química) - Departamento de Engenharia Química, Universidade Federal de Santa Catarina - UFSC, Florianópolis. GARCIA, C. E.; PRETT, D. M.; MORARI, M. Model predictive control: theory and practice - A Survey. Automatica, v. 25, no 3, p. 335-348, 1989.

HAYKIN, S.Redes Neurais – Princípios e Prática, 2001,2ª edição; Bookman. MAZZUCCO, M. M. Implementação de um controlador preditivo baseado em um modelo neural associado a um sistema especialista. 1996. Dissertação (Mestrado em engenharia química) - Departamento de Engenharia Química e Engenharia de Alimentos, Universidade Federal de Santa Catarina - UFSC, Florianópolis. MAZZUCCO, M. M, BARCIA R. M., Bolzan A. Rede Neural Backpropagation,

2001.

MAZZUCCO, M. M. Um sistema difuso para o controle de temperatura de unidades de processamento em batelada, 2003. 297f. Tese (Doutorado em Engenharia de Produção) - Programa de Pós-graduação em Engenharia de Produção, Universidade Federal de Santa Catarina - UFSC. Florianópolis.





64

SEBORG, D. E.; EDGAR, T. F.; MELLICHAMP, D. A. Process dynamics and control. New York: John Wiley & Sons, 1989.

THAMPSON, M. L., KRAMER M. A. Modeling Chemical Processes Using Prior Knowledge and Neural Networks. AIChE Journal, Vol. 40, No 8, 1994. VIEIRA, R. A. M.; EMBIRUÇU, M.; SAYER, C.; PINTO, J. C.; LIMA, E. L. Control strategies for complex chemical processes. Applications in polymerization processes. Computers and Chemical Engineering, v. 27, p. 1307-1327, 2003.

Documents

Controle de processos da indústria de petróleo e gás ... S... · engenharia de processos tem se beneficiado de estratégias de controle avançadas, como, por exemplo, controle