178

Click here to load reader

Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Embed Size (px)

DESCRIPTION

Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Citation preview

Page 1: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia
Page 2: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Fran Sergio LobatoValder Steffen Jr

Antonio Jose da Silva Neto

(Editores)

Tecnicas de Inteligencia Computacionalcom Aplicacoes em

Problemas Inversos de Engenharia

Modelagem Computacional, Otimizacaoe Problemas Inversos

2014

Page 3: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Copyright c©2014 Omnipax Editora LtdaCaixa Postal 16532 – 81520-980 Curitiba, PR

A editora disponibiliza por acesso livre a versao eletronica deste livro no site:http://www.omnipax.com.br, sob uma licenca Creative Commons 3.0 Atribuicao-Nao Comercial-Sem Derivados (CC BY-NC-ND 3.0 BR).

Digital Object Identifier (DOI): 10.7436/2014.tica.0

Capa:Sergio Alexandre Prokofiev

Projeto grafico e editoracao:Omnipax Editora Ltda

Ficha catalografica:Juliana Farias Motta (CRB7/5880)

Dados Internacionais de Catalogacao na Publicacao (CIP)

T255 Tecnicas de Inteligencia Computacional com Apli-cacoes em Problemas Inversos de Engenharia [livroeletronico] / Editores Fran Sergio Lobato ; ValderSteffen Jr ; Antonio Jose da Silva Neto — Curitiba,PR: Omnipax, 2014

16 Mbytes; 162 p.Inclui bibliografiaseISBN: 978-85-64619-15-9

1. Problemas inversos (Equacoes diferenciais). 2.Modelos matematicos. 3. Otimizacao matematica.4. Algoritmos. I. Lobato, Fran Sergio (ed.). II. Stef-fen Jr, Valder, ed. III. Silva Neto, Antono Jose da,ed. IV. Tıtulo.

CDD (22. ed.) 005.1

Page 4: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Dedicatória

Aos meus pais, meus irmaos e meus amigos.

Fran Sergio Lobato

Aos alunos do Programa de Pos-Graduacao em Engenharia Mecanica da UFU que, ao longode muitos anos, tem compartilhado comigo de seu talento

Valder Steffen Jr

Para os meus amores Gilsineida, Lucas e Luısa.

Antonio Jose da Silva Neto

Page 5: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

.

Page 6: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Editores

Fran Sergio Lobato: Engenheiro Quımico graduado em 2002 pelaFaculdade de Engenharia Quımica da Universidade Federal de Uber-landia, onde concluiu sua Dissertacao de Mestrado na area de Con-trole Otimo Algebrico-Diferencial, em 2004. Concluiu em 2008 suaTese de Doutorado na Faculdade de Engenharia Mecanica da Univer-sidade Federal de Uberlandia, onde trabalhou com otimizacao multi-objetivos. Atualmente e professor adjunto na Universidade Fede-ral de Uberlandia e coordenador do Nucleo de Modelagem, Simu-lacao, Controle e Otimizacao de Processos. Tem como areas deinteresse: Projeto de Sistemas de Engenharia, Teoria de ControleOtimo Algebrico-Diferencial com Indice Flutuante; Metodos de Oti-mizacao Classicos e Bio-Inspirados na Natureza; Resolucao de Equa-coes Diferenciais Parciais usando Metodos Sem Malha; Problemas In-versos e Problemas Multi-objetivos. Link para o currıculo Lattes:http://lattes.cnpq.br/7640108116459444

Valder Steffen Jr: Possui graduacao em Engenharia Mecanica pelaUniversidade Estadual de Campinas (1976), mestrado (1977) e douto-rado (1979) pela Universite de Franche Comte, na Franca. Defendeusua tese de Habilitation (HDR) nesta mesma universidade, em 1991.Realizou dois estagios em nıvel de pos-doutoramento, no INSA de Lyon(1986-87) e na Virginia Tech – USA (1999-2000). Tem experiencia naarea de Engenharia Mecanica, com enfase em Mecanica dos Solidos,atuando principalmente nos seguintes temas: otimizacao de sistemasmecanicos, dinamica de rotores, materiais inteligentes e problemas in-versos em dinamica. Foi Presidente da Associacao Brasileira de En-genharia e Ciencias Mecanicas – ABCM de 2006 a 2009. Recebeu aComenda da Ordem Nacional do Merito Cientıfico em 2002. Foi agraci-ado com o Premio Bom Exemplo 2012 – categoria Ciencia. E MembroEfetivo da Academia Nacional de Engenharia desde 2013. Atualmentee professor titular da Universidade Federal de Uberlandia e Coordena-dor do INCT de Estruturas Inteligentes em Engenharia. Link para ocurrıculo Lattes: http://lattes.cnpq.br/6838375689601075

Antonio Jose da Silva Neto: E Engenheiro Mecanico/Nuclear(UFRJ, 1983), MSc em Engenharia Nuclear (COPPE/UFRJ, 1989)e PhD em Engenharia Mecanica (North Carolina State University,1993). Trabalhou na Comissao Nacional de Energia Nuclear (1984-1986), na Promon Engenharia (1986-1997), e desde 1997 e professorno Instituto Politecnico da Universidade do Estado do Rio de Janeiro(Professor Adjunto 1997-2011, Professor Associado 2011-2012, Profes-sor Titular desde 2013). Atualmente e Presidente (2014-2015) da Soci-edade Brasileira de Matematica Aplicada e Computacional (SBMAC).Foi Presidente da Associacao Brasileira de Engenharia e Ciencias Me-canicas – ABCM (2009-2013). Atua na area de Engenharia Mecanica,com enfase em Transferencia de Calor, e em Matematica Aplicada eComputacional, com enfase em Metodos Numericos. Link para o cur-rıculo Lattes: http://lattes.cnpq.br/5148738006361781.

Page 7: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia
Page 8: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Biografia dos Colaboradores

Alberto Carlos Guimaraes Castro Diniz: e Professor de Engenharia Mecanica da Univer-sidade de Brasılia desde 1993, concluiu seu doutorado pela Ecole Centrale de Lyon em 2000 erealiza pesquisas em dinamica de estruturas, analise e sıntese modal, modelagem estocastica equantificacao de incertezas em sistemas mecanicos.

Aline Priscila da Silva: e graduada (1998) e mestre (2003) em Engenharia Quımica pela Uni-versidade Estadual de Maringa e doutora em Engenharia Quımica pelo PEQ/COPPE/UFRJ(2009). Tem experiencia na area de Engenharia Quımica, com enfase em Modelagem e Simu-lacao de Processos, Operacoes Industriais e Equipamentos para Engenharia Quımica, atuandoprincipalmente nos seguintes temas: metodos de otimizacao determinısticos e heurısticos, mi-nimizacao do consumo de energia e agua em processos industriais, analise pinch, redes detrocadores de calor, programacao matematica e projeto de equipamentos.

Alisson Rocha Machado: e Professor Doutor na Faculdade de Engenharia Mecanica da Univer-sidade Federal de Uberlandia. Area de atuacao: modelagem e otimizacao de sistemas aplicadosa usinagem convencional.

Antonio Carlos Gay Thome: e doutor em Engenharia de Computacao pela Universidadede Purdue - USA com pos-doutorado pela UFRN e Professor Associado do Departamentode Computacao da Universidade Federal do Rio de Janeiro. Suas areas de interesse incluemInteligencia Computacional, Computacao Evolutiva, e Reconhecimento de Padroes (imagens evoz).

Davi Leonardo de Souza: e graduado em Engenharia Quımica e possui Mestrado e Doutoradoem Engenharia Quımica pela Universidade Federal de Uberlandia. Atualmente e ProfessorAdjunto na Engenharia Quımica da Universidade Federal do Triangulo Mineiro. Tem interesseem monitoramento de sistemas de controle, modelagem e simulacao de processos quımicos comenfase em otimizacao multi-objetivo de problemas inversos.

Edson Hideki Koroishi: e graduado em Engenharia Mecanica pela Universidade Estadual Pau-lista Julio de Mesquita Filho (2006), possui mestrado em Engenharia Mecanica pela Universi-dade Estadual Paulista Julio de Mesquita Filho (2009) e doutorado em Engenharia Mecanicapela Universidade Federal de Uberlandia (2013). Atualmente e pesquisador do Laboratorio deMecanica de Estruturas “Prof. Jose Eduardo Tannus Reis” da Faculdade de Engenharia Meca-nica da Universidade Federal de Uberlandia. Tem experiencia na area de Engenharia Mecanica,com enfase em Mecanica dos Solidos, atuando principalmente nos seguintes temas: observadoresde estado, deteccao de falhas, dinamica de rotacao e controle de sistemas mecanicos.

Evaristo Chalbaud Biscaia Junior: possui graduacao (1969), mestrado (1972) em Engenha-ria Quımica pela Universidade Federal do Rio de Janeiro (1969) e doutorado em EngenhariaQuımica pela Universidade Federal do Rio de Janeiro (1980), em programa conjunto com aLeeds University/UK. Tem experiencia na area de Engenharia Quımica, com enfase em Mo-delagem e Simulacao de Processos, atuando principalmente nos seguintes temas: metodos nu-mericos aplicados a sistemas algebricos, equacoes diferenciais ordinarias e parciais e equacoesalgebrico-diferenciais, metodos de otimizacao determinısticos e heurısticos, sistemas dinamicosnao lineares.

Page 9: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Fabian Andres Lara-Molina: e graduado em Engenharia Mecatronica e possui mestrado edoutorado em Engenharia Mecanica pela Universidade Estadual de Campinas. Atualmente epesquisador no Laboratorio de Mecanica de Estruturas “Prof. Jose Eduardo Tannus Reis”,Faculdade de Engenharia Mecanica, Universidade Federal de Uberlandia e vinculado atravesdo programa de pos-doutorado. Tem experiencia na area de Engenharia Mecanica, com enfaseem Mecanica dos Solidos, atuando principalmente nos seguintes temas: otimizacao de sistemasmecanicos e robotica.

Gilmar Guimaraes: e Professor Doutor na Faculdade de Engenharia Mecanica da Universi-dade Federal de Uberlandia. Area de atuacao: Problemas Inversos, Metodos Experimentais eNumericos em Transferencia de Calor.

Haroldo Fraga de Campos Velho: e graduado em Engenharia Quımica (PUCRS, 1983),mestre em Engenharia Mecanica (UFRGS, 1988) e doutor em Engenharia Mecanica (UFRGS,1992). Foi cientista vistante do Instituto de Cosmo-geofısica (CNR, Turim, Italia, 1997) edo Depto. de Ciencias Atmosfericas (CSU, Fort Collins, CO, EUA, 1998). Atualmente, epesquisador titular do Instituto Nacional de Pesquisas Espaciais (INPE).

Heder S. Bernardino: e graduado em Ciencia da Computacao (2006) pela Universidade Fede-ral de Juiz de Fora (UFJF), mestre em Modelagem Computacional (2008) pela UFJF e doutorem Modelagem Computacional (2012) pelo Laboratorio Nacional de Computacao Cientıfica(LNCC/MCTI). Interessa-se por metaheurısticas, em especial para a descoberta de conheci-mento, inferencia de modelos e geracao automatica de projetos estruturais, bem como porcomputacao de alto desempenho. Atualmente e professor Adjunto do Departamento de Cienciada Computacao da UFJF.

Helio J. C. Barbosa: tem mestrado (1978) e doutorado (1986) em Engenharia Civil pelaCOPPE, Universidade Federal do Rio de Janeiro. Atualmente e Tecnologista Senior noLNCC/MCTI e Professor Associado do Departamento de Ciencia da Computacao da UFJF.Tem interesse no desenho e aplicacao de metaheurısticas em engenharia e biologia.

Kennedy Morais Fernandes: e graduado em Matematica (Universidade Vale do Rio Doce,2004), mestre em Computacao (Universidade Federal Fluminense, 2007) e doutor em Modela-gem Computacional (Universidade do Estado do Rio de Janeiro, 2010). Atualmente e ProfessorAdjunto II do Instituto de Ciencias Ambientais e Desenvolvimento Sustentavel – ICADS, Cam-pus Professor Edgard Santos da Universidade Federal do Sul da Bahia em Barreiras/BA. Atuaprincipalmente nos seguintes temas: Metodos Numericos; Inteligencia Computacional; Proble-mas Inversos; Metodos de Otimizacao Determinısticos, Estocasticos e Hıbridos; ProgramacaoLinear; Programacao Nao-Linear.

Leo Kunigk: e graduado em Engenharia Quımica pela Escola de Engenharia Maua, possuimestrado em Engenharia de Alimentos pela Escola Politecnica da Universidade de Sao Paulo edoutorado em Ciencia dos Alimentos pela Faculdade de Ciencias Farmaceuticas da Universidadede Sao Paulo. Atualmente e Coordenador do Programa de Mestrado e professor dos cursos deEngenharia Quımica e de Alimentos do Centro Universitario do Instituto Maua de Tecnologia.Tem interesse em processos de sanificacao industrial e no desenvolvimento de estrategias paraotimiza-los.

Leonardo Bacelar Lima Santos: e graduado em Fısica (UFBA, 2009), mestre em ComputacaoAplicada (INPE, 2011) e atualmente e doutorando em Computacao Aplicada pelo INPE. Eanalista da divisao de desenvolvimento do Centro Nacional de Monitoramento e Alertas deDesastres Naturais (CENADEN).

Page 10: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Leonardo Dagnino Chiwiacowsky: e graduado em Matematica Aplicada e Computacional(UFRGS, 1997), mestre em Matematica Aplicada (UFRGS, 2000) e em Engenharia Mecanica(UFRGS, 2002), e doutor em Computacao Aplicada (INPE, 2005). Atualmente e professorassistente da Universidade do Vale do Rio dos Sinos (UNISINOS), atuando nos cursos de pos-graduacao em Computacao Aplicada e Engenharia de Producao e Sistemas.

Leonardo Tavares Stutz: e graduado em Engenharia Mecanica (Universidade Federal do Riode Janeiro, 1997), mestre em Engenharia Mecanica (Instituto Alberto Luiz Coimbra de Pos-Graduacao e Pesquisa de Engenharia – COPPE, 1999) e doutor em Engenharia Mecanica (Ins-tituto Alberto Luiz Coimbra de Pos-Graduacao e Pesquisa de Engenharia – COPPE, 2005).Atualmente e professor adjunto da Universidade do Estado do Rio de Janeiro, sendo membrodo Departamento de Engenharia Mecanica e Energia e do Programa de Pos-Graduacao emModelagem Computacional do Instituto Politecnico (IPRJ), Campus Regional de Nova Fri-burgo, RJ. Atualmente atua nas seguintes linhas de pesquisa: vibroacustica e identificacao defontes sonoras; identificacao de danos estruturais e de parametros materiais a partir de ensaiosdinamicos.

Marcelo R. dos Santos: tem mestrado em Engenharia Mecanica (UFU, 2006) e atualmentee engenheiro mecanico da CODEVASF (Companhia de Desenvolvimento dos Vales do SaoFrancisco e do Parnaıba)

Marcio Bacci da Silva: e Professor Doutor na Faculdade de Engenharia Mecanica da Univer-sidade Federal de Uberlandia. Area de atuacao: modelagem e otimizacao de sistemas aplicadosa usinagem convencional.

Marco Cesar Goldbarg: e Engenheiro de Fortificacao e Construcao pelo Instituto Militar deEngenharia (1982), doutorado em Sistemas e Computacao pela COPPE/UFRJ (1990) e pos-doutorado em Ciencia da Computacao pela UFMG (1999). Atualmente e professor titular naUniversidade Federal do Rio Grande do Norte.

Marco Paulo Guimaraes: possui graduacao em Engenharia Eletrica e mestrado em Enge-nharia Mecanica, ambos pela Universidade Federal de Santa Catarina. Possui doutorado emCiencias Mecanicas pela Universidade de Brasılia. Atualmente e professor do Departamentode Engenharia de Producao da Universidade Federal de Goias. Tem experiencia nas areas deEngenharia Eletrica e Engenharia Mecanica, com enfase em: Automacao e Controle, Aquisicaode dados, Maquinas ferramenta, Usinagem de ultraprecisao e Gerenciamento de projetos.

Marcus Vinıcius Girao de Morais: e Professor de Engenharia Mecanica da Universidade deBrasılia desde 2011, concluiu seu doutorado pela Universite d’Evry val d’Essonne em 2006 erealiza pesquisas em dinamica de estruturas, acustica, interacao fluido-estrutura e problemasmulti-fısica.

Mario Olavo Magno de Carvalho: possui graduacao em Engenharia Mecanica pela Univer-sidade Federal do Rio de Janeiro, mestrado em Engenharia Nuclear pela Universidade Federaldo Rio de Janeiro e doutorado em Engenharia Mecanica pela Universidade Federal do Rio deJaneiro. Atualmente e professor adjunto da Universidade de Brasılia. Tem experiencia na areade Engenharia Mecanica, atuando principalmente nos seguintes temas: dinamica dos corposrıgidos, energia, vibracoes, dinamica, transferencia de calor e metodos estocasticos.

Page 11: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Mauro Antonio da Silva Sa Ravagnani: e graduado em Engenharia Quımica pela Univer-sidade Estadual de Maringa (1986), mestre (1989) e doutor (1994) em Engenharia Quımicapela Universidade Estadual de Campinas. Entre 2005 e 2007 realizou pos-doutorado na Uni-versidade de Alicante - Espanha. Tem experiencia na area de Engenharia Quımica, com enfaseem Operacoes Industriais e Equipamentos para Engenharia Quımica, atuando principalmentenos seguintes temas: otimizacao, minimizacao do consumo de energia e agua em processos in-dustriais, analise pinch, redes de trocadores de calor, programacao matematica e projeto deequipamentos.

Paulo Roberto Bergamaschi: possui graduacao em Licenciatura em Matematica pela Univer-sidade Estadual Paulista Julio de Mesquita Filho IBILCE, Sao Jose do Rio Preto-SP (1990),mestrado em Matematica pela Universidade de Brasılia (1994) e doutorado em Engenharia Me-canica pela Universidade Federal de Uberlandia (2004). Atualmente e Professor Associado daUniversidade Federal de Goias e Coordenador do Curso de Licenciatura em Matematica do De-partamento de Matematica do Campus Catalao/UFG. Tem experiencia na area de Matematicae Engenharia Mecanica, atuando principalmente nos seguintes temas: espaco de trabalho derobos manipuladores seriais 3R (com tres juntas de revolucao), envoltoria, otimizacao e metodosevolutivos.

Roberto Aizik Tenenbaum: e graduado em Engenharia Mecanica (Universidade Federal doRio de Janeiro, 1972), mestre em Engenharia Mecanica (Universidade Federal do Rio de Ja-neiro, 1975) e doutor em Engenharia Mecanica (Universidade Federal do Rio de Janeiro, 1987).Atualmente e docente e pesquisador do Laboratorio de Instrumentacao em Dinamica Acusticae Vibracoes – LIDAV e membro permanente do Programa de Pos-Graduacao em ModelagemComputacional do Instituto Politecnico, Campus da UERJ de Nova Friburgo. Suas principaislinhas de pesquisa atuais sao: vibroacustica e identificacao de fontes sonoras; realidade virtualacustica e modelagem de funcoes de transferencia relativas a cabeca humana; aurilizacao desalas; simulacao numerica de acustica de salas; qualidade acustica de salas de aula; avaliacaoacustica de salas de concerto; identificacao de dano estrutural a partir de ensaios de vibracoese de propagacao de ondas; e problemas inversos em dinamica, acustica e vibracoes.

Romes Antonio Borges: possui graduacao em Matematica pela Universidade Federal de Goias,Especializacao em Matematica trabalhando com Metodos de Perturbacao pela mesma universi-dade, Mestrado e Doutorado em Engenharia Mecanica pela Universidade Federal de Uberlandia.Atualmente e Professor Adjunto da Universidade Federal de Goias, Campus Catalao, no De-partamento de Matematica/Matematica Industrial. Tem experiencia na area de EngenhariaMecanica, com enfase em dinamica dos solidos e vibracoes, atuando principalmente nos seguin-tes temas: atenuacao de vibracoes, dinamica nao-linear, tecnicas inteligentes de otimizacao,otimizacao robusta.

Rubens Gedraite: e graduado em Engenharia Quımica pela Faculdade de Engenharia Industriale possui mestrado e doutorado em Engenharia Eletrica pela Escola Politecnica da Universidadede Sao Paulo. Atualmente e Professor Adjunto da Faculdade de Engenharia Quımica da Uni-versidade Federal de Uberlandia. Tem interesse no desenvolvimento de aplicacoes envolvendo aarea de automacao industrial, com foco em metodos de simulacao e otimizacao, especialmenteem problemas inversos.

Sandro M. M. de Lima e Silva: e Professor Doutor no Instituto de Engenharia Mecanica daUniversidade Federal de Itajuba. Area de atuacao: problemas inversos, metodos experimentaise numericos em transferencia de calor.

Solidonio R. de Carvalho: e Professor Doutor na Faculdade de Engenharia Mecanica da Uni-versidade Federal de Uberlandia. Area de atuacao: problemas inversos, metodos experimentaise numericos em transferencia de calor e sistema termicos.

Page 12: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Prefácio

Desde as primeiras aplicacoes dos tradicionais Algoritmos Geneticos, as tecnicas de inteligenciacomputacional tem atraıdo a atencao da comunidade cientıfica devido ao grande numero de apli-cacoes em areas distintas da ciencia e da engenharia. Nas ultimas decadas, inumeras tecnicas deinteligencia computacional foram desenvolvidas e podem ser encontradas na literatura. Basicamente,estas tecnicas se diferenciam pelo tipo de fenomeno empregado em seu desenvolvimento, podendo,em linhas gerais, fundamentar-se em um processo fısico, quımico, biologico ou, alternativamente, serpuramente estrutural.

Dentre as principais aplicacoes envolvendo as tecnicas de inteligencia computacional destaca-seo seu uso no projeto de sistemas de engenharia e em problemas inversos. Isto se deve, dentre ou-tros aspectos, ao desenvolvimento de recursos computacionais avancados, e facilidade de acesso aosmesmos, permitindo desta forma o tratamento de problemas reais de engenharia. Diante do que foiexposto, o principal objetivo deste livro e o de reunir trabalhos de pesquisa, revisao de literaturae estudos de casos multidisciplinares para o projeto de sistemas de engenharia, englobando tantoproblemas diretos como problemas inversos. Assim sendo, essa coletanea de trabalhos pretende darsuporte cientıfico para a resolucao de varios problemas de engenharia, bem como explorar direcoesfuturas de pesquisa na area, alem de difundir diversas tecnicas de inteligencia computacional.

Neste contexto, este livro foi dividido em duas amplas classes, a saber: a primeira trata de proble-mas inversos e a, segunda, dedica-se a modelagem e sıntese automatizada de sistemas de engenharia(problemas diretos), de modo a contemplar linhas de pesquisa de grande relevancia nos dias atuais.

A primeira classe de estudos de caso consiste em determinar causas desconhecidas a partir deefeitos observados atraves da formulacao de um problema inverso. Neste contexto, o Capıtulo 1 tratada identificacao de danos estruturais atraves de um Algoritmo Genetico associado a abordagem vari-acional atraves da formulacao de um problema inverso. Ja no Capıtulo 2 e apresentada a modelagemsimplificada do processo de transferencia de calor em alimentos utilizando o Algoritmo de EvolucaoDiferencial a partir da utilizacao de dados reais. O Capıtulo 3 descreve o estudo dos campos termicosdesenvolvidos durante a usinagem por torneamento atraves da formulacao e resolucao de problemasinversos. Em seguida, e apresentado no Capıtulo 4 um estudo sobre programacao imunologica gra-matical para fins de identificacao de modelos sujeitos a sistemas de equacoes diferenciais ordinarias.No Capıtulo 5 e descrita a formulacao e a resolucao do problema de identificacao de danos em barrasa partir de uma abordagem de propagacao de ondas acusticas. Ja o Capıtulo 6 trata do problemade identificacao de propriedades de absorcao de amostras de material submetidas a ondas de pressaoacustica unidimensionais em tubos de Kundt a partir de uma abordagem Bayesiana. O Capıtulo7 tem por objetivo identificar os coeficientes de um controlador nao linear polinomial de modo aminimizar a quantidade de energia total de um sistema vibrante. Ja o ultimo capıtulo desta secaotrata da resolucao de problemas inversos de conducao de calor usando o Metodo dos Elementos deContorno e o Algoritmo denominado Colonia de Vagalumes.

Ja a segunda secao deste livro trata da modelagem e sıntese automatizada de sistemas de en-genharia. O Capıtulo 9 tem por objetivo apresentar uma metodologia para a sıntese de redes detrocadores de calor. Na sequencia, o Capıtulo 10 apresenta uma metodologia para o projeto desistemas roboticos utilizando Tecnicas de Otimizacao Heurısticas. O Capıtulo 11 propoe uma me-todologia para a analise de incertezas nos parametros da resposta dinamica de estruturas atravesdo mapeamento dos parametros fuzzy usando otimizacao de cortes-α. Finalmente, o Capıtulo 12

Page 13: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

e dedicado a avaliacao do emprego de sistemas multi-classificadores aplicados a area do reconheci-mento de padroes utilizando Algoritmos Geneticos e Transgeneticos. Este livro tem por meta atingirum publico tecnico-cientıfico, abrangendo alunos de graduacao e pos-graduacao, bem como pesqui-sadores de areas de engenharia, matematica, computacao e modelagem computacional, que tenhaminteresse na utilizacao de metodos estocasticos para a formulacao e solucao de problemas diretos einversos em sistemas de engenharia.

Finalmente os editores agradecem aos autores e a editora Omnipax, que viabilizaram a realizacaodesta obra.

Fran Sergio Lobato,Valder Steffen Jr eAntonio Jose da Silva Neto

Page 14: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Sumário

1 Algoritmo Genetico e Metodo Variacional na Identificacao de Danos Estruturais:Metodo Hıbrido e Abordagem Hierarquica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1Leonardo Bacelar Lima Santos, Leonardo Dagnino Chiwiacowsky e

Haroldo Fraga de Campos Velho

2 Modelagem Matematica Simplificada do Processo de Transferencia de Calor emAlimentos usando o Algoritmo de Evolucao Diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11Rubens Gedraite, Davi Leonardo de Souza e Leo Kunigk

3 Problemas Inversos em Transferencia de Calor com Aplicacao em Processo deUsinagem por Torneamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23Marcelo R. dos Santos, Alisson Rocha Machado, Gilmar Guimaraes,

Marcio Bacci da Silva, Sandro M. M. de Lima e Silva e Solidonio R. de Carvalho

4 Inferencia de Modelos Utilizando a Programacao Imunologica Gramatical . . . . . . . . . . . . . . . 37Heder S. Bernardino e Helio J. C. Barbosa

5 Problema Inverso em Propagacao de Ondas em Solidos com Aplicacao deMetodo Hıbrido de Otimizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51Kennedy Morais Fernandes, Roberto Aizik Tenenbaum e Leonardo Tavares Stutz

6 Estimativa Bayesiana de Propriedades Acusticas em Tubos de Kundt . . . . . . . . . . . . . . . . . . . 67Mario Olavo Magno de Carvalho, Marcus Vinıcius Girao de Morais e

Alberto Carlos Guimaraes Castro Diniz

7 Solucao de um Problema Inverso Aplicado ao Controle de Vibracoes . . . . . . . . . . . . . . . . . . . . 81Romes Antonio Borges, Marco Paulo Guimaraes e Mario Olavo Magno de Carvalho

8 Resolucao de Problemas Inversos de Conducao de Calor Usando oMetodo dos Elementos de Contorno e o Algoritmo de Colonia de Vagalumes . . . . . . . . . . . . 93Fran Sergio Lobato, Valder Steffen Jr e Antonio J. Silva Neto

9 Metodo do Enxame de Partıculas Aplicado a Sıntese deRedes de Trocadores de Calor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107Aline Priscila da Silva, Evaristo Chalbaud Biscaia Junior e

Mauro Antonio da Silva Sa Ravagnani

Page 15: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

10 Projeto de Robos Manipuladores 3R Ortogonais UsandoTecnicas de Otimizacao Heurısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121Paulo Roberto Bergamaschi e Romes Antonio Borges

11 Analise Estrutural Considerando Incertezas Parametricas Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . 133Fabian Andres Lara-Molina, Edson Hideki Koroishi e Valder Steffen Jr

12 Construcao de Sistemas Multi-Classificadores para Reconhecimento de Padroes . . . . . . . . . 145Antonio Carlos Gay Thome e Marco Cesar Goldbarg

Page 16: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Capítulo 1

Algoritmo Genético e Método Variacional naIdentificação de Danos Estruturais:

Método Híbrido e Abordagem Hierárquica

Leonardo Bacelar Lima Santos∗, Leonardo Dagnino Chiwiacowskye Haroldo Fraga de Campos Velho

Resumo: A estrategia de deteccao de danos estruturais, que emprega a analise da resposta vibratoria(global) do sistema para detectar o dano (local), e conhecida como monitoramento da saude estrutural poravaliacao nao-destrutiva. Esta estrategia pode ser representada por uma abordagem de resolucao de umproblema inverso em vibracoes mecanicas. O presente capıtulo apresenta a formulacao e a aplicacao deum metodo hıbrido para estimacao de danos, correspondente ao uso de um algoritmo genetico epidemicoem conjunto com a formulacao variacional, resolvida pelo metodo do gradiente conjugado. O algoritmogenetico e empregado para fornecer uma estimativa inicial dos danos, utilizada como ponto inicial da buscaefetuada pelo gradiente conjugado. E apresentada uma abordagem hierarquica para o metodo hıbrido,atraves da qual foi verificada uma maior eficiencia na deteccao e identificacao de danos estruturais.

Palavras-chave: Danos estruturais, Algoritmo genetico, Metodo variacional, Abordagem hierarquica.

Abstract: The strategy of structural damage identification, using the analysis of the vibration systemresponse (global) for detecting a damage (local), is referred as structural health monitoring by non-destructive evaluation. The strategy can be expressed as an inverse problem on mechanical vibrations.This chapter presents the formulation and the application of a hybrid method for damage estimation,corresponding to the use of an epidemic genetic algorithm coupled with a variational formulation, solvedby the conjugate gradient method. A hierarchical approach for the hybrid method is presented. Higherefficiency is observed in the detection and identification of structural damages.

Keywords: Structural damage, Epidemic genetic algorithm, Variational method, Hierarchical approach.

Conteúdo

1 Introducao ................................................................................................................................ 22 Revisao da literatura................................................................................................................ 33 Metodologia de Identificacao de Danos .................................................................................... 3

3.1 Etapas do Algoritmo Genetico Epidemico ....................................................................... 43.2 Etapas do Metodo Variacional......................................................................................... 43.3 Busca hierarquica............................................................................................................. 5

4 Resultados ................................................................................................................................ 65 Conclusoes................................................................................................................................ 8

∗Autor para contato: [email protected]

Lobato et al. (Ed.), (2014) DOI: 10.7436/2014.tica.01 ISBN 978-85-64619-15-9

Page 17: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

2 Santos et al.

1. Introdução

Atualmente, somos cada vez mais dependentes de meios de transporte e da infraestrutura quepossibilita o seu funcionamento de forma adequada e segura. Independente da modalidade detransporte (terrestre, aereo ou marıtimo), da sua aplicacao (civil ou militar), ou ainda do seuambiente de uso (terrestre ou espacial), a avaliacao da integridade estrutural dos equipamentosempregados e uma questao estrategica de consideravel relevancia, por razoes materias, financeiras,e principalmente por questoes de seguranca das pessoas que utilizam este recurso.

De acordo com James (1997), ha nos EUA cerca de 10 mil pontes de estradas de ferro com idadesem torno de 100 anos. Tambem existem, aproximadamente, 500 mil pontes de estradas de rodagem,40% das quais apresentando deficiencias estruturais, sendo verificadas cerca de 150 a 200 quedas depontes por ano. Segundo Carrilo (2007), alguns governos, como o dos EUA, chegam a gastar cercade 10 bilhoes de dolares anualmente com reparos de pontes obsoletas, verba utilizada na inspecaovisual e aplicacao de metodos locais de avaliacao de danos. O uso cada vez mais intenso dos meios detransporte, tem reduzido drasticamente a vida util de pontes e demais infraestruturas essenciais parao transporte adequado de cargas e passageiros. De 1990 a 2006, segundo o Departamento de Estradasde Rodagem (DER1), a frota brasileira mais que dobrou, totalizando 15.187.281 automoveis. Estaacentuada evolucao da frota terrestre pode afetar a saude estrutural de pontes e viadutos. Segundoa Agencia Nacional de Aviacao Civil (ANAC2) a quantidade de avioes passou de 14.790 em 1996,para 18.708 em 2009, assim como a frota de helicopteros, que passou de 496 unidades para 1194, nomesmo perıodo. O uso intenso de diferentes estruturas de transporte e dos proprios veıculos, exigeum controle e monitoramento constante da sua saude estrutural.

As propriedades mecanicas de uma estrutura podem sofrer mudancas com o passar do tempo,seja por efeitos de uso ou intemperismo. Tais alteracoes, chamadas de danos, podem comprometera saude estrutural do sistema. No problema de identificacao de danos, assume-se que mudancasnas propriedades mecanicas da estrutura geram alteracoes na resposta vibratoria do sistema. Aestrategia de monitoramento e deteccao de dano que tem como base a analise da resposta vibratoria(global) do sistema para detectar dano (local) e referida como monitoramento da saude estrutural(structural health monitoring) por avaliacao nao-destrutiva (non-destructive evaluation). Destaforma, atraves do conhecimento do comportamento vibratorio da estrutura (efeitos) e possıvelidentificar as caracterısticas mecanicas do sistema que geraram esta resposta (causas). Esta estrategiapode ser representada por uma abordagem de resolucao de um problema inverso em vibracoesmecanicas (Inman, 1994; McConnell, 1995).

Entre as caracterısticas estruturais que podem ser estimadas atraves do emprego de uma tecnicade solucao de problemas inversos, o valor de rigidez estimado pode ser utilizado na comparacao com ovalor de rigidez indicado no projeto da estrutura (configuracao ıntegra, dado de projeto), permitindodeterminar a presenca de dano estrutural no sistema em avaliacao. Na literatura, sao encontradosalguns trabalhos que apresentam uma ampla revisao dos diferentes metodos utilizados neste tipode problema (Liu & Han, 2003; Auweraer & Peeters, 2001; Salawu, 1997; Cawley & Adams, 1979;Adams et al., 1978; Chen et al., 1995; Chinchalkar, 2001).

O problema direto em vibracoes mecanicas e caracterizado pelo conhecimento das propriedadesmecanicas da estrutura (massa, coeficiente de amortecimento e rigidez), e condicoes complementares(condicoes iniciais e de contorno), tendo como respostas observaveis dados de deslocamento,velocidade e aceleracao, ou de frequencia natural e modos de vibracao. Portanto, um problemainverso se apresenta quando e possıvel a obtencao de dados de observacao, seja no domınido dotempo (aceleracao ou deslocamento) ou no domınio da frequencia (frequencias naturais e modos devibracao), recolhidos via sensores de precisao e area de cobertura conhecidas, alem do conhecimentodas condicoes complementares (experimento controlado), e deseja-se estimar valores das propriedadesmecanicas do sistema vibratorio, por exemplo, o valor dos coeficientes de rigidez global do sistema.

Problemas inversos podem ser formulados, por exemplo, como um problema de otimizacao comrestricoes, minimizando a diferenca entre os valores experimentais medidos e os estimados via modelomatematico. O problema de otimizacao aqui apresentado e resolvido por um metodo hıbrido (MH),construıdo com o emprego de um metodo estocastico de busca global (Algoritmo Genetico (AG),Holland (1992); Goldberg (1989); Mitchell (1996)) para fornecer uma solucao inicial para o metododeterminıstico de convergencia a tempo finito (Metodo do Gradiente Conjugado (MGC), Hoffman(2001); Chiwiacowsky (2005)). O emprego deste metodo hıbrido tem como objetivo a deteccao e aidentificacao da intensidade de danos estruturais.

1 http://www.der.sp.gov.br2 http://www.anac.gov.br

Page 18: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

AG e método variacional na identificação de danos estruturais 3

O metodo hıbrido, entretanto, nao e suficiente a per se para garantir uma solucaocomputacionalmente eficiente para o problema. Em sistemas modelados com um numero muitoelevado de graus de liberdade, e importante o emprego de uma tecnica capaz de reduzir acomplexidade do problema. Esta foi a motivacao para desenvolver uma estrategia capaz de melhorar,de forma significativa, o desempenho na deteccao e na identificacao da intensidade de danos emestruturas. A abordagem hierarquica inicia empregando uma discretizacao grosseira do sistema emestudo, promovendo o detalhamento gradual, somente em regioes da estrutura onde a possibilidadede dano ainda nao foi descartada (Santos et al. (2011b)). O emprego da estrategia hierarquica buscaum ganho de desempenho para o metodo hıbrido, reduzindo o custo da identificacao de danos emestruturas complexas, modeladas com um alto numero de graus da liberdade.

A metodologia de estimacao de dano estrutural aqui apresentada fornece um mapa das possıveisregioes com dano e suas intensidades, sendo material para apoio a decisao dos gestores de manutencaodas estruturas, que poderao optar por reforcos estruturais ou ate pelo descarte da estrutura.

2. Revisão da literatura

Na literatura, sao encontrados alguns trabalhos que apresentam uma ampla revisao dos diferentesmetodos utilizados neste tipo de problema, destacando-se os trabalhos de Doebling et al. (1996) eSohn et al. (2003), que apresentam o estado da arte para os perıodos ate 1996 e de 1996 a 2000,respectivamente.

Huang (2001) apresentou o primeiro trabalho na area de estimacao de dano utilizando aabordagem variacional. Foi apresentado o caso simples de um sistema massa-mola com um graude liberdade, e em 2002 um segundo trabalho apresentou a formulacao e aplicacao do metodo paraestruturas massa-mola com multiplos graus de liberdade, sendo apresentados resultados para umcaso com apenas dois graus de liberdade (Huang (2002)). Chiwiacowsky et al. (2003) verificaramque a metodologia falhava para estruturas com um numero de GDL levemente superior aquelasexaminadas por Huang (Huang (2001, 2002)).

O metodo variacional (Alifanov (1974); Alifanov & Mikhailov (1978)), originalmente aplicado aarea termica, na qual o modelo matematico associado e representado por uma equacao diferencialparabolica, parece nao produzir solucoes inversas satisfatorias em problemas hiperbolicos, ouproblemas proto-hiberbolicos. Em problemas modelados com equacoes hiperbolicas, imprecisoesnas condicoes iniciais nao sao amortecidas ao longo do tempo, diferentemente do que ocorre emproblemas parabolicos, como a conducao do calor (Campos-Velho (2008); Santos et al. (2013)). Paratornar a tecnica variacional aplicavel a classe de problemas de identificao de danos, foi proposto emChiwiacowsky (2005) associar esta tenica com o algoritmo genetico epidemico (Medeiros (2002)) –AGE, para fornecer uma estimativa inicial de boa qualidade para o metodo do gradiente conjugado(Hoffman (2001)). A abordagem foi chamada de metodo hıbrido.

O metodo hıbrido, que foi pela primeira vez apresentado em Chiwiacowsky et al. (2003), foiutilizado em problemas de danos estruturais contınuos e discretos (Chiwiacowsky et al. (2006);Gasbarri et al. (2007)) e em um problema de identificacao de danos em estruturas espaciais, como aEstacao Espacial Internacional (ISS: International Space Station) (Chiwiacowsky et al. (2008)). Ometodo foi aplicado tambem ao problema de projeto otimo (optimal design) de estruturas (Gasbarriet al. (2009)), e teve analisada sua eficacia em funcao da quantidade e da intensidade dos danos(Santos et al. (2011a)).

3. Metodologia de Identificação de Danos

A metodologia empregada para a deteccao e identificacao da intensidade de danos e definida comouma sequencia de passos, detalhados a seguir:

Passo 1: E realizada a definicao das caracterısticas fısicas e estruturais do sistema vibratorioa ser avaliada a integridade. Nesta etapa, e determinado ou identificado um conjunto deinformacoes relevantes sobre a estrutura em estudo, como geometria, dimensoes, tipo dematerial, sua densidade, matriz de rigidez, elementos estruturais e area da secao transversal,entre outras caracterısticas fısicas. Com base nestas informacoes, e construıdo um modeloda estrutura, com o emprego de uma discretizacao por elementos finitos, por exemplo,correspondendo ao modelo (direto) a ser resolvido.

Passo 2: Uma vez identificadas as caracterısticas da estrutura, sao gerados dados experimentaisreferentes a sua resposta vibratoria a uma determinada solicitacao. Estes dados podem serobtidos de duas formas: (i) observacionais: atraves da realizacao de um experimento real

Page 19: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

4 Santos et al.

controlado para coleta de informacao referente ao comportamento vibratorio da estrutura emdiferentes domınios (aceleracoes ou frequencias naturais de vibracao); ou (ii) sinteticos: atravesda simulacao numerica dos dados experimentais, assumindo a presenca de danos de diferentesintensidades em diferentes localizacoes, empregando-se o modelo matematico citado no Passo 1.Assume-se que a presenca de danos e registrada pela alteracao na matriz de rigidez, em relacaoa matriz de rigidez da estrutura ıntegra. O problema direto e resolvido, seja no domınio dotempo, seja no domınio da frequencia. Os dados gerados sao entao contaminados com ruıdos,com o objetivo de emular dados experimentais reais, que estao sujeitos a erros de medida emfuncao da imprecisao dos sensores, efeitos de filtragem digital e truncamento do espectro modal(Castello et al. (2002)). Para o caso de dados sinteticos, as informacoes relativas a localizacaoe a intensidade dos danos sao armazenadas de forma independente da ferramenta de deteccaode danos.

Passo 3: Segue-se com a busca hierarquica pelo dano. Primeiramente, a estrutura erepresentada por uma discretizacao bem mais grosseira, isto e, a estrutura e modelada atravesdo emprego de um numero muito menor de graus de liberdade. Com base no conhecimentosobre as configuracoes fısicas e geometricas da estrutura, o problema direto e resolvido, sendocalculada a resposta vibratoria da estrutura correspondente, que e atualizada a cada nıvelhierarquico (sub-estrutura), gerando uma nova discretizacao, com refinamento apenas na sub-estrutura identificada com um potencial dano. A comparacao, para cada nıvel de discretizacao,entre a resposta vibratoria experimental e aquela obtida atraves da resolucao do problemadireto, com base na matriz de rigidez determinada pelo metodo de estimacao, permite inferira presenca de dano. Em cada sub-estrutura na qual dano e identificado, e promovida umadiscretizacao mais fina e o novo modelo da estrutura e submetido a uma avaliacao, ate que sejaobtida a localizacao e a quantificacao da intensidade do dano na sub-estrutura.

Passo 3.1: O AG epidemico (AGE) e empregado para iniciar a resolucao do problemade otimizacao associado, atraves da minimizacao da diferenca entre a resposta vibratoriaexperimental e a estimada. O AGE e uma metaheurıstica estocastica de busca global, comcapacidade de escapar de otimos locais. O processo iterativo e interrompido a um dadoinstante, com base em algum criterio de parada, como por exemplo um numero pre-fixadode iteracoes.

Passo 3.2: O metodo do gradiente conjugado (MGC) utiliza a solucao parcial encontradapelo AG como condicao inicial para sua busca, sendo caracterizada por uma busca localdeterminıstica, que resolve a formulacao variacional. A solucao final do MGC e a solucaofinal do problema de estimacao.

O AGE e o MGC sao discutidos com mais detalhes a seguir.

3.1 Etapas do Algoritmo Genético Epidêmico

O AG utilizado foi implementado com emprego da codificacao de numeros reais para a representacaoda solucao, com emprego dos operadores geneticos padrao, alem do operador epidemico. Foi utilizadaselecao torneio, cruzamento geometrico e mutacao uniforme. O operador epidemico foi adicionadoao algoritmo original, sendo acionado a cada 5 iteracoes sem atualizacao da melhor matriz de rigidezestimada.

Em todos os casos executados, o algoritmo genetico aplicado teve os parametros ajustaveis fixadoscom os seguintes valores: maximo de 50000 geracoes, populacao de 75 indivıduos, probabilidade demutacao de 25% e selecao elitista em 75% dos torneios.

3.2 Etapas do Método Variacional

O metodo do gradiente conjugado utilizado e brevemente descrito a seguir em nove passos. Umadescricao detalhada de cada um destes passos pode ser encontrada em Chiwiacowsky (2005):

Passo 1: Escolher uma aproximacao inicial para a matriz de rigidez, K. Tal escolha pode serfeita, por exemplo, tomando-se a matriz de rigidez da estrutura sem dano (dado de projeto).

Passo 2: Resolver o problema direto (em qualquer domınio, por exemplo no domınio dafrequencia), que e uma das restricoes do problema de otimizacao, isto e, qualquer solucao

Page 20: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

AG e método variacional na identificação de danos estruturais 5

candidata deve satisfazer o modelo direto. Por exemplo, no domınio da frequencia o modelodireto e expresso por:

(K− λi M)φi = 0 , para i = 1, . . . , N ,

sendo M a massa do sistema. O objetivo e calcular as frequencias Λ (espectro de autovalores)e os autovetores (Φ) associados.

Passo 3: Conhecendo os autovalores calculados λMod e os autovalores medidos λExp, determinara funcao custo definida pela norma euclidiana da diferenca entre a solucao estimada e aproveniente do dado experimental. Tais solucoes sao funcoes do parametro a ser estimado, nocaso, da matriz de rigidez. Nesta etapa, os multiplicadores de Lagrange (ψ) sao computados,representando a solucao do problema adjunto:

ψ = 2 Φ[λMod − λExp

].

Passo 4: Conhecendo ψ, calcular o gradiente do funcional de avaliacao atraves de:

∇Jj(K) = φT4Kj ψ , para j = 1, . . . , Ne . (1)

Passo 5: Calcular o coeficiente conjugado γ:

γ =

∥∥∥∇Jk+1∥∥∥22∥∥∥∇Jk

∥∥∥22

.

Passo 6: Calcular a direcao descendente p:

p0 = −∇J(K0) ,

pk+1 = −∇J(Kk+1) + γ pk .

Passo 7: Resolver o problema de sensibilidade e obter o comprimento descendente β, queminimiza a seguinte funcao escalar:

φ(r) = J(Kk + r pk) para k = 0, 1, . . .

Passo 8: Calcular a correcao para K:

Kk+1 = Kk + βk pk , para k = 0, 1, . . .

Passo 9: Encerrar o ciclo iterativo quando o criterio de parada (Morozov & Stessin (1993)) forsatisfeito:

J (K) < ε2 .

Caso contrario, voltar ao Passo 2. O valor ε esta vinculado ao nıvel de ruıdo presente nosdados. Em todas as simulacoes aqui efetuadas usou-se 1% como nıvel de ruıdo (gaussianomultiplicativo) no dado sintetico.

3.3 Busca hierárquica

O metodo hıbrido, uso do AGE para inicializar o MGC, permitiu identificar danos com o uso datecnica variacional. Todavia, em casos de sistemas modelados por muitos graus de liberdade, ometodo hıbrido pode tornar-se computacionalmente custoso. Uma possıvel solucao para tal questao enao usar uma discretizacao que prove muitos graus de liberdade, mas uma sequencia de discretizacoesmais grosseiras (com emprego de uma menor quantidade de elementos finitos, consequentemente umnumero menor de graus de liberdade), cuja aplicacao e dependente da confirmacao ou descarte dapossibilidade de dano em cada regiao da estrutra. A abordagem segue a ideia do modelo “divisao econquista”.

Page 21: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

6 Santos et al.

Na busca hierarquica, a funcao objetivo varia de nıvel a nıvel hierarquico, no sentido de que acada nıvel hierarquico o numero de pares de frequencias comparadas e diferente, de modo que maisfrequencias serao comparadas quanto maior o grau de refinamento (nıvel).

Compreendido que dano e uma alteracao da rigidez, desta forma, para um determinado nıvelhierarquico, uma diminuicao do valor da rigidez do material significa uma diminuicao no termoEA/L, onde E representa o modulo de Young, A a area da secao transverla e L e o comprimentodo elemento finito usado na discretizaccao. Dentre as diversas opcoes para a construcao dos nıveishierarquicos iniciais, optou-se por uma que e condicao suficiente para nao prejudicar a deteccao dedano e que e a mais simples possıvel:

• Nos nıveis hierarquicos menos refinados, a presenca de um dano e computada via uma mediaaritmetica de rigidez (ou media dos termos EA/L) dos elementos do nıvel mais refinado.

• Sendo assim, a cada nıvel hierarquico, o valor de rigidez e atualizado atraves da media dostermos EA/L. Dessa forma, a discretizacao hierarquica, apesar de simplificar a estruturae possivelmente nao representar algumas de suas caracterısticas (como supressao de algunsmodos), em nada prejudica o objetivo central de deteccao e identificacao da severidade dedanos estruturais.

A vantagem da busca hierarquica frente a abordagem tradicional sera aqui discutida com base noestudo de um modelo simplificado da Estacao Espacial Internacional (ISS), discretizada em elementosfinitos, sendo adotadas as seguintes propriedades fısicas: comprimentos totais vertical e horizontal daestrutura Lx = Ly = 42 m, com area da secao transversal de cada elemento A = 80 cm2, densidadeρ = 2700 Kg ·m−3 e modulo de Young E = 70 GPa.

Todos os testes foram realizados em um computador com processador Intel Celeron, 2133 MHz,com 1GB de memoria DDR2. Os valores de tempo de processamento foram armazenados e utilizadospara confronto entre as diferentes abordagens.

4. Resultados

Para o caso da ISS, foi aplicado o elemento finito do tipo barra bidimensional, por permitir movimentonao so longitudinal mas tambem transversal, que e uma abordagem mais realista, se comparado a umelemento de barra unidimensional, por exemplo. Para estruturas espaciais de grande porte, o numerode auto-frequencias pode ser muito elevado (Chiwiacowsky et al., 2008). Desta forma, a deteccaode danos na Estacao Espacial Internacional sera feita no domınio do tempo e nao no domınio dafrequencia. Foi gerado dado experimental sintetico com nıvel de 1% de ruıdo branco gaussiano.

Aplicando uma discretizacao via elementos finitos para a estrutura (Figura 1), o comportamentovibratoorio do sistema (resposta dinamica da estrutura a uma dada solicitacao) pode ser representadopor um modelo linear definido por um conjunto de equacoes diferenciais com varios graus deliberdade:

M x(t) + C x(t) + K x(t) = f(t) , (2)

com as seguintes condicoes iniciais:

x(0) = x0 and x(0) = x0 , (3)

onde M, C e K sao, respectivamente, as matrizes de massa, amortecimento e rigidez, x(t) e o vetordependente do tempo referente aos deslocamentos dos nos da estrutura e o vetor f(t) representa aforca externa aplicada a estrutura.

Para o estudo de caso a ser apresentado, segundo numeracao apresentada na Figura 1, forammarcados como elementos danificados os elementos 17, 18, 19 e 48, totalizando 4 elementos, com asintensidades de 10%, 20%, 7,5% e 10%, respectivamente.

Para uma dada estrutura, o metodo hıbrido aqui descrito, do ponto de vista teorico, tem seu custoindependente do numero de elementos danificados e intensidade dos danos. O exemplo numerico foiexecutado e registrou um tempo de CPU de 14 horas e 48 minutos.

No procedimento hieraquico adotado, a ISS e discretizada de forma ainda mais grosseira do quemostrado na Figura 1. As duas partes da ISS que apresentam os paineis solares engastados, foramcolapsados em trelicas de baia unica com 5 elementos. A parte central da ISS (discretizada comtrelicas de 3 baias) foi tambem colapsada numa trelica de baia unica. Deste modo, a ISS passa a serrepresentada por uma estrutura do tipo trelica de 3 baias. Ou seja, a ISS deixa de ser representadapor um estrutura de 68 elementos, para tornar-se uma estrutura ainda mais simplificada com somente12 elementos.

Page 22: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

AG e método variacional na identificação de danos estruturais 7

Figura 1. (a) Estacao Espacial Internacional, (b) Discretizacao simplificada da Estacao Espacial Internacionalem 68 elementos finitos.

As etapas da busca hierarquica sao descritas a seguir:

1. Primeiro nıvel: a estrutura foi discretizada em apenas 12 elementos finitos. O metodo hıbridoidentificou dano no elemento 12 (Figura 2a).

2. Segundo nıvel: como o dano foi identificado na baia de trelica localizada na parte superior dafigura, esta baia e subdividida em uma trelica de 2 baias.

3. A trelica composta pelos elementos 3, 4, 5 e 12, do primeiro nıvel deu origem a trelicas de 2baias no segundo nıvel de identificacao, todas restritas a parte superior da estrutura.

4. O metodo de identificacao de danos nessa nova estrutura (agora com 16 elementos finitos)encontrou dano apenas nos elementos 4, 5, 6 e 16 (Figura 2b). Neste nıvel, todos os elementoscom dano apresentam a precisao de discretizacao espacial da estrutura mais refinada (de 68elementos).

O processo de identificacao de danos, para o exemplo executado, e concluıdo no segundo nıvelhierarquico.

O tempo de processamento da estrategia hierarquica foi calculado somando-se os temposenvolvidos em todos os nıveis hierarquicos. A soma do tempo de processamento para o primeiro epara o segundo nıveis na busca hierarquica foi de menos de 18 segundos (com mais de 99% de eficacia,tendo sido alcancado um erro relativo de estimacao menor que 1%). O tempo de processamento viabusca hierarquica foi, portanto, mais de 2960 vezes menor que o referente a busca do metodo hıbrido

Figura 2. Nıveis hierarquicos de discretizacao: (a) primeiro nıvel, 12 elementos finitos, (b) segundo nıvel, 16elementos finitos. Ao lado de cada figura a correspondencia, via cores de fundo, com a estrutura discretizada em

68 elementos finitos.

Page 23: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

8 Santos et al.

padrao, isto e, menos de 18 segundos contra mais de 14 horas e meia. Para que tenhamos umaideia da economia do tempo de computacao em outra escala, tal diferenca e similar a realizar acomputacao do resultado em 8 anos (estrategia metodo hıbrido padrao) pela obtencao do resultadoem apenas um dia, absolutamente sem nenhum prejuizo a qualidade do mesmo.

Se danos fossem localicados em mais partes da estrutura de nıvel-1, e provavel que mais nıveishierarquicos pudessem ser usados. No limite, se todos os elementos da estrutura estao danificados,a busca hierarquica so ira parar quando atingir a discretizacao mais refinada. Neste caso, oprocedimento hierarquico se torna, computacionalmente, menos eficiente. Este caso limite, todavia,nao deve acontecer na pratica de engenharia.

5. Conclusões

O metodo hıbrido (MH), composto do algoritmo genetico epidemico seguido pelo metodo do gradienteconjugado, mostrou-se eficaz em estimar dano em estruturas discretizadas por elementos finitos.

A eficiencia do MH nao depende da localizacao e intensidade dos danos, ou seja, o tempo decomputacao da solucao depende apenas do numero de elementos finitos na discretizacao utilizada.Ja a eficacia apresenta uma dependencia frente ao numero e intensidade dos danos, conforme Santoset al. (2011a). Uma vez que na busca hierarquica as sub-estruturas discretizadas apresentam menoselementos danificados individualmente, com uma certa diluicao da intensidade do dano, o resultadode estimacao de dano e, realmente, melhor, ou seja, a busca hierarquica nao e apenas mais eficienteque a estrategia padrao (discretizacao com grande numero de elementos e homogenea), mas tambemmais eficaz. Em casos como o apresentado, em uma estrutura com um pequeno numero de elementosdanificados e com intensidade do dano mais distribuıda ou diluıda, a busca hierarquica representaimensa melhoria na eficiencia e, como mencionado, sem nenhum prejuızo a identificacao do dano.

O aprimoramento mais destacavel da metodologia apresentada e a automatizacao do processo dediscretizacao das estruturas e montagem da matriz de rigidez, sendo capaz de operar com outrostipos de elementos finitos e vınculos, utilizando-se pacotes de software ja consagrados, como o pacoteNASTRAN3, desenvolvido pela NASA especialmente para modelagem de estruturas aeroespaciaisvia elementos finitos. Desta forma, espera-se operar com estruturas complexas e de grande porte,de forma razoavelmente robusta, eficaz e eficiente.

Agradecimentos

Os autores agradecem a Fundacao de Amparo a Pesquisa do estado de Sao Paulo pelo apoio financeiroao projeto, na modalidade bolsa de mestrado, sob protocolo 2009/07875-7. Os demais autoresagradecem ao CNPq, agencia federal de suporte a pesquisa.

ReferênciasAdams, R.; Cawley, P.; Pye, C. & Stone, B., A vibration technique for non-destructively assessing the integrity of

structures. Journal of Mechanical Engineering Science, 20(2):93–100, 1978.

Alifanov, O., Solution of an inverse problem of heat conduction by iteration methods. Journal of Engineering Physics,26(4):471–476, 1974.

Alifanov, O. & Mikhailov, V., Solution of the nonlinear inverse thermal conductivity problem by iteration method.Journal of Engineering Physics, 35(6):1501–1506, 1978.

Auweraer, H. & Peeters, B., International research projects on strucutral health monitoring: an overview. StructuralHealth Monitoring, 2(4):341–358, 2001.

Campos-Velho, H., Problemas inversos em pesquisa espacial. Belem (PA), Brasil: Mini-curso no Congresso Nacionalde Matematica Aplicada e Computacional (CNMAC), 2008.

Carrilo, O.J.B., Algoritmo hıbrido para a avaliacao da integridade estrutural: uma abordagem heurıstica. Tese dedoutorado, Universidade Federal de Sao Carlos, Sao Carlos, 2007.

Castello, D.; Stutz, L. & Rochinha, F., A structural defect identification approach based on a continuum damagemodel. Computers and Structures, 80:417–436, 2002.

Cawley, P. & Adams, R., The location of defects in structures from measurements of natural frequencies. Journal ofStrain Analysis, 14(2):49–57, 1979.

Chen, H.; Spyrakos, C. & Venkatesh, G., Evaluating structural deterioration by dynamic response. Journal of StructuralEngineering, 121(8):1197–1204, 1995.

Chinchalkar, S., Determination of crack location in beams using natural frequencies. Journal of Sound and Vibration,247(3):417–429, 2001.

3 http://www.mscsoftware.com/Contents/Products/CAE-Tools/MSC-Nastran.aspx~.

Page 24: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

AG e método variacional na identificação de danos estruturais 9

Chiwiacowsky, L., Metodo variacional e algoritmo genetico em identificacao de danos estruturais. Tese (doutorado emcomputacao aplicada), Instituto Nacional de Pesquisas Espaciais, Sao Jose dos Campos, 2005.

Chiwiacowsky, L.; Campos-Velho, H. & Gasbarri, P., The damage identification problem: A hybrid approach. In:Proceedings... Congresso Tematico de Dinamica, Controle e Aplicacoes, Sao Jose dos Campos: SBMAC, p. 1393–1402, 2003, 1 CD-ROM.

Chiwiacowsky, L.; Campos-Velho, H. & Gasbarri, P., A variational approach for solving an inverse vibration problem.Inverse Problems in Science and Engineering, 14(5):557–577, 2006.

Chiwiacowsky, L.; Gasbarri, P. & Campos-Velho, H., Damage assessment of large space structures through thevariational approach. Acta Astronautica, 62(10):592–604, 2008.

Doebling, S.; Farrar, C.; Prime, M. & Shevitz, D., Damage identification and health monitoring of structural andmechanical systems from changes in their vibration characteristics: a literature review. Relatorio Tecnico, LosAlamos National Laboratory, Los Alamos, USA, 1996.

Gasbarri, P.; Chiwiacosky, L. & Campos-Velho, H.F., A hybrid multilevel approach for aeroelastic optimization ofcomposite wing-box. In: Proceedings... Rio de Janeiro: Conferencia Internacional de Otimizacao em EngenhariaENGOPT, p. cod. 583, 2009.

Gasbarri, P.; Chiwiacowsky, L. & Campos-Velho, H., A comparison between frequency and time domain approachesfor determining a structural damage using the adjoint method. In: Proceedings... Volterra: Congresso Nazionaledella Associazione Italiana di Aeronautica e Astronautica, p. 53–69, 2007, 1 CD-ROM.

Goldberg, D., Genetic algorithms in search, optimization, and machine learning. Reading, Massachusetts: Addison-Wesley Publishing Company, 1989.

Hoffman, J., Numerical methods for engineers and scientists. USA: CRC Press, 2001. ISBN: 978-0824704438.

Holland, J., Adaptation in natural and artificial systems. Cambridge, Massachussets: MIT Press, 1992.

Huang, C., An inverse vibration problem for simultaneously estimating the time-dependent stiffness coefficients. In:Proceedings... Rio de Janeiro: International Conference on Inverse Problems in Engineering, p. 113–122, 2002, 1CD-ROM.

Huang, C.H., A non-linear inverse vibration problem of estimating the time-dependent stiffness coefficients by conjugategradient method. International Journal for Numerical Methods in Engineering, 50:1545–1558, 2001.

Inman, D., Engineering vibration. New Jersey: Prentice Hall, 1994.

James, J.H.e.a., Current horizon for structural damage detection, precision engineering. SEM - Society of ExperimentalMechanics, 1997.

Liu, G. & Han, X., Computational inverse techniques in nondestructive evaluation. Boca Raton: CRC Press, 2003.

McConnell, K., Vibration testing. New York: John Wiley & Sons, 1995.

Medeiros, F., Algoritmo genetico hıbrido como um metodo de busca de estados estacionarios de sistemas dinamicos.Dissertacao de mestrado em computacao aplicada, Instituto Nacional de Pesquisas Espaciais, Sao Jose dos Campos,2002.

Mitchell, M., An introduction to genetic algorithms. Cambridge, Massachussets: MIT Press, 1996.

Morozov, V. & Stessin, M., Regularization methods for ill-posed problems. New York: CRC Press, 1993.

Salawu, O., Detection of structural damage through changes in frequency: a review. Engineering Structures, 19(9):718–723, 1997.

Santos, L.; Campos-Velho, H.d. & Chiwiacowsky, L., Analise de robustez do metodo hıbrido de estimacao de danoestrutural. Tendencias em Matematica Aplicada e Computacional, 12(3):245 – 252, 2011a.

Santos, L.; Campos-Velho, H.d. & Chiwiacowsky, L., Genetic Algorithm and Variational Method to Identify InitialConditions: Worked Example in Hyperbolic Heat Transfer. Tendencias em Matematica Aplicada e Computacional,14(2):265–276, 2013.

Santos, L.; Chiwiacowsky, L. & Campos-Velho, H., Uma abordagem hierarquica ao metodo hıbrido de identificacao dedanos estruturais. In: Proceedings... Congresso Tematico de Dinamica, Controle e Aplicacoes, Aguas de Lindoia:SBMAC, p. 43–46, 2011b.

Sohn, H.; Farrar, C.; Hemez, F.; Shunk, D.; Stinemates, D. & Nadler, B., A review of structural health monitoringliterature: 1996-2001. Relatorio Tecnico, Los Alamos National Laboratory, Los Alamos, USA, 2003.

Page 25: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

10 Santos et al.

.

Page 26: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Capítulo 2

Modelagem Matemática Simplificada doProcesso de Transferência de Calor em Alimentos

Usando o Algoritmo de Evolução Diferencial

Rubens Gedraite∗, Davi Leonardo de Souza e Leo Kunigk

Resumo: A modelagem matematica de processos de transferencia de calor tem um papel fundamentalno desenvolvimento cientıfico e tecnologico em diversas areas com aplicacoes em engenharia e areas afins.Dentre estas, a identificacao do modelo matematico no processo de transferencia de calor em alimentose de fundamental importancia para uma melhor caracterizacao dos processos, objetivando, entre outrosaspectos, no aumento da vida de prateleira dos produtos. Neste contexto, o presente capıtulo propoe umametodologia para a identificacao do modelo matematico simplificado do processo de transferencia de caloraplicado ao processo de proteına texturizada de soja utilizando o Algoritmo de Evolucao Diferencial.

Palavras-chave: Modelagem Matematica, Transferencia de Calor em Alimentos, Evolucao Diferencial.

Abstract: The mathematical modeling of heat transfer processes is very important in scientific andtechnologic development with applications in various fields of engineering and science. Among these,the model identification in process of food heat transfer is of fundamental importance for a bettercharacterization of process, aiming, among others, the increasing the shelf life of products. In this context,the present contribution proposes a methodology for the identification of a simplified mathematical modelof textured soybean protein process using the Differential Evolution Algorithm.

Keywords: Mathematical Modeling, Food Transfer Heat, Differential Evolution.

Conteúdo

1 Introducao ................................................................................................................................ 122 Procedimento Experimental do Processo de Transferencia de Calor em Alimentos................. 133 Modelagem Matematica do Processo de Transferencia de Calor em Alimentos....................... 164 Algoritmo de Evolucao Diferencial........................................................................................... 17

4.1 Inicializacao ..................................................................................................................... 174.2 Operador de mutacao ...................................................................................................... 174.3 Operador de cruzamento.................................................................................................. 184.4 Operador de selecao ......................................................................................................... 18

5 Resultados e Discussao............................................................................................................. 186 Conclusoes................................................................................................................................ 20

∗Autor para contato: [email protected]

Lobato et al. (Ed.), (2014) DOI: 10.7436/2014.tica.02 ISBN 978-85-64619-15-9

Page 27: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

12 Gedraite et al.

1. Introdução

Um dos principais objetivos da industria de alimentos e o aumento da vida de prateleira dosprodutos alimentıcios fabricados. Esta meta so pode ser alcancada atraves do emprego de tecnicas depreservacao que inibam as transformacoes quımicas, bioquımicas e microbiologicas que normalmenteocorrem nos mesmos, em associacao com modelos matematicos que os carac- terizem. O ramoda tecnologia de alimentos tem por finalidade estudar os processos industriais empregados para aconservacao dos produtos alimentıcios. Dentre esses pode-se citar: os que empregam o calor, ofrio e/ou os que removem o conteudo de agua do alimento, cuja principal finalidade e eliminar osesporos de bacterias presentes em alimentos industrializados (Gedraite, 2005; Gedraite & Leonhardt,1997). Estes microorganismos presentes nos alimentos sao capazes de produzir toxinas que, mesmoem quantidades muito reduzidas sao patogenicas ao ser humano, podendo mesmo serem letais seingeridas (Germer, 1997). Especificadamente, o processamento termico de alimentos industrializadosconsiste no aquecimento de embalagens em autoclaves pressurizadas, que podem ser estacionarias ourotativas, verticais ou horizontais, e/ou contınuas ou descontınuas. O processamento termico deveser especificado por especialistas que, para cada sistema equipamento/embalagem/alimento definamas condicoes de processo: tempo de processo, temperatura de processo, temperatura mınima inicialdo alimento, perfil de pressao e programa de desaeracao da autoclave (Germer, 1997).

Face aos requisitos de qualidade e de seguranca anteriormente citados, grande cuidado e tomadono calculo dos tempos de processamento, assim como no controle do tempo e da temperatura vigentesdurante os mesmos, de modo a evitar que o alimento seja submetido a um sub-processamento ou aum sobre-processamento. Embora os processos possam ser criteriosamente definidos, a sua aplicacaono dia-a-dia da producao industrial foge da idealidade. Isto se deve a problemas operacionais comopor exemplo a falta de energia, a queda na geracao de vapor de agua e a falha nos sistemas decontrole, causando desvios no processo pela flutuacao da temperatura do meio de aquecimento, entreoutros aspectos. Outros desvios de processo podem ocorrer quando ha alteracao de parametros doprocesso, tais como: temperatura inicial do produto, tempo de processo mais curto e temperaturado meio de aquecimento uniformemente mais baixa. Quando estes desvios acontecem, o lote,em geral, e reprocessado ou segregado para analise dos registros por um especialista que devetomar decisoes quanto a liberacao deste ou o seu descarte. Do ponto de vista pratico, taisprocedimentos sao dispendiosos, demorados e quando a opcao e feita pelo reprocessamento, resultamnum comprometimento da qualidade do alimento (Germer, 1997).

Outro aspecto relevante em tais processos e que a atividade enzimatica e microbiologica presenteem um produto alimentıcio industrializado e funcao da temperatura. Quando um produto alimentıcioe submetido a temperaturas superiores as maximas em que se verificam essas atividades, osmicroorganismos e as enzimas sao destruıdas. Foi com base nesse comportamento que as tecnicasdenominadas como processamento termico foram desenvolvidas. O processo de conservacao maisimportante que utiliza esta tecnologia e o enlatamento. Neste contexto, a etapa de esterilizacaode um produto alimentıcio se configura como uma das mais importantes neste processo. Quandoprodutos alimentıcios sao colocados numa embalagem, que por sua vez e colocada numa autoclave,este e processado termicamente atraves da condensacao do vapor de agua saturado, sendo que ataxa de transferencia de calor e funcao dos seguintes fatores (Teixeira & Balaban, 1996): coeficientesde transferencia de calor, propriedades fısicas do produto alimentıcio e da embalagem, diferenca detemperatura entre o produto alimentıcio e autoclave, e tamanho da embalagem.

Ressaltada a importancia da caracterizacao de processos de transferencia de calor em alimentos,deve ser mencionado que para esta finalidade faz-se necessario o conhecimento de modelosmatematicos, mesmo que simplificados, que sejam capazes de predizer satisfatoriamente o processoem funcao de alteracoes nas condicoes de processo, para fins da determinacao do perfil detemperaturas e do calculo do ındice de letalidade. Este ultimo e definido como um problemainverso. Tradicionalmente, tais problemas de otimizacao sao resolvidos atraves da aplicacao detecnicas fundamentadas no uso de derivadas. A partir do desenvolvimento de estrategias deotimizacao fundamentadas em analogias com processos quımicos, fısicos e/ou biologicos, os metodosdenominados heurısticos passaram a configurar como uma interessante alternativa para a resolucaodestes problemas, e, mais especificamente, de problemas inversos. Dentre estes metodos, destaca-seo algoritmo de Evolucao Diferencial (ED) proposto por Storn & Price (1995). A ideia basica portras do algoritmo de ED e o esquema proposto para atualizacao de cada indivıduo, a saber, por meioda realizacao de operacoes vetoriais. A diferenca ponderada entre dois indivıduos da populacao eadicionada a um terceiro indivıduo da mesma populacao. Assim, o indivıduo gerado atraves desteesquema e avaliado segundo a funcao objetivo, podendo inclusive substituir indivıduos mal sucedidosnas gera- coes seguintes. Na literatura especializada, inumeras aplicacoes usando o algoritmo de ED

Page 28: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Modelagem matemática simplificada do processo de transferência de calor em alimentos 13

podem ser encontradas, dentre as quais pode-se citar a determinacao do perfil otimo de alimentacaode substrato em fermentadores (Kapadi & Gudi, 2004); a determinacao das condicoes operacionais deum reator industrial utilizado para a producao de estireno (Babu et al., 2005); a otimizacao multi-objetivo de vigas (Lobato & Steffen Jr, 2007), a determinacao do perfil otimo de alimentacao desubstrato em um problema de controle otimo com ındice flutuante (Lobato et al., 2007), a estimacaode parametros cineticos em um secador rotatorio (Lobato et al., 2008); o uso de tecnicas de meta-modelagem associada ao enfoque multi-objetivo para o tratamento de um problema de interacaofluido-estrutura (Lobato, 2008), entre outras aplicacoes (Price et al., 2005).

Especificamente na area de alimentos pode-se citar como exemplos de aplicacoes em otimizacao:a estimacao de propriedades fısicas e termicas de feijao (Martins & Silva, 2004), a estimativa dacondutividade termica e da capacidade termica de macas (Mendonca et al., 2005) e de morangos(na etapa de super-resfriamento) (Martins & Lopes, 2007), a determinacao da difusividade termicade frutas (Mariani et al., 2008) e de legumes (durante o processo de congelamento) (Mariani et al.,2009), e a determinacao do coeficiente de transferencia de calor e da condutividade termica da popade coco (Ramsaroop & Persad, 2012), dentre outras.

Diante do que foi apresentado, o presente capıtulo tem por objetivo a identificacao de um modelomatematico simplificado aplicado ao processo de transferencia de calor para a producao de proteınastexturizadas de soja atraves da formulacao e resolucao de um problema inverso usando o algoritmoED. Este capıtulo esta estruturado como segue: nas Secoes 2 e 3 aao apresentados o procedimentoexperimental e o modelagem matematica do processo, respectivamente. Na Secao 4 e apresentada,de forma simplificada, aspectos gerais do algoritmo de ED. Na Secao 5 sao apresentados os resultadosobtidos com a aplicacao da metodologia proposta. Finalmente, as conclusoes e perspectivas paratrabalhos futuros sao descritas na ultima Secao.

2. Procedimento Experimental do Processo de Transferência de Calor em Alimentos

No processo de transferencia de calor em alimento, o controle da temperatura do produto alimentıcioe o ponto crıtico. Basicamente, existem duas estrategias de controle para se alcancar este objetivo.Uma delas envolve a medicao da temperatura do produto e o ajuste da temperatura do meiode aquecimento/resfriamento para se alcancar e manter a temperatura do produto alimentıciono valor desejado. A outra consiste exclusivamente no controle da temperatura do meio deaquecimento/resfriamento, assumindo que a temperatura do produto seguira o curso definido pelosestudos previos de penetracao de calor.

A primeira alternativa permite tanto o ajuste em tempo real das temperaturas dos meios deaquecimento/resfriamento como do tempo de processamento necessario para se considerar quaisquerdesvios. As temperaturas do produto podem ser transformadas em taxas de letalidade e a letalidadeacumulada avaliada em tempo real, de forma a permitir que se encontre o instante mais adequadopara a finalizacao do processamento termico. A temperatura do produto alimentıcio acondicionadonuma embalagem durante o processamento termico e medida por meio de um elemento sensor detemperatura adequadamente instalado no ponto mais frio do mesmo. O sinal de saıda geradopelo elemento sensor de temperatura e enviado a um sistema digital de controle, em cuja base dedados encontra-se configurado um bloco de funcao que executa, em tempo real, o calculo do ındicede letalidade do produto alimentıcio. Esta abordagem nao requer um conheci- mento previo domecanismo de transferencia de calor ou das propriedades fısicas e termicas do produto alimentıcio.Contudo, exige-se a preparacao de unidades de teste para a instalacao em cada carregamento daautoclave, no ponto de aquecimento mais lento, o que nao e facilmente exequıvel na pratica. Eimportante ressaltar o fato de que a colocacao de unidades de teste no carregamento da autoclave e amanipulacao dos fios dos res- pectivos elementos sensores por ocasiao do fechamento e da abertura damesma, podem causar atrasos na programacao de operacao das autoclaves, que acarretem diminuicaoda produtividade. As unidades de teste podem, tambem, exibir parametros de penetracao de calorvariaveis; assim sendo, os processamentos termicos poderao variar quando baseados nas mesmas.Alem do mais, a medicao direta e difıcil, ou mesmo impossıvel, no caso de autoclaves contınuas,implicando, tambem, numa recalibracao frequente do sistema de medicao de temperatura (Larousse& Brown, 1997).

A segunda alternativa baseia-se na previsao da temperatura do produto alimentıcio a partir datemperatura do meio de aquecimento/resfriamento. Com base em modelo matematico que descrevacom precisao o fluxo de calor, em regime transiente, pode-se executar o controle do processo deesterilizacao deste. Esta metodologia e mais vantajosa porque dispensa a medicao da temperaturano interior do produto alimentıcio. A sua desvantagem mais marcante e a necessidade de se conhecer

Page 29: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

14 Gedraite et al.

as propriedades termofısicas do produto alimentıcio considerado, que nem sempre sao constantes e/ouconhecidas em literatura. Porem, este fato nao impede que estas propriedades sejam determinadasexperimentalmente e/ou que se considere um valor medio global para as mesmas quando daelaboracao do modelo. Larousse & Brown (1997) afirmam que os dois mecanismos predominantes detransferen- cia de calor envolvidos no processamento termico de alimentos enlatados sao a conducaoe a conveccao. Afirmam, tambem, que, na pratica, o mecanis- mo de aquecimento condutivo econsiderado mais restritivo para efeito de modelamento matematico da transferencia de calor parao alimento enlatado, apesar do fato dos modelos desenvolvidos com base neste ultimo mecanismoparecerem operar igualmente bem no caso de aquecimento convectivo de produtos alimentıcios. Porse estar trabalhando com transporte de calor por conducao, a complexidade do modelo matematico foiconsideravelmente reduzida, pois este mecanismo de transporte faz uso de equacoes significativamentemais simples do que aquelas utilizadas pelo mecanismo da conveccao.

De um modo geral, a industria de alimentos tem procurado utilizar forma mais intensivaos sistemas de automacao nos processos de enlatamento, com a finalidade de garantir que oprocessamento termico imposto elimine, com seguranca, os microorganismos indesejaveis no produtoalimentıcio. Para se alcancar tal meta e essencial que o processamento termico sofra um rıgidocontrole toda vez que for empregado. As Figuras 1 (a) e (b) (Gedraite, 2005; Gedraite & Leonhardt,1997) apresentam a autoclave estacionaria vertical e o respectivo sistema de controle utilizados nosexperimentos conduzidos. Ja na Figura 2 e apresentado o fluxograma do processo e instrumentacaodo referido equipamento.

(a) Autoclave. (b) Sistema de Controle.

Figura 1. Procedimento experimental para a coleta de pontos (Gedraite, 2005).

A cronometragem do perıodo de exaustao e do perıodo de manutencao na temperatura necessariapara a analise de letalidade dos microorganismos indesejaveis e feita por meio de um controladorlogico programavel. Uma vez alcancada a esterilizacao desejada, deve-se proceder ao resfriamentoda autoclave por meio da injecao de agua. Nesta etapa do processo e muito importante o controleda pressao no interior da autoclave, para evitar que os recipientes que contenham o alimento sejamdanificados. A malha de controle de pressao, mostrada na Figura 2, ira atuar apos o termino daetapa de aquecimento, ajustando a vazao de ar comprimido que e alimentado a autoclave.

Tanto o controle da temperatura como o controle da pressao no interior da autoclave sao feitospor um controlador e indicador eletronico microprocessado com capacidade para ate quatro malhasde controle fechadas por realimentacao. O intertravamento da autoclave e executado por meio deum controlador logico programavel e tem por finalidade principal impedir a colocacao da mesma emoperacao se a tampa nao estiver fechada e travada, alem de impedir a abertura da tampa se a pressaointerna for superior a pressao atmosferica. A autoclave esta equipada com sensores de temperatura,que podem ser montados internamente aos recipientes que contem o produto alimentıcio, de modoa permitir a avaliacao experimental da curva de penetracao de calor no mesmo. Para a medicaoda pressao e das temperaturas foram instalados transmissores eletronicos microprocessados, quepermitem a obtencao de maior confiabilidade e maior precisao nas medicoes efetuadas.

A autoclave estudada emprega um sistema de controle totalmente digital, e que utiliza umcontrolador e indicador eletronico microprocessado acoplado a um controlador logico programavelinterligados a um computador empregado para a supervisao do processo. Este computador executa

Page 30: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Modelagem matemática simplificada do processo de transferência de calor em alimentos 15

S

S

S

S

S

vapor

água

arcomprimido

alívio

dreno

PIC 1

PT 1

I

PY1

ZHS 1

PV1

I/P

Π

3

Π

2

Π

4

Π

6

Π

1 I

I

A1

A1XV2

XV1

A1

I/P

I

Π

1

TY1

TCI1

Figura 2. Fluxograma de processo e instrumentacao da autoclave vertical.

o aplicativo de supervisao que permite o acompanhamento das condicoes de processo atraves de telasgraficas pre-programadas. O sistema de controle da autoclave e empregado visando gerar o perfil detemperatura desejado para a mesma em funcao do tempo. Podem-se distinguir, fundamentalmente,tres fases tıpicas de operacao de uma autoclave, a saber: aquecimento, esterilizacao e resfriamento.A fase de aquecimento compreende as etapas de exaustao e de aquecimento propriamente ditas. Aetapa de exaustao tem por finalidade a eliminacao do ar existente no interior da autoclave, enquantoque a etapa de aquecimento visa atingir a temperatura pre-fixada para a esterilizacao.

A primeira atividade a ser executada quando do inıcio da operacao da autoclave e a etapa deexaustao (muitas vezes denominada de desaeracao ou remocao do ar). Considerando que o vaporde agua e utilizado como meio de transferencia de calor em autoclaves, devido, entre outras razoes,aos maiores coeficientes de transferencia de calor verificados, para que possamos tirar vantagem deseu uso, devemos eliminar o ar presente no interior da autoclave. A presenca do ar, nao somentereduz a transferencia de calor, mas, quando a exaustao nao for total, o ar restante ao redor dosrecipientes podera agir como isolante e provocar a corrosao e queima de sua superfıcie. Mesmoquando a autoclave se encontre com sua capacidade maxima ocupada, a maior parte do espaco totaldisponıvel e preenchida pelo ar. Em autoclaves horizontais, apos seu preenchimento, 80% do seuespaco se encontra ocupado pelo ar. Em autoclaves verticais, 60% da sua capacidade e tomada peloar. Para removermos todo este ar e necessario algum tempo de circulacao do vapor com as valvulasde exaustao abertas, pois o ar deve ser desalojado dos espacos formados entre os recipientes. Poroutro lado, devemos lembrar que, devido a superfıcie dos recipientes se encontrar em temperaturasinferiores a de saturacao do vapor, ocorrera uma condensacao inicial. Por esta razao, a velocidadede fornecimento de vapor deve ser elevada para compensar as possıveis condensacoes, eliminar o arpresente e para que a temperatura de esterilizacao seja alcancada rapidamente (Gedraite, 2005).

Uma vez que a temperatura recomendada para a exaustao seja atingida, deve-se manter aautoclave nesta temperatura pelo tempo necessario para se assegurar a eliminacao do ar presente e,em seguida, providenciar que a valvula de exaustao seja fechada. Geralmente este intervalo de tempoe determinado experimentalmente e esta baseado na concordancia entre o valor da pressao lida nomanometro e a temperatura indicada no termometro de mercurio, ambos instalados no corpo daautoclave. Este procedimento nao e uma indicacao segura de que todo ar foi eliminado, no entanto,enquanto esta concordancia nao for verificada, deve-se prosseguir com a desaeracao. A seguir, deve-se continuar o fornecimento de vapor de agua, ate que seja alcancada a temperatura adequada paraa esterilizacao do produto alimentıcio. A partir deste ponto, deve-se iniciar o fechamento gradual davalvula de controle que e empregada para ajustar o valor da vazao de vapor de aquecimento. Este

Page 31: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

16 Gedraite et al.

procedimento evita uma diminuicao acentuada da temperatura, que geralmente ocorre quando estavalvula e fechada abruptamente. A partir deste ponto, tem inıcio a cronometragem do tempo deprocessamento, o que e feito pelo sistema de automacao da autoclave. Durante a fase de esterilizacao,os seguintes cuidados sao necessarios (Gedraite, 2005):

• Manter a temperatura da autoclave 1 C acima da temperatura recomendada, para compensarflutuacoes;

• Verificar periodicamente, atraves do termometro de mercurio, a temperatura da autoclave;

• Verificar se, em todos os sangradores, o vapor esta escoando normalmente;

• Verificar o tempo de processamento e, uma vez esgotado este tempo, iniciar imediatamente aoperacao de resfriamento.

O resfriamento do sistema e conduzido na propria autoclave, sob pressao controlada. Esta pressaoe mantida praticamente constante com a introducao de ar comprimido, obedecendo-se ao seguinteprocedimento: terminada a etapa de esterilizacao, interrompe-se o fornecimento do vapor de aguae fecha-se a valvula de dreno. Tem inıcio a injecao de ar comprimido pelo topo da autoclave, demodo a se obter a pressao desejada, apos o que tem inıcio o fornecimento de agua de resfriamentopela base. Naturalmente, a tendencia da pressao e diminuir com o tempo, daı a necessidade de umcontrole adequado da pressao interna da autoclave. No instante em que a agua atinge o topo, osistema de automacao abre a valvula de dreno, mantendo a pressao estipulada para o resfriamento.O relaxamento da pressao, que sera realizado de acordo com o tipo de produto, so deve se iniciarapos a temperatura do produto ter atingido 70 C. E importante ressaltar o fato de que a vazao deagua, bem como sua circulacao, deve ser aquela necessaria e suficiente para encher a autoclave em,no maximo, 5 minutos (Gedraite, 2005).

3. Modelagem Matemática do Processo de Transferência de Calor em Alimentos

A Figura 3 apresenta um esquema tıpico de uma embalagem cilındrica usada no acondicimento dealimentos.

H

R

r

y

Figura 3. Sistemas de coordenadas para uma embalagem cilındrica.

Matematicamente, o processo de transferencia de calor em uma embalagem de altura H e raio R,e com difusividade termica constante, e dada pela seguinte equacao diferencial parcial (Chapman,1984):

∂T

∂t= α

(∂2T

∂r2+

1

r

∂T

∂r+∂2T

∂y2

)(1)

onde T e a temperatura do produto, t e o tempo de processamento, r e a cota na direcao radial, y ea cota na direcao axial e α e a difusividade termica do produto.

Em termos praticos, de posse do perfil de temperatura, e possıvel calcular o ındice de letalidadeatraves da seguinte equacao

Page 32: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Modelagem matemática simplificada do processo de transferência de calor em alimentos 17

F0 =

∫ tf

0

1

10Tr−T

z

dt (2)

onde Tr e a temperatura de referencia para um dado alimento, tf e o tempo total de processamentoe z e a diferenca de temperatura necessaria para reduzir o tempo requerido em 10 vezes a populacaode microorganismos. Neste contexto, esta equacao nos permite avaliar o tratamento termico queocorre nas secoes de aquecimento, resfriamento e retencao (Aguiar, 2009).

E importante ressaltar que, apesar da Equacao 1 poder ser resolvida numericamente, a suaavaliacao em termos de otimizacao exige um alto custo computacional, desde que e necessario, a cadaiteracao, da resolucao de uma equacao diferencial parcial. Alem disso, em se tratanto da etapa decontrole de processo, onde exige-se a avaliacao do modelo matematico on-line, um modelo compostopor uma equacao diferencial partial nao o favorece. Neste contexto, como ressaltado anteriormente,a presente contribuicao tem por objetivo a determinacao de um modelo matematico simplificadodeste processo. Para essa finalidade, foram consideradas as seguintes hipoteses simplificadoras(Gedraite, 2005; Gedraite & Leonhardt, 1997): a temperatura do produto e uniforme no instantet=0, a temperatura da embalagem cilındrica e igual em qualquer ponto depois de t=0 (nao havariacao entre dois pontos distintos da embalagem), o coeficiente de transferencia de calor, externoa embalagem, foi assumido apresentar amplitude significativamente superior em relacao aos demaiscoeficientes que participam do sistema embalagem/produto, as propriedades de transporte de calorforam consideradas constantes em relacao a temperatura, e nao existe headspace (espaco livre entreo conteudo acondicionado dentro da embalagem e o produto) no interior da embalagem.

4. Algoritmo de Evolução Diferencial

O algoritmo de ED baseia-se na realizacao de operacoes vetoriais na qual a diferenca ponderadaentre dois indivıduos distintos, adicionada a um terceiro indivıduo, e o responsavel pela geracaode candidatos. O algoritmo de ED apresenta as seguintes operacoes: inicializacao da populacao,mutacao, cruzamento, selecao, e criterio de parada. A seguir sao descritas cada uma destas operacoes.

4.1 Inicialização

O processo de inicializacao consiste na geracao de indivıduos de forma aleatoria. Neste caso, deposse do numero de indivıduos da populacao e do domınio de cada variavel de projeto, geram-senumeros aleatorios que serao aplicados a esse intervalo, obtendo-se assim um vetor de indivıduos dapopulacao, como mostrado a seguir:

xi,j = xi,L + rand (xi,U − xi,L) (3)

onde xi,L e xi,U sao os limites inferiores e superiores das j-esimas variaveis de projeto,respectivamente, e rand e um gerador de numeros aleatorios entre 0 e 1.

4.2 Operador de mutação

Neste operador, o algoritmo de ED realiza as operacoes de mutacao e recombinacao para a geracao deuma nova populacao com NP indivıduos. Este operador adiciona a um vetor de referencia, escolhidoaleatoriamente na populacao, um vetor diferenca obtido a partir de outros dois vetores tambemescolhidos aleatoriamente na populacao, como descrito a seguir:

vi,g = xr0,g + F (xr1,g − xr2,g) (4)

onde vi,g e um novo vetor (candidato), o escalar F (taxa de perturbacao) e um numero real quecontrola a magnitude do vetor diferenca obtido em cada operacao, e os vetores xr0,g, xr1,g e xr2,gsao escolhidos aleatoriamente na populacao, como ilustrado na Tabela 1.

A convencao utilizada nesta tabela e DE/X/Y/Z, onde X representa o vetor que sera perturbado(best ou rand). Y e o numero de pares de vetores que sao considerados durante a perturbacao eZ e o tipo de cruzamento usado para a geracao do candidato, bin no caso binomial e exp no casoexponencial. Os subscritos κi (i=1,..., 5) sao ındices escolhidos aleatoriamente na populacao. xbest eo melhor indivıduo da populacao na geracao anterior e xold e um indivıduo escolhido aleatoriamentedentro da populacao na geracao anterior.

Page 33: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

18 Gedraite et al.

Tabela 1. Mecanismos de mutacao no algoritmo de ED.

Estrategia Representacao Mecanismo

1 xj+1=xjbest + F (xjκ1 − xjκ2) DE/best/1/exp

2 xj+1=xjκ3 + F (xjκ1 − xjκ2) DE/rand/1/exp

3 xj+1=xjold + F (xjbest − xjold) + F (xjκ1 − xjκ2) DE/ran-to-best/2/exp

4 xj+1=xjbest + F (xjκ1 − xjκ2) + F (xjκ3 − xjκ4) DE/best/2/exp

5 xj+1=xjκ5 + F (xjκ1 − xjκ2) + F (xjκ3 − xjκ4) DE/rand/2/exp

6 xj+1=xjbest + F (xjκ1 − xjκ2) DE/best/1/bin

7 xj+1=xjκ3 + F (xjκ1 − xjκ2) DE/rand/1/bin

8 xj+1=xjold + F (xjbest − xjold) + F (xjκ1 − xjκ2) DE/rand-to-best/2/bin

9 xj+1=xjbest + F (xjκ1 − xjκ2) + F (xjκ3 − xjκ4) DE/best/2/bin

10 xj+1=xjκ5 + F (xjκ1 − xjκ2) + F (xjκ3 − xjκ4) DE/rand/2/bin

4.3 Operador de cruzamento

Neste operador, o vetor vi,g gerado anteriormente pode ou nao ser aceito na proxima geracao deacordo com a seguinte condicao:

ui,g =

vi,g se rand ≤ CR ou j = jrandxi,g caso contrario

(5)

onde CR e denominada probabilidade de cruzamento, definida pelo usuario e pertencente ao intervalo[0, 1]. De forma geral, tal parametro controla as informacoes dos pais que serao transmitidas aosfilhos. Para determinar qual a contribuicao de um determinado vetor gerado, o cruzamento comparaCR com o gerador de numeros aleatorios rand. Se o numero aleatorio gerado e menor ou igual aCR, o vetor vi,g (com posicao jrand) e aceito, caso contrario, o vetor xi,g e mantido na populacaoatual.

4.4 Operador de seleção

Se o vetor ui,g tem melhor valor de funcao objetivo (f) em relacao ao vetor xi,g, ele o substitui naproxima geracao; caso contrario, xi,g e mantido na populacao por mais uma geracao, como mostradoa seguir:

xi,g+1 =

ui,g se f(ui,g) ≤ f(xi,g)xi,g caso contrario

(6)

Finalmente, uma vez completado o processo de atualizacao da populacao, este processo e repetidoate que um determinado criterio de parada seja satisfeito. Neste capıtulo, o criterio de paradaadotado foi o numero maximo de geracoes.

Com relacao a escolha dos parametros do algoritmo de ED, Storn & Price (1995) aconselham ouso dos seguintes valores: numero de indivıduos da populacao como sendo igual a um valor entre 5e 10 vezes o numero de variaveis de projeto, taxa de perturbacao F entre 0,2 e 2,0, probabilidadede cruzamento CR entre 0,1 e 1,0, e estrategia DE/rand/1/bin Babu et al. (2005). E importanteressaltar que outros valores para esses parametros podem ser atribuıdos de acordo com uma aplicacaoparticular.

5. Resultados e Discussão

O produto alimentıcio considerado neste trabalho foi a proteına texturizada de soja (PTS),industrializada na forma de granulos, por empresa do segmento alimentıcio. A PTS foi acondicionadaem embalagem metalica de geometria cilındrica com 73,3 mm de diametro por 111 mm de altura. Atemperatura no centro do produto alimentıcio foi medida por meio de elemento sensor de temperaturado tipo DATA TRACEr. Numa outra embalagem, com as extremidades abertas, foi instalado

Page 34: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Modelagem matemática simplificada do processo de transferência de calor em alimentos 19

outro elemento sensor de temperatura da mesma marca para medir a temperatura da autoclavepropriamente. A seguir, foi executado o processamento termico do produto em questao conformedeterminado no procedimento operacional da empresa.

As Figuras 4 e 5 apresentam o diagrama de blocos do processo da malha de controle baseada emmodelos e os resultados experimentais obtidos por (Gedraite, 2005), respectivamente.

C V P

Modelomatemático

Cálculo de devido ao

resfriamentoLiga/desliga

aquecimento daautoclave

Elemento finalde controle

Controlador

Sinal discreto F0

F0Cálculo de no instante t

+ ++

+

+

-TRSP

TR

TRCV

MV

Carga (U)

TC

ε

F0alvo

F0total

Figura 4. Diagrama de blocos tıpico para uma malha de controle antecipatorio baseada em modelo.

0 750 1500 2250 3000 3750 45000153045607590105120135

Autoclave Produto

Tempo (s)

Tem

pera

tura

(o

Figura 5. Perfis de temperatura da autoclave e do produto.

De posse dos perfis de temperutura da autoclave e do produto, e possıvel propor modelosaproximados e de baixa ordem para descrever o comportamento dinamico do processo nas etapas deaquecimento e resfriamento. Segundo Aguirre (2007); Astrom & Hagglung (1995), tais modelos saosuficientemente precisos para aplicacoes industriais, alem de fornecer uma ideia bastante adequada dosistema estudado. Ainda segundo este autor, a entrada normalmente mais usada para identificar umprocesso de forma nao-parametrica e a excitacao em degrau. Neste caso, estes ensaios normalmentepermitem gerar, graficamente, modelos empıricos dinamicos representados por urna funcao detransferencia de baixa ordem (1a ou 2a ordem, eventualmente incluindo um tempo morto) com,no maximo, quatro parametros a serem determinados experimentalmente. Alem disso, Astrom &Hagglung (1995) afirmam que muitos dos processos podem ser representados pela combinacao de

Page 35: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

20 Gedraite et al.

quatro elementos tipicamente encontrados em processos industriais, a saber, i) ganho, ii) atraso detransporte, iii) atraso de transferencia e iv)elemento integrador.

Diante do que foi discutido, o modelo matematico simplificado (Πcal) proposto neste trabalho e umsistema superamortecido de 1a ordem mais tempo morto, representado pela funcao de transferenciaa seguir (Aguirre, 2007)

Gp(s) =Kp

τps+ 1exp(−θps) (7)

onde Kp representa o ganho no estado estacionario do sistema estudado, τp representa o atraso detransferencia e θp representa o atraso de transporte.

De posse do modelo simplificado do processo, a proxima etapa e a definicao do problema inverso,que neste caso, consiste na minimizacao do funcional Q (minimizacao da diferenca entre os valores“experimentais” (Πexp) e os valores calculados pelo modelo matematico simplificado que rege ofenomeno em analise). Matematicamente, tem-se:

Q =

Nd∑i=1

(Πical − Πi

exp)2 (8)

onde Nd representa o numero total de dados experimentais.Para a resolucao deste problema inverso usando o algoritmo ED foram utilizados os seguintes

parametros: populacao inicial com 10 indivıduos, probabilidade de cruzamento igual a 0,5, taxa deperturbacao igual a 0,8, estrategia DE/rand/1/bin, 100 geracoes e 10 execucoes para a obtencao dosresultados apresentados nas tabelas. Para avaliar a qualidade dos resultados obtidos pelo algoritmode ED, sera utilizado o algoritmo de Levenberg-Marquardt (LM) (com estimativa inicial [Kp=1,τp=100 e θp=100] para as fases de aquecimento e resfriamento, e tolerancia da ordem de 10−7);e o Metodo de Miller (Miller et al., 1967), que permite identificar a funcao de transferencia querepresenta o comportamento dinamico de um sistema com base na curva de resposta deste a umaperturbacao do tipo degrau no sinal correspondente a variavel de entrada associada ao mesmo. Eleesta baseado na reta tangente tracada no ponto de inflexao da curva de resposta do processo, a partirda qual se obtem os parametros de ganho, atraso de transferencia e atraso de transporte, se houver.

A Tabela 2 apresenta os parametros do modelo obtidos pelo Metodo de Miller.

Tabela 2. Parametros do modelo matematico obtido aplicavel ao processo (etapas de aquecimento e deresfriamento) usando o Metodo de Miller.

Parametros Valor

Kp (C/C) 0,95

τp (s) 570

Ja na Tabela 3 sao apresentados os parametros do modelo identificado para as etapas aquecimentoe resfriamento usando os algoritmos ED e LM. E importante ressaltar que, a partir de execucoesinicias de ambos os algoritmos, foi possıvel observar que os resultados obtidos com o modelo propostoconsiderando todo o tempo de operacao nao eram satisfatorios, isto e, o perfil de temperaturasimulado era bem diferente do perfil experimental. Desta forma, optou-se por propor um modelopara a fase de aquecimento e outro para a fase de resfriamento.

Ja na Figura 6 sao apresentados os perfis de temperatura obtidos com os Metodos de Miller, EDe LM em comparacao com os dados experimentais empregados para no processo de identificacao.

Como pode ser observado na Tabela 3 e na Figura 6, os melhores resultados foram obtidos pelosalgoritmos ED e LM, os quais consideram um modelo para a fase de aquecimento e outro para afase de resfriamento, respectivamente. Ja o Metodo de Miller, como e uma abordagem baseada nacurva de reacao do processo, este tem muita incerteza asssociada, nos conduzindo desta forma pararesultados inferiores aos obtidos pelos algoritmos ED e LM.

6. Conclusões

Este capıtulo teve por objetivo a identificacao de um modelo matematico simplificado aplicadovia formulacao e resolucao de um problema inverso de transferencia de calor aplicado ao processode producao de proteına texturizada de soja usando o algoritmo de Evolucao Diferencial. Neste

Page 36: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Modelagem matemática simplificada do processo de transferência de calor em alimentos 21

Tabela 3. Parametros do modelo matematico para as etapas de aquecimento e de resfriamento usando ED e LM.

Aquecimento Resfriamento

Parametros Valor Q Parametros Valor Q

Kp (C/C) 0,81 172,042 Kp (C/C) -5,13 156,012

ED1 τp (s) 475,32 τp(s) (s) 1000θp 80

Kp (C/C) 0,82 172,03 Kp (C/C) -5,11 155,98LM3 τp (s) 475,29 τp(s) (s) 1000

θp 80

11010 avaliacoes da funcao objetivo, 2desvio padrao medio da ordem de 10−5 e319 avaliacoes da funcao objetivo.

0 750 1500 2250 3000 3750 45000153045607590105120135

Autoclave Produto Miller ED LM

Tempo (s)

Figura 6. Comparacao entre os perfis de temperatura obtidos com os Metodos de Miller, ED e LM em relacaoaos dados experimentais.

contexto, o algoritmo mostrou-se eficiente quando comparado com Levenberg Marquardt e superiorao Metodo de Miller. Como justificativa para a obtencao de um modelo simplificado, valido paraa faixa experimental considerada, e nao de um modelo fenomenologico tradicional, ressalta-se a suaaplicabilidade na area de controle de processo, exigindo uma rapida resposta do mesmo. Comoperspectivas de trabalhos futuros pode-se citar a determinacao do calculo de letalidade atraves daformulacao de um problema de otimizacao.

Agradecimentos

Todos os autores agradecem o suporte financeiro da FAPEMIG, Fundacao de Amparo a Pesquisa deMinas Gerais, e do CNPq, Conselho Nacional de Desenvolvimento Cientıfico e Tecnologico.

ReferênciasAguiar, H.F., Modelagem Matematica e Validacao Experimental da Pasteurizacao de Leite pela Avaliacao do Historico

de Temperatura e Letalidade em Trocador de Placas. Tese de doutorado, Universidade de Sao Paulo, 2009.

Aguirre, L., Introducao a identificacao de sistemas: tecnicas lineares e nao-lineares aplicadas a sistemas reais. 3aedicao. Belo Horizonte, 2007.

Astrom, K. & Hagglung, T., Pid controllers: Theory, design and tuning. North Carolina: ISA, 1995.

Babu, B.; Chakole, P. & Mubeen, J., Multiobjective differential evolution (mode) for optimization of adiabatic styrenereactor. Chemical Engineering Science, 60(12):4822–4837, 2005.

Chapman, A., Fundamentals of Heat Tranfer. 1a edicao. New York: Macmillan Publishing Company, 1984.

Page 37: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

22 Gedraite et al.

Gedraite, R., Desenvolvimento e implementacao de algoritmo computacional para calcular o valor da difusividadetermica em alimentos industrializados aquecidos pelo mecanismo de conducao. Tese de doutorado, Universidadede Sao Paulo, 2005.

Gedraite, R. & Leonhardt, G., Modernizacao da instrumentacao de autoclave estacionaria para esterilizacao dealimentos. ISA SHOW BRASIL/97, Sao Paulo - SP, 1997.

Germer, S., Avaliacao dos desvios no processamento termico de alimentos em conserva. Informativo FRUTHOTEC,3(2):2–3, 1997.

Kapadi, M. & Gudi, R., Optimal control of fed-batch fermentation involving multiple feeds using differential evolution.Process Biochemistry, 39(3):1709–1721, 2004.

Larousse, J. & Brown, B., Food canning technology. New York, :Wiley1997.

Lobato, F., Otimizacao Multi-objetivo para o Projeto de Sistemas de Engenharia. Tese de doutorado, Faculdade deEngenharia Mecanica, Universidade Federal de Uberlandia, Brasil, 2008.

Lobato, F.; Arruda, E.; Barrozo, M. & Steffen Jr, V., Estimation of drying parameters in rotary dryers using differentialevolution. Journal of Physics Conference Series, 1(2):1–8, 2008.

Lobato, F.; Oliveira-Lopes, L.; Murata, V. & Steffen Jr, V., Solution of multi-objective optimal control problems withindex fluctuation using differential evolution. In: Proceedings in 6th Brazilian Conference on Dynamics, Controland Applications - DINCON, 2007, Sao Jose do Rio Preto - SP. p. 1–8, 2007.

Lobato, F. & Steffen Jr, V., Engineering system design with multi-objective differential evolution. In: Proceedings in19th International Congress of Mechanical Engineering - Cobem 2007, Brasılia, Brazil. p. 1–10, 2007.

Mariani, V.; Amarante, A. & Coelho, L., Estimation of apparent thermal conductivity of carrot pure’e during freezingusing inverse problem. International Journal of Food Science and Technology, 44(1):1292–1303, 2009.

Mariani, V.; Lima, A. & Coelho, L., Apparent thermal diffusivity estimation of the banana during drying using inversemethod. Journal of Food Engineering, 85(2):569–579, 2008.

Martins, R. & Lopes, V., Modelling supercooling in frozen strawberries: Experimental analysis, cellular automationand inverse problem methodology. Journal of Food Engineering, 80(1):126–141, 2007.

Martins, R. & Silva, C., Inverse problem methodology for thermal-physical properties estimation of frozen green beans.Journal of Food Engineering, 63(4):383–392, 2004.

Mendonca, S.; Celso Filho, R. & Silva, Z., Transient conduction in spherical fruits: method to estimate the thermalconductivity and volumetric thermal capacity. Journal of Food Engineering, 67(3):261–266, 2005.

Miller, J.; Miller, J.; Lopez, A.; Smith, C. & Murrill, P., A comparison of controller tuning techniques. ControlEngineering, 14(12):72–77, 1967.

Price, K.; Storn, R. & Lampinen, J., Differential Evolution - A Practical Approach to Global Optimization. 1a edicao.Springer: Natural Computing Series, 2005.

Ramsaroop, R. & Persad, P., Determination of the heat transfer coefficient and thermal conductivity for coconut kernelsusing an inverse method with a developed hemispherical shell model. Journal of Food Engineering, 110(1):141–157,2012.

Storn, R. & Price, K., Differential evolution: a simple and efficient adaptive scheme for global optimization overcontinuous spaces. International Computer Science Institute, 12(1):1–16, 1995.

Teixeira, A. & Balaban, M., Computer applications in thermal processing of canned foods. ITAL, 1996.

Page 38: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Capítulo 3

Problemas Inversos em Transferência de Calorcom Aplicação em

Processo de Usinagem por Torneamento

Marcelo R. dos Santos, Álisson Rocha Machado, Gilmar Guimarães,Márcio Bacci da Silva, Sandro M. M. de Lima e Silva e Solidônio R. de Carvalho ∗

Resumo: Este capıtulo tem como objetivo aplicar tecnicas de problemas inversos no estudo dos campostermicos desenvolvidos durante a usinagem por torneamento. O modelo computacional para a solucao doproblema direto foi desenvolvido a partir do metodo dos volumes finitos. Tecnicas inversas foram estudadase aplicadas na analise termica do processo de usinagem por torneamento de um aco de corte-facil comferramenta de aco-rapido. Verificou-se ainda a influencia dos parametros de corte (avanco, profundidade evelocidade de corte) na temperatura desenvolvida na interface cavaco-ferramenta. Por fim, os resultadosforam comparados aqueles obtidos pelo metodo experimental do termopar ferramenta-peca, apresentandocoerencia entre eles.

Palavras-chave: Problemas inversos, Transferencia de calor tridimensional, Temperatura em usinagem,Torneamento de aco de corte facil.

Abstract: This chapter is devoted to the application of inverse problem techniques in heat transfer to studythe thermal fields developed During the turning operation. The computational model for the solution ofthe direct problem was based on finite volume method. Inverse techniques have been applied to estimatethe heat flux at an AISI M32C high speed steel tool during machining of an ABNT 12L14 free machiningsteel. The effect of the cutting parameters (cutting speed, feed rate and depth of cut) on the chip toolinterface temperature was studied. The results were compared with those obtained with the tool-workpiecethermocouple technique and a fair agreement was obtained.

Keywords: Inverse problems, Three-dimensional heat conduction, Cutting temperature,Turning of freemachining steel.

Conteúdo

1 Introducao ................................................................................................................................ 241.1 Revisao bibliografica ........................................................................................................ 24

2 Problema Direto: Descricao do Modelo Fısico e Matematico .................................................. 252.1 Discretizacao do modelo termico ..................................................................................... 25

3 Problema Inverso em Transferencia de Calor........................................................................... 264 Analise Termica do Processo de Usinagem por Torneamento.................................................. 295 Conclusoes................................................................................................................................ 35

∗Autorparacontato:[email protected]

Lobato et al. (Ed.), (2014) DOI: 10.7436/2014.tica.03 ISBN 978-85-64619-15-9

Page 39: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

24 Santos et al.

1. Introdução

Diversas pesquisas tem sido desenvolvidas com o intuito de resolver as equacoes de transferencia decalor e aplica-las na modelagem e analise de problemas termicos de fabricacao.

Uma das formas de se tratar um modelo termico consiste em uma formulacao que considera afonte de calor conhecida e se busca determinar os campos termicos a partir da solucao da equacaoda difusao, seja por metodos analıticos ou por metodos numericos. De acordo com a literatura,da-se a essa metodologia o nome de problema direto de transferencia de calor. O problema direto eclassificado matematicamente como um problema “bem posto” visto que este problema satisfaz tresrequisitos essenciais que sao: a existencia de solucao (existe no mınimo uma solucao); a unicidade,isto e, uma solucao unica fixada as condicoes especıficas; e a estabilidade com relacao a pequenasvariacoes.

Porem, o que ocorre geralmente em problemas de engenharia termica e que a fonte de calor nao seencontra disponıvel, o que leva os pesquisadores a abordarem o problema de transferencia de calora partir de outra metodologia. Assim surgem os chamados problemas inversos, que pertencem auma classe interessante e comum de problemas que sao matematicamente ditos “mal postos”, poisnao atendem aos tres requisitos mencionados anteriormente para problemas diretos. Os problemasinversos de transferencia de calor podem ser considerados como uma classe especial dentro dastecnicas de problemas inversos. Basicamente ele faz uso de temperaturas medidas experimentalmentee da equacao de difusao de calor para estimar algum parametro termico desconhecido. Esteparametro termico desconhecido pode ser: as propriedades termicas de um material, o coeficiente detransferencia de calor por conveccao ou o fluxo de calor.

Assim, para o processo de torneamento analisado neste trabalho, a metodologia consiste emse estimar o fluxo de calor na interface cavaco-ferramenta a partir da observacao da evolucaoexperimental da temperatura em regioes acessıveis da ferramenta de corte durante um processode usinagem. A distribuicao de temperatura sera calculada a partir da estimativa do aporte decalor fornecida pela tecnica inversa e de um modelo termico tridimensional baseado no problemaexperimental. Desta forma uma revisao bibliografica se faz necessaria para que se possa compreendere estabelecer o problema termico de usinagem e, alem disso, conhecer o que vem sendo desenvolvidonessa area de pesquisa e como esse trabalho podera somar para o setor cientıfico e industrial.

1.1 Revisão bibliográfica

A Figura 1 apresenta a localizacao deste trabalho dentro das areas de pesquisa da engenhariamecanica.

Figura 1. Fluxograma simplificado das areas da engenharia mecanica que sao tema deste trabalho.

Page 40: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Problemas Inversos em Transferência de Calor 25

A partir da Figura 1 e possıvel verificar que o foco deste trabalho esta relacionado a duas grandesareas da engenharia mecanica: a fabricacao e a termica. Os estudos sao conduzidos a partir dodesenvolvimento de modelos matematicos, simulacao numerica, estudo de tecnicas de problemasinversos em transferencias de calor e medicao experimental da temperatura no processo de usinagempor torneamento. Assim, inicialmente, esta revisao bibliografica apresenta um estudo sobre metodosnumericos para a solucao do problema termico de usinagem por torneamento.

Dentre os trabalhos que utilizam a metodologia numerica para a solucao de problemas termicos,destacam-se: Lazoglu & Altintas (2002); Dessoly et al. (2004); Grzesik et al. (2004); Jie & Kevin(2007); Dinc et al. (2008) que resolvem a equacao da difusao de calor a partir de softwares comerciais.Tais trabalhos abordam o problema termico de usinagem partindo do conhecimento da causa (a taxade transferencia de calor) para determinar seus efeitos (a variacao de temperatura na amostra). Naliteratura esse tipo de problema e definido como problema direto. No entanto, quando apenas osefeitos sao conhecidos, torna-se necessario o uso de problemas inversos para definir as causas.

A partir da analise de outros trabalhos, verifica-se que diversas tecnicas podem ser aplicadas paraa solucao de problemas inversos, por exemplo: tecnicas baseadas em filtros passa-baixa, tecnicas quevisam encontrar o zero de uma funcao e tecnicas baseadas em controle de sistemas mecanicos.Alem dessas metodologias, outros trabalhos fazem uso de tecnicas de otimizacao para a solucaode problemas inversos em transferencia de calor. Neste caso, o objetivo consiste em encontrar omınimo ou maximo de funcoes. Citam-se como exemplos os metodos de Fibonacci e da Secao Aureausados para minimizacao de funcoes de uma unica variavel. Alem disso, tem-se os Metodos Powell,Simulated Annealing, Gradiente Conjugado e da Descida Maxima usados na minimizacao de funcoesde mais de uma variavel.

Utilizando algumas dessas tecnicas de otimizacao acopladas a modelos termicos algunspesquisadores vem conseguindo resultados interessantes. Lima (2001); Carvalho (2003); Carvalhoet al. (2005); Woodbury et al. (2007) fazem uso de modelos termicos, tridimensionais transientese de tecnicas de otimizacao – Simulated Annealing, Golden Section e Algoritmos Geneticos – paraestimar o fluxo de calor na interface de corte. Os campos termicos sao comparados a temperaturasexperimentais e apresentam boa concordancia.

Alem dos metodos apresentados anteriormente, ressalta-se ainda que diversos autores fazem usode metodos experimentais para estudar os campos termicos desenvolvidos no processo de usinagem.Dentre os trabalhos analisados, citam-se: Almeida et al. (2006); Naves et al. (2006); Evangelista Luiz(2007).

O presente trabalho faz uso do algoritmo computacional desenvolvido por Carvalho et al. (2005)para a analise termica de um processo de usinagem por torneamento. Inicialmente, a partir deum experimento controlado, propoe-se um estudo sobre tecnicas inversas: Secao Aurea, SimulatedAnnealing, Funcao Especificada e Observador Dinamico Baseado em Funcoes de Green. Conhecidasas vantagens e desvantagens de cada tecnica, sera escolhida uma delas para ser aplicada na analisetermica do processo de torneamento. O objetivo consiste em estimar o fluxo de calor na interfacecavaco-ferramenta e definir os campos de temperatura tridimensional em uma ferramenta de aco-rapido. Propoe-se ainda uma analise da influencia dos parametros de corte (avanco, profundidade evelocidade de corte) na temperatura da interface cavaco-ferramenta. Por fim, os resultados obtidosserao comparados ao metodo experimental do termopar ferramenta-peca conforme Evangelista Luiz(2007). Ressalta-se que os testes experimentais foram conduzidos a partir de uma parceria entre oLaboratorio de Transferencia de Calor e Massa (LTCM) e o Laboratorio de Ensino e Pesquisa emUsinagem (LEPU), ambos da Universidade Federal de Uberlandia (UFU).

2. Problema Direto: Descrição do Modelo Físico e Matemático

2.1 Discretização do modelo térmico

O problema fısico consiste na analise do processo de transferencia de calor tridimensional transienteem uma ferramenta de corte. O objetivo e determinar a distribuicao de temperatura na ferramentaa partir de informacoes do fluxo de calor gerado na interface de corte conforme apresentado naFigura 2.

O problema termico apresentado na Figura 2 pode ser descrito pela equacao da difusao de calor3D transiente, ou seja,

∂x

(λ∂T

∂x

)+

∂y

(λ∂T

∂y

)+

∂z

(λ∂T

∂z

)= ρC

∂T

∂t(1)

Page 41: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

26 Santos et al.

(a) Ferramenta de aco-rapido. (b) Modelo fısico da ferramenta.

Figura 2. Esquema representativo do modelo termico.

Observa-se na Figura 2 que a maior parte da superfıcie da ferramenta esta exposta ao meioambiente. A unica regiao nao exposta ao meio (area de contato cavaco-ferramenta) esta sujeita ao

fluxo de calor q′′(x, y, t) na regiao identificada pela area Aq(x, y).

As condicoes de contorno impostas ao problema podem ser representadas por

− λ∂T

∂η= h(T − T∞) (2)

nas regioes expostas ao meio e

− λ∂T

∂η= q

′′(x, y, t) (3)

na interface definida por Aq(x, y), onde η representa a normal para fora nas coordenadas x, y e z, Ta temperatura, T∞ a temperatura ambiente, λ a condutividade termica, ρC o produto da massaespecıfica versus calor especıfico e h o coeficiente medio de transferencia de calor por conveccao.Como condicao inicial adotou-se:

T (x, y, z, 0) = T0 (4)

onde T0 representa a temperatura inicial da ferramenta.Neste trabalho propoe-se a solucao da Equacao 1 a partir do metodo dos volumes finitos inteiros,

com formulacao implıcita e malha irregular co-localizada (Maliska, 2004). As propriedades termicassobre as faces da celula foram interpoladas de maneira pertinente conforme sugerido por Patankar(1980).

Assim, conhecido o modelo numerico da equacao da difusao, apresentam-se na sequenciametodologias para a solucao do problema inverso em transferencia de calor.

3. Problema Inverso em Transferência de Calor

Uma grande dificuldade existente na solucao de problemas inversos em transferencia de calor residena validacao da tecnica usada. Esta dificuldade e inerente ao problema, uma vez que a validacaodo fluxo termico estimado exige o conhecimento previo do fluxo experimental. Observa-se que emproblemas inversos reais, como o de usinagem, o fluxo de calor experimental nao e conhecido. Assim,para a validacao e analise de tecnicas inversas, uma alternativa e a realizacao de um experimentocontrolado, no qual sao medidos na pratica o fluxo de calor e a temperatura. Posteriormente,essas grandezas sao comparadas com seus respectivos valores estimados para cada tecnica inversamencionada anteriormente. A partir deste procedimento, torna-se possıvel identificar as vantagense desvantagens de cada tecnica e por fim selecionar a mais apropriada para a solucao do problematermico de usinagem.

A Figura 3 apresenta a comparacao entre o fluxo de calor experimental e estimado a partir detecnicas inversas, considerando como caso teste um experimento controlado (Santos, 2008). Verifica-

se que foram avaliadas quatro metodologias inversas: a tecnica de otimizacao da Secao Aurea comaproximacao polinomial cubica – GS – (Vanderplaats, 1984), a tecnica de otimizacao do SimulatedAnnealing – SA – (Carvalho et al., 2005), o metodo da Funcao Especificada Sequencial (Beck et al.,1985) e a metodologia inversa baseada em Observadores Dinamicos e em Funcoes de Green (Souza,2006).

Page 42: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Problemas Inversos em Transferência de Calor 27

Figura 3. Comparacao entre o fluxo de calor experimental e estimado a partir das tecnicas inversas.

Nota-se que todas apresentaram resultados satisfatorios na estimativa do fluxo de calor, o quepode ser confirmado por meio da analise da Figura 4, na qual sao apresentados os resıduos entre ofluxo de calor experimental e estimados a partir das tecnicas inversas.

Figura 4. Resıduo entre o fluxo de calor experimental e os estimados pelas tecnicas.

A Tabela 1, por sua vez, define o ranking das tecnicas inversas baseado na analise do resıduomedio entre o fluxo experimental e estimado.

Tabela 1. Ranking das tecnicas inversas baseado na analise do resıduo medio entre o fluxo de calor experimentale estimado.

Ranking Tecnica Inversa Resıduo Medio Figura 4 [ Wm2 ]

1 Simulated Annealing (SA) 130,10

2 Secao Aurea (GS) 138,103 Funcao Especificada Sequencial (Func-Esp) 244,704 Observadores Dinamicos (Obser-Din-Green) 297,37

A partir da analise da Figura 4 e da Tabela 1, verifica-se que a tecnica que apresenta omenor resıduo e a do Simulated Annealing (SA), seguidas pela Secao Aurea, Funcao Especificada eObservadores Dinamicos.

Outra analise realizada foi com relacao ao tempo computacional para solucao de cada tecnicainversa. A Tabela 2 apresenta os resultados obtidos a partir de um computador Pentium 4, 3.0 GHze 1Gb de memoria RAM.

No Simulated Annealing e Secao Aurea o tempo computacional e atribuıdo ao criterio de paradada tecnica de otimizacao e a solucao do problema direto. Neste caso, o fluxo de calor e estimadoindividualmente, a cada instante de aquecimento, usando como criterio de parada uma funcao

Page 43: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

28 Santos et al.

Tabela 2. Tempo computacional para a solucao de cada tecnica inversa.

Ranking Tecnica Inversa Tempo [min]

1 Funcao Especificada Sequencial eObservadores Dinamicos 2

2 Secao Aurea (GS) 363 Simulated Annealing 37

mınimos quadrados baseada em temperaturas experimentais e calculadas e 12 solucoes do problemadireto. Dessa forma, para estimar o comportamento do fluxo de calor, conforme apresentado naFigura 3, foram realizadas aproximadamente 1500 solucoes do problema direto. Destaca-se que ouso de tais tecnicas permite ao usuario encontrar um perfil otimizado para o fluxo de calor, com menorresıduo, quando comparado ao valor experimental (Tabela 1). No entanto, a solucao e associada aalto custo computacional conforme indicado na Tabela 2.

Tecnicas de problemas inversos como a Funcao Especificada Sequencial e Observadores Dinamicosse baseiam em resolver o problema direto apenas 1 vez, e minimizar uma funcao mınimos quadradosa partir de conceitos de transferencia de calor, funcoes de Green, sistemas dinamicos e filtrospassa banda. Em ambas as tecnicas, o criterio de parada e baseado no numero de sensores detemperatura e passos de tempo de aquecimento. Tais caracterısticas reduzem substancialmente ocusto computacional, conforme apresentado na Tabela 2, no entanto, aumentam o resıduo medio naestimativa do fluxo de calor (Tabela 1).

Alem da comparacao entre os tempos computacionais e resıduos em relacao aos dadosexperimentais, pode-se mencionar tambem a dificuldade de implementacao e de ajuste dosparametros de cada tecnica de acordo com o ranking apresentado nas Tabelas 3 e 4.

Tabela 3. Dificuldade de implementacao das tecnicas inversas.

Ranking Tecnica Inversa

1 Observadores Dinamicos2 Simulated Annealing3 Funcao Especificada Sequencial

4 Secao Aurea

Tabela 4. Dificuldade de ajuste de parametros para a solucao inversa.

Ranking Tecnica Inversa

1 Simulated Annealing2 Observadores Dinamicos3 Funcao Especificada Sequencial

4 Secao Aurea (GS)

A partir da analise das Tabelas de 1 a 4, verificou-se que todas as tecnicas inversas foram eficientesna solucao do problema inverso. Alem disso, destaca-se que a tecnica do Simulated Annealing foia que apresentou os melhores resultados, no entanto, com um alto custo computacional, grau dedificuldade de implementacao moderada e alta dificuldade para ajuste de parametros.

Uma vez realizada a analise de todas as tecnicas, foram levantadas as seguintes conclusoes:

• Todas as tecnicas podem ser utilizadas para experimentos simples, bem controlados e compouco ruıdo;

• As tecnicas da Secao Aurea e do Simulated Annealing sofrem forte influencia de ruıdos no sinalexperimental da temperatura;

• A tecnica da Secao Aurea e a do Simulated Annealing apresentam um alto custo computacionalquando comparadas as tecnicas da Funcao Especificada Sequencial e dos ObservadoresDinamicos Baseados em Funcoes de Green;

• Comparando-se o fluxo de calor estimado pelas tecnicas da Funcao Especificada Sequencial edos Observadores Dinamicos, conclui-se que ambas conseguiram estimar de forma satisfatoriao fluxo experimental;

Page 44: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Problemas Inversos em Transferência de Calor 29

• Ajustar os parametros de recozimento do Simulated Annealing e uma tarefa complexa que podelevar horas de trabalho.

Assim, a partir do disposto anteriormente, conclui-se que a tecnica escolhida para a solucaoinversa do problema termico de usinagem deve aliar as seguintes caracterısticas:

• Baixo nıvel de dificuldade de implementacao computacional;

• Facilidade de ajuste dos parametros iniciais para a simulacao;

• Custo computacional reduzido;

• Sofrer pouca influencia de ruıdos no sinal experimental da temperatura;

Por meio de tais informacoes, conclui-se que, dentre as tecnicas analisadas, a unica que aliatodos esses quesitos e a da Funcao Especificada Sequencial proposta por Beck et al. (1985), sendoesta, portanto, a metodologia inversa aplicada na solucao do problema termico de usinagem portorneamento. Mais detalhes podem ser encontrados em Santos (2008).

No metodo da Funcao Especificada Sequencial uma funcao q(t) e assumida para os tempos futuros(tm+1, tm+2, ...., tM+r−1) sendo que, para t < tM , o fluxo de calor e conhecido. r representa o numerode tempos futuros no qual as componentes de fluxo de calor sao consideradas temporariamenteiguais. As componentes de fluxo de calor sao calculadas sequencialmente, de acordo com a funcaoespecificada (constantes, segmentos lineares, parabolicos, cubicos ou exponenciais). O criterio deparada do metodo e baseado no numero de sensores de temperatura e passos de tempo nos quaisse deseja calcular o fluxo de calor. No procedimento de calculo e necessario fornecer temperaturasexperimentais e a sensibilidade do modelo termico. Neste trabalho, adotou-se convenientemente umfuncao constante para os tempos futuros r. Estimado o fluxo de calor para um determinado passode tempo M , este e incrementado, e o procedimento e repetido para os tempos subsequentes (Becket al., 1985).

4. Análise Térmica do Processo de Usinagem por Torneamento

Na montagem da bancada experimental, para analise do processo de usinagem, utilizou-se um tornomecanico convencional IMOR MAXI – II – 520 – 6CV. As temperaturas experimentais foram medidaspor meio de um sistema de aquisicao de dados HP 75000 Series B com voltımetro E1326B, comandadopor PC, no qual foram conectados cinco termopares do tipo T. Estes foram tambem posicionadosnas faces inferior e superior da ferramenta por meio do metodo da descarga capacitiva (Carvalhoet al., 2005). A Figura 5 apresenta em detalhes o posicionamento dos termopares na ferramenta decorte e as dimensoes da ferramenta de corte de aco-rapido.

(a) Termopares fixados a ferramenta a partir dometodo da descarga capacitiva.

(b) Dimensoes da ferramenta de corte de acordo como sistema de coordenadas apresentado na Figura 2b.A espessura da ferramenta e 9,5 mm.

Figura 5. Posicionamento dos termopares na ferramenta de corte e as dimensoes da ferramenta de corte deaco-rapido.

A Tabela 5, por sua vez, indica as coordenadas dos termopares de acordo com o eixo decoordenadas apresentado na Figura 2b.

Page 45: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

30 Santos et al.

Tabela 5. Posicao dos termopares na ferramenta.

Posicao/Termopar 1 2 3 4 5

x [mm] 0,61 2,70 0,0 3,30 2,00y [mm] 7,20 8,50 9,0 7,00 3,40z [mm] 0,0 0,0 5,0 9,50 9,50

Com relacao ao material usinado, foram usados corpos-de-prova de aco de corte facil com baixocarbono ao chumbo ABNT 12L14.

A ferramenta de corte, por sua vez, e de aco-rapido AISI M32 C com 10 % de cobalto. Demaisinformacoes sobre a ferramenta e o corpo de prova podem ser encontradas em Evangelista Luiz(2007).

Realizaram-se, no total, 41 experimentos com barras de aco de corte facil com diametro de 50,2mm. O tempo total de aquisicao da temperatura foi de 168 s, com um intervalo de medicao de 0,112s. Na Figura 6 apresenta-se um esquema da bancada experimental.

Figura 6. Esquema da bancada experimental.

Para avaliar a influencia das condicoes de usinagem – profundidade de corte, avanco e velocidadede corte (rotacao) – na temperatura da interface cavaco-ferramenta foram realizados testes conformeas Tabelas de 6 a 8.

Tabela 6. Profundidade de corte variavel e demais propriedades constantes:V c = 56 m/mim e f = 0, 138 mm/rot .

Unidade [mm]

Profundidade de corte (ap) 0,5 1,0 1,5 2,0

Tabela 7. Avanco variavel e demais propriedades constantes: Vc = 56 m/mim e ap = 1, 0 mm.

Unidade [mm/rot]

Avanco (f ) 0,138 0,162 0,176 0,204 0,242 0,298

Tabela 8. Velocidade de corte (rotacao) variavel e demais propriedades constantes: f = 0, 138 mm/rot eap = 1, 0 mm.

Unidade [mm/rot]

Velocidade de 4,4 7,1 8,8 11,2 14,2 17,7 22,1 28,4 35,3 44,2 56 88,3 112 142Corte (V c)

Conhecidos os parametros de corte, uma das maiores dificuldades na solucao do problema termicode usinagem reside na identificacao correta da area de contato cavaco-ferramenta (Santos, 2008). Naliteratura e possıvel encontrar alguns metodos relacionados a determinacao desta interface de contato,

Page 46: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Problemas Inversos em Transferência de Calor 31

como, por exemplo, o uso de softwares de analise de imagens (Jen & Gutierrez, 2000) ou tecnicasde aplicacao de camadas (Yen & Wright, 1986). No presente trabalho, optou-se por medir a largura(L) e a altura (H) da area de contato (A=HxL), apos a execucao do corte, conforme apresentadona Figura 7. Detalhes envolvendo a metodologia e dados experimentais podem ser encontrados emSantos (2008).

Figura 7. Identificacao da area de contato cavaco-ferramenta para a condicao de corte: ap = 1, 0 mm, f = 0, 138mm/rot e V c = 56 m/mim.

Assim, a partir do sinal experimental da temperatura e do modelo termico apresentado naEquacao 1, aplicou-se a tecnica inversa da Funcao Especificada Sequencial para estimar o fluxode calor na interface cavaco-ferramenta. Destaca-se o uso de duas metodologias para simular o fluxode calor na interface de corte: na primeira, adotou-se uma taxa de transferencia de calor uniformeq(t). Na segunda, considerou-se uma taxa exponencial conforme a Equacao 5.

q(t) = qa.exp

(− 1

(lx)2

).

(x−xo

)2

+

(− 1

(ly)2

).

(y−yo

)2

(5)

Na Equacao 5 as variaveis x e y definem as coordenadas da area de contanto, qa permite ajustara amplitude maxima da taxa de transferencia de calor na area de contato a cada instante deaquecimento, lx e ly ajustam as dimensoes da area de contato e x0 e y0 definem o ponto de maioramplitude na area.

No modelo termico, considerou-se a condutividade (λ) e a difusividade termica (α) da ferramentade corte (aco-rapido AISI M32 C, com 10% de cobalto) variando com a temperatura, conformeapresentado na Tabela 9.

Tabela 9. Propriedades termicas da ferramenta variando com a temperatura. Santos (2008).

Faixa de 0 ≤ T ≤ 400 T > 400Temperatura [oC]

Condutividade 0, 0105T + 23, 8 −0, 005T + 30Termica [W/mK]

Difusividade −5, 03x10−10T + 7, 02x10−6 −5, 94x10−9T + 9, 19x10−6

Termica [m2/s]

Na sequencia, a Figura 8 mostra a taxa de transferencia de calor e a Figura 9 a variacao mediade temperatura na interface cavaco-ferramenta calculada para a seguinte condicao de corte: avancode 0, 138mm/rot, velocidade de corte de 142m/min (rotacao de 900 rpm) e profundidade de cortede 1,0 mm (no raio).

Analisando-se as Figuras 8 e 9, verifica-se que, no ultimo instante de aquecimento, a taxa detransferencia de calor foi de aproximadamente 15 W, o que corresponde a uma temperatura mediana interface de corte de 621C. Evangelista Luiz (2007), usando o metodo termopar ferramenta-peca, relata temperaturas medias na interface de corte de aproximadamente 620C. Trent (1984),por sua vez, comenta que a temperatura media na interface cavaco-ferramenta para ferramenta deaco-rapido com baixo carbono varia de 600C a 800C. Conclui-se, portanto, que os resultadosobtidos neste trabalho estao em conformidade com dados experimentais e parametros previstos naliteratura cientıfica.

Page 47: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

32 Santos et al.

Figura 8. Taxa de transferencia de calor estimada considerando calor uniforme e Equacao 5.

Figura 9. Temperatura media na interface de corte calculada a partir da taxa de transferencia de calor uniformee Equacao 5.

Na Figura 10 apresenta-se o resıduo entre a temperatura experimental e calculada a partir dacada metodologia. Verifica-se que em ambos os casos houve boa concordancia entre as temperaturascalculadas e experimentais. Contudo, nota-se menor resıduo com a adocao de fluxo de calorexponencial (Equacao 5) na interface cavaco-ferramenta.

Figura 10. Resıduo entre a temperatura experimental e calculada a partir das Equacoes 5 e 6.

Page 48: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Problemas Inversos em Transferência de Calor 33

Para uma analise mais detalhada dos campos termicos desenvolvidos na ferramenta de corteconsiderando o fluxo de calor uniforme e exponencial, apresenta-se na Figura 11 uma visualizacaotridimensional da temperatura no ultimo instante de aquecimento (57s).

Figura 11. Distribuicao tridimensional da temperatura: (a) na ferramenta de corte; (b) na interface de cortepara fluxo de calor uniforme; (c) na interface de corte para fluxo de calor exponencial (Equacao 5).

Comparando tais resultados com outros encontrados na literatura, dentre eles o de Dearnley(1983), verifica-se que as isotermas em um processo de usinagem real tendem a se comportar conformeapresentado na Figura 11c, ou seja, a temperatura maxima na area de contato se apresenta a umadeterminada distancia da aresta principal de corte. Portanto, considera-se neste estudo o uso dofluxo de calor exponencial (Equacao 5) mais apropriado para a simulacao do problema termico deusinagem por torneamento.

No que diz respeito a tecnica inversa da Funcao Especificada Sequencial, ressalta-se o baixıssimocusto computacional e a facilidade de ajuste da mesma para realizar a solucao inversa com fluxouniforme ou exponencial. Basicamente o ajuste consiste em calcular previamente a sensibilidade domodelo termico para cada situacao. A sensibilidade, por sua vez, e calculada a partir da solucao doproblema termico. Para o caso de fluxo uniforme, a sensibilidade e obtida aplicando-se um fluxo decalor de valor unitario e constante na area de contato cavaco-ferramenta. Para fluxo exponencial, oproblema termico e novamente resolvido, considerando, no entanto, fluxo unitario com distribuicaoexponencial na area de contato cavaco-ferramenta. As temperaturas calculadas para cada caso saointerpretadas como a sensibilidade do modelo termico da ferramenta de corte para cada situacao.

As Figuras de 12 a 14 apresentam a temperatura na interface cavaco-ferramenta em funcao davariacao da profundidade de corte, avanco e velocidade de corte, conforme as condicoes de cortedefinidas nas Tabelas 6 a 8, respectivamente. Verifica-se que o aumento das condicoes de corte induzno aumento da temperatura na interface cavaco ferramenta. Ressalta-se que os resultados obtidosno processo de simulacao sao comparados aos valores obtidos por Evangelista Luiz (2007) a partirdo metodo experimental do termopar ferramenta-peca.

Para a variacao da profundidade de corte, Figura 12, houve uma diferenca significativa entre astemperaturas calculadas e medidas por Evangelista Luiz (2007)). Alem disso, nota-se que, com oauxılio da funcao exponencial, as temperaturas tendem a se aproximar daquelas medidas por meiodo metodo do termopar ferramenta-peca.

Na Figura 13, por sua vez, verificou-se um desvio maximo de 142C entre as temperaturascalculadas e medidas por Evangelista Luiz (2007), o que representa um desvio de aproximadamente

Page 49: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

34 Santos et al.

Figura 12. Temperatura na interface de corte considerando a profundidade de corte (ap) variavel e:V c = 55, 98m/min e f = 0, 138mm/rot.

32% quando se compara as temperaturas calculadas com aquelas medidas pelo termopar ferramenta-peca. Neste caso o uso da funcao exponencial nao induziu em diferencas significativas na solucao doproblema inverso.

Figura 13. Temperatura na interface de corte considerando o avanco (f) variavel e: V c = 55, 98m/min eap = 1, 0mm no diametro.

Analisando-se a Figura 14, em baixas velocidades de corte ha uma diferenca significativa entreas temperaturas calculadas e aquelas medidas a partir do metodo do termopar ferramenta-peca.O resıduo maximo encontrado foi de 111, 7%, o que representa um erro de aproximadamente 29%entre as temperaturas calculas e aquela medida por Evangelista Luiz (2007). Com o uso da funcaoexponencial (Equacao 5) e o aumento das condicoes de corte, verifica-se uma maior proximidadeentre os resultados calculados pelo metodo inverso e aqueles medidos com o metodo do termoparferramenta-peca.

E importante destacar que a metodologia numerica adotada neste trabalho e aquela propostapor Evangelista Luiz (2007), baseada no metodo do termopar ferramenta-peca, possuem fontes deerros que podem influenciar nos resultados apresentados e tambem justificar as diferencas entreos resultados obtidos. Com relacao as fontes de erro presentes na simulacao do processo detransferencia de calor na ferramenta de corte, podem-se destacar as seguintes: as imprecisoesna geometria do modelo matematico, as simplificacoes adotadas, a dificuldade de se identificarcorretamente as propriedades termicas da ferramenta, imprecisoes e limitacoes da tecnica inversaescolhida, a real influencia da conveccao termica entre o modelo e o meio, a incerteza e os ruıdos nastemperaturas experimentais e a incertezas relacionadas a correta identificacao da areas de contatocavaco-ferramenta para cada condicao de corte.

Ressalta-se que a funcao exponencial, aqui proposta, para a area de contato da ferramenta-pecae apenas uma sugestao. Propoe-se que em trabalhos futuros, uma pesquisa mais aprofundada e que

Page 50: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Problemas Inversos em Transferência de Calor 35

Figura 14. Temperatura na interface cavaco-ferramenta, considerando a (V c) variavel e: ap = 1, 0mm nodiametro e f = 0, 138mm/volta.

novos testes sejam realizados para confirmar e validar seu uso na solucao de problemas termicosenvolvendo o processo de torneamento.

5. Conclusões

Neste trabalho, apresenta-se um estudo interdisciplinar envolvendo duas grandes areas da engenhariamecanica: transferencia de calor e processos de fabricacao. Assim, com base nos conhecimentodestas duas areas, foi desenvolvido um novo algoritmo computacional para resolver problemas detransferencia de calor aplicados a processos de fabricacao, com foco no processo de usinagem portorneamento. E importante destacar que este algoritmo foi implementado no software INV 3D,idealizado e desenvolvido por Carvalho et al. (2005) no Laboratorio de Transferencia de Calor eMassa e Dinamica dos Fluidos (LTCM) da Universidade Federal de Uberlandia (UFU).

Com relacao as simulacoes realizadas, preocupou-se em otimizar ao maximo o modelo numericoproposto a partir de analises envolvendo a malha numerica, custo computacional, convergenciado solver aplicado na solucao do sistema linear (S.O.R), qualidade dos resultados numericos epossıveis fontes de erros de modo a obter uma relacao custo-benefıcio que garanta a eficiencia e aqualidade dos resultados obtidos. Alem disto, nos experimentos realizados neste trabalho, procurou-se tambem minimizar ao maximo as fontes de erros experimentais, tomando-se todos os cuidados eprocedimentos necessarios como pode ser identificado em Santos (2008).

No que tange os efeitos termicos estudados, foi possıvel calcular e analisar a distribuicaode temperatura tridimensional no modelo termico de usinagem, bem como na interface cavaco-ferramenta. As temperaturas calculadas numericamente sao comparadas a dados experimentaiso que permite aumentar a confiabilidade e a credibilidade nos resultados encontrados. Alem datemperatura, estimou-se neste trabalho o fluxo de calor na interface de contato, o que possibilitouuma analise quantitativa da energia termica gerada no processo de usinagem.

Para a estimativa do fluxo de calor foram analisadas e validadas, a partir de um experimentocontrolado, quatro tecnicas inversas: Secao Aurea, Simulated Annealing, Observador Dinamicobaseados em Funcoes de Green e Funcao Especificada Sequencial. Esta analise teve como objetivoselecionar a tecnica mais apropriada para a solucao do problema termico de usinagem. Nestecaso, a metodologia adotada foi a da Funcao Especificada Sequencial baseada nos seguintes fatores:dificuldade de implementacao computacional moderada; facilidade de ajuste dos parametros para asimulacao; baixo custo computacional; baixa influencia de ruıdos experimentais.

Quanto ao processo de usinagem, este trabalho contribuiu para aprofundar os estudos sobreos efeitos termicos desenvolvidos durante o torneamento e, alem disso, proporcionou uma analiseda influencia das condicoes de corte (velocidade de corte, avanco e profundidade de corte) natemperatura gerada na interface cavaco-ferramenta. Analisando-se os resultados obtidos, verificou-seque, conforme definido na literatura, a temperatura na interface de corte aumenta com o aumento dascondicoes de corte. Ressalta-se que os resultados deste trabalho nao se ajustam perfeitamente aquelesapresentados por Evangelista Luiz (2007), a partir do uso do metodo experimental do termoparferramenta-peca. Atribui-se este fato as possıveis fontes de erro de cada metodologia que teminfluencia direta nos resultados obtidos. Diante disto, verifica-se que nenhuma tecnica existente

Page 51: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

36 Santos et al.

ate o momento pode ser universalmente aceita como absoluta, o que na verdade existe sao tentativasde se entender os pontos fundamentais do processo de transferencia de calor durante a usinagem portorneamento, pois, julga-se que o entendimento e o passo mais proximo da capacidade de se prevero desempenho deste processo de fabricacao (Machado & Silva, 2004).

Agradecimentos

Os autores agradecem a CAPES, CNPq e FAPEMIG pelo apoio financeiro.

ReferênciasAlmeida, D.O.; Naves, V.T.G.; Machado, A.R. & Silva, M.B., Influencia da direcao de aplicacao do fluido de corte na

temperatura da interface cavaco-ferramenta. Anais do COBEF-Congresso Brasileiro de Engenharia de Fabricacao,2006.

Beck, J.; Blackwell, B. & Clair, C.S., Inverse Heat Conduction: Ill-posed Problems. New York, USA: Wiley-IntersciencePublication, 1985.

Carvalho, S., Determinacao da Temperatura na Interface Cavaco-Peca-Ferramenta Durante o Processo de Usinagempor Torneamento. PhD thesis, Faculdade de Engenharia Mecanica, Universidade Federal de Uberlandia, MG,Brasil, 2003.

Carvalho, S.; Silva, S.L.; Pinho, F.; Machado, A. & Guimaraes, G., Determinacao da temperatura na interface cavaco-peca-ferramenta durante o processo de torneamento usando a tecnica do Simulated Annealing. 2o COBEF -Congresso Brasileiro de Engenharia de Fabricacao, 2005.

Dearnley, P., New technique for determining temperature distribution in cemented carbide cutting tools. MaterialsScience and Technology, 10:205–214, 1983.

Dessoly, V.; Shreyes, N. & Melkote, C., Modeling and verification of cutting tool temperatures in rotary tool turningof hardened steel. International Journal of Machine Tools and Manufacture, 44:1463–1470, 2004.

Dinc, C.; Lazoglu, I. & Serpenguzel, A., Analysis of thermal fields in orthogonal machining with infraded imaging.Journal of Materials Processing Technology, 98:47–57, 2008.

Evangelista Luiz, N., Usinabilidade do Aco de Corte Facil Baixo Carbono ao Chumbo ABNT 12l14 com DiferentesNıveis de Elementos Quımicos Residuais (cromo, nıquel e cobre). PhD thesis, Faculdade de Engenharia Mecanica,Universidade Federal de Uberlandia, Uberlandia, MG, 2007.

Grzesik, W.; Bartoszuk, M. & Nielonsy, P., Finite difference analysis of the thermal behaviour of coated tools inorthogonal cutting of steels. International Journal of Machine Tools and Manufacture, 44:1451–1462, 2004.

Jen, T.C. & Gutierrez, G., Numerical heat transfer analysis in transient cutting tool temperatures. Proceedings of the34th National Heat Transfer Conference, 2000.

Jie, L. & Kevin, C., On temperatures and tool wear in machining hypereutectic al-si alloys with vortex-tube cooling.International Journal of Machine Tools and Manufacture, 47:635–645, 2007.

Lazoglu, I. & Altintas, Y., Prediction of tool chip temperature in continuous and interrupted machining. InternationalJournal of Machine Tools and Manufacture, 42:1011–1022, 2002.

Lima, F., Modelagem Tridimensional de Problemas Inversos em Conducao de Calor: Aplicacao em Problemas deUsinagem. PhD thesis, Faculdade de Engenharia Mecanica, Universidade Federal de Uberlandia, Uberlandia,MG, 2001.

Machado, A. & Silva, M., Usinagem dos Metais. 8a edicao. Brasil, 2004.

Maliska, C., Transferencia de Calor e Mecanica dos Fluıdos. 2a edicao. Brasil: LTC, 2004.

Naves, V.; Luiz, N.; Machado, A. & Dantas, N., Calibracao de um sistema termopar ferramenta-peca para medicao detemperatura de usinagem. 16o POSMEC - Simposio do Programa de Pos-Graduacao em Engenharia Mecanica,2006.

Patankar, S., Numerical Heat Transfer and Fluid Flow. USA: Hemisphere Publishing Corporation, 1980.

Santos, M., Modelo Termico para a Solucao de Problemas Inversos em Transferencia de Calor com Aplicacao emum Processo de Usinagem por Torneamento. Dissertacao de mestrado, Universidade Federal de Uberlandia,Uberlandia, MG, Brasil, 2008.

Souza, P., Desenvolvimento de uma Tecnica Baseada em Funcoes de Green e Observadores Dinamicos para Aplicacaoem Problemas Inversos. Dissertacao de mestrado, Universidade Federal de Uberlandia, Uberlandia, MG, Brasil,2006.

Vanderplaats, G., Numerical optimization techniques for engineering design. Mc Graw-Hill College, 1984.

Woodbury, K.; Suprasanna, D.; Kevin, C. & Jie, L., Use of evolutionary algorithms to determine tool heat fluxes in amachining operation. 2nd IPDO - International Symposium on Inverse Problems Design and optimization, 2007.

Yen, D. & Wright, P., A remote temperature sensing technique for estimating the cutting interface temperaturedistribution. Journal of Engineering for Industry, 108:252–263, 1986.

Page 52: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Capítulo 4

Inferência de Modelos Utilizando aProgramação Imunológica Gramatical

Heder S. Bernardino∗ e Helio J. C. Barbosa

Resumo: Apresenta-se neste capıtulo a programacao imunologica gramatical, uma tecnica para evolucaode programas que combina um mecanismo de busca inspirado pela teoria da selecao clonal com arepresentacao via evolucao gramatical, que faz uma distincao clara entre o espaco de busca e o espaco desolucoes, oferecendo portanto mais flexibilidade. A tecnica e aplicada ao problema inverso de identificacaode modelos – em forma simbolica – a partir de dados. Exemplos de inferencia de sistemas de equacoesdiferenciais ordinarias sao apresentados.

Palavras-chave: Programacao genetica, Problemas inversos, Identificacao de modelos, Programacaoimunologica gramatical.

Abstract: In this chapter we present the grammar-based immune programming, a technique for evolvingprograms by combining a search mechanism, inspired by the clonal selection theory, with the grammaticalevolution representation which makes a clear distinction between the search and the solution spaces, thusoffering more flexibility. The technique is applied to the inverse problem of model identification – insymbolic form – from data. Examples of the inference of systems of ordinary differential equations arepresented.

Keywords: Genetic programming, Inverse problems, Model identification, Grammar-based immuneprogramming.

Conteúdo

1 Introducao ................................................................................................................................ 382 Inferencia Automatica de Modelos........................................................................................... 38

2.1 Identificacao parametrica................................................................................................. 382.2 Regressao simbolica e identificacao estrutural ................................................................. 382.3 Inferencia de modelos evolutivos...................................................................................... 39

3 Evolucao Gramatical ................................................................................................................ 393.1 Gramatica formal............................................................................................................. 393.2 Evolucao gramatical......................................................................................................... 40

3.2.1 Coeficientes numericos.......................................................................................... 413.3 Avaliacao das solucoes candidatas ................................................................................... 42

4 Programacao Imunologica Gramatical ..................................................................................... 424.1 CLONALG....................................................................................................................... 434.2 Sistemas imunologicos para evolucao de programas ........................................................ 444.3 Programacao imunologica gramatical .............................................................................. 44

5 Experimentos Computacionais ................................................................................................. 445.1 Modelo de reacao quımica................................................................................................ 465.2 Modelo da equacao de fertilidade para dois alelos ........................................................... 465.3 Modelo de rede de regulacao genica................................................................................. 47

6 Conclusao ................................................................................................................................. 49

∗Autor para contato: [email protected]

Lobato et al. (Ed.), (2014) DOI: 10.7436/2014.tica.04 ISBN 978-85-64619-15-9

Page 53: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

38 Bernardino & Barbosa

1. Introdução

Problemas inversos ocorrem nas mais variadas areas da ciencia e engenharia. Entretanto,simplificacoes sao frequentemente introduzidas no problema de forma a torna-lo tratavel. Porexemplo, a estrutura do modelo pode ser pre-especificada, restando assim a tarefa de determinar seusparametros numericos. Todavia, mesmo com esse tipo de simplificacao, o problema de otimizacaoresultante pode ser complexo o suficiente de modo que tecnicas numericas tradicionais nao sejamaplicaveis. Nesse tipo de situacao, as metaheurısticas em geral, e os algoritmos geneticos emparticular, parecem ser alternativas mais adequadas (Mera et al., 2002).

Explora-se nesse capıtulo a possibilidade de se ir alem da identificacao parametrica. A ideia aquie apoiar o analista na identificacao, a partir de dados observados, nao so de parametros mas tambemda estrutura do modelo. As tecnicas de inteligencia computacional, em particular as de programacaogenetica (Koza, 1992), tem se mostrado promissoras nesta area (Schmidt & Lipson, 2009). O presentetrabalho descreve o algoritmo imuno-inspirado para a evolucao de programas, guiado por gramaticasformais, denominado Programacao Imunologica Gramatical (Bernardino & Barbosa, 2009, 2010a,b,2011; Bernardino et al., 2011; Bernardino, 2012). Este metodo e baseado na tecnica de selecaoclonal conhecida como CLONALG e adota o mapeamento da evolucao gramatical (O’Neill & Ryan,2001, 2003), em que solucoes candidatas, codificadas por cadeias binarias, sao transformadas emprogramas utilizando-se uma gramatica formal.

A programacao imunologica gramatical e aplicada aqui a problemas inversos que visam aidentificacao de sistemas de equacoes diferenciais ordinarias –em forma simbolica– a partir de dados.Experimentos computacionais com problemas da literatura sao apresentados.

2. Inferência Automática de Modelos

2.1 Identificação paramétrica

Simplificacoes sao muitas vezes introduzidas no problema de encontrar um modelo que melhor seajuste a um conjunto de observacoes de modo a torna-lo tratavel. Na identificacao dita parametrica,a estrutura do modelo e pre-especificada pelo analista; por exemplo, f(x) = g(x,a), onde apenasalguns coeficientes a1, a2, . . . , an sao variaveis a serem ajustadas, ou seja, o espaco de busca reduz-sea Rn. Pode-se entao estipular uma medida de erro a ser minimizada, como

Ψ(a) =

(m∑i=1

|yi − g(xi,a1, . . . ,an)|p)1/p

, (1)

onde yi e o valor observado (podendo ser multidimensional) para o registro xi, i = 1, . . . ,m, dosdados fornecidos e p ≥ 1 um parametro.

Observe-se que, ao buscar um modelo que reproduza/explique um conjunto de dados, o que sedeseja na realidade e que este seja capaz de oferecer tambem boas aproximacoes para novos pontosapresentados. Portanto, alem de um modelo acurado em relacao aos dados ditos de treinamento,deseja-se encontrar aquele que generalize para outros casos.

Finalmente, nota-se o papel fundamental do especialista nesse processo, por causa da suaresponsabilidade na escolha da estrutura do modelo. Modelos com baixa acuracia ou quesuperajustem os dados podem ser resultados de escolhas inadequadas na sua forma.

2.2 Regressão simbólica e identificação estrutural

Pode-se esperar mais da inferencia de modelos, de modo que sua capacidade nao esteja limitada aprevisao de resultados sobre novos dados, mas que tambem possibilite a geracao de conhecimentosobre o fenomeno modelado. Isto ocorre na identificacao dita estrutural, onde a forma do modelo naoe pre-especificada. A consequencia obvia e o aumento no “tamanho” e na complexidade do conjuntodas solucoes candidatas do problema.

A inteligencia computacional (IC) vem entao fornecer ferramentas para a inferencia automaticade modelos a partir de dados observados de determinado fenomeno. A expressao regressao simbolicapassa a ser utilizada nos casos em que a estrutura do modelo nao e pre-definida pelo analista, massim construıda, combinando-se estruturas de um conjunto de primitivas. A forma mais comum daregressao simbolica corresponde ao problema de se encontrar a expressao algebrica f(x1, x2, . . . , xn)que melhor relaciona a quantidade de interesse, y, a um conjunto de variaveis independentesobservadas x1, x2, . . . , xn.

Page 54: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Inferência de modelos utilizando a programação imunológica gramatical 39

A Programacao Genetica (PG) e a ferramenta de IC capaz de resolver o problema de regressaosimbolica, agregando tambem conhecimento acerca do fenomeno observado. Como sera visto, aPG pode fornecer conhecimento de forma bem mais legıvel, entendıvel e comunicavel; esse tipo deinformacao e incomum em outras tecnicas de aprendizado de maquina (tais como as redes neuronaisartificiais).

2.3 Inferência de modelos evolutivos

Um conjunto de equacoes diferenciais ordinarias (EDOs) e uma forma de descrever matematicamentecomportamentos que variam ao longo do tempo nas mais variadas areas da ciencia e das engenharias.Neste capıtulo, ha o interesse em inferir um modelo evolutivo na forma de uma EDO, ou seja,encontrar f(x, y) em forma explıcita tal que y′(x) = f(x, y) seja o que melhor representa os dadosobservados (xi, yi), com i = 1, . . . ,m.

A derivacao numericamente dos dados observados para determinar um conjunto de aproximacoesy′i ≈ y′i e uma forma possıvel de tratamento para esse problema. Uma expressao em diferenca centralrequerendo apenas informacoes dos pontos (xi−1, yi−1) e (xi+1, yi+1) pode ser utilizada:

y′i =yi+1 − yi−ixi+1 − xi−1

. (2)

Recai-se assim no caso usual da regressao simbolica.Alternativamente, um modelo evolutivo tambem pode ser avaliado integrando numericamente a

EDO y′ = f(x,y), que corresponde a solucao candidata f(x,y), resultando numa aproximacao y.Assim, a qualidade do modelo pode ser calculada comparando-se y com as observacoes yi.

Mesmo a diferenciacao numerica dos valores observados resultar em menor custo computacional,ja que seu calculo e realizado apenas uma vez, a integracao dos modelos candidatos fornece maisprecisos para os resultados. Considerando o metodo apresentado aqui, modelos mais acurados egeneralizaveis sao encontrados ao adotar a alternativa de integrar os candidatos (Bernardino &Barbosa, 2010a).

Finalmente, nao e difıcil perceber que pode-se abordar tambem o caso em que o modelo a serinferido e um sistema de EDOs. O objetivo passa a ser encontrar as fi(x1, x2, . . . , xn), i = 1, . . . , neq,tais que o sistema de EDOs y′ = f(x1, x2, . . . , xn) seja aquele que melhor se ajuste aos valoresobservados. A abordagem em sistemas de EDOs e importante tambem por permitir inferir EDOsde ordem superior.

3. Evolução Gramatical

A programacao genetica e uma poderosa ferramenta para geracao automatica de programas.Entretanto, os sub-elementos na representacao por arvore devem ter o mesmo tipo, restringindoa PG tradicional e, possivelmente, dificultando sua aplicacao a problemas reais. Essa limitacao podeser resolvida adotando-se a programacao genetica fortemente tipada, em que as operacoes sobre asarvores podem ocorrer desde de que suas sub-estruturas concordem nao somente em numero, mastambem em relacao aos tipos de dados dos parametros de entrada e saıda. Todavia, percebe-se querestricoes mais complexas podem ser uteis para o processo de busca, especialmente nos casos em quea introducao de conhecimento previo sobre o problema diminua convenientemente o espaco de buscae, portanto, aumente as chances de sucesso do metodo.

A sintaxe da linguagem em que e permitido que os programas evoluam pode ser restringida, demodo a aumentar o controle sobre o espaco de busca. Gramaticas formais podem ser utilizadas paraeste fim, impedindo que programas ditos invalidos sejam gerados e aumentando a capacidade da PGde evoluir estruturas complexas (um codigo-fonte, por exemplo), agora delimitado pela sintaxe dalinguagem de programacao requerida.

3.1 Gramática formal

Pode-se definir uma gramatica formal G como (Chomsky, 2002)

G = N,Σ, R, S, (3)

onde N e um conjunto finito de nao-terminais, Σ e um conjunto finito de terminais, R e um conjuntofinito de regras (ou producoes) e S ∈ N e o sımbolo inicial. Enquanto componentes auxiliares dagramatica formam N , Σ e composto por sımbolos que podem aparecer na linguagem: em expressoesaritmeticas, x, sin, 1, e + seriam exemplos de elementos de Σ. Finalmente, no que se refere as

Page 55: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

40 Bernardino & Barbosa

G =N,Σ, R, SN = <expr>,<op>,<uop>,<var>Σ = sin, cos, log, exp,

√, x, y, 1, 2, 3,+,−,×,÷,pow, (, )

S =<expr>

R :

<expr> ::= (<expr> <op> <expr>) | <uop> (<expr>) | <var>

<op> ::= + | − | × | ÷ | pow

<uop> ::= sin | cos | log | exp | √

<var> ::= x | y | 1 | 2 | 3

Figura 1. Exemplo de gramatica formal para expressoes aritmeticas.

gramaticas livres de contexto (normalmente usadas na evolucao de programas), as regras R naforma de Backus-Naur (BNF) podem ser expressas como

<nao terminal> ::= expressao, (4)

onde <nao terminal> ∈ N , expressao = (Σ ∪N)∗ e ∗ e a estrela de Kleene, um operador quepermite a formacao de palavras compostas pelos elementos do conjunto de referencia. Assim, osnao-terminais podem ser expandindos em um ou mais terminais e nao-terminais bem como auto-referenciar-se, gerando uma recursao. Na ocorrencia de varias sequencias em“expressao”, as possıveisescolhas sao delimitadas pelo sımbolo “|”.

A Figura 1 apresenta um exemplo de gramatica livre de contexto para definir expressoes algebricassimples. Algumas possıveis expressoes aritmeticas representaveis por essa gramatica sao ((y−3)×x)e cos(y + x). Vale lembrar que, embora expressoes como tan(x + 3) nao possam ser representadaspela gramatica, pois a sequencia de sımbolos tan nao aparece nos terminais, a expressao (sin(x +3)/ cos(x+ 3)) e perfeitamente valida, sendo a funcao seno representada por sin.

3.2 Evolução gramatical

Apesar da adicao de gramaticas formais gerar mais generalidade, expressividade e aplicabilidade naPG, e possıvel perceber um aumento na complexidade de sua implementacao e uso. Nota-se tambemque o metodo de otimizacao e limitado a procedimentos similares a PG (ou AG), ja que nao hadistincao entre genotipo e fenotipo nas solucoes candidatas. A Evolucao Gramatical (EG), propostapor Ryan et al. (1998) e estendida por O’Neill & Ryan (2001, 2003), foi criada como uma forma dedesconectar a representacao genica do programa em si, mas mantendo a capacidade restritiva dasgramaticas formais.

Na EG, o processo de mapeamento genotipo-fenotipo pode ser decomposto em duas etapas:(i) decodificacao de uma lista de binarios em um vetor de numeros inteiros; e (ii) criacao deum programa, por meio de uma gramatica formal, utilizando o vetor de inteiros previamentedecodificado.

Dessa forma, a lista binaria e uma representacao de um vetor de inteiros codificado utilizando bbits (usualmente, b = 8). Na realidade, a primeira etapa pode ser suprimida utilizando-se diretamenteuma representacao inteira das solucoes candidatas (Hugosson et al., 2007, 2010).

Um programa pode entao ser criado por meio de uma gramatica formal (definida pela Equacao 3)a partir do vetor de numeros inteiros. Cada passo desse processo e realizado selecionando-se umaregra no conjunto de producoes da gramatica atraves da seguinte expressao:

regra = ip mod (nr) ,

onde ip e o proximo numero inteiro na sequencia e nr e o numero de regras do nao-terminal corrente(o primeiro nao-terminal observado numa verificacao da esquerda para a direita).

Um exemplo ilustrativo do processo e apresentado a seguir (extraıdo de (Bernardino, 2012)). Agramatica G mostrada na Secao 3.1 sera adotada mas suas regras de producao R sao re-apresentadase em outro formato para facilitar o entendimento do processo de mapeamento. Cada uma dasproducoes em R foi colocada em uma linha e a direita dessas sao apresentados seus ındices emrelacao ao nao-terminal derivador. Assim, as regras de producao R ficam como na Figura 2.

Page 56: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Inferência de modelos utilizando a programação imunológica gramatical 41

<expr> ::= (<expr> <op> <expr>) (0)

| <uop> (<expr>) (1)

| <var> (2)

<op> ::= + (0)

| − (1)

| × (2)

| ÷ (3)

| pow (4)

<uop> ::= sin (0)

| cos (1)

| log (2)

| exp (3)

| √ (4)

<var> ::= x (0)

| y (1)

| 1 (2)

| 2 (3)

| 3 (4).

Figura 2. Regras de producao R da gramatica ilustrativa.

Nas Figuras 3 e 4, ve-se que a entrada no primeiro passo e o nao-terminal inicial definido nagramatica corrente, S =<expr>. De posse do proximo inteiro (33), verificando-se que o nao-terminalbase (<expr>) possui 3 possibilidades de derivacao e sendo 33 mod (3) = 0, entao (<expr> <op><expr>) e selecionado para substituir o nao terminal base, por ser a possibilidade zero dentre asregras de <expr>. O resultado e criado trocando-se o nao-terminal base (<expr>) pela producaoescolhida na derivacao ((<expr> <op> <expr>)). O resultado de um passo e utilizado comoentrada para o passo seguinte. Sendo a base o primeiro nao-terminal a esquerda encontrado naentrada entao, neste caso, <expr> e o nao-terminal base no segundo passo. Como o proximo inteiroe 29, sendo 3 as possibilidades de derivacao do nao-terminal base (<expr>) e 29 mod (3) = 2, entao<var> e selecionado para substituir o nao terminal base. O procedimento continua enquanto houvernao-terminais no resultado; caso contrario o programa estara completo. Seguindo esse processo, oexemplo conclui gerando o programa x+ (exp (y)).

0 0 1 0 0 0 0 1 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 0 0 0 0 1 0 1 0 0 0 1 0 1 1 0 1 1 ...

33, 29, 10, 20, 91, 32, 92, 66, ...

Figura 3. Exemplo de decodificacao de um genotipo num vetor de inteiros.

Percebe-se que nao e necessario utilizar todos os valores inteiros disponıveis. Apesar dissonao gerar complicacoes, uma outra ocorrencia precisa ser tratada: o mapeamento pode esgotaros numeros inteiros antes que um programa completo seja criado. Uma proposta seria reutilizar osvalores inteiros (wrap-around) a partir do inıcio do cromossomo (O’Neill & Ryan, 2001). A alternativaadotada aqui e reparar o programa durante o mapeamento, sempre gerando solucoes validas, ja quea reutilizacao de valores nao resolve completamente o problema (Bernardino & Barbosa, 2009).

3.2.1 Coeficientes numéricosVarios programas incluem coeficientes numericos entre seus componentes, tornando seu processo decriacao muito importante para a geracao desse tipo de estrutura. A utilizacao de uma gramaticaformal incorpora a EG diversas possibilidades de se tratar essa situacao. Aparentemente nao haconsenso sobre qual a tecnica mais adequada, apesar de alguns trabalhos analisarem varias das

Page 57: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

42 Bernardino & Barbosa

passo entrada regra resultado

1 <expr> 33 mod (3) = 0 (<expr> <op> <expr>)2 (<expr> <op> <expr>) 29 mod (3) = 2 (<var> <op> <expr>)3 (<var> <op> <expr>) 10 mod (5) = 0 (x <op> <expr>)4 (x <op> <expr>) 20 mod (5) = 0 (x + <expr>)5 (x + <expr>) 91 mod (3) = 1 (x + <uop>(<expr>))6 (x + <uop>(<expr>)) 32 mod (5) = 2 (x + exp(<expr>))7 (x + exp(<expr>)) 92 mod (3) = 2 (x + exp(<var>))8 (x + exp(<var>)) 66 mod (5) = 1 (x + exp(y))

Figura 4. Ilustracao do mapeamento do vetor da Figura 3 num programa.

alternativas que existem atualmente (Augusto et al., 2011). Dois metodos sao concomitantementeadotados aqui: o tradicional e o dos mınimos quadrados.

No metodo tradicional (O’Neill & Ryan, 2001), os coeficientes numericos sao criados atraves deoperacoes aritmeticas sobre os valores inteiros pre-fixados. Por exemplo, pode-se gerar o coeficientereal 2,5 com a expressao (5 ÷ 2).

Outra forma de ajustar os coeficientes numericos na EG e adotar uma gramatica que gere funcoes-base sobre as quais aplica-se o metodo dos mınimos quadrados (Bernardino & Barbosa, 2011). Nestecaso, a gramatica deve ser adaptada para mapear uma combinacao linear de expressoes. Por exemplo,atraves da regra de producao

<base> ::= (<base> + <base>) | <expr>

e indicando <base> como o nao-terminal inicial (S =<base>). Ao avaliar um dado programa, asbases sao executadas sobre os dados, formando uma matriz X que e entao utilizada para determinaro vetor de coeficientes a que minimiza o erro quadratico medio em relacao aos valores observadosy. Apenas os coeficientes lineares sao ajustados por meio dessa tecnica. As demais constantes saogeradas aqui por meio do metodo tradicional.

3.3 Avaliação das soluções candidatas

A qualidade com a qual os programas candidatos realizam uma determinada tarefa e medida na etapade avaliacao dos indivıduos. Para isso, cada programa candidato e executado sobre os conjuntos deargumentos de entrada e os valores de retorno sao comparados ao que se e esperado (conhecido).Dessa forma, uma funcao objetivo (a ser minimizada) e a media dos erros ao quadrado, ou seja,

f( programa ) =1

m

m∑i=1

[programa(pi)− yi]2 . (5)

onde m e o numero de pontos, pi ∈ Rn e o i-esimo ponto, “programa” e a funcao/programa codificadapor um indivıduo e yi ∈ R e o valor esperado para o i-esimo ponto.

Como ja mencionado na Secao 2.3, existem duas formas de adequar a Equacao 5: (i) osvalores esperados (y) sao definidos como a diferenciacao dos valores observados; (ii) a execucaodo “programa” resulta na integracao do modelo dinamico.

Como em todo processo de aprendizado automatico, corre-se o risco de se super-ajustar o modeloaos dados e, dessa forma, duas direcoes de busca conflitantes ficam evidentes: (i) maximizar aacuracia, ou seja, minimizar a discrepancia em relacao ao que e esperado; e (ii) minimizar acomplexidade do modelo, assumindo que maior complexidade esta geralmente ligada a ocorrenciade super-ajuste. Nota-se inclusive, que o segundo item tambem esta relacionado a facilidade deinterpretabilidade do modelo. Alem disso, e importante observar que a forma como os programassao mapeados na evolucao gramatical gera um vies na direcao de aumentar a probabilidade de criacaode programas menores.

4. Programação Imunológica Gramatical

A evolucao gramatical dissocia o espaco de busca (binario, inteiro, etc) do de programas, permitindoque diferentes algoritmos de busca possam ser utilizados na criacao de estruturas complexas emuma linguagem arbitraria. Apesar de originalmente adotada em conjunto com os algoritmos

Page 58: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Inferência de modelos utilizando a programação imunológica gramatical 43

geneticos (Ryan et al., 1998), a tecnica adotada aqui utiliza um algoritmo imuno-inspirado combinadocom ideias da EG para evoluir programas (Bernardino & Barbosa, 2009, 2010b).

4.1 CLONALG

O CLONALG (CLOnal selection ALGorithm, ou algoritmo de selecao clonal) foi proposto por Castro& von Zuben (2000, 2002) e imita o princıpio de selecao clonal (Burnet, 1957), de modo que assolucoes candidatas sao melhoradas seguindo as etapas de clonagem dessas solucoes, hipermutacaodas novas celulas geradas e selecao daquelas com maior afinidade em relacao ao antıgeno, ou seja,as melhores solucoes em relacao ao objetivo. E importante ressaltar que as solucoes candidatas saorepresentadas por anticorpos (para simplificar, os linfocitos nao sao considerados) e que a exploracaodo espaco de busca e feita atraves mutacoes aplicadas com uma taxa elevada.

Um pseudo-codigo do CLONALG e apresentado no Algoritmo 1 (extraıdo de (Bernardino, 2012)).Seus parametros de entrada sao: um valor β que define o numero de clones gerados por cadaanticorpo (veja a Equacao 6), um fator ρ responsavel por ajustar a intensidade da hipermutacaoque sera aplicada aos clones (veja a Equacao 7), o tamanho tamanhoPopulacao da populacao desolucoes candidatas anticorpos, a quantidade nAleatorio de anticorpos de menor afinidade quedevem ser substituıdos por novas solucoes aleatoriamente geradas, e o numero nSelecao de anticorposa serem selecionados para a clonagem e re-selecionados na atualizacao da populacao corrente. Ovalor de nAleatorio pode ser tomado como uma fracao do tamanho da populacao, apesar de ter sidoinicialmente proposto como um parametro absoluto.

Algoritmo 1: Pseudo-codigo do CLONALG.

Entrada: β, ρ, tamanhoPopulacao, nAleatorio, nSelecaoSaıda: anticorpos

1 inicio2 anticorpos←− inicializaPopulacao(tamanhoPopulacao);3 afinidades←− avalia(anticorpos);4 enquanto criterio de parada nao e atingido faca5 afinidadesNormalizadas←− normaliza(afinidades);6 selecionados←− seleciona(anticorpos, afinidadesNormalizadas, nSelecao);7 clones←− clona(selecionados, afinidadesNormalizadas, β);8 hipermuta(clones, afinidadesNormalizadas, ρ);9 afinidadesClones←− avalia(clones);

10 substituiPopulacao(anticorpos, afinidades, clones, afinidadesClones, nSelecao,nAleatorio);

O pseudo-codigo utiliza tambem as funcoes que seguem: “inicializaPopulacao”, responsavelpor gerar uma nova populacao de solucoes candidatas (normalmente isso e feito aleatoriamente);“avalia”, avalia as solucoes em relacao a funcao objetivo; “normalize”, normaliza as afinidadesem [0; 1]; “seleciona”, seleciona os anticorpos que serao clonados; “clona”, clona as solucoescandidatas; “hipermuta”, aplica o operador de modificacao (hipermutacao) nos clones gerados;“substituiPopulacao”, atualiza a populacao de anticorpos pela substituicao dos piores nSelectionanticorpos pelos melhores clones gerados e gera nRandom novas solucoes candidatas aleatoriamentetambem substituindo-as na populacao (note que calculos adicionais da funcao objetivo sao necessariosaqui).

O numero de clones nclones gerados pelo anticorpo anticorpoi e definido por

nclones(anticorpoi) = arredonda

(β. |anticorpos|

i

), (6)

onde “arredonda” e um operador que retorna o valor inteiro mais proximo do seu argumento e i e aposicao do anticorpo anticorpoi na lista ordenada (de forma decrescente) pela afinidade normalizada;dessa forma, o primeiro anticorpo da lista corresponde a melhor solucao candidata. Segundo Castro &von Zuben (2002), a hipermutacao e aplicada com uma taxa α proporcional a afinidade do anticorpoque deu origem ao clone clonei, de forma que

α(clonei) = exp(−ρ.fi

), (7)

Page 59: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

44 Bernardino & Barbosa

com fi sendo a afinidade normalizada do anticorpo i correspondente.Uma vantagem do CLONALG e a sua adaptabilidade a diversos tipos de problemas. Um

algoritmo evolutivo, por exemplo, precisa ser equipado com alguma tecnica de nicho quando se desejamanter a diversidade da populacao, enquanto que no CLONALG apenas precisa-se fazer (Castro &von Zuben, 2002):

• nSelection = |antibodies|, ou seja, todos os anticorpos da populacao sao selecionados para oprocesso de clonagem;

• nclones igual para todas as solucoes candidatas;

• a populacao passa a ser atualizada substituindo-se os anticorpos pelo seu melhor clone, quandouma melhora ocorre.

O CLONALG destaca-se principalmente pela manutencao da diversidade de suas solucoescandidatas, facilitando a adaptacao (importante em problemas dinamicos), permitindo uma largaexploracao do espaco e disponibilizando um conjunto de solucoes ao concluir a busca (relevante nocaso de problemas multi-modais).

4.2 Sistemas imunológicos para evolução de programas

As tecnicas imuno-inspiradas nao vem sendo muito exploradas como mecanismo de busca paraprogramas, apesar da popularizacao das tecnicas de PG, especialmente a partir do estudo deKoza (1992). Pode-se citar Johnson (2003), que propos um algoritmo imuno-inspirado pararesolver problemas de regressao simbolica em que as solucoes eram representadas por arvores e,mais recentemente, Musilek et al. (2006), que elaboraram a chamada Programacao Imunologica,posteriormente utilizada por Lau & Musilek (2009). Outras variantes sao a chamada programacaoimunologica elitista, proposta por Ciccazzo et al. (2008) e a programacao por selecao clonalproposta por Gan et al. (2009a,b), em que as solucoes candidatas sao representadas linearmente.Posteriormente, Gan et al. (2010) estenderam a ideia para a representacao via grafos. Finalmente,assim como a PIG, a tecnica proposta por McKinney & Tian (2008) utiliza gramaticas formais paraapoiar a evolucao de programas, diferentemente dos outros metodos imuno-inspirados apresentados,que baseiam-se na forma tradicional da PG. E importante destacar que no metodo proposto porMcKinney & Tian (2008), nao ha separacao entre o espaco de busca e o de solucoes.

4.3 Programação imunológica gramatical

A evolucao de programas auxiliada por gramaticas formais tem se mostrado uma opcao interessantena obtencao de bons resultados, principalmente pela facilidade em conectar a experiencia doespecialista a busca. E possıvel observar tambem que o complexo espaco de busca de programaspossui caracterısticas que tornam o CLONALG uma boa alternativa. Em especial, pode-se destacarque o CLONALG oferece as seguintes vantagens na resolucao dessa classe de problemas (Bernardino,2012): (i) adequacao a espacos de busca complexos; (ii) disponibilizacao de um variado conjuntode solucoes ao final da busca; (iii) natural navegacao em espacos de busca discretos; e (iv) maiorcapacidade de paralelizacao, dada a reduzida quantidade de troca de informacao entre as solucoes.E possıvel verificar tambem que, assim como outras metaheurısticas, o CLONALG requer muitoscalculos da funcao objetivo, o que resulta num alto custo computacional. Todavia, assim como emoutras tecnicas populacionais, essa desvantagem pode ser aliviada com o uso de computacao paralela.

Assim, a programacao imunologica gramatical (Bernardino & Barbosa, 2009, 2010b), ousimplesmente PIG, e um metodo que codifica as solucoes candidatas em codigo de Gray, utilizao CLONALG como mecanismo de busca e adota o mapeamento da EG para gerar programas pormeio de uma gramatica formal. O pseudo-codigo para a PIG e o mesmo apresentado anteriormentepara o CLONALG no Algoritmo 1. A diferenca reside na avaliacao da solucao candidata realizadapelo procedimento “avalia” que, nesse caso, engloba o mapeamento da solucao candidata para umprograma bem como a avaliacao de sua qualidade.

5. Experimentos Computacionais

Nessa secao, tres problemas encontrados na literatura sao utilizados para averiguar a capacidadeda PIG em resolver problemas inversos encontrados na literatura. Busca-se com os experimentoscomputacionais avaliar o desempenho da PIG na inferencia de modelos na forma de um sistemade EDOs a partir de um conjunto de dados observados. Os dados (xk,yk), k ∈ 1, . . . ,m

Page 60: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Inferência de modelos utilizando a programação imunológica gramatical 45

dos experimentos sao artificialmente gerados pela integracao numerica do modelo alvo, com xkigualmente espacado em [x1, xm]. Ruıdos foram introduzidos aos dados de modo que cada valor yikfoi alterado fazendo-se yik = yik × (rg(0, 1)× pruido + 1), onde rg(0, 1) e um numero aleatoriamentegerado com distribuicao gaussiana com media zero e desvio padrao unitario e pruido e a intensidadedo ruıdo. Nos experimentos foram adotados pruido = 0.01, 0.03 e 0.05. As solucoes candidatassao avaliadas comparando-se os dados do problema com os valores calculados pela integracaonumerica dos modelos candidatos utilizando o metodo de Runge-Kutta de quarta ordem com passoh = (b− a)/(m− 1).

De forma geral, a mesma gramatica e utilizada para todos os problemas de inferencia de modelosem forma de sistemas de EDOs. Para cada equacao do sistema, as regras de formacao R dasexpressoes sao dadas por

<base> ::= (+ <base> <base>) | <expr>

<expr> ::= (<op> <expr> <expr>) | <var>

<op> ::= + | − | ×<var> ::= 1 | y1 | y2 | y3.

Nota-se que as regras de producao previamente apresentadas sao suficientes para gerar apenasuma EDO, logo ne mapeamentos sao necessarios para criar o sistema desejado, onde ne e o numerode equacoes do modelo. Alem disso, foi definido que cada linha mapeia uma expressao do sistema,ou seja, as solucoes candidatas sao matrizes binarias (Bernardino & Barbosa, 2011). As gramaticasformais adotadas aqui sao as mesmas definidas por Bernardino & Barbosa (2011).

Verifica-se tambem que a gramatica gera programas na forma de uma combinacao linear de bases eos coeficientes lineares dos modelos devem ser ajustados atraves do metodo dos mınimos quadrados.Para isso, os dados de entrada (com ruıdo) sao diferenciados numericamente (Equacao 2) e esseresultado compoe o sistema linear que completa a definicao do modelo quando resolvido.

As regras de reparo Rr tambem precisam ser especificadas e foram definidas como

(+ <base> <base>) ::= <base> | 1 | y1 |y2 | y3

(<op> <expr> <expr>) ::= <expr> | 1 | y1 |y2 | y3

<base> ::= 1 | y1 |y2 | y3

<expr> ::= 1 | y1 |y2 | y3

Os parametros do algoritmo de busca utilizados aqui sao similares aos atribuıdos em experimentosanteriores: tamanho da populacao= 50, tamanho do vetor de inteiros para cada equacao do sistema=100, nclones = 1, ρ = 5 e nAleatorio = 10% da populacao. Cada experimento foi composto por 30execucoes independentes onde as sementes do gerador de numeros pseudoaleatorios foram inteirosnuma sequencia a partir do zero. Assim como em Bernardino & Barbosa (2011), um orcamento de100.000 calculos da funcao objetivo foi adotado como criterio de parada.

Alem do erro de treinamento, que e computado nos limites [x1, xm], tambem sao fornecidosos erros de teste, calculado sobre 11 pontos igualmente espacados no intervalo estendido E =[xm, xm + 11× h], onde h e o espacamento entre os pontos. E importante destacar que os dadosem E nao sao utilizados durante a evolucao e, assim, o erro de teste funciona como um indicadorda capacidade de generalizacao do modelo. Para os casos em que ha diferentes condicoes iniciais,um unico modelo que atenda a todas elas deve ser inferido; para isso, os modelos candidatos saoavaliados considerando todos os dados de todos os valores iniciais.

Uma tabela apresentando o melhor valor de erro bem como sua mediana, media, desvio padrao(sd) e pior valor, tanto em relacao aos dados de treinamento quanto de teste e apresentada para cadaproblema. Esses valores correspondem as solucoes encontradas em todas as execucoes independentes.Alem disso, analises estatısticas nao-parametricas utilizando o Teste de Soma de Postos de Wilcoxonsao realizados para verificar a significancia das diferencas entre os resultados quando diferentesquantidades de ruıdo sao introduzidas aos dados. A biblioteca SciPy 1 foi adotada para a realizacaodestes destes.

Finalmente, a biblioteca JScheme, para computar as expressoes em linguagem scheme, e umabiblioteca cientıfica devida a Michael Thomas2 foram incluıdas na implementacao.

1 Disponıvel em: http://www.scipy.org.2 Disponıvel em: http://www.ee.ucl.ac.uk/~mflanaga/java

Page 61: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

46 Bernardino & Barbosa

5.1 Modelo de reação química

Este problema tem como objetivo inferir um modelo que represente o comportamento das reacoesentre o hidrato de formaldeıdo (HCHO) e carbamida (ou ureia, (NH2)2CO) em solucao aquosaproduzindo metilol ureia (H2N · CO ·NH · CH2OH) e que, reagindo novamente com a carbamidaforma metileno de ureia ((NH2CONH)2CH2). Essa reacao pode ser representada como

HCHO + (NH2)2CO → H2N · CO ·NH · CH2OH

H2N · CO ·NH · CH2OH + (NH2)2CO → (NH2CONH)2CH2.

As concentracoes de HCHO (y1), H2N · CO · NH · CH2OH (y2) e (NH2CONH)2CH2 (y3), sobreacoes consecutivas, podem ser modeladas de maneira que satisfazem o sistema de EDOs (Caoet al., 2000)

y′1 = −1,4y1

y′2 = 1,4y1 − 4,2y2

y′3 = 4,2y2

Os dados de entrada sao formados por 101 registros com x ∈ [0, 1] e os valores de y gerados apartir da condicao inicial y(0) = (0,1; 0; 0).

A Tabela 1 mostra a analise dos erros dos modelos encontrados para o problema corrente. Osmodelos encontrados para representar a reacao quımica apresentam valores medios de erro da ordemde 10−5, para os dados de treinamento, e da ordem de 10−6, em relacao aos de teste. Destaca-se assima capacidade de generalizacao dos modelos encontrados. Alem disso, as analises estatısticas indicamque os modelos encontrados sao adequados independente da quantidade de ruıdo introduzido nosdados, ou seja, dadas as intensidades de ruıdos testadas, os modelos encontrados apresentam errosde treinamento e teste similares. Esse resultado ressalta a robustez da tecnica de busca adotadaaqui.

Tabela 1. Erros observados nos sistemas inferidos para o modelo de reacao quımica.

pruido melhor mediana media sd pior

Erros de treinamento

0,1 2,59× 10−6 5,03× 10−6 1,44× 10−5 1,76× 10−5 6,72× 10−5

0,3 9,63× 10−7 4,66× 10−6 1,29× 10−5 2,87× 10−5 1,61× 10−4

0,5 3,77× 10−6 5,70× 10−6 1,09× 10−5 9,53× 10−6 3,73× 10−5

Erros de teste

0,1 1,36× 10−6 3,00× 10−6 5,43× 10−6 6,71× 10−6 3,44× 10−5

0,3 1,25× 10−6 2,54× 10−6 3,95× 10−6 7,36× 10−6 4,31× 10−5

0,5 1,37× 10−6 2,68× 10−6 3,61× 10−6 2,52× 10−6 1,12× 10−5

5.2 Modelo da equação de fertilidade para dois alelos

Segundo Hofbauer & Sigmund (1998), ao denotar as frequencias de ocorrencia dos genotipos A1A1,A1A2 e A2A2, respectivamente, por y1, y2 e y3 a equacao de fertilidade para dois alelos, A1 e A2,pode ser modelada pelo sistema de EDOs y′1 = 2y2

1 + 2,5y1y2 + 0,375y22 − y1P (y1, y2, y3)

y′2 = 0,75y22 + 2,5y1y2 + 2,5y2y3 + 3y1y3 − y2P (y1, y2, y3)

y′3 = 1,5y23 + 2,5y2y3 + 0,375y2

2 − y3P (y1, y2, y3)

P (y1, y2, y3) = 2y21 + 5y1y2 + 1,5y2

2 + 3y1y3 + 5y2y3 + 1,5y23.

Tres sequencias com 41 valores de x ∈ [0, 10] sao utilizadas na geracao dos dados de entrada paraa inferencia deste modelo. As observacoes foram artificialmente geradas considerando as condicoesiniciais y(0) = (0,5, 0,5, 0), (0,5, 0, 0,5) e (0, 0,5, 0,5).

Os resultados para o problema abordado nessa secao podem ser encontrados na Tabela 2. Assimcomo no problema apresentado na secao anterior, os modelos encontrados aqui apresentam valoresbaixos de erro, tanto ao que se refere aos dados de treinamento quanto aos de teste. Esse resultadodestaca novamente a capacidade de generalizacao dos modelos encontrados. Nao obstante, segundoanalises estatısticas, os modelos encontrados apresentam erros similares independente da quantidadede ruıdo introduzido nos dados, mostrando que a tecnica e robusta em relacao a qualidade dos dados.

Page 62: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Inferência de modelos utilizando a programação imunológica gramatical 47

Tabela 2. Erros observados nos sistemas inferidos para o modelo da equacao de fertilidade para dois alelos.

pruido melhor mediana media sd pior

Erros de treinamento

0,1 1,63× 10−3 4,16× 10−3 4,29× 10−3 1,36× 10−3 8,27× 10−3

0,3 2,76× 10−3 3,87× 10−3 4,33× 10−3 1,36× 10−3 8,00× 10−3

0,5 2,03× 10−3 4,46× 10−3 4,67× 10−3 1,33× 10−3 8,04× 10−3

Erros de teste

0,1 8,91× 10−4 2,76× 10−3 3,26× 10−3 1,78× 10−3 8,04× 10−3

0,3 9,37× 10−4 3,23× 10−3 3,80× 10−3 2,19× 10−3 1,00× 10−2

0,5 1,09× 10−3 4,15× 10−3 4,40× 10−3 2,64× 10−3 1,19× 10−2

5.3 Modelo de rede de regulação gênica

Tendo como objetivo principal identificar a relacao entre os mecanismos regulatorios dosgenes (Noman & Iba, 2005), a modelagem das redes de regulacao genicas, que sao sistemas biologicoscomplexos, tambem pode ser feita por um sistema de equacoes diferencias ordinarias, representandoa dinamica da iteracao entre os genes e os S-systems.

Aqui, o sistema de EDOs a ser inferido e o apresentado por Tominaga et al. (2000) para um casoparticular composto por cinco genes:

y′1 = 15y3y−0,15 − 10y2

1y′2 = 10y2

1 − 10y22

y′3 = 10y−0,12 − 10y−0,1

2 y23

y′4 = 8y21y−15 − 10y2

4y′5 = 10y2

4 − 10y25

Os dados sao compostos por 31 valores em tres sequencias, sendo x ∈ [0, 0,3] e as condicoes iniciaisdadas por y(0) = (0,1, 0,1, 0,1, 0,1, 0,1), (0,5, 0,5, 0,5, 0,5, 0,5) e (1,5, 1,5, 1,5, 1,5, 1,5).

A gramatica adotada para esse problema foi modificada, assim como em Bernardino & Barbosa(2011). As regras de producao R e as producoes de reparo Rr sao apresentadas, respectivamente,nas Figuras 5 e 6.

<base> ::= (+ <base> <base>) | <expr>

<expr> ::= (<op> <expr> <expr>) | <var>

<op> ::= + | − | ×<var> ::= y1 | y2 | y3 | y4 | y5 | y−1

1 | y−12 | y−1

3 | y−14 | y−1

5 |y0,1

1 | y0,12 | y0,1

3 | y0,14 | y0,1

5 | y−0,11 | y−0,1

2 | y−0,13 | y−0,1

4 | y−0,15

Figura 5. Regras de producao R adotadas na inferencia de um modelo para a rede de regulacao genica.

Os resultados para esse problema sao apresentados na Tabela 3, que mostra o bom desempenhotanto sobre os dados de treinamento quanto ao que se refere aos dados de teste. Todavia, os errosde teste sao uma ordem de grandeza pior do que aqueles obtidos sobre os dados de treinamento,o que pode indicar um superajuste dos modelos. Diferentemente do que ocorreu nos problemasanteriores, os modelos encontrados apresentam aqui erros de teste estatisticamente diferentes quandopruido = 0,1. Isso provavelmente se deve ao fato do pouco ruıdo contribuir para uma convergenciamais rapida para um modelo adequado e, consequentemente, na sequencia inicializar um processo desuperajuste aos dados durante o treinamento. Verifica-se assim a necessidade de monitorar os errosde teste a cada geracao afim de evitar essa perda de generalizacao dos modelos.

Page 63: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

48 Bernardino & Barbosa

(+ <base> <base>) ::= <base> | y1 | y2 | y3 | y4 | y5

| y−11 | y−1

2 | y−13 | y−1

4 | y−15

| y0,11 | y0,1

2 | y0,13 | y0,1

4 | y0,15

| y−0,11 | y−0,1

2 | y−0,13 | y−0,1

4 | y−0,15

(<op> <expr> <expr>) ::= <expr> | y1 | y2 | y3 | y4 | y5

| y−11 | y−1

2 | y−13 | y−1

4 | y−15

| y0,11 | y0,1

2 | y0,13 | y0,1

4 | y0,15

| y−0,11 | y−0,1

2 | y−0,13 | y−0,1

4 | y−0,15

<base> ::= y1 | y2 | y3 | y4 | y5

| y−11 | y−1

2 | y−13 | y−1

4 | y−15

| y0,11 | y0,1

2 | y0,13 | y0,1

4 | y0,15

| y−0,11 | y−0,1

2 | y−0,13 | y−0,1

4 | y−0,15

<expr> ::= y1 | y2 | y3 | y4 | y5

| y−11 | y−1

2 | y−13 | y−1

4 | y−15

| y0,11 | y0,1

2 | y0,13 | y0,1

4 | y0,15

| y−0,11 | y−0,1

2 | y−0,13 | y−0,1

4 | y−0,15

Figura 6. Regras de reparo Rr adotadas na inferencia de um modelo para a rede de regulacao genica.

Tabela 3. Erros observados nos sistemas inferidos para o modelo da rede de regulacao genica.

pruido melhor mediana media sd pior

Erros de treinamento

0,1 4,03× 10−2 8,62× 10−2 8,31× 10−2 1,52× 10−2 1,06× 10−1

0,3 5,51× 10−2 8,69× 10−2 8,49× 10−2 1,29× 10−2 1,05× 10−1

0,5 4,68× 10−2 8,89× 10−2 8,59× 10−2 1,51× 10−2 1,14× 10−1

Erros de teste

0,1 1,32× 10−1 2,38× 10−1 2,21× 10−1 3,81× 10−2 2,61× 10−1

0,3 7,32× 10−2 1,78× 10−1 1,78× 10−1 5,88× 10−2 2,61× 10−1

0,5 6,16× 10−2 2,06× 10−1 1,90× 10−1 5,79× 10−2 2,70× 10−1

Page 64: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Inferência de modelos utilizando a programação imunológica gramatical 49

6. Conclusão

O presente capıtulo descreve a programacao imunologica gramatical, um algoritmo imuno-inspiradopara a evolucao de programas guiados por gramaticas formais, combinando a tecnica de selecao clonalconhecida como CLONALG com o mapeamento adotado na evolucao gramatical (EG). Aplicacoesem problemas inversos mostram que a tecnica consegue encontrar modelos acurados e com capacidadede generalizacao, mesmo quando os dados apresentam ruıdos. A inferencia de modelos dinamicosna forma de sistemas de equacoes diferenciais ordinarias e uma das varias tarefas na descoberta deconhecimento a partir de dados, e a programacao imunologica gramatical mostrou-se promissora.

ReferênciasAugusto, D.A.; Barbosa, H.J.C.; Barreto, A.M. & Bernardino, H.S., Evolving numerical constants in grammatical

evolution with the ephemeral constant method. In: Proc. of the Portuguese Conference on Progress in ArtificialIntelligence – EPIA. Berlin, Heidelberg: Springer-Verlag, p. 110–124, 2011.

Bernardino, H.S., Programacao Imunologica Gramatical para Inferencia Automatica de Modelos e Projeto Otimo deEstruturas. Tese de doutorado, Laboratorio Nacional de Computacao Cientıfica, Petropolis, RJ, Brasil, 2012.Orientador: Helio J. C. Barbosa.

Bernardino, H.S. & Barbosa, H.J.C., Grammar-based immune programming for symbolic regression. In: Proc. Intl.Conf. on Artificial Immune Systems – ICARIS. Springer Berlin / Heidelberg, v. 5666 de LNCS, p. 274–287, 2009.

Bernardino, H.S. & Barbosa, H.J.C., Comparing two ways of inferring a differential equation model via grammar-based immune programming. In: Proc. of the Iberian-Latin-American Congress on Computational Methods inEngineering. Asociacion Argentina de Mecanica Computacional, v. 29, p. 9107–9124, 2010a.

Bernardino, H.S. & Barbosa, H.J.C., Grammar-based immune programming. Natural Computing, 10(1):209–241,2010b.

Bernardino, H.S. & Barbosa, H.J.C., Inferring systems of ordinary differential equations via grammar-based immuneprogramming. In: Lio, P.; Nicosia, G. & Stibor, T. (Eds.), Proc. Intl. Conf. on Artificial Immune Systems –ICARIS. Springer Berlin / Heidelberg, v. 6825 de LNCS, p. 198–211, 2011.

Bernardino, H.S.; Castro, E.S.; ao N.C. Guerreiro, J. & Barbosa, H.J.C., Inferring strains on a locally deformed pipevia grammar-based immune programming. In: Proc. of the Iberian Latin American Congress on ComputationalMethods in Engineering – CILAMCE. Washington, DC, USA, 2011.

Burnet, F.M., A modification of Jerne’s theory of antibody production using the concept of clonal selection. AustralianJournal of Science, 20:67–69, 1957.

Cao, H.; Kang, L. & Chen, Y., Evolutionary modelling of systems of ordinary differential equations with geneticprogramming. Genetic Programming and Evolvable Machines, 1(4):309 – 337, 2000.

Castro, L.N. & von Zuben, F.J., The clonal selection algorithm with engineering applications. In: Proc. of the Geneticand Evolutionary Computation Conference – GECCO. p. 37, 2000.

Castro, L.N. & von Zuben, F.J., Learning and optimization using the clonal selection principle. IEEE Transactions onEvolutionary Computation, 6(3):239–251, 2002.

Chomsky, N., Syntactic Structures. Mouton de Gruyter, 2002.

Ciccazzo, A.; Conca, P.; Nicosia, G. & Stracquadanio, G., An advanced clonal selection algorithm with ad-hoc network-based hypermutation operators for synthesis of topology and sizing of analog electrical circuits. In: Bentley, P.J.;Lee, D. & Jung, S. (Eds.), Proc. of the Intl. Conf. on Artificial Immune Systems – ICARIS. Springer, v. 5132 deLNCS, p. 60–70, 2008.

Gan, Z.; Chow, T.W. & Chau, W., Clone selection programming and its application to symbolic regression. ExpertSystems with Applications, 36(2):3996 – 4005, 2009a.

Gan, Z.; Yang, Z.; Shang, T.; Yu, T. & Jiang, M., Automated synthesis of passive analog filters using graphrepresentation. Expert Systems with Applications, 37(3):1887 – 1898, 2010.

Gan, Z.; Zhao, M.B. & Chow, T.W., Induction machine fault detection using clone selection programming. ExpertSystems with Applications, 36(4):8000 – 8012, 2009b.

Hofbauer, J. & Sigmund, K., Evolutionary Games and Population Dynamics. Cambridge University Press, 1998.

Hugosson, J.; Hemberg, E.; Brabazon, A. & O’Neill, M., An investigation of the mutation operator using differentrepresentations in grammatical evolution. In: Proc. of the Intl. Symposium Advances in Artificial Intelligence andApplications. v. 2, p. 409–419, 2007.

Hugosson, J.; Hemberg, E.; Brabazon, A. & O’Neill, M., Genotype representations in grammatical evolution. AppliedSoft Computing, 10(1):36 – 43, 2010.

Johnson, C.G., Artificial immune system programming for symbolic regression. In: Proc. of the European Conferenceon Genetical Programming – EuroGP. Springer, v. 2610 de LNCS, p. 345–353, 2003.

Koza, J.R., Genetic Programming: On the Programming of Computers by Means of Natural Selection. MIT Press,1992.

Page 65: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

50 Bernardino & Barbosa

Lau, A. & Musilek, P., Immune programming models of cryptosporidium parvum inactivation by ozone and chlorinedioxide. Information Sciences, 179(10):1469–1482, 2009.

McKinney, B.A. & Tian, D., Grammatical immune system evolution for reverse engineering nonlinear dynamic bayesianmodels. Cancer Informatics, 6:433–447, 2008.

Mera, N.; Elliott, L. & Ingham, D., Detection of subsurface cavities in IR-CAT by a real coded genetic algorithm.Applied Soft Computing, 2(2):129 – 139, 2002.

Musilek, P.; Lau, A.; Reformat, M. & Wyard-Scott, L., Immune programming. Information Sciences, 176(8):972–1002,2006.

Noman, N. & Iba, H., Inference of gene regulatory networks using s-system and differential evolution. In: Proc. of theGenetic and Evolutionary Computation Conference – GECCO. New York, NY, USA: ACM, p. 439–446, 2005.

O’Neill, M. & Ryan, C., Grammatical evolution. IEEE Transactions on Evolutionary Computation, 5(4):349–358,2001.

O’Neill, M. & Ryan, C., Grammatical Evolution: Evolutionary Automatic Programming in an Arbitrary Language.Kluwer Academic Publishers, 2003.

Ryan, C.; Collins, J. & Neill, M.O., Grammatical evolution: Evolving programs for an arbitrary language. In: Proc.of the European Workshop on Genetic Programming. Springer-Verlag, v. 1391 de LNCS, p. 83–95, 1998.

Schmidt, M. & Lipson, H., Distilling free-form natural laws from experimental data. Science, 324(5923):81–85, 2009.

Tominaga, D.; Koga, N. & Okamoto, M., Efficient numerical optimization algorithm based on genetic algorithm forinverse problem. In: Proc. of the Genetic and Evolutionary Computation Conference – GECCO. p. 251–258, 2000.

Page 66: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Capítulo 5

Problema Inverso em Propagação de Ondas em Sólidoscom Aplicação de Método Híbrido de Otimização

Kennedy Morais Fernandes∗, Roberto Aizik Tenenbaum e Leonardo Tavares Stutz

Resumo: Este capıtulo apresenta a formulacao e solucao do problema de identificacao de danos embarras, a partir de uma abordagem de propagacao de ondas acusticas e um metodo hıbrido de otimizacao.A identificacao e obtida a partir de um ensaio sintetico do tipo pulso-eco. O problema direto e resolvido viao Algoritmo Algebrico Sequencial, que modela a propagacao de ondas planas em meios nao-homogeneos.Quatro cenarios de danos sao testados numericamente. Para comprovar a robustez do metodo, diferentesnıveis de relacao sinal/ruıdo, variando entre 30 e 0 dB foram introduzidos. Os resultados obtidosdemonstram que a identificacao de danos a partir da abordagem de propagacao de ondas e bem sucedida,mesmo com altos nıveis de ruıdo nos sinais, identificando-se a localizacao, a severidade e a forma do dano.

Palavras-chave: Propagacao de ondas acusticas, Algoritmo Algebrico Sequencial, Identificacao de danos,Metodo hıbrido de otimizacao.

Abstract: This chapter presents the solution of the damage identification problem in bars based on anacoustic wave propagation approach and an hybrid optimization method. The identification is obtainedfrom a synthetic pulse-echo test. The direct problem is solved via the Sequential Algebraic Algorithm thatmodels the plane wave propagation in non-homogeneous media. Four damage scenarios are tested. Toverify the method robustness, different levels of noise are introduced, varying from 30 to 0 dB of signal-to-noise level. The numerical results show that the damage identification based on the wave propagationsucceeds, even with highly corrupted noisy data, identifying the localization, the severity and the shapeof the tested damages.

Keywords: Acoustical wave propagation, Sequential Algebraic Algorithm, Damage identification, Hybridoptimization method.

Conteúdo

1 Introducao ................................................................................................................................ 522 Modelagem Matematica do Problema Direto........................................................................... 533 Cenarios de Danos Considerados.............................................................................................. 554 Procedimentos de Identificacao ................................................................................................ 55

4.1 Metodo de Levenberg-Marquardt .................................................................................... 564.2 Otimizacao por enxame de partıculas.............................................................................. 574.3 Hibridizacao de metodos.................................................................................................. 58

5 Identificacao com o Metodo de Levenberg-Marquardt ............................................................. 586 Identificacao com Dados Ruidosos ........................................................................................... 59

6.1 Identificacao a partir da resposta impulsiva .................................................................... 596.2 Identificacao a partir da resposta a um pulso retangular ................................................ 62

7 Conclusoes................................................................................................................................ 64

∗Autor para contato: [email protected]

Lobato et al. (Ed.), (2014) DOI: 10.7436/2014.tica.05 ISBN 978-85-64619-15-9

Page 67: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

52 Fernandes et al.

1. Introdução

A identificacao de danos em estruturas pode ser feita por meio de ensaios de vibracoes ou por meiode abordagem de propagacao de ondas acusticas (Tenenbaum et al., 2011). E bem conhecido o fatode que a propagacao de ondas acusticas possui uma alta sensibilidade a variacoes de impedanciamecanica (Gangadharan et al., 2009), tais como aquelas resultantes de pequenos defeitos naestrutura. Embora muito menos comuns na literatura do que a abordagem de vibracoes (Santos et al.,2008), a abordagem de propagacao de ondas acusticas tem a vantagem de trabalhar diretamente nodomınio do tempo, favorecendo tecnicas de identificacao computacionalmente rapidas e com boaprecisao (Tenenbaum & Zindeluk, 1992b).

Aplicacoes da abordagem de propagacao de ondas em problemas inversos estao reportadas nasareas de geofısica (Mendell & Ashrafi, 1980), ultrassonografia medica (Lefebre, 1985), ensaios nao-destrutivos (Tenenbaum & Zindeluk, 1986), ensaios de fadiga (Cantrell & Yost, 2001), e, maisrecentemente, na avaliacao da integridade de pilares enterrados (Ni et al., 2008). A abordagem depropagacao de ondas acusticas tem sido aplicada tambem na identificacao de defeitos em materiaiscompositos (Grabowska et al., 2008) e na identificacao de processo de delaminacao (Nag et al.,2002). Sao encontradas ainda na literatura alguns trabalhos envolvendo a propagacao de ondasbi-dimensionais (Kuchler et al., 2009; Vanaverbeke & Abeele, 2007).

O objetivo deste trabalho e estudar o problema inverso de identificacao de danos, ou seja, aidentificacao de inomogeneidades em um elemento estrutural esbelto (barra). Ha trabalhos beminteressantes na literatura que abordam esse problema por meio de propagacao de ondas acusticas,seja utilizando algoritmos geneticos (Nag et al., 2002), seja metodos globais (Schwetlick, 1983), porexemplo. Contudo, como mostram os trabalhos de revisao no tema (Santos et al., 2008; Montalvaoet al., 2006) nenhum dos artigos ate entao utilizaram o Algoritmo Algebrico Sequencial (AAS) quefornece uma solucao exata para o problema direto de propagacao de ondas em meios nao-homogeneosdiscretizados. Por se tratar de uma solucao fechada, o uso do AAS permite a solucao do problemainverso - via, naturalmente, algoritmos de otimizacao - com as seguintes vantagens (Tenenbaum &Zindeluk, 1992a; Tenenbaum et al., 2012):

1. propicia a determinacao de um grande numero de parametros;

2. em consequencia, a precisao da identificacao do dano e incrementada;

3. a tecnica e robusta com respeito a ruıdo aditivo.

O problema e tratado como um ensaio de pulso-eco. Um pulso e gerado em uma extremidade (aesquerda, digamos) da barra, e propaga-se para a direita, constituindo uma onda acustica progressiva.Ao encontrar uma nao-homogeneidade, e gerada uma onda regressiva, tambem chamada de eco, quepropaga-se para a esquerda. A identificacao de danos, portanto, e feita a partir dos sinais sinteticosde pulso e eco.

No presente trabalho, o problema direto de propagacao de ondas planas em barras e abordado,inicialmente, utilizando-se o AAS, tal como apresentado em Tenenbaum & Zindeluk (1992a). Emseguida, o problema inverso de identificacao de danos e abordado, no domınio do tempo, via aminimizacao da diferenca entre um eco previsto pelo AAS a partir de uma variacao arbitraria deimpedancia, e o eco experimental.

A contribuicao maior deste trabalho consiste na utilizacao do AAS para a solucao do problemadireto de propagacao de ondas acusticas em meios nao-homogeneos e na adocao de uma tecnicahıbrida - utilizando um metodo estocastico de otimizacao associado a um metodo determinıstico -para a solucao do problema inverso de identificacao de danos em estruturas. A tecnica estocasticautilizada neste trabalho e o metodo de otimizacao por enxame de partıculas, PSO (da sigla em ingles,Particle Swarm Optimization) (Kennedy & Eberhart, 2001). O metodo de otimizacao determinısticoadotado foi o de Levenberg-Marquardt-LM (Marquardt, 1963).

O maior interesse em utilizar uma tecnica hıbrida reside no fato de que os resultados gerados peloLM neste tipo de identificacao depende muito fortemente de um parametro arbitrario, denominadoparametro de relaxacao. Isso significa que uma escolha inadequada do valor adotado para oparametro de relaxacao pode ter como consequencia que o LM nao chegue a um mınimo global,podendo, inclusive, nao convergir. Por outro lado, devido a sua natureza estocastica, o PSO resulta,na maioria dos casos, em um erro residual importante, alem de um custo computacional alto. Acombinacao das duas tecnicas - onde o PSO roda um numero relativamente pequeno de iteracoes esua saıda constitui a estimativa inicial para o LM - produz os melhores resultados, apresentados naSecao 6.

Page 68: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Problema inverso em propagação de ondas em sólidos 53

Neste trabalho, a excitacao e considerada como um impacto em uma extremidade da barra deensaio, gerando um pulso progressivo que se propaga e que, ao atingir a regiao danificada, gera umsinal regressivo - denominado eco.

Sao considerados, inicialmente, pulsos do tipo delta de Dirac, δ(t), e, em seguida, pulsosretangulares (longos e curtos), tais como os que sao produzidos em ensaios experimentais de impacto.Como se observara nos resultados, os tres generos de pulsos fornecem resultados de identificacaoequivalentes.

Os sinais sao observados em um intervalo de tempo ∆T < 2l/c, onde l e a distancia entre oponto onde se situa o sensor de deformacoes/tensoes e a extremidade nao impactada da barra, e c ea velocidade de propagacao da onda acustica longitudinal. Desse modo, a resposta (eco) esperadade uma barra sem qualquer dano e nula. Ja uma barra que apresenta um dano, qualquer que seja ocenario deste, apresentara uma resposta nao nula no intervalo ∆T .

Geralmente, danos gerados por acidentes, corrosao ou defeitos de fabricacao produzem alteracoesna area da secao reta A(x) da barra, mas nao modificacoes em sua massa especıfica, ρ, ou em seumodulo elastico, E. Assim, e assumido que o dano em questao, corresponde a uma alteracao dasecao reta nominal A0 da barra, cuja extensao e localizacao sao desconhecidas. A identificacao seraobtida a partir da minimizacao, com respeito a area da secao reta, da norma quadratica da diferencaentre o eco experimental sintetico e o eco correspondente previsto pelo modelo.

Este capıtulo esta organizado da maneira a seguir. Na Secao 2 apresenta-se sumariamente omodelo teorico para a solucao da propagacao de ondas acusticas planas em meios nao-homogeneos,com especial atencao ao Algoritmo Algebrico Sequencial. Na Secao 3 os cenarios de danos estudadossao apresentados, bem como suas respostas impulsivas. Na Secao 4 discutem-se as tecnicasde otimizacao adotadas neste trabalho. Na Secao 5 discutem-se as dificuldades encontradas naidentificacao de danos utilizando o metodo determinıstico LM. Na Secao 6 aborda-se o caso maisrealıstico de identificacao de nao-homogeneidades na presenca de dados corrompidos (pulso e eco)por ruıdo aditivo. Nessa secao, diferentes relacoes sinal/ruıdo sao consideradas, para cada um doscenarios de danos em estudo. As conclusoes do trabalho sao apresentadas na Secao 7.

2. Modelagem Matemática do Problema Direto

A propagacao de ondas acusticas planas em uma barra nao-homogenea esbelta pode ser descritapela equacao diferencial hiperbolica de segunda ordem

σtt − c2

[σxx +

(A′

A− ρ′

ρ

)σx + ρ

(A′

ρA

)′σ

]= 0, (1)

onde σ(x, t) e o campo de tensoes longitudinais, dependentes da posicao x e do tempo t, A(x) e aarea da secao reta da barra, ρ(x) e a massa especıfica do material (ambos dependentes da posicao),c e a velocidade de propagacao de ondas acusticas longitudinais, a linha (′) representa derivada comrespeito ao argumento da funcao e os subscritos indicam derivadas parciais, como usual.

A Equacao (1) nao admite uma solucao fechada, tal como a solucao de D’Alembert para a equacaoda onda em meios homogeneos. Contudo, demonstra-se (Tenenbaum & Zindeluk, 1992a) que aEquacao (1) pode ser expressa de uma forma alternativa, no plano das variaveis caracterısticas (r, s),como o seguinte sistema de equacoes de primeira ordem:

Ur +Z

4ZU = 0;

Vs −Z

4ZV = 0,

(2)

onde Z = ρcA e definida como impedancia acustica generalizada, U(r, s) e V (r, s) sao,respectivamente, os componentes progressivo e regressivo da tensao propagante ao longo do planocaracterıstico e o ponto representa a derivada com respeito a variavel dependente τ , que traduz otempo de percurso, definida por

τ(x) =

∫ x

0

c(ξ). (3)

As variaveis caracterısticas, no caso de problemas hiperbolicos, podem ser expressas na forma:

r = t+ τ ;

s = t− τ. (4)

Page 69: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

54 Fernandes et al.

As Eqs. (2) constituem um par de equacoes diferenciais de primeira ordem compactas e desacopladase que descrevem de uma forma conveniente o fenomeno de propagacao de ondas planas em ummeio nao-homogeneo. Para a integracao dessas equacoes, duas condicoes de contorno no plano (r, s)necessitam ser fornecidas. A situacao fısica presente no ensaio pulso-eco condiciona, entao, umacondicao de contorno em x = 0, correspondendo a excitacao f(t) nessa extremidade,

U(s, s) = F (s) = f(t). (5)

A outra condicao de contorno corresponde a hipotese de radiacao de Sommerfeld (Pierce, 1989),que significa nao existirem perturbacoes oriundas da outra extremidade da barra, o que se traduzmatematicamente por

V (r, 0) = 0. (6)

Note-se que f(t), constituindo a tensao longitudinal aplicada a extremidade x = 0 correspondea U(s, s), um componente progressivo. Por outro lado, o eco observado em x = 0 proveniente danao-homogeneidade (dano), constituira o sinal de saıda g(t) = V (s, s), um componente regressivo.

Discretizando a barra em trechos seccionalmente homogeneos com mesmo comprimento ∆x =c∆t, o pulso - discretizado - de excitacao pode ser expresso como

Fj = f(2(j − 1)∆t

)(7)

e o sinal de eco discretizado sera

Gj = g(2j∆t), j = 1, 2, . . . , N, (8)

onde N∆t e o intervalo de tempo de observacao considerado.Pode-se mostrar que as Eqs. (2) com as condicoes de contorno dadas pelas Eqs. (5) e (6) possuem

a seguinte solucao para o eco discretizado (Tenenbaum & Zindeluk, 1992a)

Gj =

j∑k=1

Rk +k−2∑p=1

Qpk

Fj−k+1, (9)

onde os polinomios Qpk, que descrevem as multiplas trajetorias das ondas sonoras no plano das

variaveis caracterısticas, possuem a seguinte formula recursiva:

Qpk = Rk−p

[Qp

k−1

Rk−p−1−Rk−p−1

(Rk−1 +

p−1∑l=1

Qlk−1

)], (10)

k = 3, 4, . . . , N, p = 1, 2, . . . , k − 2.

Observe-se que, na Equacao (10), Ri representa o coeficiente de reflexao na i-esima camada emque o meio foi discretizado, e cuja definicao e dada por

Ri =Zi − Zi−1

Zi + Zi−1, i = 1, 2, . . . , n. (11)

onde Zi = ρiciAi e a impedancia acustica generalizada da i-esima camada, como definida acima, en e o numero de elementos da discretizacao. Uma vez que ρ e c sao assumidos neste trabalho comoconstantes, os coeficientes de reflexao podem ser definidos como

Ri =Ai −Ai−1

Ai +Ai−1, i = 1, 2, . . . , n. (12)

O modelo matematico para a solucao do problema direto de propagacao de ondas acusticas emmeios nao-homogeneos via o AAS consiste, portanto, em:

1. O meio com area da secao reta nominal A0 e discretizado em n elementos;

2. Os coeficientes de reflexao sao calculados pela Equacao (12);

3. Os polinomios Qpk sao calculados segundo a Equacao (10);

4. Finalmente, os componentes do eco sao computados pela Equacao (9).

Page 70: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Problema inverso em propagação de ondas em sólidos 55

E importante observar que o modelo matematico descrito sucintamente acima constitui umaformula original para a solucao do problema direto de propagacao de ondas planas em meiosnao-homogeneos. Esse modelo permite, durante o procedimento de identificacao, identificar umparametro por vez, o que permitira identificar um numero de parametros bem maior do que ousual com procedimentos de otimizacao (Begambre & Laier, 2009; Rao et al., 2004). Os ecos seraoobservados no intervalo ∆T < 2l, onde l e a distancia entre o ponto onde se situa o sensor dedeformacoes/tensoes (por exemplo, uma ponte de extensometros) e a extremidade da direita dabarra. Isso significa que o eco gerado por essa extremidade e irrelevante.

3. Cenários de Danos Considerados

A estrutura analisada neste trabalho e uma barra de alumınio com 1 m de comprimento e uma secaoreta nominal retangular de 30 mm× 10 mm, veja Figura 1. O material da barra possui moduloelastico Ea = 7, 1 × 1010 Pa, massa especıfica ρ = 2, 7 × 103 kg/m3 e velocidade de onda acusticalongitudinal c = 5128 m/s. O sensor e considerado estando a 10 mm de distancia da extremidadede impacto. Para uma barra com essas caracterısticas o modelo do AAS se aplica.

Quatro cenarios de dano, denominados como Casos 1 a 4 foram estudados, como indica a Figura 1.Tres dos perfis correspondem a cortes de formato triangular, enquanto um corresponde a um furotransversal. As dimensoes dos danos impostos estao indicadas na figura.

a30 mm

10 mmd

500 mm

(a) Caso 1

25 mm

2.5 mm5 mm

12.5 mm

400 mm600 mm

(b) Caso 2

10 mm

2.5 mm5 mm

5 mm

500 mm 513 mm

(c) Caso 3

5 mm

500 mm

(d) Caso 4

Figura 1. Quatro diferentes cenarios de dano impostos a barra.

As respostas impulsivas correspondentes, obtidas a partir do algoritmo algebrico sequencial, saoapresentadas na Figura 2. A discretizacao espacial adotada foi ∆x = 1 mm.

E importante observar que os ecos fornecem, de per si, algumas informacoes importantes a respeitodo defeito encontrado na barra. Por exemplo, o eco indicado na Figura 2a comeca (ou seja, passaa ser diferente de zero) em 190 µs e termina (retornando a zero) em aproximadamente 200 µs. Issosignifica que, considerando a velocidade de onda longitudinal c = 5128 m/s, o defeito deve comecara 487,5 mm da extremidade esquerda e terminar a 512,5 mm, o que corresponde ao dano ilustradona Figura 1. Naturalmente, embora a localizacao do dano seja conhecida unicamente por inspecaodo eco, sua severidade e forma nao podem ser conhecidos sem a solucao do problema inverso deotimizacao correspondente.

4. Procedimentos de Identificação

Os procedimentos de identificacao de danos sao descritos considerando uma barra nao-homogenea,como as apresentadas na Figura 1. A barra e discretizada em n secoes de mesmo comprimento, demodo que a area da secao transversal A(x) e representada pelos valores seccionalmente constantesAi, i = 1, 2, ..., n, sendo

A = A1, A2, . . . , An. (13)

O problema de identificacao de dano e baseado num problema de minimizacao do seguinte modo:

minA

E, (14)

Page 71: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

56 Fernandes et al.

160 180 200 220 240−0.04

−0.02

0

0.02

0.04

t(µs)

g(t)

(a) Caso 1

140 160 180 200 220 240 260−0.06

−0.04

−0.02

0

0.02

0.04

0.06

t(µs)

g(t)

(b) Caso 2

180 190 200 210 220−0.06

−0.04

−0.02

0

0.02

0.04

0.06

t(µs)

g(t)

(c) Caso 3

160 180 200 220 240−0.15

−0.1

−0.05

0

0.05

0.1

0.15

t(µs)

g(t)

(d) Caso 4

Figura 2. Respostas impulsivas dos ensaios sinteticos de pulso-eco para os quatro casos ilustrados na Figura 1.

onde o funcional E e a norma do vetor de resıduo r(A), que e definido como

r(A) =

G1(A)−G1

exp

G2(A)−G2exp

...GN (A)−GN

exp

, (15)

onde N e o numero de dados experimentais considerados no processo de identificacao, Gj(A), j =

1, 2, ..., N e o eco obtido pelo modelo e Gjexp e o eco experimental sintetico no instante de tempo

tj . Portanto, a partir da Equacao (15), temos, como usual,

E = rT r =N∑j=1

[Gj(A)−Gj

exp

]2, (16)

onde E e o valor da funcao objetivo (custo) e T denota o operador transposto.Neste trabalho, com o objetivo de resolver o problema de identificacao apresentado em (14), o

metodo determinıstico de Levenberg-Marquardt, o metodo de otimizacao estocastico, Enxame dePartıculas (Particle Swarm Optimization – PSO), e um metodo hıbrido, combinando os referidosmetodos, sao considerados.

4.1 Método de Levenberg-Marquardt

O metodo de Levenberg-Marquardt – LM (Marquardt, 1963) e um metodo determinıstico baseadono gradiente, de busca local, muito empregado na solucao de problemas inversos formuladosimplicitamente como problemas de otimizacao (Silva Neto & Moura Neto, 2005) e, maisespecificamente, no problema de identificacao de dano estrutural (Fernandes et al., 2008).

O metodo LM consiste na construcao de um processo iterativo, que comeca com uma estimativainicial A0 e, na (k + 1)-esima iteracao, uma nova estimativa e dada por

Ak+1 = Ak + ∆Ak, k = 0, 1, ... , (17)

Page 72: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Problema inverso em propagação de ondas em sólidos 57

com a variacao ∆Ak sendo calculada a partir de

∆Ak = −((

JT)k

Jk + λkI)−1 (

JT)k

Γrk, (18)

onde λ e um parametro de amortecimento, ajustado em cada iteracao, I e a matriz identidade, Γ eum fator de relaxacao, e os elementos da matriz Jacobiana J sao definidos como

Jij =∂Gj

∂Ai, j = 1, 2, ...N, i = 1, 2, ..., n, (19)

onde n e o numero de parametros a serem identificados, de acordo com a Equacao (13).O procedimento iterativo e computado ate que um criterio de parada seja atingido, |Ek| < ε1 ou

|Ek|− |Ek+1| < ε2, onde E e definido na Equacao (16) e ε1 e ε2 sao numeros reais positivos proximosde zero, definidos previamente.

4.2 Otimização por enxame de partículas

A otimizacao por enxame de partıculas (Particle Swarm Optimization - PSO), e um metodo debusca heurıstica adequado para otimizacao de funcoes nao-lineares. Ele foi inspirado a partir docomportamento natural dos animais (Kennedy & Eberhart, 2001). A populacao contem um conjuntode indivıduos, ou agentes, conhecidos como partıculas, em que cada posicao que uma partıcula ocuparepresenta uma solucao possıvel para um dado problema de otimizacao.

O algoritmo PSO busca pelo otimo, em geral, no espaco de busca n-dimensional de numerosreais. Os passos para implementacao apresentados a seguir sao referentes a versao canonica do PSO,inicialmente apresentada por Kennedy & Eberhart (2001) como fruto de suas pesquisas envolvendoa minimizacao de funcoes reais atraves da tecnica mais simplificada por eles proposta:

Passo 1 : Definicao das condicoes iniciais do enxame (bando). Para cada partıcula, a posicao Ai

(parametro a ser estimado) e a velocidade vi sao geradas aleatoriamente, dentro do espaco debusca;

Passo 2 : Avaliacao da funcao objetivo E(Ai), Equacao 16, para cada partıcula do enxame.As posicoes Abest

i (melhor posicao da partıcula i) e Aglobal (melhor posicao do bando) saoatualizadas;

Passo 3 : Atualizacao das velocidades de cada partıcula do enxame. A velocidade de uma partıculae atualizada atraves da Equacao (20), abaixo;

Passo 4 : Atualizacao da posicao de cada partıcula do enxame usando a Equacao (21) com oobjetivo de se obter a nova posicao Ai;

Passo 5 : Verificacao do criterio de parada. Se nao atendido, retorna ao Passo 2 para a proximaiteracao;

Passo 6 : Parada. Utilizacao de Aglobal como a solucao desejada.

Mantendo a aleatoriedade do movimento com a multiplicacao de numeros aleatorios (randi) emcada componente, temos a equacao que controla a velocidade de cada partıcula no instante de tempok (iteracao):

vki = v(k−1)i + c1 rand1(Abest

i −A(k−1)i ) + c2 rand2(Aglobal −A(k−1)

i ). (20)

Com a atualizacao de sua velocidade, fazemos a atualizacao da posicao Ai, empregando a equacao:

Aki = A

(k−1)i + vki t. (21)

Quando se considera a otimizacao de funcoes reais, a aplicacao das variaveis ci se alteraconsideravelmente. A variavel c1, regula a forca de atracao para o melhor ponto de cada partıcula.Ja a variavel c2, esta relacionada ao conhecimento da melhor posicao global, alcancada por ummembro do grupo, Aglobal, i.e., a memoria do melhor local ja visitado pelo grupo.

Page 73: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

58 Fernandes et al.

4.3 Hibridização de métodos

Com o objetivo de preservar as melhores caracterısticas do metodo determinıstico de LM e do metodoestocastico PSO, uma hibridizacao com a combinacao desses metodos e considerada no presentetrabalho. Recentemente, abordagens hıbridas, combinando metodos estocasticos e o metodo LMtem sido utilizada com exito para a solucao dos problemas inversos onde sao feitas estimativas deparametros (Silva Neto & Soeiro, 2002) como SA-LM (Simulated Annealing e Levenberg-Marquardt)e AG-LM (Algoritmos Geneticos e Levenberg-Marquardt). Outras estrategias de hibridizacao demetodos determinısticos e estocasticos sao relatadas na literatura, como em Campos Velho et al.(2003).

Essencialmente, o procedimento adotado, e gerar uma estimativa inicial para o metodo LM usandoo resultado do metodo PSO. Uma desvantagem do metodo LM, especialmente quando se lida comdados ruidosos, e a possibilidade de convergencia para mınimos locais, parando antes de chegar aomınimo global desejado. Alem disso, a convergencia do metodo LM e muito dependente da estimativainicial para os parametros a serem identificados.

Utilizando o metodo PSO para fornecer a estimativa inicial, uma melhor precisao pode ser obtida,o mınimo global efetivo e alcancado, bem como o numero de iteracoes necessarias para obter o mınimoe reduzido, como sera visto posteriormente.

5. Identificação com o Método de Levenberg-Marquardt

O metodo de Levenberg-Marquardt (LM) e aqui utilizado para a identificacao dos cenarios de danoapresentados na Figura 1. Considerou-se, primeiramente, a identificacao de danos sem a presenca deruıdo nos sinais do pulso incidente e do correspondente eco. O metodo LM nao convergiu em algunsdos casos considerados, mesmo na ausencia de ruıdo nos sinais, e nos casos em que uma solucao foiencontrada, o fator de relaxacao Γ, na Equacao (18), teve de ser ajustado ad-hoc. O ajuste finodesse parametro e muitas vezes feito por tentativa e erro e depende do problema em questao.

485 490 495 500 505 510 515 5200

0.25

0.5

0.75

1

1.25

1.5

x(mm)

A(x

)

ExataΓ=1Γ=1000Γ=5000Γ=10000

Figura 3. Efeito do fator de relaxacao Γ na identificacao de danos com o metodo LM.

Com o intuito de ilustrar a influencia do parametro de relaxacao Γ nos resultados de identificacaofornecidos pelo metodo LM, a Figura 3 apresenta os resultados obtidos para o Caso 1, com a = 25 mme d = 7, 5 mm. Por conveniencia, nos resultados apresentados, a area da secao transversal da barrafoi normalizada pelo seu valor nominal. Nesse caso, um total de 31 parametros foram estimados,onde se considerou como estimativas iniciais os valores Ai = 1. Da Figura 3, pode ser observadoque um resultado sem interpretacao fısica foi obtido com Γ = 10000. Com Γ = 1, a solucao obtidae muito proxima da estimativa inicial, mesmo apos 100 iteracoes do algoritmo. Para Γ = 1000, umasolucao melhor foi obtida, no entanto, um desvio da solucao exata pode ainda ser observado, mesmoapos 100 iteracoes do metodo. A solucao exata foi obtida, com 50 iteracoes, para Γ = 5000.

Devido as dificuldades observadas com o metodo LM, uma abordagem hıbrida foi considerada.Nessa abordagem, o metodo estocastico PSO e utilizado para gerar uma estimativa inicial para ometodo determinıstico LM. Na abordagem hıbrida, o valor Γ = 10000 foi utilizado em todos os casosconsiderados.

No presente trabalho, todos os resultados apresentados foram obtidos considerando-se o metodoestocastico PSO ou o metodo hıbrido PSO-LM. Em todos os casos, foram considerados: c1, c2 e c3

iguais a 0,2; ε = 10−10; e o numero de partıculas igual a 103, conforme sugerido em Becceneri et al.(2006).

Page 74: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Problema inverso em propagação de ondas em sólidos 59

6. Identificação com Dados Ruidosos

Os resultados de identificacao de danos, obtidos considerando-se os sinais de excitacao e de ecocorrompidos com um ruıdo aditivo, serao aqui analisados.

6.1 Identificação a partir da resposta impulsiva

Em se tratando de um problema real de identificacao de danos, os sinais de excitacao (pulso incidente)e de resposta (eco), obtidos a partir de um ensaio experimental do tipo pulso-eco, sempre saocorrompidos com ruıdo aditivo. Sendo assim, com o intuito de verificar a influencia, nos resultadosda identificacao, de diferentes nıveis de ruıdo aleatorio e de media nula, quatro nıveis de relacaosinal-ruıdo (SNR - Signal to Noise Ratio) foram considerados: 30, 20, 10 e 0 dB. Deve-se ressaltarque no ultimo e mais severo caso SNR de 0 dB a potencia do ruıdo e equivalente a potencia dosinal representando uma condicao raramente encontrada em um procedimento experimental bemcontrolado.

A Figura 4 ilustra as respostas impulsivas da estrutura danificada no Caso 1, ver Figura 1a,com a = 25 mm e d = 5 mm, corrompidas com ruıdo aleatorio de media nula para os casos deSNR iguais a 30, 20, 10, e 0 dB. Os resultados da identificacao, fornecidos pelo PSO e PSO-LM,

0 50 100 150 200 250 300 350 400−0.04

−0.02

0

0.02

0.04

t(µs)

g(t)

(a) SNR = 30 dB

0 50 100 150 200 250 300 350 400−0.04

−0.02

0

0.02

0.04

t(µs)

g(t)

(b) SNR = 20 dB

0 50 100 150 200 250 300 350 400−0.04

−0.02

0

0.02

0.04

0.05

t(µs)

g(t)

(c) SNR = 10 dB

0 50 100 150 200 250 300 350 400−0.04

−0.02

0

0.02

0.04

t(µs)

g(t)

(d) SNR = 0 dB

Figura 4. Respostas impulsivas para o Caso 1, com a = 25 mm e d = 5 mm e diferentes nıveis de relacaosinal-ruıdo.

juntamente com o perfil exato do dano em questao, sao apresentados na Figura 5. Como pode serobservado, nao ha nenhuma diferenca notavel entre as curvas mostradas - perfil exato e resultadosobtidos - para SNR de 30 e 20 dB. No entanto, para os maiores nıveis de ruıdo (SNR de 10 e 0 dB),pequenos erros podem ser observados nos resultados fornecidos por ambos os metodos. Uma vezque um comportamento semelhante foi observado nos demais cenarios de dano avaliados, apenas osresultados obtidos considerando-se os nıveis mais severos de ruıdo (SNR de 10 e 0 dB) serao aquiapresentados.

O efeito dos parametros a e d nos resultados de identificacao do perfil do dano triangular doCaso 1, a partir de dados ruidosos com SNR = 0 dB, e apresentado na Figura 6. Quatro danosdistintos foram obtidos da variacao desses parametros. Nas Figuras 6a e 6b, a profundidade d dodano, que representa a sua severidade, foi alterada. Por outro lado, nas Figuras 6c e 6d, a alteracaono comprimento a do dano foi analisada. Comparando a Figura 5d com a Figura 6, ambas comSNR = 0 dB, deve-se concluir que alteracoes nos parametros de dano a e d nao afetam a capacidadede o metodo identificar o perfil do dano. No entanto, no caso menos severo, ilustrado na Figura 6a,o erro relativo na identificacao se mostrou ligeiramente maior, conforme esperado.

Page 75: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

60 Fernandes et al.

480 485 490 495 500 505 510 515 5200.4

0.6

0.8

1

1.1

x(mm)

A(x

)

ExataPSOPSO−LM

(a) SNR = 30 dB

480 485 490 495 500 505 510 515 5200.4

0.6

0.8

1

1.1

x(mm)

A(x

)

ExataPSOPSO−LM

(b) SNR = 20 dB

480 485 490 495 500 505 510 515 5200.4

0.6

0.8

1

1.1

x(mm)

A(x

)

ExataPSOPSO−LM

(c) SNR = 10 dB

480 485 490 495 500 505 510 515 5200.4

0.6

0.8

1

1.1

x(mm)A

(x)

ExataPSOPSO−LM

(d) SNR = 0 dB

Figura 5. Identificacao de danos para o Caso 1, com a = 25 mm e d = 5 mm, para diferentes nıveis de SNR.

480 485 490 495 500 505 510 515 5200.7

0.8

0.9

1

1.1

x(mm)

A(x

)

ExataPSOPSO−LM

(a) a = 25 mm, d = 2.5 mm

480 485 490 495 500 505 510 515 5200.2

0.4

0.6

0.8

11.1

x(mm)

A(x

)

ExataPSOPSO−LM

(b) a = 25 mm, d = 7.5 mm

490 495 500 505 5100.4

0.6

0.8

1

1.1

x(mm)

A(x

)

ExataPSOPSO−LM

(c) a = 15 mm, d = 5 mm

480 485 490 495 500 505 510 515 5200.4

0.6

0.8

1

1.1

x(mm)

A(x

)

ExataPSOPSO−LM

(d) a = 35 mm, d = 5 mm

Figura 6. Efeito dos parametros a e d nos resultados de identificacao para o Caso 1 com SNR = 0 dB.

A Figura 7 apresenta o resultado da identificacao do perfil da area da secao transversal da primeiraregiao danificada (Parte 1) do Caso 2. O resultado da identificacao da segunda regiao (Parte 2) eilustrado na Figura 8.

O resultado da identificacao de danos no Caso 3, para os dois nıveis de SNR (10 e 0 dB) eapresentado na Figura 9. Dos resultados fornecidos por ambos os metodos, deve-se notar que operfil do dano foi claramente identificado.

Por fim, a Figura 10 apresenta os resultados de identificacao para o Caso 4. Note-se que, devidoao modelo de propagacao de onda plana considerado, nao e possıvel identificar o perfil circular dodano (ver Figura 1d), assim como a sua posicao no eixo vertical, mas apenas a correta variacao dearea da secao transversal da barra analisada.

Page 76: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Problema inverso em propagação de ondas em sólidos 61

380 385 390 395 400 405 410 415 4200.4

0.5

0.6

0.7

0.8

0.9

1

1.1

x(mm)

A(x

)

ExataPSOPSO−LM

(a) SNR = 10 dB

380 385 390 395 400 405 410 415 4200.4

0.5

0.6

0.7

0.8

0.9

1

1.1

x(mm)

A(x

)

ExataPSOPSO−LM

(b) SNR = 0 dB

Figura 7. Identificacao de danos para a primeira regiao danificada do Caso 2 para dois nıveis de SNR.

590 595 600 605 6100.7

0.8

0.9

1

1.1

x(mm)

A(x

)

ExataPSOPSO−LM

(a) SNR = 10 dB

590 595 600 605 6100.7

0.8

0.9

1

1.1

x(mm)A

(x)

ExataPSOPSO−LM

(b) SNR = 0 dB

Figura 8. Identificacao de danos para a segunda regiao danificada do Caso 2 para dois nıveis de SNR.

485 490 495 500 505 510 515 520 5250.4

0.6

0.8

1

1.1

x(mm)

A(x

)

ExataPSOPSO−LM

(a) SNR = 10 dB

485 490 495 500 505 510 515 520 5250.4

0.6

0.8

1

1.1

x(mm)

A(x

)

ExataPSOPSO−LM

(b) SNR = 0 dB

Figura 9. Identificacao de danos para o Caso 3 para dois nıveis de SNR.

490 495 500 505 5100.6

0.7

0.8

0.9

1

1.1

x(mm)

A(x

)

ExataPSOPSO−LM

(a) SNR = 10 dB

494 496 498 500 502 504 506 5080.6

0.7

0.8

0.9

1

1.1

x(mm)

A(x

)

ExataPSOPSO−LM

(b) SNR = 0 dB

Figura 10. Identificacao de danos para o Caso 4 para dois nıveis de SNR.

Considerando-se o metodo hıbrido PSO-LM, a Tabela 1 apresenta os principais aspectosrelacionados a identificacao de danos para os Casos 1 a 4: numero de dados experimentais sinteticosutilizados na identificacao; numero de parametros estimados; numero de iteracoes para os quatrosnıveis de SNR; e funcao custo do processo de identificacao, Equacao (16). Conforme pode serobservado na Tabela 1, o metodo hıbrido PSO-LM apresentou resultados bastante satisfatorios noque diz respeito ao numero de iteracoes e ao valor alcancado para a funcao custo.

Page 77: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

62 Fernandes et al.

Tabela 1. Dados da identificacao de danos com o metodo PSO-LM.

Caso 1 Caso 2 Caso 2 Caso 3 Caso 4(Parte 1) (Parte 2)

Dados utilizados 31 31 19 33 13Parametros estimados 29 29 17 31 11Iteracoes (0 dB) 34 32 21 39 14Iteracoes (10 dB) 33 31 21 38 14Iteracoes (20 dB) 33 34 22 39 13Iteracoes (30 dB) 31 34 21 35 14E (0 dB) 1,669E−14 1,805E−14 3,703E−15 2,088E−14 8,833E−16

E (10 dB) 1,833E−14 1,671E−14 3,370E−15 1,957E−14 8,570E−16

E (20 dB) 1,710E−14 1,706E−14 3,400E−15 2,043E−14 8,383E−16

E (30 dB) 1,711E−14 1,717E−14 3,486E−15 2,019E−14 8,187E−16

As Tabelas 2 e 3 apresentam os custos computacionais dos metodos PSO e PSO-LM para os quatrocenarios de dano estudados e para diferentes nıveis de SNR. Como pode ser observado, o metodoestocastico PSO apresentou um custo computacional muito maior do que o metodo hıbrido PSO-LM.Por exemplo, no Caso 4, com SNR de 20 dB, o metodo PSO apresentou um tempo computacional decerca de 1 hora, enquanto que no metodo PSO-LM, o tempo foi de cerca de 10 segundos. A enormediscrepancia observada se deve a natureza estocastica do metodo PSO, que demanda um numerorelativamente grande de iteracoes para alcancar pequenos valores de resıduo. Na abordagem hıbridaPSO-LM, por outro lado, o algoritmo PSO roda somente um determinado numero de iteracoes como objetivo de se obter uma melhor estimativa inicial para o algoritmo LM, que, por sua vez, rodarelativamente rapido.

Tabela 2. Custo computacional do metodo PSO.

Caso 1 Caso 2 Caso 2 Caso 3 Caso 4(Parte 1) (Parte 2)

SNR 0 dB

Custo3h47m24s 3h45m00s 3h52m42s 8h20m24s 3m13s

ComputacionalExecucoes AAS 6.824.000 3.541.000 128.000 5.000.000 66.000SNR 10 dB

Custo3h23m24s 3h46m48s 9h34m12s 1h53m24s 58m23s

ComputacionalExecucoes AAS 5.278.000 3.516.000 483.000 1.049.000 901.000SNR 20 dB

Custo2h11m24s 3h28m48s 4h48m00s 6h20m22s 1h36s

ComputacionalExecucoes AAS 2.702.000 1.796.000 191.000 4.491.000 901.000SNR 30 dB

Custo2h09m36s 4h10m45s 4h03m00s 3h43m48s 56m56s

ComputacionalExecucoes AAS 2.689.000 3.565.000 183.000 3.495.000 897.000

6.2 Identificação a partir da resposta a um pulso retangular

Nesta secao, o efeito do ruıdo aditivo nos sinais de excitacao (agora um pulso retangular) ede resposta, e considerado no problema inverso de identificacao de danos. O cenario de danoapresentado na Figura 1c (Caso 3) foi considerado para as analises. Uma relacao sinal-ruıdo de10 dB, representando um elevado nıvel de ruıdo num procedimento experimental, foi adotada.

Page 78: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Problema inverso em propagação de ondas em sólidos 63

Tabela 3. Custo computacional do metodo PSO-LM.

Caso 1 Caso 2 Caso 2 Caso 3 Caso 4(Parte 1) (Parte 2)

SNR 0 dB

Custo Computacional 3m46s 2m48s 15m15s 5m4s 9,72sExecucoes AAS 57.223 53.857 12.160 74.998 3.403SNR 10 dB

Custo Computacional 3m10s 2m40s 15m01s 3m53s 10,24sExecucoes AAS 55.540 52.174 12.160 73.075 3.403SNR 20 dB

Custo Computacional 2m55s 2m57s 15m50s 4m7s 9,94sExecucoes AAS 55.540 57.223 12.739 74.998 3.160SNR 30 dB

Custo Computacional 2m39s 3m11s 16m15s 3m43s 10,58sExecucoes AAS 52.174 57.223 12.160 67.306 3.403

As Figuras 11 e 12 apresentam as excitacoes retangulares de curta e de longa duracao, corrompidaspor um ruıdo aleatorio de media nula com SNR de 10 dB, juntamente com os seus respectivos sinaisde eco.

0 20 40 60 80 100

0

1

t(µs)

f(t)

(a) Excitacao com SNR = 10 dB

0 100 200 300 400−0.4

−0.2

0

0.2

0.4

t(µs)

g(t

)

(b) Eco com SNR = 10 dB

Figura 11. Pulso retangular de curta duracao e eco correspondente. Ambos corrompidos com ruıdo comSNR = 10 dB.

0 20 40 60 80 100

0

1

t(µs)

f(t)

(a) Excitacao com SNR = 10 dB

0 100 200 300 400−0.4

−0.2

0

0.2

0.4

t(µs)

g(t

)

(b) Eco com SNR = 10 dB

Figura 12. Pulso retangular de longa duracao e eco correspondente. Ambos corrompidos com ruıdo deSNR = 10 dB.

Os resultados obtidos na identificacao de danos com os metodos PSO e PSO-LM, considerando-seas duas excitacoes retangulares com ruıdo, sao apresentados nas Figuras 13 e 14. Dos resultados,pode-se observar que, para ambas as excitacoes, o dano foi identificado de forma satisfatoria,apresentando erros relativos abaixo de 4%. Observa-se tambem que a identificacao foi ligeiramentemelhor no caso do pulso de curta duracao. No entanto, esse resultado era esperado, uma vez que o

Page 79: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

64 Fernandes et al.

pulso de curta duracao se aproxima mais do delta de Dirac e, portanto, fornece uma resposta comum conteudo frequencial maior do que a obtida com o pulso de longa duracao.

480 490 500 510 520 5300.4

0.6

0.8

1

x(mm)

A(x

)

ExataPSOPSO−LM

(a) Area da secao transversal

485 490 495 500 505 510 515 520 525−6

−4

−2

0

2

4

x(mm)

Err

o (

%)

PSOPSO−LM

(b) Erros relativos

Figura 13. Resultados da identificacao para o Caso 3: Dados com SNR = 10 dB e pulso de curta duracao.

480 490 500 510 520 5300.4

0.6

0.8

1

x(mm)

A(x

)

ExataPSOPSO−LM

(a) Area da secao transversal

480 490 500 510 520 530−4

−2

0

2

4

x(mm)

Err

o (

%)

PSOPSO−LM

(b) Erros relativos

Figura 14. Resultados da identificacao para o Caso 3: Dados com SNR = 10 dB e pulso de longa duracao.

7. Conclusões

O problema inverso de identificacao de danos em uma barra a partir de uma abordagem depropagacao de ondas acusticas foi apresentado. Considerou-se que o dano resulta em uma alteracaona area da secao reta nominal da barra e o problema de identificacao foi, entao, definido comoum problema de minimizacao, com respeito a area da secao reta, da norma quadratica da diferencaentre o eco experimental sintetico e o correspondente eco previsto pelo modelo. O problema direto depropagacao de ondas em meios nao homogeneos foi modelado pelo Algoritmo Algebrico Sequenciale, para a obtencao da solucao do problema inverso, foram considerados dois metodos de otimizacao:o metodo estocastico PSO e um metodo hıbrido PSO-LM.

Com o intuito de verificar a adequacao das tecnicas propostas, diferentes formas e posicoes dedanos foram consideradas. A robustez das tecnicas, em relacao a presenca de ruıdo aditivo nossinais de excitacao e de eco, foi avaliada para diferentes nıveis de relacao sinal-ruıdo. Considerou-setambem excitacoes na forma de um delta de Dirac e pulsos retangulares de curta e longa duracao.

Uma das grandes vantagens da abordagem de propagacao de ondas acusticas e a possibilidade dese localizar a regiao danificada atraves de uma analise direta do sinal de eco, permitindo, portanto, aselecao de um subconjunto de parametros a serem estimados no processo de identificacao. Deve serenfatizado tambem que o AAS, por sua vez, permite que os parametros sejam estimados um por vez,ao inves de se estimar todos de uma unica vez, como seria feito ao se utilizar a equacao diferencialhiperbolica, Equacao (1). Esses fatos combinados, fazem com que, no problema de identificacaobaseado no AAS, um numero relativamente grande de parametros possa ser estimado.

A primeira conclusao importante e que ambos os metodos de otimizacao utilizados (PSO e PSO-LM) fornecem resultados excepcionais de identificacao, sendo recuperado um numero substancial deparametros. Todavia, a abordagem hıbrida PSO-LM resultou em um menor custo computacional.

Considerando-se pulsos retangulares e uma relacao sinal-ruıdo de 10 dB, os perfis de danos foramidentificados com boa acuracia, como mostram as Figuras 13 e 14. Os resultados da identificacaoforam similares ao resultado obtido com o delta de Dirac, Figura 9a. Portanto, a tecnica de

Page 80: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Problema inverso em propagação de ondas em sólidos 65

identificacao de danos aqui apresentada, fundamentada no AAS, mostrou-se robusta em relacaoa presenca de ruıdo nos sinais e em relacao a excitacao utilizada.

Agradecimentos

Os autores agradecem ao CNPq, Conselho Nacional de Desenvolvimento Cientıfico e Tecnologico e aFAPERJ, Fundacao Carlos Chagas Filho de Amparo a Pesquisa do Estado do Rio de Janeiro, peloapoio financeiro a esta pesquisa.

ReferênciasBecceneri, J.C.; Stephany, S.; Campos Velho, H.F. & Silva Neto, A.J., Solution of the inverse problem of radiative

properties estimation with the particle swarm optimization technique. In: Proceedings of the Inverse Problems inEngineering Seminar. Ames, 2006.

Begambre, O. & Laier, J.E., A hybrid Particle Swarm Optimization - Simplex algorithm (PSOS) for structural damageidentification. Advances in Engineering Software, 40:883–891, 2009.

Campos Velho, H.F.; Ramos, F.M.; Chalhoub, E.S.; Stephany, S.; Carvalho, J.C. & Souza, F.L., Inverse problems inspace science and technology. Sidney: Proceedings of the 5th International Conference on Industrial and AppliedMathematics, 2003.

Cantrell, J.H. & Yost, W.T., Nonlinear ultrasonic characterization of fatigue microstructures. Int J Fatigue, 23:480–487,2001.

Fernandes, K.M.; Silva Neto, A.J.; Tenenbaum, R.A. & Stutz, L.T., Vibration and wave propagation approachesapplied to assess damage influence on the behavior of Euler-Bernoulli beams — part II: Inverse problem. Athens:Proceedings of the Ninth International Conference on Computational Structures Technology, 2008.

Gangadharan, R.; Mahapatra, D.R.; Gopalakrishnan, S.; Murthy, C.R.L. & Bhat, M.R., On the sensitivity of elasticwaves due to structural damages: Time-frequency based indexing method. Journal of Sound and Vibration,320(12):915–941, 2009.

Grabowska, J.; Palacz, M. & Krawczuka, M., Damage identification by wavelet analysis. Mechanical System and SignalProcessing, 22:1623–1635, 2008.

Kennedy, J. & Eberhart, R., Swarm Intelligence. Morgan Kaufmann Publishers, 2001.

Kuchler, S.; Meurer, T.; Jacobs, L.J. & Qu, J., Two-dimensional wave propagation in an elastic half-space withquadratic nonlinearity: A numerical study. J Acoust Soc Am, 125:1293–1301, 2009.

Lefebre, J.P., La tomographie d’impedance acoustique. Trait Signal, 2(2):103–110, 1985.

Marquardt, D.W., An algorithm for least-squares estimation of nonlinear parameters. J Soc Industr Appl Math,11:431–441, 1963.

Mendell, J.M. & Ashrafi, F.H., A survey of approaches to solving inverse problems for lossless layered media systems.IEEE Trans Geosci Rem Sensing, GE-18(4):320–330, 1980.

Montalvao, D.; Maia, N.M.M. & Ribeiro, A.M.R.A., Review of vibration-based structural health monitoring withspecial emphasis on composite materials. The Shock and Vibration Digest, 38:295–324, 2006.

Nag, A.; Mahapatra, D. & Gopalakrihnan, S., Identification of delamination in composite beams using spectralestimation and a genetic algorithm. Smart Materials and Structures, 11(6):899–908, 2002.

Ni, S.H.; Lo, K.F.; Lehmann, L. & Huang, Y., Time-frequency analyses of pile-integrity testing using wavelet transform.Computers and Geotechnics, 35:600–607, 2008.

Pierce, A., Acoustics: An Introduction to its Physical Principles and Applications. Woodbury: Acoustical Society ofAmerica, 1989.

Rao, M.A.; Srinivas, J. & Murthy, B.S.N., A damage detection in vibrating bodies using genetics algorithms. Computersand Structures, 82:963–968, 2004.

Santos, J.V.A.; Maia, N.M.M.; Mota Soares, C.M. & Mota Soares, C.A., Structural damage identification: A survey.In: Topping M. Papadrakakis, E. (Ed.), Trends in Computational Structures Technology. Stirlingshire, UK: Saxe-Coburg Publications, B.H.V, p. 1–24, 2008.

Schwetlick, H., Inverse methods in the reconstruction of acoustic impedance profiles. J Acoust Soc Am, 73(6):1179–1186,1983.

Silva Neto, A.J. & Moura Neto, F.D., Problemas Inversos - Conceitos Fundamentais e Aplicacoes. Rio de Janeiro:EdUERJ - Editora da Universidade do Estado do Rio de Janeiro, 2005.

Silva Neto, A.J. & Soeiro, F.J.C.P., Estimation of the phase function of anisotropic scattering with a combinationof gradient based and stochastic global optimization methods. Vienna, Austria: Proceedings of the Fifth WorldCongress on Computational Mechanics, 2002.

Tenenbaum, R.A.; Fernandes, K.M. & Stutz, L.T., Damage identification in bars with a wave propagation approachand a hybrid optimization method. Shock and Vibration, 19:301–321, 2012.

Page 81: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

66 Fernandes et al.

Tenenbaum, R.A.; Stutz, L.T. & Fernandes, K.M., Comparison of vibration and wave propagation approaches appliedto assess damage influence on the behavior of Euler-Bernoulli beams. Computers & Structures, 89:1820–1828,2011.

Tenenbaum, R.A. & Zindeluk, M., Classical signal processing techniques applied to variable impedance identificationby impulse testing. In: Proceedings of 15th Internoise. v. 2, p. 1241–1246, 1986.

Tenenbaum, R.A. & Zindeluk, M., An exact solution for the one-dimensional elastic wave equation in layered media.J Acoust Soc Am, 92(6):3364–3370, 1992a.

Tenenbaum, R.A. & Zindeluk, M., A fast algorithm to solve the inverse scattering problem in layered media witharbitrary input. J Acoust Soc Am, 92(6):3371–3378, 1992b.

Vanaverbeke, S. & Abeele, K., Two-dimensional modeling of wave propagation in materials with hysteretic nonlinearity.J Acoust Soc Am, 122:58–72, 2007.

Page 82: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Capítulo 6

Estimativa Bayesiana dePropriedades Acústicas em Tubos de Kundt

Mario Olavo Magno de Carvalho∗, Marcus Vinicius Girão de Moraise Alberto Carlos Guimarães Castro Diniz

Resumo: Por meio de uma abordagem Bayesiana, resolve-se o problema da identificacao das propriedadesde absorcao de amostras de material submetidas a ondas unidimensionais de pressao acustica em tubosde Kundt. Aplica-se um metodo de Monte Carlo via cadeia de Markov, em um algorıtmo de Metropolis-Hastings, para a solucao do problema inverso. As solucoes sao buscadas em um espaco de funcoes Splines,acelerando a convergencia sem perda de generalidade. Sinais de pressao independentes foram simuladospara construir o modelo a priori. Apresentam-se os conceitos fundamentais da metodologia proposta; quee analisada quanto a sua precisao e estabilidade em um experimento simulado.

Palavras-chave: Modelagem estocastica, Funcoes splines, Otimizacao, Tubo de impedancia.

Abstract: A Bayesian approach was applied to solve an identification problem of some absorptionproperties of material samples subjected to one-dimensional acoustic pressure waves in a Kundt’s Tube.A Markov Chain Monte Carlo sampling approach, implemented in the form of the Metropolis-Hastingsalgorithm, was used to solve the inverse problem. The solutions were searched in a spline functions space,accelerating the convergence without loss of generality. Pressure signals were simulated to construct theprior model. The fundamental concepts of the proposed methodology are presented, and it is analysed toits accuracy and stability in a simulated experiment.

Keywords: Stochastic modeling, Spline functions, Optimization, Impedance tube.

Conteúdo

1 Introducao ................................................................................................................................ 682 Abordagem Bayesiana na solucao de problemas inversos......................................................... 68

2.1 Estimativas usando metodos de Monte Carlo via cadeia de Markov ............................... 693 O Modelo Matematico do Tubo de Impedancia....................................................................... 69

3.1 Formulacao teorica........................................................................................................... 704 Processo de Otimizacao e Implementacao Numerica ............................................................... 72

4.1 Otimizacao usando aproximacao ponto-a-ponto .............................................................. 724.2 Otimizacao utilizando funcoes splines ............................................................................. 724.3 Simulacao do problema direto.......................................................................................... 724.4 Implementacao numerica ................................................................................................. 73

5 Resultados Obtidos .................................................................................................................. 745.1 Tubo excitado por uma funcao impar.............................................................................. 745.2 Tubo excitado por uma funcao Gaussiana....................................................................... 77

6 Conclusao ................................................................................................................................. 77

∗Autor para contato: [email protected]

Lobato et al. (Ed.), (2014) DOI: 10.7436/2014.tica.06 ISBN 978-85-64619-15-9

Page 83: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

68 Carvalho et al.

1. Introdução

O tubo de Kundt, tambem chamado de tubo de impedancia, e muito usado em ensaios para adeterminacao das propriedades acusticas de materiais (coeficiente de absorcao, impedancia acustica,

etc). E constıtuido por um tubo com um autofalante posicionado em uma de suas extremidades eum corpo de prova na outra. Microfones sao usados para medir a pressao acustica das ondas que sepropagam dentro do tubo. As ondas medidas pelos microfones sao a combinacao da onda incidente(emitida pelo autofalante) e da onda refletida pela amostra testada. Conhecendo-se os sinais medidospelos microfones e possıvel determinar as caracterısticas das ondas incidente e refletida e, assim,determinar as propriedades do material testado.

A determinacao das propriedades de absorcao de materiais testados em tubos de Kundt a partirdos sinais medidos nos microfones e um problema de identificacao de parametros, que esta incluıdoem uma classe, mais geral, de problemas inversos. Para resolver este problema inverso, foi utilizadoum metodo estatıstico com base na abordagem Bayesiana, que apresenta uma maior estabilidadeno tratamento de dados incompletos e sujeitos a incertezas, do que os metodos determinısticostradicionais. Utilizar uma abordagem estocastica para resolver um problema inverso envolve aotimizacao de uma funcao (ou parametro) que minimiza a dispersao dos resıduos no problema diretoassociado, e exige metodos eficientes para amostragem. Um algoritmo que se adapta muito bemaos problemas de otimizacao estatısticos e o algoritmo de Metropolis-Hastings, usando o metodo deMonte Carlo via cadeia de Markov (MCMC, do ingles Markov Chain Monte Carlo) para realizar aamostragem. A utilizacao dos metodos MCMC permite, naturalmente, uma analise mais robusta dasolucao, e um calculo mais preciso das estimativas de erro.

Este trabalho propoe uma estrategia de otimizacao que faz uso de aproximacao por funcoes splines,que sao muito adequadas para a solucao de problemas de engenharia, tanto por suas caracterısticas,como pelo seu baixo custo computacional, em um algoritmo de otimizacao de Metropolis-Hastings,para resolver o problema inverso estocastico. Para comparacao e usada uma otimizacao comaproximacao ponto-a-ponto dos sinais de interesse.

Um programa, desenvolvido na plataforma Matlab, resolve o problema inverso para os dadossimulados e analisa o desempenho da otimizacao usando funcoes splines; comparando os resultadosobtidos aqueles obtidos pelo metodo tradicional de aproximacao ponto-a-ponto.

Na sequencia sao apresentados a modelagem do problema da medicao de propriedades acusticasem tubos de Kundt, a metodologia e o algoritmo desenvolvido, bem como os resultados obtidos.Esses sao analisados e discutidos, com enfase na qualidade da representacao das ondas incidente erefletida e na capacidade de reconstrucao dos sinais dos microfones.

2. Abordagem Bayesiana na solução de problemas inversos

A identificacao de sinais faz parte dos chamados problemas inversos. De acordo com uma definicaosuficientemente ampla (Engl et al., 1996), “resolver um problema inverso e determinar causasdesconhecidas a partir de efeitos observados ou desejados”. Problemas inversos sao matematicamenteclassificados como mal postos por nao atenderem uma das tres condicoes de Hadamard, que definemos problemas bem postos (Isakov, 2006).

A solucao de um problema bem posto deve satisfazer as condicoes de existencia, unicidade eestabilidade no que diz respeito aos dados de entrada. Quanto aos problemas inversos, a existenciade uma solucao pode, em muitos casos, ser assegurada com base em argumentos fısicos. Por outrolado, a unicidade da solucao pode ser matematicamente demonstrada apenas para alguns casosespeciais de problemas inversos e, em geral, as tecnicas convencionais, sao extremamente instaveisem relacao aos dados de entrada, exigindo tecnicas especiais para garantir a estabilidade da solucao.

Existem varias metodologias para se resolver problemas inversos, que podem ser divididas emdois grupos principais (Kirsch, 2011): regularizacao classica e abordagem por inversao estatıstica.

Metodos de regularizacao classicos visam basicamente a minimizacao da norma dos mınimosquadrados dos resıduos do modelo. Nesses metodos busca-se uma solucao aproximada que seja suave(regular) e compatıvel com os dados observados para um determinado nıvel de ruıdo. Dois tipos deregularizacao sao mais frequentemente utilizados: a tecnica de regularizacao de Tikhonov (Tikhonov& Arsenin, 1977) e o metodo de maxima entropia (Jaynes, 1957), que procura uma regularidadeglobal, produzindo reconstrucoes suaves para os mesmos dados observados.

A inversao estatıstica baseia-se na abordagem Bayesiana em que modelos (distribuicao deprobabilidade) das medicoes e das incognitas sao construıdos separadamente e de forma explıcita.O objetivo geral da inversao estatıstica e atualizar a distribuicao de probabilidade (modelo) a prioriem uma distribuicao (modelo) posterior, quando novas informacoes (dados observados) tornam-se

Page 84: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Estimativa Bayesiana de propriedades acústicas em tubos de Kundt 69

disponıveis. A solucao do problema inverso e reformulada na forma de inferencia estatıstica dadensidade da probabilidade a posteriori , a qual e o modelo para a distribuicao de probabilidadecondicional dos parametros desconhecidos dadas as medicoes. O modelo de medicao incorporando oserros de medicao e as incertezas associadas e chamado de verossimilhanca, ou seja, a probabilidadecondicional das medicoes, dados os parametros desconhecidos (Kirsch, 2011). O modelo para asincognitas que reflete toda a incerteza dos parametros, sem a informacao veiculada pelas medicoes,e chamado modelo anterior. O mecanismo formal para combinar a nova informacao (medicoes) coma informacao previamente disponıvel (a priori) e conhecido como Teorema de Bayes (Lee, 2004).

2.1 Estimativas usando métodos de Monte Carlo via cadeia de Markov

Os metodos de Monte Carlo via Cadeia de Markov (MCMC) sao versoes iterativas do tradicionalmetodo de Monte Carlo (Robert & Casella, 2004). A ideia basica e a obtencao de uma amostra dadistribuicao a posteriori e calculo de estimativas amostrais de caracterısticas dessa distribuicao (Lee,2004). A amostragem baseada nos metodos de Monte Carlo via Cadeia de Markov e a tecnica maisviavel para o calculo das estimativas, especialmente nos casos em que o numero de incognitas nao emuito grande. Neste trabalho fazemos uso de um metodo MCMC para a solucao do problema inverso.O algoritmo MCMC mais comum e o algoritmo de Metropolis-Hastings (Kaipio & Somersalo, 2004).

Uma Cadeia de Markov e um processo estocastico P0,P1, ...,Pn tal que a distribuicao de Pt,dados todos os valores previos P0,P1, ...,Pt−1, depende apenas do valor imediatamente anteriorPt−1. Assim, para um subconjunto A:

P(Pt ∈ A | P0,P1, ...,Pt−1) = P(Pt ∈ A | Xt−1) (1)

O Algoritmo de Metropolis-Hasting satisfaz as condicoes dadas pela Equacao 1 e e um dos maisutilizados para inferencia Bayesiana. A ideia basica do algoritmo de Metropolis-Hasting e simularum caminho aleatorio no espaco P que converge para uma distribuicao estacionaria na qual se estainteressado (Kaipio & Somersalo, 2004).

A inferencia Bayesiana incorpora informacoes a priori sobre os parametros e as medicoes naformulacao do problema.

Os metodos MCMC de estimativa por inferencia Bayesiana implicam necessariamente no usode tecnicas de amostragem de funcoes densidade de probabilidade e de um criterio de avaliacao demaxima verossimilhanca. Esses metodos permitem obter uma grande amostragem de combinacoespara o vetor de parametros a partir de uma funcao densidade de probabilidade. Estas amostras saotestadas, aceitas ou rejeitadas em um algoritmo, a exemplo do de Metropolis-Hastings (Gamerman &Lopes, 2006). Com uma amostragem suficientemente grande a sequencia P0,P1, ...,Pn convergepara a solucao do problema inverso.

E importante notar que, com esse metodo, o problema direto precisa ser resolvido paracada amostra do vetor de parametros, exigindo um grande numero de calculos. Assim, apenasrecentemente, com o aumento da capacidade e velocidade de calculo dos computadores e que aaplicacao pratica desses metodos em problemas mais complexos tornou-se viavel.

3. O Modelo Matemático do Tubo de Impedância

O tubo de impedancia e um metodo padronizado para a determinacao da impedancia acustica e docoeficiente de absorcao de um material especıfico. Este aparato experimental consiste de um longotubo conectado a uma fonte acustica (alto-falante). A geometria tubular serve como guia de ondaspara suportar a propagacao de uma onda plana para uma banda de frequencia entre a frequenciade corte da fonte acustica e a primeira frequencia transversal da cavidade. Para essa banda defrequencias, as ondas planas incidem sobre o material acustico localizado na extreminada do tubooposta a fonte acustica. As condicoes de contorno podem ser simplificadas sobre a superfıcie domaterial atraves de uma impedancia especıfica z = p/v onde p e a pressao acustica e v e a velocidadeacustica.

Existem varios metodos para determinar os coeficiente de absorcao por meio de ondasestacionarias dentro de um tubo. Podemos citar o metodo da razao de onda estacionaria, definidopela norma ISO 10534-1:1996 (ISO, 1996), e o metodo de funcao de transferencia, definido pelanorma ISO 10534-2:1998 (ISO, 1998).

O metodo de funcao de tranferencia, primeiramente formulado por Chung e Blaser (Chung &Blaser, 1980a,b), desacopla os campos acusticos incidentes e refletidos a partir da hipotese de ondasplanas. Assim, a partir da funcao de transferencia da pressao acustica de dois pontos, ele permitedeterminar a razao entre as ondas refletida e incidente no material.

Page 85: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

70 Carvalho et al.

A Figura 1 ilustra um esquema experimental para determinar o coeficiente de absorcao acustica eimpedancia acustica pelo metodo de funcao de transferencia. Diversos laboratorios no paıs possuemou desenvolveram aparatos experimentais para a determinacao do coeficiente de absorcao pelometodo de funcao de transferencia. Melo Filho (2010) desenvolveu uma bancada experimental paradeterminar o coeficiente de absorcao acustica de materiais usando uma variante do metodo de funcaode transferencia para um unico microfone (Chu, 1986).

Figura 1. Esquema geometrico do tubo de impedancia aplicando o metodo de funcao de transferencia.

3.1 Formulação teórica

A Figura 2 apresenta um esquema simplificado da geometria do tubo de impedancia aplicando ometodo de funcao de transferencia.

O modelo fısico propoem, atraves da hipotese de ondas planas, que a informacao e composta porduas ondas: a onda incidente pi propagando-se na direcao-x positiva e a onda refletida pr progando-sena direcao-x negativa ao longo do tubo.

As pressoes acusticas referentes a cada uma das componente incidentes e refletidas sao indicadaspor: p1,i (t) e p2,i (t) para as ondas incidentes, e p1,r (t) e p2,r (t) para as ondas refletidas. Destaforma, a pressao acustica pi em cada microfone (i = 1, 2) e dada pelas expressoes:

p1 (t) = p (x, t)cx=−(L+s) = p1,i(t) + p1,r(t) e,

p2 (t) = p (x, t)cx=−L = p2,i(t) + p2,r(t)(2)

Figura 2. Pressoes incidentes e refletidas nos microfones do tubo de Kundt.

Page 86: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Estimativa Bayesiana de propriedades acústicas em tubos de Kundt 71

A funcao de transferencia no domınio da frequencia pode ser definida para a pressao total entredois pontos em termos da transformada de Fourier, bem como para as componentes incidentes erefletidas:

H12 (f) =p2(f)

p1(f)=p2,i(f) + p2,r(f)

p1,i(f) + p1,r(f), (3)

e,

H12i (f) =p2,i(f)

p1,i(f)e, H12r (f) =

p2,r(f)

p1,r(f)(4)

sendo p(f), com os subscritos apropriados, a Transformada de Fourier da pressao acustica temporal.Alem disso, os coeficientes de reflexao (no domınio da frequencia) em cada ponto podem ser definidoscomo:

R1 (f) =p1,r(f)

p1,i(f)e, R2 (f) =

p2,r(f)

p2,i(f)(5)

neste caso,

H12 (f) = H12i (f)1 +R2(f)

1 +R1(f)(6)

O coeficiente de reflexao no ponto 2 pode ser escrito em termos do ponto 1,

R2 (f) =

[H12,r(f)

H12,i(f)

]R1(f) (7)

e, entao, a equacao (6) pode ser resolvida para R1(f),

R1 (f) =

[H12(f)−H12,i(f)

H12,r(f)−H12(f)

](8)

Ao assumir o tubo sem perdas, a funcao de transferencia entre os microfones e facilmentedeterminada por um delay de propagacao. No microfone #1, a pressao acustica incidente e refletidasao descritas, respectivamente, como,

p1,i(t) = po exp (ıωt) exp (−ık[−(L+ s)]) (9)

e,p1,r(t) = R po exp (ıωt) exp (−ık(L+ s)) . (10)

Entao, no microfone #2, a pressao acustica e descrita como,

p2,i(t) = po exp (ıωt) exp (−ık[−L]) = p1,i(t)exp (−ıks) (11)

e,p2,r(t) = R po exp (ıωt) exp (−ıkL) . = p1,r(t)exp (ıks) (12)

Entao,H12i (f) = exp (−ıks) e, H12r (f) = exp (ıks) (13)

Por esta mesma razao, estas expressoes podem ser extendidas para permitir a expressao docoeficiente de reflexao R(f) na superfıcie da amostra em termos de R1(f), ou seja,

R (f) = R1(f) exp [ı 2k(L+ s)] (14)

Finalmente, usando (8), (13), e (14),

R (f) = exp [ı 2k(L+ s)]

[H12(f)− exp(−ıks)H12(f)− exp(+ıks)

](15)

O coeficiente de absorcao de incidencia normal e entao dado por αn = 1− |R(f)|2, ou ainda,

αn (f) = 1−∣∣∣∣H12(f)− exp(−ıks)H12(f)− exp(+ıks)

∣∣∣∣2 (16)

Page 87: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

72 Carvalho et al.

4. Processo de Otimização e Implementação Numérica

A busca de convergencia da Cadeia de Markov, no problema descrito, constitui-se, claramente, emum processo de otimizacao de funcoes. Como a otimizacao exige a solucao do problema diretoum grande numero de vezes, tem-se um elevado custo computacional associado. Assim, diferentesestrategias de otimizacao podem ser adotadas. A seguir sao apresentadas duas estrategias que foramusadas para resolver o probelma inverso para determinacao das ondas incidentes e refletidas no tubode Kundt: o metodo tradicional, usando aproximacao ponto-a-ponto, e um metodo com aproximacaopor funcoes splines. Em ambos os casos e usada a abordagem estocastica bayesiana.

4.1 Otimização usando aproximação ponto-a-ponto

O numero de passos requerido para a convergencia de um problema inverso cresce diretamente coma dimensao do espaco de solucao procurado. Em um processo de otimizacao usando aproximacaoponto-a-ponto muitos pontos devem ser considerados a fim de atingir uma solucao mais precisa,aumentando o tamanho do vetor da funcao tentativa e, consequentemente, o numero de passosnecessarios para a convergencia do problema inverso.

Como criterio de aceleracao da convergencia pode-se afirmar que, a qualquer tempo, ao longo deum processo de otimizacao, a perturbacao aleatoria imposta a melhor aproximacao disponıvel ateo momento em questao deve guardar uma relacao direta com a dispersao (avaliacao de maximaverossimilhanca) apresentada por essa solucao. Assim, para dispersoes grandes, que aparecemnos primeiros passos da Cadeia de Markov (que se encontra longe da convergencia), convem seutilizar perturbacoes grandes, que devem ser reduzidas a medida que se aproxima da convergencia(solucao procurada). Contudo, mesmo adotando-se esta estrategia para a evolucao da perturbacao,o custo computacional da otimizacao utilizando a tecnica tradicional de aproximacao ponto-a-pontopermanece elevado.

4.2 Otimização utilizando funções splines

Tendo em vista a grande incerteza envolvida nos primeiros passos da Cadeia de Markov, alemda estrategia de se evoluir com a amplitude das perturbacoes aplicadas ao longo do processo deotimizacao, aplicou-se tambem uma tecnica de modificacao da dimensao do espaco de solucao.Inicialmente adota-se uma aproximacao mais grosseira da solucao buscada, de forma a se terum espaco vetorial de menor dimensao e, portanto, uma convergencia mais rapida. Garantida aconvergencia inicial (no espaco reduzido), inicia-se a etapa seguinte pesquisando uma solucao maisrefinada num espaco maior (o espaco da solucao procurada). Assim, o processo de convergencia noespaco da solucao desejada e mais rapido, pois se inicia com uma solucao ja proxima da procurada.

Para tornar esse processo mais eficaz, busca-se uma representacao utilizando um espaco de funcoessplines (ou funcoes polinomiais por partes) da classe C2, que se mostram mais convenientes pararepresentacao de problemas fısicos reais.

Inicialmente desenvolvidas para a modelagem de formas suaves utilizadas na industria naval, coma evolucao dos recursos computacionais, as aplicacoes das funcoes splines se expandiram para outrasareas da computacao cientıfica devido a sua simplicidade, precisao e flexibilidade para representargeometrias complexas (Schumaker, 2007). Autores como Biloti et al. (2001) e Steffens (2005), dentreoutros, exploraram as propriedades das funcoes splines em algoritmos de interpolacao e de otimizacao.Do ponto de vista matematico uma spline e uma funcao polinomial definida por intervalos. Dentre asfamılias de curvas splines, a mais difundida e a Spline Cubica Natural (Natural Cubic Splines - NCS)

de grau 3 e de continuidade C2 (Biloti et al., 2003; Mota et al., 2010). E conveniente interpretar asfuncoes splines como formando um subespaco vetorial de <, frequentemente designado por Sr

n(p),onde p e o vetor dos nos, definidos pelas extremidades dos intervalos de interpolacao; n e o grau dopolinomio de interpolacao (n = 3 para o caso de splines cubicas) e o vetor r indica a suavidade daspline ou o grau de continuidade das derivadas nos pontos definidos pelo vetor p (Schumaker, 2007).

Assim, este trabalho usa uma estrategia de otimizacao, com aproximacao por Splines, que alemde evoluir com a amplitude da perturbacao, aplicada a cada passo de aproximacao, de acordo com aCadeia de Markov, evolui tambem com a classes da funcao spline, adotando classes mais completasa medida que a dispersao identificada, pelo criterio de maxima verossimilhanca, vai sendo reduzida.

4.3 Simulação do problema direto

O problema direto foi modelado considerando a propagacao de ondas unidimensionais em tubos, ondea solucao classica e composta de duas ondas que se propagam em sentidos opostos ao longo de todo

Page 88: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Estimativa Bayesiana de propriedades acústicas em tubos de Kundt 73

o tubo. Adotando como origem a superfıcie da amostra testada, temos a propagacao de uma ondaincidente, no sentido da direita para a esquerda, e uma onda refletida, da esquerda para a direita,conforme Figura 2. A amplitude da onda refletida diferere da amplitude da onda incidente de umfator R, que caracteriza as propriedades de absorcao do material da amostra no tubo. Assumindo ahipotese de linearidade, essas duas ondas sao adicionadas. O resultado dessa composicao de ondas eassumido conhecido no modelo proposto e simula a medicao dos microfones no domınio do tempo.

Apesar de que, no presente caso, foram usados dois microfones, nao ha limitacao para a avaliacaoda resposta quanto ao numero ou a posicao dos microfones. Se um numero maior de microfonesfor utilizado existira mais informacao disponıvel e a solucao do problema inverso sera mais eficiente(seguindo o princıpio bayesiano), embora isso implique em um maior custo experimental.

Uma vez conhecidas as ondas incidente e refletida, o valor das propriedades de absorcao (R) domaterial da amostra testada pode ser estimada.

4.4 Implementação numérica

Ambas as estrategias de otimizacao, por aproximacao ponto-a-ponto e por funcoes splines usam umaaproximacao estatıstica para obter uma solucao para o problema inverso do tubo de impedancia. AFigura 3 mostra o fluxograma do algoritmo computacional desenvolvido para ambas as estrategias.A diferenca entre estas estrategias esta limitado apenas a classe de funcoes admissıveis utilizadas.

O algoritmo proposto arbitra uma funcao teste inicial para resolver o problema direto. Entao, adispersao da resposta e estimada e a funcao teste e modificada ate que a dispersao seja menor que umvalor ε especificado. Nos primeiros passos, utiliza-se como funcao teste uma spline de baixa ordem(pertencente a um espaco de dimensao reduzida). Com a nova etapa proposta para o algoritmo, epossıvel implementar um segundo teste que aumenta a classe da funcao spline quando a dispersaoaproxima-se do valor ε, aumentando a qualidade da representacao (Figura 3).

Figura 3. Fluxograma para solucao do problema inverso do tubo de Kundt.

Foi implementado, em linguagem Matlab, um programa que, usando o algoritmo proposto, avaliae compara o erro para o ajuste das funcoes que representam as ondas de pressao incidente e refletida.

Page 89: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

74 Carvalho et al.

Foram realizadas duas otimizacoes para diferentes casos (considerando-se diferentes tipos de ondasincidentes), usando aproximacao por funcoes ponto-a-ponto e aproximacao por funcoes splines.

5. Resultados Obtidos

Apresenta-se a seguir a comparacao dos resultados obtidos, aplicando-se o algoritmo proposto paraos dois tipos de aproximacao: ponto-a-ponto e por funcoes splines, em condicoes equivalentes. Saoconsiderados dois casos tıpicos: um primeiro com uma onda incidente impar e um segundo com umaonda incidente par (funcao Gaussiana).

5.1 Tubo excitado por uma função impar

O primeiro caso considera uma onda incidente do tipo impar em um tubo de 1 m, com dois microfonesposicionados a 0,1 m e 0,8 m da extremidade onde esta fixada a amostra testada.

Na Figura 4(a) e apresentado o sinal incidente, simulando a onda emitida pelo autofalante.Considerando um coeficiente de absorcao uniforme igual a R = 0, 5, espera-se que o sinal refletidoseja como o mostrado na Figura 4(b). Usando, entao, esses dois sinais foi resolvido o problema diretoe gerado os sinais que teoricamente seriam medidos pelos microfones, como mostra a Figura 5. Estessinais serao usados como referencia para a verificacao da qualidade da solucao do problema inverso.

(a) onda incidente (b) onda refletida

Figura 4. Sinais simulados no tubo de impedancia - onda impar.

Figura 5. Composicao dos sinais capturados pelos microfones (simulacao).

Page 90: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Estimativa Bayesiana de propriedades acústicas em tubos de Kundt 75

A aplicacao do algoritmo, apresentado na Secao 4.4, implica em se arbitrar funcoes que tentemrepresentar os sinais incidente e refletido existentes no tubo para, resolvendo o problema inverso,reconstruir os sinais “medidos” pelos microfones (mostrados na Figura 5). Partindo das funcoesarbitradas para os sinais incidente e refletido, o algoritmo procede a aplicacao de uma perturbacaoaleatoria sobre essas funcoes ate atingir aquelas que melhor representam os sinais compostos,“medidos” pelos microfones. Ao se atingir o nıvel de qualidade de aproximacao exigido para arepresentacao dos sinais dos microfones, usa-se as funcoes representativas dos sinais incidente erefletido para determinar o coeficiente de absorcao da amostra testada.

As Figuras 6(a) e 6(b) mostram a qualidade da aproximacao dos sinais incidente e refletido apos500 iteracoes (apos um tempo de calculo de 7 s). Nas figuras podemos ver a funcao de partida(indicada pelo tracejado verde), a funcao aproximada (tracejado azul) e a solucao esperada (linhavermelha).

Deve-se notar que nestas figuras as solucoes esperadas sao mostradas apenas a tıtulo decomparacao, visto que o algoritmo considera, para verificar a convergencia, a qualidade daaproximacao dos sinais nos dois microfones, mostrada na Figura 6(c), onde a aproximacao numericae mostrada pelo tracejado azul e a solucao esperada (“medida” pelo microfone) em vermelho.

(a) onda incidente (b) onda refletida

(c) Sinais recuperados nos microfones

Figura 6. Evolucao da aproximacao dos sinais apos 500 iteracoes.

Page 91: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

76 Carvalho et al.

Transcorridos 13,12 min. de simulacao, o algoritmo convergiu para os resultados resumidosna Figura 7, que foram obtidos com 10.000 iteracoes. Na Figura 7 pode-se ver a qualidade daaproximacao dos sinais “medidos” nos microfones, os quais permitem determinar com exatidao ossinais incidente e refletido no tubo e com estes e possıvel calcular a coeficiente de absorcao do materialtestado.

Figura 7. Resultado da aproximacao dos sinais nos microfones apos 10.000 iteracoes, usando funcoes splines.

A tıtulo de comparacao, repetiu-se o mesmo procedimento adotando agora uma aproximacaoponto-a-ponto. Foram repetidas as mesmas condicoes de simulacao e usado o mesmo algoritmo,contudo sem o passo de refinamento da funcao de aproximacao.

De forma a abreviar o texto, a Figura 8 resume o resultado final da otimizacao (apos 10.000iteracoes) mostrando as ondas incidente e refletida, bem como a aproximacao dos sinais nosmicrofones. As aproximacoes numericas sao apresentadas em linhas tracejadas azuis e as solucoesesperadas em linhas vermelhas.

Figura 8. Identificacao numerica de um sinal de entrada impar usando aproximacao ponto-a-ponto.

Page 92: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Estimativa Bayesiana de propriedades acústicas em tubos de Kundt 77

5.2 Tubo excitado por uma função Gaussiana

Neste segundo caso considera-se uma onda incidente do tipo Gaussiana (onda par). Sao adotadosos mesmos valores para as dimensoes do tubo e para o posicionamento dos microfones. Considera-setambem o mesmo valor para o coeficiente de absorcao da amostra: R = 0, 5.

Adotando-se o mesmo procedimento do caso anterior, o algoritmo foi inicialmente aplicadoconsiderando uma aproximacao por funcoes splines e, em seguida, repetido usando aproximacaoponto-a-ponto. De forma a evitar repeticoes e alongar o texto, apresentam-se apenas os resultadosfinais das simulacoes.

A Figura 9 mostra, em sua parte superior, o resultado obtido para a identificacao das ondasincidente e refletida no tubo de impedancia e, na parte inferior, a aproximacao dos sinais nosmicrofones. As aproximacoes sao mostradas pelas linhas tracejadas azuis e as solucoes exatas pelaslinhas vermelhas. Para um resıduo quadratico inferior a 0, 3%, a solucao por splines converge em274 iteracoes apos 12,0 segundos, em media. Enquanto, para o mesmo resıduo quadratico inferiora 0, 3%, a solucao ponto-a-ponto converge em 29566 iteracoes apos 125,2 segundos, em media. Assimulacoes foram efetuadas em um computador Pentium Core2 1, 86GHz 1Gb RAM, WindowsXP2002 SP3 e MatLab 7.6.0 (R2008a).

Figura 9. Identificacao numerica de um sinal de entrada gaussiano usando aproximacao por funcoes splines.

Os resultados para a aproximacao ponto-a-ponto sao resumidos na Figura 10, onde, como nasdemais, o tracejado azul mostra o resultado da simulacao e o tracejado vermelho a solucao exata.

6. Conclusão

A identificacao de propriedades acusticas de coeficiente de absorcao e impedancia acustica de umaamostra testada em um tubo de impedancia (Tubo de Kundt) caracteriza um problema inverso emacustica.

O problema bem posto foi adequadamente modelado. A aplicacao de uma abordagem estocasticapor meio de um metodo de Monte Carlo via Cadeia de Markov (MCMC) resultou numa solucaoadequada, robusta e estavel. As ondas incidente, emitida pela fonte sonora, e refletida pela amostratestada, foram recuperadas a partir dos sinais de saıda obtidos por dois microfones (simulando dadosmedidos).

A abordagem de aproximacao por funcoes splines mostrou-se mais adequada, considerando aforma e suavidade das curvas das ondas procuradas. Deve-se atentar para o nıvel de discretizacaodas funcoes splines usadas.

Page 93: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

78 Carvalho et al.

Figura 10. Identificacao numerica de um sinal de entrada gaussiano usando aproximacao ponto-a-ponto.

Uma vez que as ondas incidente e refletida sao conhecidas e possıvel calcular o coeficiente deabsorcao α do material testado no tubo de impedancia. A despeito de que este trabalho objetiveapenas uma aplicacao da metodologia de otimizacao MCMC a um problema de acustica, vislumbra-sea aplicacao alternativa a norma ISO 10534-1:1996 (ISO, 1996). Por exemplo, dado um coeficiente deabsorcao α(f) para uma determinada faixa de frequencia, compara-se a simulacao do sinal acusticodos microfones com relacao ao sinal experimental obtido por tubo de impedancia. Utiliza-se ametodologia de otimizacao MCMC a fim de aprimorar o resultado numerico ate um limite pre-estabelecido.

Deve-se notar ainda que o coeficiente de absorcao acustica α das amostras testadas dependedo espectro de frequencia escolhido. Sinais incidentes com diferentes espectros conduzirao adeterminacao do coeficiente de absorcao para diferentes bandas de frequencia.

ReferênciasISO 10534-1:1996 Acoustics - Determination of sound absorption coefficient and impedance in impedance tubes - Part

1: Method using standing wave ratio. ISO, 1996. .

ISO 10534-2:1998(E) Acoustics - Determination of sound absorption coefficient and impedance in impedance tubes -Part 2: Transfer-function method. ISO, 1998. .

Biloti, R.; Santos, L. & Tygel, M., Layered velocity model from kinematic. In: International Congress of the BrasilianGeophisical Society. v. 2, p. 1055–1058, 2001.

Biloti, R.; Santos, L. & Tygel, M., Automatic smoothing by optimal splines. Brazilian Journal of Geophysics, 21((2)),2003.

Chu, W.T., Transfer function technique for impedance and absorption measurements in a impedance tube using asingle microphone technique. Journal of the Acoustical Society of America, 80(2):555–560, 1986.

Chung, J. & Blaser, D., Transfer function method of measuring in-duct acoustic properties. i. theory. Journal of theAcoustical Society of America, 63(3):907–913, 1980a.

Chung, J. & Blaser, D., Transfer function method of measuring in-duct acoustic properties. ii. experiment. Journal ofthe Acoustical Society of America, 63(3):914–921, 1980b.

Engl, H.; Hanke, M. & Neubauer, A., Regularization of Inverse Problems: Mathematics and its Applications. Kluwer,1996.

Page 94: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Estimativa Bayesiana de propriedades acústicas em tubos de Kundt 79

Gamerman, D. & Lopes, H.F., Markov Chain Monte Carlo: Stochastic Simulation for Bayesian Inference. 2a edicao.Chapman and Hall/CRC, 2006.

Isakov, V., Inverse Problems for Partial Differential Equations. 2a edicao, v. 127 de Applied Mathematical Sciences.Springer, 2006.

Jaynes, E., Information theory and statistical mechanics. Physics Review, 106, 1957.

Kaipio, J. & Somersalo, E., Statistical and Computational Inverse Problems. v. 160 de Applied Mathematical Sciences.Springer, 2004.

Kirsch, A., An Introduction to the Mathematical Theory of Inverse Problems. 2a edicao, v. 120 de Applied MathematicalSciences. Springer, 2011.

Lee, P., Bayesian Statistics. Oxford University Press, 2004.

Melo Filho, N.G.R., Caracterizacao Experimental de Materiais Acusticos para Uso Automotivo. Projeto de Graduacaodo curso de Engenharia Mecanica, Universidade de Brasılia, 2010.

Mota, C.; Orlande, H.; Carvalho, M.; Kolehmainen, V. & Kaipio, J., Bayesiam estimation of temperature-depedentthermophysical properties and transient boundary heat flux. Heat Transfer Engineering, 31(7):570–580, 2010.

Robert, C. & Casella, G., Monte Carlo Statistical Methods. Springer, 2004.

Schumaker, L.L., Spline Functions: Basic Theory. 3a edicao. Cambridge University Press, 2007.

Steffens, L.M., Desenvolvimento de uma metodologia integrada para otimizacao de forma de mecanica dos fluidos.Dissertacao de mestrado, Universidade Federal de Santa Catarina (UFSC), Florianopolis, 2005.

Tikhonov, A. & Arsenin, V., Solution of Ill-Posed Problems. John Wiley & Sons, 1977.

Page 95: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

80 Carvalho et al.

.

Page 96: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Capítulo 7

Solução de um Problema InversoAplicado ao Controle de Vibrações

Romes Antonio Borges∗, Marco Paulo Guimarães e Mario Olavo Magno de Carvalho

Resumo: Este capıtulo propoe avaliar o uso de forcas (momentos) de controle nao lineares para o controlesemiativo de vibracoes em uma estrutura sujeita a esforcos torcionais, modelada por parametros discretosque resultam em baixas frequencias naturais. O controle semiativo e concebido para ser realizado por meiode um momento de controle produzido por atrito de Coulomb em um freio eletromagnetico. Tecnicas deotimizacao estocasticas sao utilizadas para desenvolver modelos nao lineares adotados para o momento decontrole. Os resultados obtidos por simulacao sao comparados com os de um controle passivo classico paraa mesma estrutura e permitem avaliar a vantagem relativa da estrategia adotada para excitacao aleatoria.

Palavras-chave: Problema inverso, Controle de vibracoes, Otimizacao estocastica, Metodo de MonteCarlo.

Abstract: This chapter aims at evaluating the use of nonlinear control forces (moments) for vibrationsemiactive control in a structure with torsional efforts, modeled by lumped parameters that result in lownatural frequencies. Semiactive control is designed to be performed by Coulomb friction forces in a magneticbrake. Stochastic optimization are used to develop nonlinear models adopted for the control moment.The results obtained by simulations are compared with those of a classical passive control to evaluate theadvantage of the strategy used for random excitation.

Keywords: Inverse problem, Vibration control, Stochastic optimization, Monte Carlo Method.

Conteúdo

1 Introducao ................................................................................................................................ 822 Controle de Vibracoes .............................................................................................................. 823 Modelagem da Estrutura.......................................................................................................... 82

3.1 Modelo fısico .................................................................................................................... 823.2 Modelo numerico.............................................................................................................. 843.3 Modelo da estrutura com excitacao e controle................................................................. 84

4 Desenvolvimento do Controlador ............................................................................................. 854.1 Calculo da energia total ................................................................................................... 864.2 Metodo estocastico para a determinacao dos coeficientes do polinomio do momento

de controle ....................................................................................................................... 874.3 Modelo do controlador ..................................................................................................... 87

5 Simulacao Numerica para Excitacao Aleatoria ........................................................................ 895.1 Estrutura de referencia (sem controle)............................................................................. 905.2 Momento proporcional a velocidade angular e suas potencias......................................... 905.3 Momento proporcional a velocidade, deslocamento e suas potencias............................... 91

6 Conclusoes................................................................................................................................ 91

∗Autor para contato: [email protected]

Lobato et al. (Ed.), (2014) DOI: 10.7436/2014.tica.07 ISBN 978-85-64619-15-9

Page 97: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

82 Borges et al.

1. Introdução

Os fenomenos vibratorios que atuam em estruturas mecanicas sao foco de estudos e objeto deinteresse dentro de diversas areas da engenharia. Varios estudos sao dedicados as inumeras formasde controle de vibracoes em sistemas mecanicos. Neste sentido podem ser citados os absorvedoresdinamicos de vibracao passivos e ativos com caracterısticas lineares ou nao lineares (Borges et al.,2010). O estudo destas singularidades e de cunho essencialis- ta, uma vez que, inerentes a todosos sistemas mecanicos, a eminencia de analises e simulacoes do comportamento do movimento paraa determinacao de parametros e condicoes crıticas de operacoes, viabilizam as aplicacoes praticasreduzindo ou eliminando todas as probabilidades de um provavel colapso estrutural, concedendo aoprojeto confiabilidade e seguranca.

O estudo e a analise dinamica dos sistemas mecanicos passam pela cons- trucao de modelosadequados a retorica em foco e a forma de abordagem para solucao do modelo pode resultar emanalises significativamente mais condizentes com a realidade do sistema fısico. Ja difundida, aabordagem determinıstica dos sistemas mecanicos nao considera incertezas inerentes ao sistemareal e, com isso, os modelos determinısticos sao mais afetados pelos efeitos decorrentes de ruıdos.Em ascendencia, a abordagem estocastica considera as incertezas presentes no problema real,possibilitando um tratamento adequado aos ruıdos, ocasionando a resultante do comportamentodos sistemas mecanicos, variaveis aleatorias (Silva, 2008).

Neste cenario, a presente contribuicao tem por objetivo o projeto de controlares atraves daformulacao de um problema inverso de otimizacao parametrica. Este consiste na identificacaodos coeficientes de um controlador nao linear polinomial de modo a minimizar a quantidade deenergia total de um sistema vibrante. Para essa finalidade, e empregado um metodo de otimizacaoestocastica, associado com Cadeias de Markov e o Metodo de Monte Carlo.

2. Controle de Vibrações

A tecnologia relacionada ao controle de vibracoes tem se tornado uma ciencia interdisciplinar,ocasionada pela crescente demanda nos criterios de desempenho de estruturas e maquinas (Inman,2006). Uma dificuldade frequentemente encontrada em maquinas e estruturas de medio e grandeportes, quando sujeitas a carregamentos cıclicos ou aleatorios, e o controle de vibracoes visando amaximizacao da vida dos componentes. Esses carregamentos implicam em esforcos de flexao e/outorcao, entre outros, que podem levar a estrutura a falha.

Um tipo de controle que se apresenta promissor, em relacao aos demais, e o controle semiativo,que propicia implementacao facil e de baixo custo, aliada a simplicidade tıpica de sistemas passivose a adaptabilidade dos sistemas ativos (Carneiro, 2009). Um dos quesitos que tornam o controlesemiativo muito atrativo e a energia externa requerida no controle, que e menor, em relacao a energiarequerida nos sistemas de controle ativos (Li & Huo, 2010). Alem disso, estes autores afirmam queos sistemas semiativos sao mais simples e exequıveis, se comparados aos sistemas ativos, e maiseficientes que os sistemas passivos.

No controle semiativo, a forca de controle nao atua diretamente sobre a estrutura ou componenteque se deseja controlar, e sim sobre outro disposi- tivo, o qual atua passivamente sobre o elementoa ser controlado.

3. Modelagem da Estrutura

3.1 Modelo físico

O comportamento dinamico das estruturas pode ser avaliado por meio de modelos simplificados,em que inercia, rigidez e amortecimento sao para- metros concentrados que representam, de formadiscreta, a estrutura a ser estudada.

A estrutura abordada neste trabalho e representada de forma esquematica na Figura 1. Estaconsiste de um eixo cilındrico montado na vertical e engastado na extremidade superior, no qualestao montados quatro volantes de inercia.

Mi (i=1, ..., 4) e o vetor de excitacoes aplicadas nos quatro graus de liberdade da estrutura,Ii (i=1, ..., 4) e o vetor de inercias dos quatro volantes, θi (i=1, ..., 4) e vetor de deslocamentosangulares dos quatro graus de liberdade, ci (i=1, ..., 4) e o vetor de amortecimentos torcionaisproprios (proporcionais) da estrutura, ki (i=1, ..., 4) e o vetor de rigidez torcional dos trechos doeixo e Mc e o momento de controle aplicado sobre um grau de liberdade especıfico.

Page 98: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Solução de um problema inverso aplicado ao controle de vibrações 83

Figura 1. Estrutura torcional com 4 graus de liberdade.

Considerando que um eixo sujeito a torcao sofrera uma deformacao angular, e possıvel definiruma rigidez torcional equivalente por meio da Equacao 1, a seguir:

keq =M

θ=GJ

L(1)

onde M e o momento aplicado ao eixo, θ e o deslocamento angular do eixo, G e o modulo de rigidez aocisalhamento (77 GPa para o aco selecionado), J e o momento polar de inercia da seccao transversaldo eixo e L e o comprimento do eixo. Esta rigidez torcional equivalente esta representada por kina Figura 1, e esta relacionada a rigidez de cada trecho do eixo utilizado nos modelos numerico eexperimental.

A partir da configuracao mostrada na Figura 1, pode ser formulado o modelo da estrutura. Suarepresentacao, em notacao matricial, para res- posta livre, segue na Equacao 2 (Inman, 2006):

[I]θ + [Ct]θ + [Kt]θ = 0 (2)

onde I e a matriz de inercia dos volantes, Ct e a matriz de amortecimento torcional e Kt e a matrizde rigidez torcional dos trechos do eixo, dados por:

[I] =

I1 0 0 00 I2 0 00 0 I3 00 0 0 I4

(3)

[Ct] =

c1 + c2 −c2 0 0−c2 c2 + c3 −c3 0

0 −c3 c3 + c4 −c40 0 −c4 c4

(4)

[kt] =

k1 + k2 −k2 0 0−k2 k2 + k3 −k3 0

0 −k3 k3 + k4 −k40 0 −k4 k4

(5)

[θ] =

θ1θ2θ3θ4

(6)

Page 99: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

84 Borges et al.

3.2 Modelo numérico

Os momentos de inercia foram obtidos analiticamente utilizando as massas e os diametros dosvolantes. A rigidez dos segmentos do eixo foi obtida com o uso da Equacao 1. Ja o amortecimentotorcional foi obtido a partir de um ensaio de resposta a um degrau de momento. Para tal,um momento estatico conhecido foi aplicado ao ponto tres da estrutura e, ao ser retiradoinstantaneamente, a curva com a energia total foi obtida. Por meio da comparacao do decaimentoda energia total do modelo numerico com o decaimento da energia total do modelo experimental, oamortecimento foi estimado, conforme pode ser visto em Guimaraes (2013).

A Tabela 1 mostra as propriedades da estrutura utilizadas nas simulacoes (Guimaraes, 2013).

Tabela 1. Caracterısticas da estrutura experimental.

Caracterıstica Elemento Unidade Valores

Momento polar de inercia dos volantes

I1

kg m2

0,72I2 0,22I3 0,22I4 0,085

Rigidez torcional dos segmentos do eixo

k1

Nm/rad

1991k2 1991k3 1991k4 1991

Amortecimento torcional equivalente

c1

Nms/rad

0,4c2 0,4c3 0,4c4 0,4

O modelo numerico correspondente ao sistema fısico apresentado foi desenvolvido no ambienteMatLab Simulinkr.

3.3 Modelo da estrutura com excitação e controle

O modelo fısico da estrutura, com a excitacao e com o controlador, considera a existencia de apenasum momento de controle Mc, aplicado no quarto grau de liberdade, e um momento de excitacao,aplicado no terceiro grau de liberdade, conforme a Figura 1.

A escolha de um unico atuador foi feita em funcao das restricoes de custo para montagemexperimental e nao se apresenta como uma restricao do modelo ou do metodo desenvolvido. Outrarazao para montagem do atuador afastado da excitacao e a tentativa de reproduzir as dificuldadesde acesso a determinados pontos da estrutura, como acontece na pratica. Nem sempre e possıvelescolher o ponto otimo de controle da estrutura para se posicionar o atuador.

Incorporando a excitacao e o momento de controle no modelo fısico representado pela Equacao 2,o caso de resposta forcada, controlado, pode ser representado pelas Equacao 7

[I]θ + [Ct]θ + [Kt]θ = M +Mc (7)

onde M e Mc sao os vetores de momentos de excitacao e de momentos de controle, respectivamente,dados por

M =

00M3

0

(8)

Mc =

000Mc4

(9)

O modelo numerico desenvolvido no Simulinkr para a estrutura completa, com excitacao econtrole, pode ser visto na Figura 2. Estes subsistemas sao acoplados ao modelo da estrutura parasimular a resposta do sistema quando sujeito a um determinado momento de controle arbitrario.

Page 100: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Solução de um problema inverso aplicado ao controle de vibrações 85

Figura 2. Modelo desenvolvido para o sistema torcional com 4 graus de liberdade.

4. Desenvolvimento do Controlador

Visando definir as caracterısticas do momento de controle Mc como um polinomio nao linear, asimulacao do sistema controlado e realizada por integracao direta da Equacao 7, para uma dadaexcitacao M .

O desempenho do controlador sera funcao dos coeficientes do polinomio, sendo que cada conjuntode coeficientes arbitrado leva a um desempenho de controle e a uma energia total para a estrutura.A energia total (para os quatro graus de liberdade) foi escolhida como escalar (funcao objetivo) emrelacao a qual se dara a otimizacao dos coeficientes do polinomio que define Mc.

O problema de controle pode ser caracterizado como um problema inverso, no qual se procuraencontrar um momento de controle que conduza a otimizacao de uma funcao objetivo, aqui tomadacomo sendo a energia total mınima. O problema direto associado consiste em, dado um momentode controle e uma excitacao conhecida, minimizar a energia total maxima do sistema em regimepermanente. As condicoes necessarias para se considerar o regime permanente serao discutidasadiante.

Em um problema direto busca-se em determinar a saıda, sendo conhecidas a entrada e o sistemade parametros. Ja um problema inverso pode ser apresentado de duas formas diferentes (Cezaro,2010):

• O problema de reconstrucao: conhecidos o sistema de parametros e a saıda, determinar qual ea entrada;

• O problema de identificacao: dadas a entrada e a saıda, determinar qual o sistema de parametrosque os relaciona.

O problema de controle otimo abordado neste trabalho pode ser considerado como sendo umproblema inverso de identificacao que consiste em, a partir de uma entrada conhecida e uma saıdadesejada (energia mınima), determinar os coeficientes do momento de controle. A Figura 3 mostra oexposto, sendo que a parte superior da figura esta relacionada ao problema direto e a parte de baixoesta relacionada ao problema inverso proposto neste trabalho.

Neste trabalho pretende-se minimizar a energia mecanica total. E importante ressaltar que outrosobjetivos poderiam ter sido adotados, como por exemplo, o deslocamento ou a velocidade.

Para a resolucao do problema inverso proposto e empregado o Metodo de Monte Carlo via Cadeiasde Markov. A metodologia proposta consiste em perturbar os coeficientes, dos quais depende omomento de controle, e verificar se a funcao objetivo esta sendo otimizada. Apos uma quantidade

Page 101: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

86 Borges et al.

Figura 3. Caracterizacao dos problemas direto e inverso.

suficientemente grande de perturbacoes, encontra-se o conjunto de parame- tros (coeficientes dopolinomio) que leva a funcao objetivo a se aproximar do ponto otimo, ou seja, do ponto de energiamınima para a estrutura.

Para chegar ao controlador que leve a estrutura para a situacao na qual a energia total e mınima,as etapas abordadas nos topicos seguintes se fazem necessarias.

4.1 Cálculo da energia total

A Equacao 7 foi resolvida numericamente para diversos valores de momento de controle (Mc). Paracada condicao estudada, e calculada a energia potencial elastica (Ep) e a energia cinetica (Ec),conforme as seguintes equacoes:

EP =1

2θT [Kt] θ (10)

EC =1

2

θT

[I]θ

(11)

As matrizes e elementos apresentados na Equacao 10 e na Equacao 11 foram descritasanteriormente.

A energia total da estrutura corresponde a soma das energias cineticas de cada volante de inerciae as energias potenciais elasticas de cada segmento de eixo, e esta representada pela Equacao 12.

ET = EP + EC (12)

O modelo do subsistema que calcula a energia total da estrutura (cinetica mais potencial),desenvolvido no Simscape, esta detalhado na Figura 4, a seguir. O Subsistema Energia Total,como foi chamado, foi acoplado ao modelo da estrutura, e que foi ilustrado, sem os detalhes de seuinterior, na Figura 2.

Figura 4. Subsistema que calcula a energia total.

Page 102: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Solução de um problema inverso aplicado ao controle de vibrações 87

4.2 Método estocástico para a determinação dos coeficientes do polinômio do momento decontrole

O Metodo de Monte Carlo via Cadeias de Markov e muito utilizado para resolver problemas deotimizacao. Este faz parte de uma estrategia para a geracao de amostras a partir de um mecanismobaseado nas Cadeias de Markov (Andrieu et al., 2003).

O Metodo de Monte Carlo e uma abordagem estocastica muito utilizada no estudo de sistemascom um grande numero de graus de liberdade, em sistemas que envolvem fluidos (e incertezas), naanalise de risco financeiro, em computacao numerica e simulacao estocastica (Lima, 2011). Esteconsiste em gerar um vetor aleatorio, com uma determinada distribuicao de probabilidade, realizaros calculos relativos ao modelo simulado, usando o vetor gerador, e registrar a resposta, certificandoda convergencia da simulacao em relacao a funcao objetivo.

Ja os Metodos de Monte Carlo via cadeias de Markov (MCMC) sao processos estocasticos em umaversao iterativa dos Metodos de Monte Carlo tradicionais nao iterativos, em que a distribuicao deprobabilidade de um dado estado depende apenas do valor da distribuicao no estado anterior. Estapropriedade, tambem chamada de Memoria Markoviana, faz com que os estados anteriores sejamirrelevantes para a predicao dos estados seguintes, desde que o estado atual seja conhecido (Carvalho& Mota, 2009). Valendo-se de metodos estocasticos via Cadeias de Markov e possıvel desenvolverum controlador que proporcione um momento de controle otimo. A otimizacao parametricaseleciona o melhor modelo de momento de controle para uma dada estrategia conseguindo assim,a combinacao otima de parametros que caracterizam a dependencia do momento de controle nasvariaveis monitoradas. A principal vantagem do metodo estocastico empregado e a sua robustez,que faz com que ele convirja em todos os casos (mesmo que para um otimo local), nao se tornandoinstavel.

Neste trabalho, o problema evolui a partir do repouso, na posicao nao deformada. Em seguida,resolve-se a equacao diferencial por meio de integracao direta, ate que o regime permanente sejaatingido e, entao, o calculo da energia total da estrutura e efetuado. A energia total e comparadacom a energia total obtida no passo anterior e, caso a energia total venha a ser menor que a obtidaanteriormente, os coeficientes que caracterizam o Momento de Controle sao armazenados. Caso aenergia total obtida seja maior que a armazenada anteriormente, os novos coeficientes sao descartadose o algoritmo retorna para uma nova perturbacao de parametros e um novo calculo da energia total.

O algoritmo e interrompido ao atingir um numero de iteracoes predefinido pelo usuario. Olaco de repeticao e interrompido e os coeficientes otimos que definem o Momento de Controlesao armazenados. Como e proprio do Metodo de Monte Carlo via cadeias de Markov, a solucaoencontrada pode nao ser um mınimo absoluto do problema, mas se aproxima deste. Uma procuramaior poderia encontrar uma energia ainda menor.

Valendo-se desses recursos, por meio da abordagem estocastica descrita, e possıvel determinar omomento de controle (MC) que minimize a energia total da estrutura pela solucao do problemainverso proposto. O procedimento descrito para a abordagem estocastica esta ilustrado nofluxograma da Figura 5.

Uma grande vantagem do metodo de otimizacao estocastico escolhido e a sua robustez. O metodoconverge, mesmo tolerando erros ocasionais no processamento devido ao arbıtrio de coeficientesinadequados. Por outro lado, o algoritmo descrito pode ter baixa convergencia, nao sendo adequadopara otimizacao em tempo real.

4.3 Modelo do controlador

O Subsistema Controlador pode ser visto na Figura 2. Os momentos de controle abordados nostopicos a seguir foram programados dentro do referido bloco, utilizando a linguagem de blocos doSimScaper.

Na busca pelos coeficientes otimos, o cenario construıdo foi o caso de momento de controleproporcional a velocidade e/ou as suas potencias. No caso do amortecedor proporcional viscoso(classico), o momento de controle e assumido como sendo proporcional a velocidade. Esta condicaoiguala o controle semiativo ao controle passivo por amortecedor torcional proporcional classico.O resultado obtido para o controlador passivo proporcional sera usado como referencia para acomparacao com os demais resultados obtidos para os controladores propostos neste trabalho. Dadaa facilidade de se produzir, no controle semiativo, uma forca (ou momento) de controle de classe bemmais ampla, inclusive com caracterısticas nao lineares, neste trabalho sera investigada a conveniencia

Page 103: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

88 Borges et al.

Figura 5. Fluxograma mostrando o metodo para definicao dos coeficientes otimos do momento de controle.

em adotar o momento de controle descrito pela Equacao 13. O momento de controle ora propostodepende da velocidade angular e das suas potencias (Estudo de Caso 1).

Mc = −

C1θ4∣∣∣θ4∣∣∣ + C2θ4 + C3θ4

∣∣∣θ4∣∣∣+ C4θ34

(13)

Neste estudo de caso os coeficientes Cn (n=1, ..., 4) sao diferentes de zero e sao definidos deforma a minimizar uma funcao objetivo determinada, para as condicoes de excitacao escolhidas.

A funcao objetivo adotada foi a energia total dos quatro graus de liberdade da estrutura e, paraminimizar essa funcao objetivo, foi utilizado um metodo estocastico que busca a combinacao otimados coeficientes do polinomio da Equacao 13. O procedimento foi utilizado para determinacao dosparametros que minimizam a energia total para dada condicao de excitacao aleatoria.

Em uma abordagem semelhante a descrita acima, foram determinados os parametros otimos paraum controlador de classe ainda mais geral. Nesse controlador, para os mesmos padroes de excitacao,o momento de controle apresenta dependencia na velocidade e no deslocamento. A Equacao 14mostra esse modelo, cujo cenario apresentado representa o Estudo de Caso 2:

Mc =

−(C1

θ4|θ4| + C2θ4 + C3θ4

∣∣∣θ4∣∣∣+ C4θ34

)↔ sgn (θ) 6= sgn

(θ)

−C1θ4|θ4| − C2θ4 − C3θ4

∣∣∣θ4∣∣∣− C4θ34 − C5

θ4|θ4|+

−C6θ4 − C7θ4 |θ4| − C8θ34 ↔ sgn (θ) = sgn

(θ) (14)

onde a funcao sgn(x) corresponde ao sinal de x.Neste estudo de caso os coeficientes Cn (n=1, ..., 8) sao diferentes de zero. Destaca-se que, nesse

polinomio, parte dos termos da Equacao 14 sao funcao da velocidade angular (coeficientes Cn, n= 1,..., 4), similar ao modelo desenvolvido anteriormente. Os demais termos da equacao sao proporcionaisao deslocamento angular (Cn, n=5, ..., 8). Na parte da equacao em que o controlador atua sobre a

Page 104: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Solução de um problema inverso aplicado ao controle de vibrações 89

rigidez (Mc e proporcional ao deslocamento), foi criada uma estrutura na qual o controlador so atuacaso a velocidade e o deslocamento tenham o mesmo sinal. Essa e a unica situacao exequıvel comcontroladores semiativos, ja que eles nao sao capazes de adicionar energia ao sistema, pois atuamatraves de forcas passivas. Isto e, o modelo admite a possibilidade de um comportamento como molaapenas enquanto esta retira energia da estrutura.

Se a velocidade e o deslocamento tiverem sentidos diferentes (sinais diferentes), os termosproporcionais ao deslocamento terao que ser nulos, e o momento de controle passa a ser proporcionalexclusivamente a velocidade, como apresentado na Equacao 13. Embora ambos sejam constantes, asestrategias de controle que consideram o coeficiente Cn, n=1, se diferem ligeiramente da estrategiade controle modelada utilizando o coeficiente Cn, n=5. Isto acontece devido ao fato dos termosproporcionais ao deslocamento, incluindo o coeficiente Cn, n=5, so atuarem em parte do tempo,quando a velocidade e o deslocamento angular tem a mesma direcao. Essa atuacao se da em todo otempo no controlador com o coeficiente Cn, n=1, conforme mostra a Equacao 14. Desconsiderandoesse efeito, os dois coeficientes, Cn, n=1 e n=5, tem o mesmo comportamento, por multiplicarem,ambos, o termo de ordem zero do polinomio. Por isso, o coeficiente Cn, n=5, pode ser incorporadoao coeficiente Cn, n=1, sem prejuızo a eficiencia do controle.

Neste caso, pretende-se mostrar que, quanto maior o numero de parametros (coeficientes adeterminar), mais baixo sera o nıvel de energia alcancado. O metodo de otimizacao estocasticaadotado foi baseado no Metodo de Monte Carlo via cadeias de Markov (MCMC).

Observe que a construcao da Equacao 13 e compatıvel com o controle exercido por um momentoproporcionado por uma forca passiva, isto e, que, a qualquer tempo, retira energia da estrutura.Ainda nesta equacao, percebe-se que os termos de ordem zero ou dois encontram-se multiplicadospelo sinal da velocidade angular. Com essa configuracao, o modelo do freio representa um momentode controle sempre contrario a direcao da velocidade angular. No modelo do controlador, e sobo enfoque da energia, o trabalho realizado pelo momento aplicado pelo freio e sempre negativo,retirando energia da estrutura e concorrendo para minimizar a energia global dos graus de liberdadeconsiderados no modelo fısico.

A realizacao experimental desse controlador semiativo pode ser facilmente obtida por um freioeletromagnetico que, no caso do modelo proposto, esta montado no volante de inercia posicionadono ponto quatro, mostrado na Figura 1. O controlador foi montado em um ponto distinto ao daexcitacao visando reproduzir as dificuldades de controle frequentemente encontradas em campo, emque nem sempre se consegue acesso ao melhor ponto da estrutura para a aplicacao de uma forca decontrole.

Sendo o momento exercido pelo freio eletromagnetico dependente da forca normal e, como aforca normal e controlada por um campo eletrico aplicado a uma bobina, pode-se, controlando acorrente, construir uma forca que resulte em um momento de controle (Mc) de acordo com o modelodeterminado pelo metodo estocastico aplicado a um dos cenarios mencionados.

A estrategia de controle proposta considera um momento de controle dependente da velocidade,de classe mais geral que o controle passivo proporcional, dado pela Equacao 13. Sendo mais geral, omomento determinado conduz a um ponto otimo com um menor nıvel de energia total da estrutura.Este modelo, descrito por esta equacao, com a sua aplicacao especıfica em problemas excitadosharmonicamente, foi abordado por Carvalho & Guimaraes (2010), e mostrou bom desempenho.

5. Simulação Numérica para Excitação Aleatória

Os resultados obtidos para excitacao aleatoria foram simulados considerando-se um ruıdo brancocom densidade espectral de potencia (PSD) igual a 0,1 W/rad s−1, aplicado no ponto tres daestrutura. O comportamento da estrutura e simulado partindo do repouso e evolui ate a condicaode regime permanente. Para que se tenha a garantia de que a resposta da estrutura atingiu o regimepermanente, quando excitada aleatoriamente, foi considerado um tempo dez vezes maior que o maiorperıodo natural da estrutura (que e de aproximadamente 0,2 segundos). Isto resulta em, no mınimo,dois segundos para que se possa considerar o regime permanente. Visando garantir a reproducaodos sinais proximos ao limite inferior de interesse com seguranca, foram considerados dez segundosdurante as simulacoes.

Os resultados para esses controladores sao apresentados na Tabela 2. Na referida tabela saomostrados os dois casos propostos junto ao controlador classico proporcional (viscoso).

A aplicacao de um momento nulo nao permite o controle da estrutura. Por outro lado, aplicar ummomento elevado tende a bloquear o eixo, levando a extremidade livre do eixo a condicao estatica(engastado-engastado). Essa condicao foi estudada pois resulta em uma tentativa de baixo custopara realizar o controle. Estes resultados foram apresentados juntos aos dois casos propostos.

Page 105: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

90 Borges et al.

Tabela 2. Resultados numericos para excitacao aleatoria.

Estudo de Caso Coeficiente (Cn) Valor Energia Total (mJ)

Engastado-livre (Sem controle) - 0,0000 467,63

Engastado-engastado (Sem controle) - 0,0000 218,19

Controlador classico proporcional n=2 15,5278 43,12

Estudo de Caso 1

n=1 -0,8484

41,94n=2 17,6837n=3 25,1107n=4 23,2499

Estudo de Caso 2

n=1 -0,06945

41,80

n=2 9,1438n=3 42,6392n=4 16,7225n=5 -n=6 9,4987n=7 12,6468n=8 13,990

5.1 Estrutura de referência (sem controle)

Neste caso e calculada a energia maxima quando o sistema evolui a partir do repouso, estimulado porexcitacao aleatoria, para duas situacoes distintas: com a extremidade do eixo livre (engastado-livre)e com a extremidade do eixo engastada (engastado-engastado).

Para a estrutura sem controle, em que Mc e igual a zero, a energia final maxima da estruturaatingiu 467,63 mJ para o caso engastado-livre. Na condicao de extremidade engastada, a energiafinal maxima foi de 218,19 mJ. A Figura 6 exibe a energia total em funcao do tempo para essascondicoes.

0 1 2 3 4 5 6 7 8 9 100,0

0,1

0,2

0,3

0,4

Ener

gia

Tota

l (J)

Tempo (s)

Engastado-Livre Engastado-Engastado

Figura 6. Energia da estrutura sem controlador.

5.2 Momento proporcional à velocidade angular e suas potências

Neste caso, foi simulado o controle em que o momento de controle e dependente dos coeficientesCn (n=1, ..., 4), da Equacao 13, que sao obtidos por otimizacao multiparametros, pelo metodo deMonte Carlo via Cadeia de Markov descrito anteriormente.

Apos a obtencao dos coeficientes otimos, a partir do emprego do metodo de otimizacaodesenvolvido, a Equacao 13 pode ser apresentada na forma da Equacao 15, que segue.

Mc = −

−0, 8484θ∣∣∣θ∣∣∣ + 17, 6837θ + 25, 1107θ

∣∣∣θ∣∣∣+ 23, 2499θ3

(15)

Page 106: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Solução de um problema inverso aplicado ao controle de vibrações 91

Com a aplicacao deste momento otimo, a energia total maxima obtida foi de 41,94 mJ, conformeregistrado na Figura 7.

0 1 2 3 4 5 6 7 8 9 100,00

0,01

0,02

0,03

Figura 7. Energia na estrutura para o sistema controlado do Estudo de Caso 1 (ver Tabela 2).

5.3 Momento proporcional à velocidade, deslocamento e suas potências

Assim, considera-se o caso mais geral, em que o momento de controle e modelado por um polinomioproporcional a velocidade, ao deslocamento e as suas potencias. Nestes casos, a resposta da estruturafoi obtida pela aplicacao do metodo estocastico para determinacao de um momento de controle quese valha de um polinomio cujos termos Cn (n=1, ..., 8) da Equacao 14 podem ser diferentes de zero.Conforme representado pela condicionalidade da Equacao 16, com uma forca de controle passiva,gerada por atrito, nao e possıvel aplicar um momento de controle proporcional ao deslocamento,quando a velocidade e o deslocamento nao tiverem o mesmo sinal. Daı, a expressao condicionalapresentada pela Equacao 14 e pela Equacao 16. Esta condicao corresponde a introduzir umarigidez na estrutura apenas durante o intervalo de tempo em que ela contribui para retirar energiada estrutura. Esta rigidez e suprimida durante o perıodo em que a energia seria devolvida a estrutura.Procedendo a otimizacao de parametros, a Equacao 14 toma a forma apresentada na Equacao 16,que modela o momento de controle por meio da aplicacao de um momento de controle dependenteda velocidade, do deslocamento e de suas potencias.

Mc =

−(

0, 0695 θ

|θ| + 9, 144θ + 42, 639θ∣∣∣θ∣∣∣+ 16, 723θ3

)↔ sgnθ 6= sgnθ

−0, 0695 θ

|θ| − 9, 144θ − 42, 639θ∣∣∣θ∣∣∣− 16, 723θ3 − 9, 499θ

−12, 647θ |θ| − 13, 99θ3 ↔ sgnθ = sgnθ

(16)

Apos a determinacao, por meio de otimizacao, dos coeficientes que levaram ao melhor controladordo Estudo de Caso 2, a energia total obtida foi de 41,80 mJ. A Figura 8 registra a energia total naestrutura.

O resultado para este caso e coerente com o processo de otimizacao de parametros, que indicauma energia mınima tao mais baixa quanto mais parametros se dispuser para otimizacao.

6. Conclusões

Com a realizacao do trabalho foi possıvel determinar controladores mais eficientes que os passivosconvencionais. Foi resolvido um problema inverso de otimizacao parametrica, que consistiu emidentificar quais os coeficientes que melhor modelam um momento de controle nao linear polinomial,e que levam uma estrutura a um nıvel mınimo de energia total, quando sujeita a determinadacondicao de excitacao. Para tanto, um metodo de otimizacao estocastica, combinando Cadeias deMarkov e o Metodo de Monte Carlo, foi implementado e apresentou, como resultado, a combinacaootima de parametros que minimiza a energia total do sistema vibrante para determinadas condicoesestabelecidas, quando em regime permanente.

Quanto ao metodo de otimizacao estocastica, os resultados comprovaram a sua eficiencia, vistoque o estudo indicou uma energia mınima tao mais baixa quanto mais parametros se dispuser paraotimizacao. No caso da excitacao aleatoria, a aplicacao dos controladores semiativos se mostrou

Page 107: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

92 Borges et al.

0 1 2 3 4 5 6 7 8 9 100,00

0,01

0,02

0,03

Figura 8. Energia na estrutura para o sistema controlado do Estudo de Caso 2 (ver Tabela 2).

vantajosa, representando, no caso tratado, uma reducao na energia maxima na ordem de 3%, secomparado ao controlador classico passivo.

A utilizacao, em trabalhos futuros, de expoentes menores que a unidade para o polinomio quemodela o momento de controle pode levar a bons resultados. O expoente meio, por exemplo, podeser uma boa opcao para teste. Ainda, a utilizacao de outras classes e graus de funcoes para omomento de controle tambem pode levar a bons resultados. Em relacao a excitacao, a utilizacao,em trabalhos futuros, de diferentes padroes de carregamentos de excitacao, buscando representarcondicoes normais de utilizacao de estruturas de grande porte, pode enriquecer o estudo deste tipode controlador. Varios trazem dados sobre as caracterısticas de excitacao ocasionadas por pessoastransitando sobre estruturas e sobre cargas de vento. Existem, tambem, diversos padroes de excitacaoque representam terremotos, amplamente publicados na literatura. Esses trabalhos podem sugerirpadroes de carregamento para os quais seria interessante avaliar o desempenho do controlador oraproposto.

Agradecimentos

Os autores agradecem o suporte financeiro do CNPq, Conselho Nacional de DesenvolvimentoCientıfico e Tecnologico.

ReferênciasAndrieu, C.; Freitas, N.; Doucet, A. & Jordan, M., An introduction to MCMC for Machine Learning. 1a edicao.

Machine Learning, Netherlands, 2003.

Borges, R.; Lima, A. & Jr, V.S., Robust optimal design of a nonlinear dynamic vibration absorber combining sensitivityanalysis. Shock and Vibration, 17(1):507–520, 2010.

Carneiro, R., Controle Semiativo de Vibracoes em Estruturas utilizando Amortecedor Magnetorreologico. Tese dedoutorado, Programa de Pos-Graduacao em Estruturas e Construcao Civil, Universidade de Brasılia, Brasılia,2009.

Carvalho, M. & Guimaraes, M., Controle semiativo de vibracoes com otimizacao estocastica. In: MECOM-CILAMCE.Buenos Aires, Argentina, p. 6707–6726, 2010.

Carvalho, M. & Mota, C., Otimizacao via spline em problemas inversos. In: CILAMCE Proceedings. Armacao dosBuzios, p. 1–10, 2009.

Cezaro, A., Problemas Inversos: Uma Introducao. 1a edicao. Rio de Janeiro: Sociedade Brasileira de Matematica,2010.

Guimaraes, M., Controle Semi-ativo de Vibracoes por Atrito de Coulomb. Tese de doutorado, Programa de Pos-Graduacao em Estruturas, Universidade de Brasılia, Brasılia, 2013.

Inman, D., Vibration With Control. 1a edicao. West Sussex: John Wiley & Sons, 2006.

Li, H. & Huo, L., Advances in structural control in civil engineering in china. Mathematical Problems in Engineering,2(1):1–24, 2010.

Lima, R., Analise de Vibracoes Estocasticas em Sistemas Mecanicos. Dissertacao de mestrado, Programa de PosGraduacao em Engenharia Mecanica, Pontifıcia Universidade Catolica, Rio de Janeiro, 148 p., 2011.

Silva, D., Identificacao de Funcoes de Transferencia como Entrada Um Degrau. Dissertacao de mestrado, UniversidadeEstadual Paulista -UNESP, Campus de Ilha Solteira, Ilha Solteira -SP, 2008.

Page 108: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Capítulo 8

Resolução de Problemas Inversos de Condução de CalorUsando o Método dos Elementos de Contorno

e o Algoritmo de Colônia de Vagalumes

Fran Sérgio Lobato∗, Valder Steffen Jr, e Antônio J. Silva Neto

Resumo: A analise inversa de problemas de conducao de calor tem um papel fundamental nodesenvolvimento cientıfico e tecnologico em diversas areas das ciencias e da engenharia. Tradicionalmente,estes problemas sao resolvidos usando tecnicas de otimizacao baseadas no uso do gradiente da funcaoobjetivo e das restricoes. Neste capıtulo, apresenta-se como alternativa para o tratamento destes problemaso Algoritmo de Colonia de Vagalumes, que se fundamenta no conceito de comportamento social coletivopara a atualizacao de candidatos a solucao do problema inverso associado. Para a resolucao do problemadireto de transferencia de calor por conducao e utilizado o Metodo dos Elementos de Contorno.

Palavras-chave: Problema inverso, Algoritmo de colonia de vagalumes, Conducao de calor, Metodo doselementos de contorno.

Abstract: The analysis of inverse heat conduction problems is an important tool that can be applied tovarious branches of science and engineering. Traditionally, these problems are solved by using optimizationtechniques based on gradient of objective function and constraints. In this chapter, the Fireflies ColonyAlgorithm, which is based on the collective social behavior concept, is used as an alternative approach forthe resolution of the associate inverse problem. To solve the direct conduction heat transfer problem, theBoundary Element Method is used.

Keywords: Inverse problem, Fireflies colony algorithm, Heat conduction, Boundary element method.

Conteúdo

1 Introducao ................................................................................................................................ 942 Formulacao do Problema Direto de Transferencia de Calor por Conducao ............................. 953 Metodo dos Elementos de Contorno ........................................................................................ 964 Formulacao do Problema Inverso de Transferencia de Calor por Conducao ............................ 975 Algoritmo de Colonia de Vagalumes ........................................................................................ 98

5.1 A Inspiracao biologica...................................................................................................... 985.2 A Descricao do algoritmo................................................................................................. 98

6 Resultados e Discussao............................................................................................................. 996.1 Estudo de caso 1 ..............................................................................................................1006.2 Estudo de caso 2 ..............................................................................................................102

7 Conclusoes................................................................................................................................103

∗Autor para contato: [email protected]

Lobato et al. (Ed.), (2014) DOI: 10.7436/2014.tica.08 ISBN 978-85-64619-15-9

Page 109: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

94 Lobato et al.

1. Introdução

A analise inversa e uma poderosa ferramenta com aplicacao em varios ramos da ciencia e engenharia.No contexto da transferencia de calor, a analise inversa e utilizada para determinar varios aspectosimportantes do problema, a saber: identificacao de forma (geometria), identificacao das condicoesda superfıcie de contorno (como a temperatura e o fluxo de calor) e determinacao de propriedadestermicas (como a condutividade e a difusividade). A importancia desta analise se deve as numerosasaplicacoes praticas. No caso especıfico do problema de identificacao de forma, este consiste emdeterminar formas desconhecidas a partir do conhecimento de dados experimentais das variaveisobservaveis no interior e/ou na superfıcie do domınio sob analise, caracterizando desta forma umtıpico problema inverso de engenharia. Considerando a possibilidade da utilizacao de modelos maiscomplexos, juntamente com a informacao fornecida pelos dados experimentais, os resultados obtidospela resolucao de um problema inverso podem ser usados para simular o comportamento do sistemapara diferentes condicoes de operacao.

Neste contexto, a literatura especializada apresenta varias aplicacoes de problemas inversosobjetivando a determinacao de forma. Huang & Chao (1997) identificaram os perfis de contornoem problemas de transferencia de calor por conducao em estado estacionario usando o algoritmode Levenberg-Marquardt e o metodo do gradiente conjugado. Huang & Tsai (1998) resolveram umproblema de conducao transiente para identificar as configuracoes de contorno irregulares com baseem medidas de temperatura. Kennon & Dulikravich (1985) e Dulikravich (1992) determinaram otamanho, a forma, o numero, e a localizacao das passagens de fluido no interior das palhetas deturbinas. Cheng & Chang (2003a) determinaram a forma de um cilindro considerando a distribuicaode temperatura uniforme via formulacao e resolucao de um problema inverso. Cheng & Chang(2003b) propuseram uma modificacao no metodo do gradiente conjugado aplicado ao problemainverso de transferencia de calor para fins de identificacao de forma. Fazeli & Mirzaei (2011)determinaram a forma de um tubo usado para refrigeracao empregando um algoritmo baseadono gradiente em um problema de transferencia de calor por conducao associado ao metodo doselementos finitos. Kazemzadeh-Parsi et al. (2011) utilizaram redes neurais artificiais para determinara localizacao e o tamanho de cavidades circulares em um problema de transferencia de calor porconducao 2D utilizando dados experimentais. Lesnic & Bin-Mohsin (2012) resolveram um problemainverso para a determinacao da geometria usando o metodo das solucoes fundamentais associado aometodo do gradiente conjugado considerando dados experimentais de temperatura e fluxo de calor.Fazeli & Mirzaei (2012) identificaram superfıcies irregulares (tamanho e forma) em um problemainverso de transferencia de calor por conducao modelado por elementos finitos e depois otimizadopor um metodo baseado na avaliacao do gradiente da funcao objetivo e de suas restricoes.

Tradicionalmente os problemas inversos tem sido resolvidos via aplicacao de tecnicas deotimizacao classicas (determinısticas). Nos ultimos anos, no entanto, tecnicas de otimizacao baseadasno comportamento social de especias da natureza tem sido empregadas para a resolucao de problemasinversos. Neste contexto, o comportamento social de colonias de vagalumes foi explorado parao desenvolvimento de um novo algoritmo, o Algoritmo de Colonia de Vagalumes – ACV (FireflyColony Algorithm), proposto por Yang (2008). Basicamente, a ideia principal deste algoritmo e oesquema proposto para atualizacao de cada vagalume via modelagem matematica da interacao entreos mesmos, simulando as etapas de atracao e acasalamento. Dentre as aplicacoes do ACV listadasna literatura, pode-se citar a sincronizacao de sensores em rede (Werner-Allen et al., 2005), o projetode redes sem fio (Leidenfrost & Elmenreich, 2008), estimaticao de condicao inicial em problema deconducao de calor (Luz et al., 2009), sua associacao com modelos caoticos de busca (Lobato & SteffenJr, 2010), tratamento de problemas de controle otimo algebrico-diferenciais em engenharia quımica(Pfeifer & Lobato, 2010), otimizacao de funcoes matematicas nao-lineares com a presenca de ruıdos(Chai-ead et al., 2011), otimizacao de funcoes matematicas classicas atraves de um ACV modificadovia desenvolvimento de um novo operador para determinar novas direcoes de busca dos vagalumes(Tilahun & Ong, 2012), aplicacao em problemas de otimizacao lineares com a presenca de ruıdos(Pal et al., 2012), resolucao de problemas de despacho economico nao-convexos (Yang et al., 2012),

dentre outras. E importante ressaltar que apesar destas aplicacoes em areas distintas da literatura,o numero de contribuicoes na resolucao de problemas inversos ainda e bastante limitado.

Para a resolucao de qualquer problema inverso, quando formulado implicitamente como umproblema de otimizacao, faz-se necessaria, em cada iteracao, a resolucao de um problema direto(problema de simulacao). Neste caso, em se tratando de metodos baseados em populacao, para cadaiteracao sao necessarias varias avaliacoes da funcao objetivo, que dependem da complexidade domodelo a ser simulado. Em termos do tempo de processamento, quanto mais rapida for a avaliacao

Page 110: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Resolução de problemas inversos de condução de calor 95

da funcao objetivo, melhor sera o desempenho do algoritmo de otimizacao. Para a avaliacao dafuncao objetivo em problemas de transferencia de calor, inumeras metodologias numericas podemser aplicadas, dentre as quais pode-se citar o Metodo das Diferencas Finitas (MDF), o Metodo dosVolumes Finitos (MVF), o Metodo de Colocacao (MC), o Metodo das Direcoes Alternadas (MDA),o Metodo das Solucoes Fundamentais (MSF) e o Metodo dos Elementos de Contorno (MEC). Em setratando de problemas inversos reais, de interesse pratico, estes podem ter geometrias complexas, oque pode inviabilizar/dificultar a aplicacao da grande maioria dos metodos numericos citados, porexigirem a discretizacao do domınio em elementos de controle (Chan, 1991; Ang, 2007; Menin, 2009;Lobato et al., 2012). Para superar tais dificuldades, os metodos meshless tem sido amplamenteestudados pela comunidade cientıfica. Assim sendo, o MEC configura-se como uma estrategiainteressante para o tratamento de problemas com geometrias e condicoes de contorno complexas. Aprincipal vantagem do MEC e que ele necessita somente da discretizacao do contorno do domınio,o que reduz em muito o esforco computacional em relacao as tecnicas classicas para a resolucao deequacoes diferenciais parciais (Ang, 2007). Basicamente, no MEC e realizada a divisao do contornoem segmentos, ao longo dos quais deve-se determinar o valor da variavel dependente ou de suaderivada na direcao normal, dependendo de qual condicao de contorno e aplicada em cada elemento,resultando desta forma na reducao da dimensao do problema (Menin, 2009). Neste caso, a utilizacaodo MEC para a obtencao de aproximacoes para a solucao de equacoes diferenciais em problemasinversos reduz de forma significativa o custo computacional do processo de otimizacao, visto que adiscretizacao do interior do domınio e evitada.

Diante do que foi apresentado, o presente capıtulo tem por objetivo resolver problemas inversosde transferencia de calor por conducao visando a determinacao de geometrias e/ou condicoes decontorno pela formulacao de um problema inverso a ser resolvido pelo ACV associado ao MEC. Estecapıtulo e estruturado conforme segue. As Secoes 2 e 3 apresentam a formulacao do problema diretode conducao de calor e aspectos gerais do MEC, respectivamente. Ja na Secao 4 e apresentada aformulacao do problema inverso de transferencia de calor por conducao. Na Secao 5 e apresentadauma breve revisao do ACV. Os resultados sao descritos na secao 6. Finalmente, as conclusoes eperspectivas para trabalhos futuros sao descritas na ultima secao.

2. Formulação do Problema Direto de Transferência de Calor por Condução

Seja o problema de transferencia de calor por conducao em estado estacionario num meio homogeneobidimensional definido pelo contorno ∂Ω = C1 ∪ C2, como mostrado na Figura 1 (Ang, 2007).

x

y

C2

C1

φ

φ

Ω

( especificado)

( especificado)

nx ny[ ]

Figura 1. Domınio do problema de transferencia de calor por conducao.

Matematicamente, este problema pode ser formulado como (Huang & Chao, 1997; Ang, 2007):

∂2φ

∂x2+∂2φ

∂y2= 0 (1)

φ = f1(x, y) para (x, y) ∈ C1 (2)

∂φ

∂n= f2(x, y) para (x, y) ∈ C2 (3)

onde f1 e f2 sao funcoes das variaves independentes e C1 e C2 sao os contornos que definem o domınio∂Ω = C1 ∪ C2.

Page 111: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

96 Lobato et al.

3. Método dos Elementos de Contorno

A principal ideia do MEC e transformar a equacao diferencial de Laplace (Equacao 1) que atuasobre todo o domınio Ω em uma equacao integral que atua somente sobre o contorno do domınio(∂Ω = C1 ∪ C2). Tal transformacao e realizada atraves da chamada solucao recıproca, que e umarelacao entre duas solucoes particulares quaisquer, Φ e φ, da equacao diferencial parcial e de suasderivadas na direcao normal, ∂Φ/∂n e ∂φ/∂n, sobre o contorno do domınio ∂Ω, e que pode sercalculada, por exemplo, para φ como

∂φ

∂n= nx

∂φ

∂x+ ny

∂φ

∂y(4)

onde nx e ny sao as componentes x e y do vetor normal unitario (Figura 1).A obtencao da solucao recıproca pode ser feita atraves do Teorema da Divergencia de Gauss

(Ambrosio et al., 2000). Para essa finalidade, sejam Φ e φ duas solucoes particulares da equacao deLaplace

∂2Φ

∂x2+∂2Φ

∂y2= 0 (5)

∂2φ

∂x2+∂2φ

∂y2= 0 (6)

Se multiplicarmos a primeira equacao por φ e a segunda equacao por Φ e tomarmos a diferencaentre as equacoes obtidas resulta

∂x

(φ∂Φ

∂x− Φ

∂φ

∂x

)+

∂y

(φ∂Φ

∂y− Φ

∂φ

∂y

)= 0 (7)

que e entao integrada no domınio Ω∫ ∫Ω

(∂

∂x

(φ∂Φ

∂x− Φ

∂φ

∂x

)+

∂y

(φ∂Φ

∂y− Φ

∂φ

∂y

))dxdy = 0 (8)

A aplicacao do Teorema da Divergencia de Gauss converte a integral de area em Ω em umaintegral de contorno em ∂Ω∫

∂Ω

((φ∂Φ

∂x− Φ

∂φ

∂x

)nx +

(φ∂Φ

∂y− Φ

∂φ

∂y

)ny

)ds = 0 (9)

reescrita como ∫∂Ω

((φ∂Φ

∂xnx + φ

∂Φ

∂yny

)−

(Φ∂φ

∂xnx + Φ

∂φ

∂yny

))ds = 0 (10)

e que define a solucao recıproca ∫∂Ω

(φ∂Φ

∂n− Φ

∂φ

∂n

)ds = 0 (11)

onde

φ∂Φ

∂n= φ

∂Φ

∂xnx + φ

∂Φ

∂yny (12)

Φ∂φ

∂n= Φ

∂φ

∂xnx + Φ

∂φ

∂yny (13)

Como mencionado, a solucao recıproca (Equacao 11) fornece uma relacao entre duas solucoesquaisquer φ e Φ da equacao de Laplace. Neste caso, se conhecermos uma solucao particular, a outrapode ser obtida a partir da solucao recıproca. No caso da equacao de Laplace, uma solucao particular

Page 112: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Resolução de problemas inversos de condução de calor 97

pode ser obtida se as coordenadas retangulares (x,y) forem convertidas para coordenadas polares(r,θ), tal que x=r cos(θ) e y=r sin(θ). Assim, pode-se definir uma funcao Ψ tal que (Ang, 2007)

1

r

∂r

(r∂Ψ

∂r

)+

1

r2

∂2Ψ

∂θ2= 0 (14)

Supondo que a funcao Ψ=Ψ(r), esta equacao diferencial parcial se transforma em uma equacaodiferencial ordinaria cuja solucao analıtica e

φ(x, y) =Ψ(r)

π2=

1

2πln(√

(x− ξ)2 + (x− η)2)

(15)

onde o ponto (ξ e η) e o centro do sistema de coordenadas com raio r e que produz a solucaofundamental

φ(x, y, ξ, η) =1

4πln(

(x− ξ)2 + (x− η)2)

para (x, y) 6= (ξ, η) (16)

A partir das Equacoes (11) e (16) pode-se determinar a equacao integral do MEC para resolver oproblema de Laplace (Equacao (1)). Considerando Φ=Φ(x, y, ξ, η) e que φ=φ(x, y), a Equacao (11)se torna ∫

∂Ω

(φ(x, y)

∂Φ(x, y, ξ, η)

∂n− Φ(x, y, ξ, η)

∂φ(x, y)

∂n

)ds = 0

para (ξ, η) 6= Ω ∪ ∂Ω (17)

Deve ser observado que a equacao acima e valida para pontos (ξ,η) que nao pertencem ao domınioΩ e nem a ∂Ω. No entanto, e possıvel superar esta dificuldade de forma a se determinar duas equacoesdiferentes, uma valida para pontos interiores ao domınio Ω e outra para pontos do contorno ∂Ω.Omitindo esse desenvolvimento matematico por ser extenso, pode-se mostrar que para o caso emque o ponto (ξ,η) localiza-se no interior de Ω, a Equacao (17) se torna

φ(x, y) ≡∫∂Ω

(φ(x, y)

∂Φ(x, y, ξ, η)

∂n− Φ(x, y, ξ, η)

∂Φ(x, y)

∂n

)ds = 0

para (ξ, η) ∈ Ω (18)

e para pontos localizados no contorno

1

2φ(x, y) ≡

∫∂Ω

(φ(x, y)

∂Φ(x, y, ξ, η)

∂n− Φ(x, y, ξ, η)

∂Φ(x, y)

∂n

)ds = 0

para (ξ, η) ∈ ∂Ω (19)

E importante ressaltar que na parte do contorno onde se impoe o potencial φ, nao se conheceo valor de ∂φ/∂n e vice versa. Sendo assim, primeiramente deve-se usar a Equacao (19) paradeterminar os valores desconhecidos de φ e de ∂φ/∂n nos pontos do contorno ∂Ω. Em seguida, comestes valores, deve-se aplicar a Equacao (18) para calcular o valor de φ em qualquer ponto (ξ,η) dodomınio Ω.

Uma descricao matematica detalhada sobre o desenvolvimento apresentado pode ser encontradoem Ang (2007).

4. Formulação do Problema Inverso de Transferência de Calor por Condução

O problema inverso consiste na minimizacao do funcional Q (Equacao (20)), i.e., na minimizacao dadiferenca entre os valores “experimentais” e os valores calculados pelo sistema de equacoes que regemo fenomeno em analise para fins de determinacao da geometria e/ou das condicoes de contorno.Matematicamente, tem-se:

Q =N∑i=1

(Γical − Γi

exp)2 (20)

onde N representa o numero total de dados experimentais, Γical e Γi

exp representam os perfis davariavel observavel, calculados pelo modelo e os experimentais, respectivamente.

Page 113: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

98 Lobato et al.

Para a presente aplicacao, como nao sao conhecidos pontos experimentais, considera-se conhecidaa geometria e as condicoes de contorno do problema para a resolucao do problema direto. Destaforma, conhecendo-se o perfil da variavel dependente Γ em pontos do domınio e atribuindo-se umruıdo aleatorio, define-se os pontos “experimentais sinteticos”, i.e., os dados experimentais que seraoutilizados neste capıtulo. Esse ruıdo acrescido ao ponto calculado procura reproduzir erros demedicao que sao inerentes a qualquer procedimento experimental. Desse modo, tal aspecto seraconsiderado neste trabalho atraves da seguinte relacao:

Γexp = Γcal + riσ (21)

onde ri e um numero aleatorio entre -1 e 1 e σ e relacionado ao desvio padrao associado aos errosno procedimento experimental.

5. Algoritmo de Colônia de Vagalumes

Para a resolucao do problema inverso, que visa a minimizacao do funcional dado pela Equacao (20)sera utilizado como ferramenta de otimizacao o Algoritmo de Colonia de Vagalumes (ACV). Estasecao apresenta uma breve descricao deste algoritmo, que e baseado no comportamento social decolonias de vagalumes.

5.1 A Inspiração biológica

O ACV e conceitualmente baseado na caracterıstica bioluminescente de vagalumes. Dentre asfuncoes desempenhadas por esta luminescencia pode-se enumerar as seguintes (Yang, 2008): (i)ferramenta de comunicacao e atracao para potenciais parceiros na reproducao; (ii) isca para atracaode eventuais presas para o vagalume; (iii) mecanismo de alerta para potenciais predadores. A funcaoda comunicacao atraves dessa bioluminescencia advem do fato observado que, em determinadasespecies de vagalumes, a taxa de intermitencia e a intensidade dos flashes luminosos e parte essencialdo mecanismo que atrai ambos os sexos para o ritual de acasalamento. As femeas sao atraıdas pelobrilho emitido pelos machos. Alem disso, quando existe uma grande quantidade destes em uma areacomum, o fenomeno de sincronizacao e responsavel pela emissao dos flashes luminosos, evidenciandouma caracterıstica de auto-organizacao emergente (Yang, 2008).

5.2 A Descrição do algoritmo

O processo de inicializacao da populacao no ACV, assim como acontece em outras estrategiasbaseadas em populacao (Price & Storn, 1997; Yang, 2008; Chai-ead et al., 2011), consiste na geracaode indivıduos de forma aleatoria. Neste caso, faz-se uso da definicao do tamanho da populacao e dodomınio de cada variavel de projeto. A partir daı, geram-se numeros aleatorios que serao aplicadosa esse intervalo, obtendo-se assim um vetor de indivıduos da populacao, como mostrado a seguir:

xi,j = xi,L + rand (xi,U − xi,L) (22)

onde xi,L e xi,U sao os limites inferiores e superiores das j-esimas variaveis de projeto,respectivamente, e rand e um gerador de numeros aleatorios entre 0 e 1.

No algoritmo proposto por Yang (2008), as seguintes hipoteses foram consideradas: (i) osvagalumes nao possuem sexo, portanto qualquer vagalume podera atrair ou ser atraıdo; (ii) aatratividade e proporcional ao brilho emitido e decai conforme aumenta a distancia entre osvagalumes; (iii) o brilho emitido por um vagalume e determinado pela sua avaliacao frente aoobjetivo (i.e., quanto melhor avaliado, mais brilhante). Neste sentido, a intensidade de emissao deluz de um vagalume e proporcional a funcao objetivo (I(x)), que decai em funcao da distancia entreos vagalumes, devido a absorcao da luz pelo meio. Assim, a intensidade percebida por um vagalumee dada por:

I(r) = Io exp(−γr2) (23)

em que Io e a intensidade da luz emitida; r e a distancia Euclidiana entre os vagalumes i e j, sendoi o vagalume mais brilhante e j o vagalume menos brilhante; e γ e o parametro de absorcao da luzpelo meio. O fator de atratividade β, responsavel pela aproximacao dos vagalumes, e definido como:

β = βo exp(−γr2

)(24)

Page 114: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Resolução de problemas inversos de condução de calor 99

onde βo e a atratividade para uma distancia r = 0. A movimentacao em um dado passo de tempo tdo vagalume i em direcao ao vagalume j, em termos da funcao objetivo, e definida como:

xti = xt−1i + β

(xt−1j − xt−1

i

)+ α (rand− 0, 5) (25)

Na equacao acima, o termo β introduz a parcela de atratividade, enquanto o parametro α regulaa insercao de aleatoriedade no caminho percorrido pelo vagalume, onde rand e um numero aleatorioentre 0 e 1.

No ACV o usuario deve informar os seguintes parametros: numero de vagalumes (n), numerode variaveis de projeto (D), fator de atratividade (βo), parametro de insercao de regularidade (α) enumero maximo de geracoes (ngen).

O pseudocodigo do ACV para o problema de minimizacao e apresentado a seguir (Yang, 2008).

Algoritmo de Colonia de Vagalumes

Inıcio........Definir a funcao objetivo Q(x), x = (x1, x2, ..., xD)T

........Definir os parametros do ACV (n, D, βo, α e ngen)

........Para i=1 ate o numero maximo de geracoes (ngen) faca

..........Calcular a intensidade da luz Ii para xi inversamente proporcional a Q(xi)

............Para j=1 ate o numero de vagalumes (n)

..............Calcular o fator de atratividade (Equacao (24))

..............Mover o vagalume j em direcao aos vagalumes mais brilhantes (Equacao (25))

..............Verificar se o vagalume esta dentro dos limites

............Fim-Para

........Fim-Para

........Pos-processamento e visualizacao dos resultados

..baFim

Como em qualquer metodo evolutivo, existe a possibilidade da populacao ficar estagnada emum ponto que nao seja o otimo global. Para aumentar a chance do algoritmo evitar esse tipo desituacao foi acoplado ao algoritmo original um operador para evitar a estagnacao da populacao.Neste operador, na t-esima geracao, calcula-se a media das ultimas k-esimas funcoes objetivo comrelacao a geracao corrente t. Se a diferenca entre a media e o valor da funcao objetivo referenteao melhor candidado for menor que uma tolerancia pre-definida pelo usuario, a populacao correntee substituıda na ıntegra por novos candidatos gerados aleatoriamente dentro do espaco de projeto.Dessa maneira, apesar do acoplamento desse operador levar naturalmente ao aumento do numerode avaliacoes da funcao objetivo, e inserida diversidade a populacao que estava estagnada, o queaumenta a chance da populacao sair deste estado de estagnacao, e consequentemente, continuar abusca pelo otimo global.

6. Resultados e Discussão

O esquema computacional proposto para resolver o problema inverso de tranferencia de calor porconducao consiste na definicao das variaveis de projeto, bem como do seu domınio, dos parametrosdo ACV e dos parametros do MEC. Para cada avaliacao da funcao objetivo, faz-se necessaria aresolucao do sistema de equacoes diferenciais (problema direto) atraves do MEC com os candidatosgerados pelo ACV. A Figura 2 ilustra este procedimento.

Para um melhor entendimento deste trabalho, a descricao dos parametros e demais procedimentosadotados sao comentados a seguir:

• definicao dos parametros do MEC: numero de elementos de controle definidos para cada estudode caso e apresentados nas tabelas a seguir, 25 elementos de controle discretizados no interiordo domınio Ω, o sistema linear resultante da aplicacao do MEC foi resolvido usando o Metodode Gauss-Siedel com tolerancia de 10−08;

• definicao dos parametros do ACV: populacao com 50 vagalumes, fator de atratividade iguala 0,8, parametro de insercao de regularidade igual a 0,5, e numero maximo de geracoes igual

Page 115: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

100 Lobato et al.

Parâmetros do ACV

ACV

Início

Fim

Parâmetros do MEC

MEC

Avaliar a Função Objetivo

O critério de parada foisatisfeito?

SIM

NÃO

Figura 2. Esquema computacional para a resolucao do problema inverso de transferencia de calor por conducao.

a 250. Para ativar a estrategia de refinamento considerou-se a media das ultimas 20 geracoescom tolerancia de 10−2;

• todos os estudos de caso foram resolvidos dez vezes em um microcomputador Core i5 com 3GB de memoria para a apresentacao dos valores medios. Considera-se um gerador de numerosaleatorios uniformemente distribuıdos implementado no software MATLABr com o seguintevetor de sementes para a sua inicializacao [0 1 2 3 4 5 6 7 8 9];

• sao considerados estudos de caso sem ruıdo (σ=0) e com ruıdo (σ=0,05), vide Equacao 21, quecorrespondem a erros da ordem de 7%;

• para fins de comparacao sao considerados os seguintes algoritmos (Silva-Neto & Becceneri,2012): Algoritmos Geneticos (AG) (50 indivıduos, probabilidade de cruzamento igual a 0,5,probabilidade de mutacao igual a 0,05, e numero maximo de geracoes igual a 250) e Otimizacaopor Enxame de Partıculas (PSO) (50 indivıduos, fatores de inercia, parametros de ponderacaocognitivos e sociais iguais a 1,4, 1,5, e 2,5, respectivamente, e numero maximo de geracoes iguala 250);

• em todos os estudos de caso considerados foram utilizados 25 sensores (16 no contorno e 9 nointerior), como apresentado nas Figuras (3) e (5);

• o criterio de parada neste trabalho foi o numero maximo de geracoes para cada estrategiautilizada.

6.1 Estudo de caso 1

Seja o problema proposto por Ang (2007), cujo domınio Ω=[0, 1]× [0, 1] e apresentado na Figura (3).

As condicoes de contorno associadas a este estudo de caso sao:

φ = 0 para x = 0 e 0 ≤ y ≤ 1 (26)

φ = cos(πy) para x = 1 e 0 ≤ y ≤ 1 (27)

∂φ

∂y= 0 para y = 0 e y = 1 e 0 ≤ x ≤ 1 (28)

Antes de resolver o problema inverso, sera verificada a qualidade da solucao do problema diretousando o MEC em termos do numero de elementos de contorno utilizados. A Tabela 1 apresenta osresultados numericos confrontados com a solucao analıtica (φ = sinh(πx) cos(πy)/ sinh(π)).

Page 116: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Resolução de problemas inversos de condução de calor 101

x

y

φ

φ= 0

φ= 0

=0 φ=cos( )πy

0

0 1

1

sensores

Figura 3. Domınio considerado no estudo de caso 1.

Tabela 1. Avaliacao do MEC para a simulacao do estudo de caso 1.

Numero de elementos de contorno

(ξ;η) 20 40 60 80 Analıtica

(0,10;0,20) 0,022397 0,022375 0,022375 0,022374 0,022371(0,10;0,30) 0,016279 0,016262 0,016258 0,016256 0,016254(0,10;0,40) 0,008559 0,008549 0,008547 0,008546 0,008545(0,50;0,20) 0,161520 0,161316 0,161266 0,161246 0,161212(0,50;0,30) 0,117325 0,117195 0,117162 0,117149 0,117127(0,50;0,40) 0,061672 0,061610 0,061594 0,061588 0,061577(0,90;0,20) 0,590102 0,590022 0,589989 0,589973 0,589941(0,90;0,30) 0,428609 0,428634 0,428630 0,428627 0,428618(0,90;0,40) 0,225307 0,225337 0,225340 0,225339 0,225338

CPU1 0,12 0,25 0,56 1,12 -Ξ2 0,11 0,04 0,02 0,01 -

1Tempo de processamento em segundos.2Erro relativo medio (%).

Nesta tabela e possıvel observar uma boa concordancia entre os resultados simulados pelo MECe a solucao analıtica, com erro maximo da ordem de 0,11 % para 20 elementos de controle. Alemdisso, como esperado, o aumento do numero de elementos de controle aumenta a precisao do MEC,e por consequencia, o tempo de processamento.

Com o intuito de avaliar o desempenho do ACV, o problema inverso referente ao estudo de caso1 consiste da minimizacao do funcional dado pela Equacao (20) visando a determinacao da condicaode contorno em x=1 e 0≤ y ≤ 1, descrita pela Equacao (27).

A Tabela 2 apresenta os resultados obtidos pelos algoritmos ACV, AG e PSO considerando dadosexperimentais sinteticos com e sem ruıdo para 80 elementos de controle.

Tabela 2. Resultados numericos obtidos pelos algoritmos ACV, AG e PSO para o estudo de caso 1.

Funcao Objetivo (Equacao (20))

AG PSO ACV

σ=0 1,0227E-06 (6,0289E-07)† 1,4502E-06 (7,3325E-07) 1,1043E-07 (9,1848E-08)σ=0,05 0,0104 (8,7513E-05) 0,0098 (1,3513E-05) 0,0093 (9,8170E-06)N1

aval 12550 12550 14255

1Numero de avaliacoes da funcao objetivo.†Desvio padrao.

Conforme pode ser observado nesta tabela, todos os algoritmos foram capazes de obter resultadossatisfatorios para o problema com dados experimentais sem ruıdo e boas estimativas para o problemaonde ruıdo e considerado. E importante destacar que, devido a inclusao do operador para refinamento

Page 117: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

102 Lobato et al.

de solucoes no ACV, sao necessarias mais avaliacoes da funcao objetivo (cerca de 14 %) em relacaoaos algoritmos AG e PSO. Isto e justificavel na medida em que mais avaliacoes da funcao objetivosao requeridas no operador de refinamento.

Na Figura (4) e apresentado o valor medio da funcao objetivo (Equacao (20)) em funcao donumero de geracoes, para cada um dos algoritmos empregados.

Figura 4. Funcao objetivo versus numero de geracoes para o estudo de caso 1(Dados experimentais sem ruıdo, σ=0).

6.2 Estudo de caso 2

Seja o problema proposto por Ang (2007), cujo domınio e apresentado na Figura (5).

x

y

φ= 0

φ 3cos(4arctan( ))

1

0 2

2

1

φ= 0= y/x

φ cos(4arctan( ))= y/x

sensores

Figura 5. Domınio considerado no estudo de caso 2.

As condicoes de contorno associados e este estudo de caso sao:

∂φ

∂x= 0 para x = 0 e 1 ≤ y ≤ 2 (29)

∂φ

∂y= 0 para y = 0 e 1 ≤ x ≤ 2 (30)

φ = cos

(4 arctan

(y

x

))para x2 + y2 = 1 e 0 ≤ x, y ≤ 1 (31)

φ = 3 cos

(4 arctan

(y

x

))para x2 + y2 = 4 e 0 ≤ x, y ≤ 2 (32)

Page 118: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Resolução de problemas inversos de condução de calor 103

A Tabela 3 apresenta os resultados numericos confrontados com a solucao analıtica (φ =16/85((x2 + y2)2 − 1/(x2 + y2)2) − 16/255((x2 + y2)2/16 − 16/(x2 + y2)2) cos(4 arctan(y/x))) paradiferentes numeros de elementos de controle.

Tabela 3. Avaliacao do MEC para a simulacao do estudo de caso 2.

Numero de elementos de contorno

(ξ;η) 60 120 240 Analıtica

(1,0825;0,6250) -0,359761 -0,379226 -0,388946 -0,392045(0,8750;1,5155) -0,892767 -0,901232 -0,905432 -0,907816(1,0606;1,0606) -1,080586 -1,078836 -1,077954 -1,094211(1,0999;0,0019) 0,8331354 0,8330876 0,833108 0,826958(1,0100;0,0001) 0,9788720 0,9736364 0,975643 0,975656

CPU1 1,87 5,96 26,39 -Ξ2 2,45 1,27 0,66 -

1Tempo de processamento em segundos.2Erro relativo medio (%).

Assim como no estudo de caso anterior, na Tabela 3 e possıvel observar boa concordancia entreos resultados simulados pelo MEC e a solucao analıtica, com erro maximo da ordem de 2,45 % para60 elementos de controle. O aumento do numero de elementos de controle aumenta a precisao ascustas do aumento do tempo de processamento.

O problema inverso associado ao estudo de caso 2 consiste da determinacao da geometria e dacondicao de contorno definida em x2 + y2 = 1 e x2 + y2 = 4, descritas, respectivamente, pelaEquacao (31) e pela Equacao (32). A Tabela 4 apresenta os resultados obtidos pelos algoritmosACV, AG e PSO considerando dados experimentais sinteticos com e sem ruıdo, para 120 elementosde controle.

Tabela 4. Resultados numericos obtidos pelos algoritmos ACV, AG e PSO para o estudo de caso 2.

Funcao Objetivo (Equacao (20))

AG PSO ACV

σ=0 2,7454E-05 (2,8879E-06)† 1,0892E-05 (4,2995E-06) 8,3989E-06 (2,4998E-07)σ=0,05 0,0014 (2,1773E-03) 0,0011 (4,1883E-03) 0,0012 (5,7880E-03)N1

aval 12550 12550 15755

1Numero de avaliacoes da funcao objetivo.†Desvio padrao.

Na tabela acima e possıvel observar que todos os algoritmos foram capazes de obter resultadossatisfatorios para o problema sem ruıdo e boas estimativas para o problema onde ruıdo e considerado.No caso do ACV, sao necessarias cerca de 26 % mais avaliacoes da funcao objetivo em relacao aosalgortimos AG e PSO devido a inclusao do operador para refinamento de solucoes.

A Figura (6) apresenta o valor medio da funcao objetivo (Equacao (20)) em funcao do numerode geracoes para cada um dos algoritmos.

7. Conclusões

O presente capıtulo teve por objetivo a resolucao de problemas inversos de transferencia de calor porconducao usando o ACV associado ao MEC para fins da determinacao da geometria e/ou condicoesde contorno, visando dois estudos de caso. Primeiramente foi avaliada a qualidade da solucao obtidapelo MEC quanto ao numero de elementos de contorno. Em seguida, foi aplicado o ACV paraa resolucao do problema inverso. De posse dos resultados foi possıvel concluir que a metodologiaproposta configura-se como uma alternativa interessante para o tratamento de problemas inversos.Isto se deve a dois fatores: o primeiro diz respeito a reducao do tempo computacional necessariopara a resolucao do problema direto, alem da habilidade do MEC para o tratamento de geometriascomplexas; em segundo lugar, o ACV mostrou-se eficiente quando comparado com outros algoritmosclassicos em termos do valor mınimo da funcao objetivo. E importante ressaltar que a inclusao

Page 119: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

104 Lobato et al.

Figura 6. Funcao objetivo versus numero de geracoes para o estudo de caso 2 (Dados experimentais semruıdo,σ=0).

do operador para refinamento de solucoes implica no aumento do numero de avaliacoes da funcaoobjetivo, independentemente da estrategia de otimizacao adotada.

Como linhas de trabalhos futuros pode-se citar a avaliacao de problemas com dados experimentaisreais e a presenca de incerteza na estimacao da geometria e/ou condicoes de contorno atraves daintroducao do conceito de robustez.

Agradecimentos

F.S.L. agradece o suporte financeiro da FAPEMIG, Fundacao de Amparo a Pesquisa de Minas Gerais,e do CNPq, Conselho Nacional de Desenvolvimento Cientıfico e Tecnologico. V.S. agradece o apoiodo INCT-EIE, atraves de recursos do CNPq e da FAPEMIG. A.J.S.N. agradece o suporte financeiroadvindo da FAPERJ, Fundacao Carlos Chagas Filho de Amparo a Pesquisa do Estado do Rio deJaneiro e do CNPq.

ReferênciasAmbrosio, L.; Fusco, N. & Pallara, D., Functions of Bounded Variation and Free Discontinuity Problems. 1a edicao.

New York: Oxford Mathematical Monographs, The Clarendon Press, Oxford University, 2000.

Ang, W.T., A Beginner’s Course in Boundary Element Methods. 1a edicao. Boca Raton, USA: Universal Publishers,2007.

Chai-ead, N.; Aungkulanon, P. & Luangpaiboon, P., Bees and firefly algorithms for noisy non-linear optimisationproblems. In: Proceedings of the International MultiConference of Engineers and Computer Scientists. p. 1–6,2011.

Chan, C.L., Boundary element method analysis for the bioheat transfer equation. Journal of BiomechanicalEngineering, 1:358–365, 1991.

Cheng, C.H. & Chang, M.H., Shape design for a cylinder with uniform temperature distribution on the outer surfaceby inverse heat transfer method. Int J Heat Mass Transfer, 46(2):101–111, 2003a.

Cheng, C.H. & Chang, M.H., A simplified conjugate-gradient method for shape identification based on thermal data.Numerical Heat Transfer, Part B: Fundamentals: An International Journal of Computation and Methodology,43(5):489–507, 2003b.

Dulikravich, G.S., Inverse design of proper number, shapes, sizes and locations of coolant flow passages. In: Williams,R.W. (Ed.), Proceedings of 10th Annual Workshop for Computational Fluid Dynamics Applications in RocketPropulsion, Part 1, NASA MSFC, Huntsville, AL, NASA CP-3163. Washington, USA, p. 467–486, 1992.

Fazeli, H. & Mirzaei, M., Shape identification of frost formation around refrigeration tube via the inverse heatconduction approach. Computational Thermal Sciences, 3(4):375–387, 2011.

Fazeli, H. & Mirzaei, M., Shape identification problems on detecting of defects in a solid body using inverse heatconduction approach. Journal of Mechanical Science and Technology, 26(11):3681–3690, 2012.

Huang, C.H. & Chao, B.H., An inverse geometry problem in identifying irregular boundary configurations. Int J HeatMass Transfer, 40(1):2045–2053, 1997.

Huang, C.H. & Tsai, C.C., A transient inverse two-dimensional geometry problem in estimating time-dependentirregular boundary configurations. Int J Heat Mass Transfer, 41(3):1707–1718, 1998.

Page 120: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Resolução de problemas inversos de condução de calor 105

Kazemzadeh-Parsi, M.J.; Ahmadfard, M.A. & Tahavvor, A., Location and size identification of circular cavities viaboundary temperature measurements using artificial neural network. In: 19th Annual Conference on MechanicalEngineering - ISME201110-12. The University of Birjand, Birjand, Iran, p. 1–4, 2011.

Kennon, S.R. & Dulikravich, G.S., Inverse design of internally cooled turbine blades. Trans ASME J Eng Gas TurbPower, 107(2):123–126, 1985.

Leidenfrost, R. & Elmenreich, W., Establishing wireless time-triggered communication using a firefly clocksynchronization approach. In: Proceedings of the 2008 International Workshop on Intelligent Solutions inEmbedded Systems. Regensburg, Germany, p. 1–18, 2008.

Lesnic, D. & Bin-Mohsin, B., Inverse shape and surface heat transfer coefficient identification. Journal of Computationaland Applied Mathematics, 236(7):1876–1891, 2012.

Lobato, F.S.; Malagoni, R.A.; Arouca, F.O. & Steffen Jr, V., Modelagem e simulacao do processo de bio-transferenciade calor em tecidos. In: Anais do XIX Congresso Brasileiro de Engenharia Quımica, 09 a 12 de Setembro,Buzios-Brazil. p. 1–10, 2012.

Lobato, F.S. & Steffen Jr, V., Desenvolvimento de uma estrategia de otimizacao auto-adaptativa usando modeloscaotiocos de busca e o algoritmo de vagalume. In: XIII Encontro de Modelagem Computacional. Nova Friburgo-RJ, Brasil, p. 1–10, 2010.

Luz, E.F.P.; Becceneri, J.C. & Campos Velho, H.F., Conceitualizacao do algoritmo vagalume e sua aplicacao naestimativa de condicao inicial da equacao de calor. In: IX Workshop do Curso de Computacao Aplicada do INPE.INPE - Sao Jose dos Campos, p. 1–10, 2009.

Menin, O.H., Metodo dos Elementos de Contorno para Tomografia em Impedancia Eletrica. Dissertacao de mestrado,Faculdade de Filosofia, Ciencias e Letras de Ribeirao Preto, Programa de Fısica Aplicada a Medicina e Biologia,2009.

Pal, S.K.; Rai, C.S. & Singh, A.P., Comparative study of firefly algorithm and particle swarm optimization for noisynon-linear optimization problems. Int J Intelligent Systems and Applications, 10(1):50–57, 2012.

Pfeifer, A.A. & Lobato, F.S., Solution of singular optimal control problems using the firefly algorithm. In: VI CongresoArgentino de Ingenierıa Quımica - CAIQ2010. Asociacion Argentina de Ingenieros Quımicos, p. 1–8, 2010.

Price, K. & Storn, R., Differential evolution - a simple evolution strategy for fast optimization. Dr Dobb’s Journal,22(4):18–24, 1997.

Silva-Neto, A.J. & Becceneri, J.C., Tecnicas de Inteligencia Computacional Inspiradas na Natureza - Aplicacao emProblemas Inversos e Transferencia Radiativa. 2a edicao. Notas em Matematica Aplicada, Vol. 41, SBMAC, SaoCarlos-SP, Brasil, 2012.

Tilahun, S.L. & Ong, H.C., Modified firefly algorithm. Journal of Applied Mathematics, 2012(1):1–12, 2012.

Werner-Allen, G.; Tewari, G.; Patel, A.; Welsh, M. & Nagpal., R., Firefly-inspired sensor network synchronicity withrealistic radio effects. In: Proceedings of the Third International Conference on Embedded Networked SensorSystems. p. 142–153, 2005.

Yang, X.; Hosseini, S.S.S. & Gandomi, A.H., Firefly algorithm for solving non-convex economic dispatch problemswith valve loading effect. Applied Soft Computing, 12(2):1180–1186, 2012.

Yang, X.S., Nature-Inspired Metaheuristic Algorithms. 1a edicao. Luniver Press, Cambridge, 2008.

Page 121: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

106 Lobato et al.

.

Page 122: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Capítulo 9

Método do Enxame de Partículas Aplicadoà Síntese de Redes de Trocadores de Calor

Aline Priscila da Silva, Evaristo Chalbaud Biscaia Juniore Mauro Antonio da Silva Sá Ravagnani∗

Resumo: Neste Capıtulo e apresentado uma metodologia para realizar a sıntese de redes de trocadorescom custo mınimo de investimento. Este e um problema descrito por um modelo de natureza altamentecombinatoria, nao-linear e nao-convexa. A sistematica proposta se utiliza de um modelo de otimizacaobaseado em superestruturas, cuja solucao e obtida com a aplicacao do metodo do enxame de partıculas. Aaplicabilidade e eficiencia dessa sistematica foram avaliadas por meio do estudo de exemplos da literaturae tambem de um caso real de grande dimensao.

Palavras-chave: Sıntese de redes de trocadores de calor, otimizacao, Enxame de partıculas, Modelo desuperestrutura.

Abstract: In this Chapter, a methodology was developed aiming to synthesize heat exchanger networkswith the minimum global cost. This optimization problem is clearly nonlinear, nonconvex and highlycombinatorial. The proposed methodology uses a model based on stagewise superstructures, whose solutionis obtained by applying Particle Swarm Optimization. The performance of the method was evaluated solvinga benchmark example, as well as a real high-dimensional problem.

Keywords: Heat exchanger network synthesis, Optimization, Particle swarm optimization, Superstructuremodel.

Conteúdo

1 Introducao ................................................................................................................................1082 Integracao Energetica de Processos..........................................................................................108

2.1 Metodos sequenciais.........................................................................................................1092.2 Metodos simultaneos........................................................................................................109

3 Otimizacao e Metodo do Enxame de Partıculas ......................................................................1093.1 O metodo do enxame de partıculas .................................................................................110

4 Sıntese De Redes de Trocadores de Calor ................................................................................1104.1 Definicao do problema .....................................................................................................1104.2 Algoritmo proposto..........................................................................................................1124.3 Variaveis e funcao objetivo ..............................................................................................113

5 Aplicacoes.................................................................................................................................1145.1 Exemplo 01 ......................................................................................................................1145.2 Exemplo 02 ......................................................................................................................115

6 Comentarios e Conclusao .........................................................................................................116

∗Autor para contato: [email protected]

Lobato et al. (Ed.), (2014) DOI: 10.7436/2014.tica.09 ISBN 978-85-64619-15-9

Page 123: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

108 Silva et al.

1. Introdução

Atualmente, um dos problemas que os engenheiros e pesquisadores em sıntese de processos quımicosmais enfrentam e o consumo excessivo de energia nas plantas de processamento. Uma das maneirasde minimizar o consumo de energia e aproveitar o excesso de calor proveniente das correntes que sedeseja resfriar para suprir a necessidade das correntes que se deseja aquecer. Essa necessidadede aquecimento/resfriamento sao feitos, normalmente, por meio de utilidades quentes e frias,respectivamente. Uma rede de trocadores de calor tem por objetivo a realizacao destas tarefas deaquecimento e resfriamento por meio da integracao energetica das correntes de processo, de forma areduzir a quantidade de utilidades empregadas.

Essencialmente, a tarefa de sıntese de redes de trocadores de calor consiste em encontraruma sequencia de troca de calor em que pares de correntes (quente e fria) sao combinadas, talque a rede seja otima em relacao ao custo. A grande complexidade do problema esta na suanatureza combinatorial, ja que para um dado numero de correntes existe uma grande quantidadede configuracoes possıveis. Alem disso, esse e tambem um problema altamente nao-linear e nao-convexo. Essas caracterısticas do problema trazem dificuldades computacionais para sua solucao,sendo principalmente elevados tempos computacionais e/ou dificuldade em se encontrar regioesviaveis, com solucoes otimas.

Por esse motivo, muitos trabalhos abordando a sıntese de redes de trocadores de calor vem sendodesenvolvidos para tentar sanar essas dificuldades. Eles sao classificados em dois grupos principais:os metodos sequenciais e os metodos simultaneos.

Os metodos sequenciais consistem na decomposicao do problema em uma serie de subproblemas,com o objetivo de reduzir o esforco computacional na solucao. E importante ressaltar que essadivisao nao garante a sıntese de uma rede com o custo total mınimo, uma vez que o resultado finalsera a soma de todos os subresultados otimos, o que nao necessariamente fornece uma rede globalotima.

Ja os metodos simultaneos baseiam-se na definicao de superestruturas para a sıntese da rede detrocadores de calor. O problema e formulado e resolvido em uma unica etapa. Portanto, para umdado espaco de solucoes, definido pela superestrutura, e possıvel obter-se uma solucao otima oumuito proxima da otima.

A vantagem da possibilidade de obtencao de um otimo global por essa tecnica nem sempree abordada devido aos modelos possuırem nao convexidades. Portanto, diversos modelos comsimplificacoes nas superestruturas foram criados.

Apesar das nao convexidades e consequente dificuldade em se obter boas solucoes para os modelosde superestruturas dos metodos simultaneos, neste Capıtulo e apresentada uma metodologia para oprojeto otimo de redes de trocadores de calor. Este e formulado como um problema de otimizacao eresolvido pelo metodo nao determinıstico do enxame de partıculas. Conjuntamente, a formulacao doproblema e a escolha do metodo de otimizacao, justificam-se pela necessidade de resolver o problemaem sua forma original, isto e, sem simplificacoes, bem como que os elevados esforcos computacionaisnao fossem impecılio para a convergencias do problema.

2. Integração Energética de Processos

Os processos industriais, na maioria dos casos, apresentam correntes que necessitam de aquecimentoou de resfriamento ao passarem de uma etapa do processo para a seguinte. Estas correntes saodenominadas correntes frias, quando precisam ser aquecidas, ou correntes quentes, quando devemser resfriadas.

O aquecimento ou resfriamento de uma corrente e feito por meio de equipamentos chamadostrocadores de calor, os quais recuperam energia entre as correntes do processo, transferindo o calorexcedente das correntes quentes para as correntes frias. Alem dos trocadores de calor, existem osequipamentos que fazem uso de energia externa ao processo, que sao denominados resfriadores ouaquecedores, conforme realizem o resfriamento ou o aquecimento das correntes. A transferencia decalor realizada por estes dois ultimos equipamentos ocorre mediante o emprego de correntes auxiliaresdenominadas utilidades, as quais fornecem (utilidade quente) ou retiram (utilidade fria) energia dosistema, de acordo com a necessidade da corrente em questao.

Realizar a integracao energetica de um processo significa utilizar primeiro o calor disponıvel nascorrentes quentes para aquecer as correntes frias e, entao, se ainda houver necessidade, empregarutilidades para o resfriamento ou o aquecimento de correntes ate as temperaturas exigidas peloprocesso. O conjunto desses equipamentos e chamado Rede de Trocadores de Calor.

Page 124: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Método do enxame de partículas aplicado à síntese de redes de trocadores de calor 109

Na tentativa de encontrar uma solucao satisfatoria para o problema da sıntese de redes detrocadores de calor com consumo mınimo de energia e custo capital mınimo, varios trabalhosempregando diferentes metodos para a solucao do problema foram desenvolvidos, conforme mostraRavagnani & Caballero (2012). Esses trabalhos, sao classificados em duas linhas basicas de estudo:as tecnicas sequenciais e as tecnicas simultaneas.

2.1 Métodos sequenciais

A abordagem sequencial, utilizando conceitos termodinamicos e regras heurısticas, foi iniciada natese de doutorado de Hohmann (1971), que desenvolveu o conhecido algoritmo da tabela do problemaou metodo da cascata de energia. Este procedimento foi a primeira forma rigorosa de calculo doconsumo mınimo de utilidades antes mesmo da sıntese da rede.

No fim da decada de 70, atraves do trabalho de Linnhoff & Flower (1978), a Analise Pinch surgiucomo a solucao para o problema de otimizacao energetica, propondo-se a oferecer ferramentas simplese praticas que apresentavam, de forma grafica, conclusoes rapidas sobre a necessidade energeticamınima e a quantidade otima de trocadores de calor para um dado processo industrial. Esta e umadas tecnicas mais antigas e mais difundidas para o desenvolvimento de trabalhos em sıntese de redesde trocadores de calor.

Ao longo das decadas de 1980 e 1990 os princıpios fundamentais da Analise Pinch foramenriquecidos com inumeras outras tecnicas e conceitos, que expandiram o poder de analise edeterminacao de alvos a outros sistemas e processos (Linnhoff & Hindmarsh, 1983; Tjoe & Linnhoff,1986; Linnhoff, 1993; Ravagnani, 1994).

Os trabalhos mesclando metodos sequenciais e metodos hıbridos de otimizacao comecaram aaparecer com Lewin et al. (1998). Em seguida vieram Lakshmanan & Fraga (2002), Ravagnani et al.(2005) e Silva et al. (2005).

Com o passar do tempo, os trabalhos abordando os metodos sequenciais tem ficado mais escassosdando cada vez mais espaco aos trabalhos abordando os metodos simultaneos. Alguns dos ultimostrabalhos encontrados mostram novas abordagens empregando as tradicionais ferramentas da AnalisePinch em Salama (2009), Castier (2012) e Sieniutycz & Jezowski (2013).

2.2 Métodos simultâneos

Em paralelo ao desenvolvimento da Analise Pinch, ao longo das decadas de 1980 e 1990 surgiramimplementacoes que reproduziram os conceitos inerentes ao pinch em formulacoes matematicas,envolvendo problemas de otimizacao do tipo linear, nao linear, linear inteiro misto e nao linearinteiro, conforme descreve Floudas (1995).

Devido aos avancos obtidos pelos algoritmos de otimizacao matematica aliados ao rapidodesenvolvimento de computadores que viabilizaram a solucao da sıntese via tecnicas simultaneas,a pesquisa relacionada a sıntese de redes de trocadores de calor teve um forte crescimento em suaproducao entre o final da decada de 1980 e o inıcio da decada de 1990, conforme Floudas & Ciric(1989).

Yee & Grossmann (1990) propuseram um dos modelo de superestrutura baseado em estagiosmais utilizados para resolver o problema de sıntese. Muitos trabalhos foram propostos utilizandoesse modelo, associado as mais diversas tecnicas para solucao do problema de otimizacao (Zamora& Grossmann, 1998; Mizutani et al., 2003; Silva et al., 2010).

A linha dos metodos simultaneos associados a tecnicas nao-determinısticas de otimizacao vemcrescendo significativamente com o passar dos anos. Alguns dos trabalhos nesse segmento sao Nielsenet al. (1996), Yu et al. (2000) e Silva et al. (2008).

Os trabalhos mais recentes em sıntese de redes de trocadores de calor pelo metodo simultaneotendem a fazer uma abordam no sentido de modificar ou simplificar os modelos anteriormenteapresentados, ou ainda propor novos metodos de resolucao desses modelos, com o intuito de tornaros resultados mais proximos da realidade ou facilitar a obtencao dos mesmos. Alguns deles podemser vistos em Alwi & Manan (2010), Bogataj & Kravanja (2012) e Ravagnani & Silva (2012).

3. Otimização e Método do Enxame de Partículas

Em uma definicao simples, um metodo de otimizacao consiste em encontrar a melhor solucao paraproblemas em que a qualidade de sua resposta pode ser medida por um numero. Estes problemasaparecem em praticamente todas as areas do conhecimento e a quantidade de ferramentas disponıveispara auxiliar nesta tarefa e quase tao grande quanto o numero de aplicacoes.

Page 125: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

110 Silva et al.

Para resolver um problema deste tipo, e preciso considerar dois componentes. O espaco de busca,no qual sao consideradas todas as possibilidades de solucao de um determinado problema, e a funcaoobjetivo, que e uma funcao matematica que associa cada ponto no espaco de solucoes a um numeroreal, possibilitando avaliar os membros do espaco de busca.

A questao fundamental esta no fato de que nem sempre o otimo e encontrado facilmente. Enecessario um processo sistematico de busca. Um procedimento iterativo de calculos que, passo apasso, de candidato a candidato, seja possıvel ir melhorando a selecao ate que o valor otimo sejaencontrado, ou ate que se esteja satisfeito. Esse procedimento nada mais e do que um metodo deotimizacao descrito por um algoritmo. A construcao de bons algoritmos e uma das principais etapasda otimizacao.

A partir da decada de 1950, por meio de analogias com a natureza, foram criados varios algoritmosnao-determinısticos na tentativa de simular fenomenos biologicos. Estes algoritmos, chamadosMetodos de Otimizacao Natural, tem alguns aspectos em comum. O mais marcante e seu carateraleatorio, na tentativa de simular o acaso que parece governar processos distintos na natureza, desde aevolucao das especies ate o comportamento social dos animais. Alem disso, esses metodos apresentamvantagens de facil implementacao e nao requerem continuidade na definicao do problema.

3.1 O método do enxame de partículas

O metodo do enxame de partıculas (Particle Swarm Optimization, muito conhecido por PSO) foiintroduzido por Kennedy & Eberhart (1995) e explora a analogia com o comportamento social deanimais, como enxames, cardumes ou bandos de passaros. Neste, verifica-se que o comportamentodo grupo e influenciado pela experiencia individual acumulada por cada indivıduo, bem como pelaexperiencia acumulada pelo grupo. Matematicamente, cada indivıduo do bando e considerado umponto do espaco de busca. Cada um desses pontos e um candidato a solucao do problema. A direcaode busca em uma iteracao e determinada por meio da ponderacao entre a experiencia daquela solucaoe da melhor solucao ja encontrada pelo grupo (metaforicamente, a solucao lıder).

O termo partıcula e usado para se referir a cada um dos indivıduos do grupo. O termo enxamese refere ao grupo de indivıduos. No algoritmo do metodo do enxame de partıculas cada candidatoa solucao do problema corresponde a um ponto no espaco de busca. Essas solucoes, ou partıculas,tem associadas um valor que e avaliado individualmente e que indica a adequacao da partıcula comosolucao do problema. Alem disso, essas partıculas tem tambem associadas uma velocidade que definea direcao de seu movimento. Cada partıcula modifica sua velocidade levando em conta a sua melhorposicao e tambem a melhor posicao do grupo, levando este, ao longo do tempo, a alcancar seuobjetivo.

Na sistematica desenvolvida foi utilizado o metodo do enxame de partıculas seguindo ametodologia proposta por Vieira & Biscaia Jr. (2002). A velocidade que define a direcao domovimento das partıculas e atualizada em cada iteracao por meio da Equacao 1 e as partıculaspor meio da Equacao 2.

Os principais parametros para o metodo sao as ponderacoes entre as experiencias individual ecoletiva c1 e c2 e o fator de inercia w. O fator de inercia e empregado para controlar o impacto dahistoria previa de velocidade na velocidade atual. Um maior valor de w favorece a exploracao global,enquanto um peso de inercia menor tende a facilitar a exploracao local. Selecao satisfatoria de wfornece, entao, um equilıbrio entre capacidade de exploracao global e local.

vk+1i = w.vki + c1.r1.(p

ki − xki ) + c2.r2(p

kglobal − xki ) (1)

xk+1i = xki + vk+1

i (2)

onde k e a iteracao, xi e vi sao, respectivamente, vetores da posicao e velocidade da partıcula i, w eo peso de inercia, c1 e c2 sao duas constantes, r1 e r2 sao dois vetores contendo numeros aleatorioscom distribuicao uniforme no intervalo [0, 1], pi e a posicao com o melhor valor da funcao objetivoque a partıcula i ja encontrou e pglobal e a posicao do melhor valor encontrado por todo o conjuntode partıculas.

4. Síntese De Redes de Trocadores de Calor

4.1 Definição do problema

Dado um conjunto de correntes quentes e frias, a sıntese de redes de trocadores de calor visa encontrara melhor combinacao de pares de correntes quentes e frias, tal que a economia de energia seja maxima

Page 126: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Método do enxame de partículas aplicado à síntese de redes de trocadores de calor 111

e o custo global seja mınimo. Para tal e necessario que se conheca as temperaturas de entrada e saıda,vazoes e propriedades fısicas das correntes. Alem disso, e necessario que se conheca os parametrosde custo das utilidades quente e fria e custos relacionados a area de troca termica.

Nesta proposta, um metodo para a sıntese de redes de trocadores de calor usando o metodo doenxame de partıculas foi desenvolvido. O metodo baseia-se no modelo de superestrutura similar aoapresentado por Yee & Grossmann (1990). A Figura 1 apresenta um exemplo da superestruturausada neste metodo, para um conjunto de tres correntes quentes e tres correntes frias. A definicaode uma superestrutura envolve possibilidades (flexibilidade) de sequencias de trocas em serie, trocasem paralelo, bypass, alem da otimizacao das vazoes e temperaturas das correntes intermediarias,com o objetivo de minimizar o custo das unidades de troca termica.

Figura 1. Superestrutura usada, baseada em Yee & Grossmann (1990).

Para criar esta superestrutura, deve-se inicialmente determinar o numero de estagios que ela vaiter. O numero maximo de estagios da superestrutura e o maior valor entre o numero de correntesquentes e o numero de correntes frias do processo em questao.

No primeiro estagio, divide-se as correntes de forma que seja possıvel que todas as correntesquentes troquem calor com todas as correntes frias. Em seguida, sao alocados trocadores de calor emtodos os ramos das correntes, formando pares de ramos de correntes quente e fria. Apos os trocadoresde calor do primeiro estagio, sao colocados nos de juncao que recebem os diversos ramos de cadacorrente. Com os ramos das correntes novamente unidos, um novo estagio se inicia, exatamentecomo o primeiro.

O problema de otimizacao passa a ser encontrar o numero de estagios da superestrutura, as vazoesde cada ramo dessas correntes que se dividem, bem como o calor trocado em cada trocador de calor,de forma a minimizar o custo dos trocadores envolvidos, respeitando-se os balancos materiais eenergeticos. Uma das diferencas da metodologia desenvolvida neste trabalho para aquela propostapor Yee & Grossmann (1990), e posteriormente amplamente usada por varios trabalhos, entre eleso de Mizutani et al. (2003), esta no fato de incluir o numero de estagios como uma variavel a serotimizada. No trabalho de Yee & Grossmann (1990) este e um parametro fixo, definido previamente.

Assim, uma funcao objetivo para minimizacao do custo total da rede e proposta e os custos aserem minimizados sao os custos de utilidade empregados na rede de trocadores de calor e o custoreferente aos equipamentos de troca termica.

A area de troca termica A e obtida considerando os trocadores de calor do tipo contracorrente,sendo calculada pela Equacao 3. Esta e outra grande diferenca do trabalho de Yee & Grossmann(1990) e de todos que trabalharam nessa linha utilizando os metodos tradiconais para resolver osproblemas de otimizacao. Para evitar problemas de convergencia e/ou nao linearidades, e comumencontrar o uso de aproximacoes para calcular a area. Neste trabalho, essas aproximacoes nao saoconsideradas.

Na Equacao 3 esta presente o termo MLDT . Este e outro aspecto que pode levar a problemasde nao linearidades sendo, com grande frequencia, simplificado e substituıdo pela media aritmeticade temperatura.

A =Q

U.MLDT(3)

Page 127: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

112 Silva et al.

onde Q e o calor trocado no trocador de calor, U e o coeficiente de transferencia de calor e MLDTe a media logarıtmica de temperatura.

As restricoes do problema de otimizacao sao as restricoes termodinamicas das trocas termicas.Isso significa que em todos os trocadores de calor da rede, as temperatura das correntes quentesdevem sempre ser maiores do que as temperaturas das correntes frias. As Equacoes 4 a 7 mostramo problema de otimizacao com a funcao objetivo e suas restricoes.

Mimimizar: Ctotal = Carea + Cutilidade (4)

Sujeito a: (T inh )k > (T out

c )k

(T outh )k > (T in

c )k

Carea =∑k

aa1.(Ak)aa2 (5)

Cutilidade = CHU .HU + CCU .CU (6)

kmax = N.ncq.ncf (7)

k = 1, ...,numero de equipamentos

onde Ctotal, Carea e Cutilidade sao os custos referentes a rede de trocadores de calor, area de trocatermica e utilidades, respectivamente. T in e T out sao as temperaturas de entrada e saıda do trocadorde calor, os ındices h e c representam as correntes quente e fria, aa1 e aa2 sao parametros constantespara o calculo do custo da area, CHU e CCU sao os custo referente as utilidades quente e fria, HU eCU e o total de utilidade quente e fria consumido na rede de trocadores de calor, kmax e o numeromaximo de equipamentos de troca termica a ser usado na rede, N e o numero de estagios, ncq e onumero de correntes quentes e ncf e o numero de correntes frias.

4.2 Algoritmo proposto

No problema de sıntese de redes de trocadores de calor otimas, quatro variaveis sao geradasaleatoriamente no inıcio da otimizacao, sendo modificadas a cada iteracao pelas Equacoes 1 e 2.Cada partıcula e formada pelas seguintes variaveis manipuladas: fracao de divisao da vazao dascorrentes quentes, fracao de divisao da vazao das correntes frias, numero de estagios e calor trocadopelos trocadores de calor.

Apos a geracao da partıcula, a area de cada trocador de calor da rede e calculada, bem comoa quantidade de utilidades quente e fria necessaria para suprir a rede. Isso e feito para todas aspartıculas, seja ela solucao do problema ou nao. O valor da Funcao Objetivo (custo global da rede)e obtido e caso a partıcula nao seja solucao do problema (alguma restricao desrespeitada), a funcaoobjetivo e penalizada.

A Equacao 8 e usada para calcular as temperaturas de saıda das correntes quente e fria de cadatrocador de calor.

Q = CPh.∆Th = CPc.∆Tc (8)

Um algoritmo seguindo o metodo do enxame de partıculas foi proposto para resolver o problemade otimizacao. O algoritmo e baseado nos seguintes passos:

i Entrada de Dados

• Criterio de parada: numero maximo de iteracoes;

• Numero de partıculas na populacao (Npt);

• c1, c2 e w;

• Valores maximo e mınimo das variaveis;

• Dados das correntes quentes e frias, dados de custo de area e das utilidades;

ii Geracao aleatoria das partıculas iniciaisNao ha criterio algum para essa geracao, a nao ser os limites das variaveis. A geracao e feita de forma aleatoria.

• Fracao de divisao das correntes quentes [0,1];

Page 128: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Método do enxame de partículas aplicado à síntese de redes de trocadores de calor 113

• Fracao de divisao das correntes frias [0,1];

• Numero de estagios [1,N ], N e o maximo valor entre o numero de correntes quentes e o numero de correntesfrias;

• Calor trocado pelos trocadores [0,Qmax];

iii Avaliacao da funcao objetivoCom as variaveis geradas no passo anterior, calcula-se:

• A temperatura de saıda das correntes quente e fria para cada trocador de calor [Equacao 8];

• A area de troca termica [Equacao 3];

• Funcao objetivo [Equacoes 4 a 7];

iv Verificar as restricoes para todas as partıculas iniciaisCom as temperaturas calculadas e possıvel verificar se algum trocador de calor da rede desrespeita a restricao detemperatura. Se houver alguma restricao nao satisfeita, a partıcula e penalizada.

v Inıcio do metodo do enxame de partıculasAtualizar as variaveis das partıculas com as Equacoes 1 e 2. Reavaliar a funcao objetivo para os valores atualizadosdas variaveis, verificar as restricoes e verificar qual das partıculas possui o valor otimo atual (passo iii e iv).

vi Repetir o passo v ate o criterio de parada ser satisfeito (numero de iteracoes).

Durante a implementacao do algoritmo e importante notar que todas as restricoes sao sempretestadas. Quando uma restricao nao e satisfeita, a patıcula e penalizada. A penalizacao e feitasomando-se um valor muito alto a funcao objetivo. Desse modo, a partıcula e naturalmentedescartada.

O valor de Qmax e definido como sendo o maior valor do calor que uma corrente corrente deprocesso, quente ou fria, possa trocar.

Nas aplicacoes praticas sao usadas as taxas de sucesso para avaliar o desempenho do algoritmo.O algoritmo e executado 50 vezes e toda as vezes em que o resultado obtido for igual ou melhor quea execucao anterior, contabiliza-se um sucesso.

4.3 Variáveis e função objetivo

Um problema extraıdo de Ahmad (1985) e apresentado para ilustrar os primeiros passos do algoritmoproposto de forma a exemplificar como sao constituıdas as partıculas e como e verificado se a solucaorespeita ou nao as restricoes.

Passo 1: Entrada de dadosDados das correntes quentes e frias, dados de custo de area e utilidades. A Tabela 1 mostra os

dados para o caso de Ahmad (1985).

Tabela 1. Dados das correntes e de custo.

Correntes T in (C) T out (C) CP (kW/C) h (kW/m2C)

H1 300 80 0,30 0,40H2 200 40 0,45 0,40C1 40 180 0,40 0,40C2 140 280 0,60 0,40UQ 400 399 0,40UF 10 11 0,40

Custo de area: 300.A0,5, A em m2.

Custo da utilidade quente: 110 $/kW ano.

Custo da utilidade fria: 12, 2 $/kW ano.

Passo 2: Geracao aleatoria das partıculas iniciaisDois exemplos de partıculas aleatorias sao apresentados na Tabela 2.Passo 3: Calculo da funcao objetivoAs Figuras 2 e 3 apresentam as redes de trocadores de calor calculadas para as partıculas j e l,

respectivamente.Passo 4: Analise das restricoes

Page 129: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

114 Silva et al.

Tabela 2. Exemplos de partıculas iniciais aleatorias.

Partıcula j Partıcula l

Estagio 1 Estagio 2 Estagio 1 Estagio 2

Q1 0,0 Q5 22,40 Q1 0,0 Q5 20,43Q2 33,70 Q6 0,0 Q2 18,16 Q6 0,0Q3 14,10 Q7 0,0 Q3 0,0 Q7 31,27Q4 0,0 Q8 35,30 Q4 22,10 Q8 0,0

FSH1 0,090 FSH1 0,900 FSH1 0,350 FSH1 0,633FSH2 0,707 FSH2 0,324 FSH2 0,129 FSH2 1,000FSC1 0,645 FSC1 0,830 FSC1 1,000 FSC1 0,263FSC2 0,918 FSC2 0,880 FSC2 0,270 FSC2 0,000

j, l ∈ i/i = 1..Npt

FSH e FSC e a fracao de divisao das correntes quente e fria, respectivamente

Figura 2. Rede de trocadores de calor da partıcula j.

A Tabela 3 mostra os melhores valores da funcao objetivo obtida pelas partıculas j e l e o melhorvalor encontrado pelo grupo todo (populacao inicial). A partıcula j foi penalizada, pois nao respeitaas restricoes.

Assim, conforme as partıculas vao sendo modificadas pelo metodo do enxame de partıculas, asredes vao sendo construıdas e seu custo e obtido. A Figura 4 mostra a rede de trocadores de calorobtida para esse exemplo apos o criterio de parada. O valor da funcao objetivo e 7884 $/ano.

5. Aplicações

5.1 Exemplo 01

O primeiro caso estudado foi extraıdo de Zhu (1997) e tambem apresentado em Silva et al. (2010).O problema tem duas correntes quentes, duas correntes frias, uma utilidade quente e uma utilidadesfria. Os dados das correntes e dos custos de area e utilidades sao mostrados na Tabela 4.

Aplicando a metodologia proposta, uma configuracao para a rede otima e obtida, conformeapresentado na Figura 5. O custo da rede de trocadores de calor obtida e 1816470 $/ano. ATabela 5 mostra a comparacao dos resultados com os resultados da literatura. A taxa de sucesso dometodo do enxame de partıculas para esse exemplo foi de 93%.

Page 130: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Método do enxame de partículas aplicado à síntese de redes de trocadores de calor 115

Figura 3. Rede de trocadores de calor da partıcula l.

Tabela 3. Valores para a populacao inicial.

P j1 P l

1 P global1

1010 $/ano 8969 $/ano 8658 $/ano

Figura 4. Rede de trocadores de calor otima.

5.2 Exemplo 02

O segundo exemplo, extraıdo de Beninca (2008), e um caso real de uma planta de Eteno daCompanhia Petroquımica do Sul (Copesul), recentemente adquirida pela Braskem S. A. SegundoBeninca (2008), a tecnologia datada da decada de 70 candidata-a como detentora de oportunidadede integracao energetica.

Page 131: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

116 Silva et al.

Tabela 4. Dados das correntes e dados de custo para o Exemplo 01.

Correntes T in (K) T out (K) CP (kW/K) h (kW/m2K)

H1 423 323 200 0,20H2 443 313 100 0,20C1 323 393 300 0,20C2 353 383 500 0,20UQ 453 453 0,20UF 293 313 0,20

Custo de area: 9094 + 221.A0,81, A em m2.

Custo da utilidade quente: 110 $/kW ano. e Custo da utilidade fria: 10 $/kW ano.

Figura 5. Rede de trocadores de calor otima para o Exemplo 1.

Tabela 5. Comparacao com a literatura para o Exemplo 1.

ZHU (1997) Resultado Atual

Custo Anual Global ($/ano) 1818031 1816470

Custo de Area ($/ano) 1008031 975270Custo de Utilidade ($/ano) 810000 841200

Para a aplicacao da metodologia, considerou-se a planta sem qualquer tipo de integracaoenergetica existente (como se fosse uma planta nova). Os dados de custo das utilidades, custode area e coeficiente global de troca termica usados sao os propostos por Beninca (2008). Este casotambem pode ser visto em Ravagnani et al. (2010).

A planta e composta por dezesseis correntes quentes e dezessete correntes frias, bem como umacorrente de utilidade quente e uma de utilidade fria. A Tabela 6 apresenta os dados das correntes,bem como os dados de custo de utilidades e area.

A configuracao da rede otima e mostrada na Figura 6. A Tabela 7 mostra o calor trocado pelostrocadores de calor. A Tabela 8 apresenta o custo de utilidades e o custo referente aos trocadores decalor. O valor do custo global anual da rede de trocadores de calor e 107 $/ano. A taxa de sucessodo metodo do enxame de partıculas para esse exemplo foi de 25%.

6. Comentários e Conclusão

Diante de tudo que foi exposto, percebe-se que pesquisa envolvendo o assunto de redes de trocadoresde calor e e vem sendo disponibilizada, ha muitos anos, motivados pela possibilidade de economiade energia em plantas de processo, reduzindo os custos de processamento.

Apesar deste nao ser um tema relativamente novo, ele nao esta esgotado. Ainda e grande ointeresse pelo assunto e a quantidade de trabalhos que continuam a ser desenvolvidos propondotecnicas mais eficientes e realistas para se obter resultados melhores so tem aumentado.

Page 132: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Método do enxame de partículas aplicado à síntese de redes de trocadores de calor 117

Tabela 6. Dados das correntes e dados de custo para o Exemplo 2.

Corr T in T out CP h Corr T in T out CP h(C) (C) (kW/C) (kW/m2C) (C) (C) (kW/C) (kW/m2C)

H1 133,4 87,8 2,3 0,80 C1 23,4 68,8 5,9 0,80H2 46,0 33,0 813,9 0,80 C2 18,4 63,0 182,9 0,80H3 162,4 40,0 16,6 0,80 C3 63,0 75,0 149,6 0,80H4 289,7 23,0 10,5 0,80 C4 83,2 116,0 243,2 0,80H5 34,1 14,0 320,5 0,80 C5 123,7 160,9 230,3 0,80H6 70,6 61,8 97,5 0,80 C6 162,4 162,6 190550 0,80H7 111,0 38,0 43,3 0,80 C7 162,4 180,0 97,8 0,80H8 38,0 36,4 80,7 0,80 C8 123,4 123,7 19383,3 0,80H9 54,7 38,0 41,3 0,80 C9 23,1 283,0 10,5 0,80H10 41,1 38,0 20,7 0,80 C10 2,4 12,4 494,9 0,80H11 38,0 10,0 3,2 0,80 C11 12,4 21,2 175,2 0,80H12 58,1 33,0 1,1 0,80 C12 70,0 75,0 1660,4 0,80H13 83,0 64,5 2254,1 0,80 C13 79,7 87,6 1245,2 0,80H14 150,3 120,0 599,0 0,80 C14 102,0 110,0 644,1 0,80H15 193,4 180,0 3695,6 0,80 C15 65,5 75,6 151,0 0,80H16 243,4 90,0 4,0 0,80 C16 73,2 87,2 185,2 0,80UQ 203 203 C17 15,3 45,0 42,5 0,80UF 30 35

Custo de area: 4333.A0,61, A em m2.

Custo da utilidade quente: 288, 2 $/kW ano. e Custo da utilidade fria: 75, 3 $/kW ano.

Tabela 7. Calor trocado pelos trocadores de calor para o Exemplo 02.

Equipamento Q (kW ) Equipamento Q (kW ) Equipamento Q (kW )

1 2739 12 3158 23 292 1538 13 1721 24 1526

%hline 3 964 14 8568 25 51534 4904 15 498 26 19755 104 16 2864 27 58146 270 17 689 28 71827 858 18 1630 A1 8038 90 19 64 A2 69739 1263 20 1796 R1 862710 611 21 129 R2 2547111 38176 22 8302

Tabela 8. Resumo dos resultados para o Exemplo 02.

Custo Anual Global ($/ano) 10753995,5

Custo de Area ($/ano) 5945372,9Custo de Utilidade ($/ano) 4808622,6

Neste capıtulo uma metodologia para obter a sıntese de redes de trocadores de calor foiapresentada. O objetivo principal e encontrar as configuracoes de uma rede de trocadores de calorcom custo mınimo, levando-se em conta os custos de area de troca termica e consumo de utilidades.

Na metodologia proposta nao foi necessario incluir nenhuma simplificacao na geracao dasuperestrutura, nem em qualquer outra etapa do modelo. Para fugir de problemas de nao-linearidades, e muito comum encontrar trabalhos que utilizam aproximacoes e simplificacoes. Ometodo e baseado no modelo de superestrutura similar ao de Yee & Grossmann (1990). Porem,diferentemente dos autores, outra inovacao apresentada e incluir o numero de estagios da rede comouma variavel a ser otimizada. A maior parte, se nao todos, os trabalhos que utilizam esse modelode superestrutura trata o numero de estagios como um parametro fixo, previamente determinado.

O problema de otimizacao e resolvido usando o algoritmo do metodo do enxame de partıculas.

Page 133: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

118 Silva et al.

Um exemplo da literatura e um caso real de grande dimensao foram usados para demonstrara aplicabilidade da metodologia. Os resultados para o problema da literatura mostraram que osvalores obtidos para a funcao objetivo usando o algoritmo proposto sao melhores que os resultadosapresentados na literatura. Nao foi possıvel fazer comparacao para nenhum caso de grande porte,por nao ter sido encontrado nenhum exemplo na literatura resolvido pelo modelo de superestruturas,o que indica mais uma limitacao para os metodos ja desenvolvidos. Entretanto, um caso real foiutilizado para mostrar a capacidade do metodo.

Analisando os resultados obtidos, nota-se que o modelo para sıntese de redes de trocadores decalor com pequeno numero de correntes possuem um desempenho muito satisfatorio. Os resultadossao obtidos com uma taxa de sucesso alta.

Conforme a dimensao do problema aumenta, a porcentagem de sucesso tende a diminuir,entretanto deve-se levar em conta o fato de ter sido possıvel obter um resultado ate mesmo em umproblema considerado de grande dimensao. Em muitos casos, os metodos de otimizacao comumenteutilizados na literatura nao permitem sequer obter um resultado.

Figura 6. Rede de trocadores de calor otima para o Exemplo 02.

Page 134: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Método do enxame de partículas aplicado à síntese de redes de trocadores de calor 119

A medida em que o numero de restricoes aumenta, o desempenho computacional diminuisignificativamente. E importante ressaltar que a performance aqui mencionada nao significa tempopara a convergencia e sim dificuldades na convergencia, ou seja, a obtencao de uma regiao viavel ebastante difıcil. Isso e observado pela baixa taxa de sucesso conseguida na sıntese de redes para oproblema de grande porte, comparada com o problema da sıntese de redes de trocadores de calor depequeno porte.

ReferênciasAhmad, S., Heat Exchanger Networks: Cost Tradeoffs in Energy and Capital. PhD thesis, Faculty of Technology,

University of Manchester Institute of Science and Technology, Manchester, USA, 1985.

Alwi, S.R.W. & Manan, Z.A., Step: A new graphical tool for simultaneous targeting and design of a heat exchangernetwork. Chemical Engineering Journal, 62:106–121, 2010.

Beninca, M., Integracao Energetica de uma Planta de Eteno com Aspectos de Flexibilidade: Aplicacao da Analise Pinchem Conjunto com a Otimizacao Matematica. Dissertacao de mestrado, Universidade Federal do Rio Grande doSul, Porto Alegre, RS, Brasil, 2008.

Bogataj, M. & Kravanja, Z., An alternative strategy for global optimization of heat exchanger networks. AppliedThermal Engineering, 43:75–90, 2012.

Castier, M., Rigorous multiple utility targeting in heat exchanger networks. Energy Conversion and Management,59:74–85, 2012.

Floudas, C.A., Nonlinear and Mixed-Integer Optimization: Fundamentals and Applications. Oxford University Press,1995.

Floudas, C.A. & Ciric, A.R., Strategies for overcoming uncertainties in heat exchanger network synthesis. Computersand Chemical Engineering, 13(10):1133–1152, 1989.

Hohmann, E.C., Optimum Networks of Heat Exchange. PhD thesis, University of Southern California, 1971.

Kennedy, J. & Eberhart, R., Particle swarm optimization. In: Proceedings of the IEEE International Conference onNeural Networks. Perth, Australia, p. 1942–1948, 1995.

Lakshmanan, R. & Fraga, E.S., Pinch location and minimum temperature approach for discontinuous composite curves.Computers and Chemical Engineering, 26:779–783, 2002.

Lewin, D.R.; Wang, H. & Shalev, O., A generalized method for hen synthesis using stochastic optimization: I. generalframework and mer optimal synthesisw. Computers and Chemical Engineering, 22:1503–1513, 1998.

Linnhoff, B., Pinch analysis: A state-of-art overview. Transactions of the IChemE, 71, 1993.

Linnhoff, B. & Flower, J.R., Synthesis of heat exchanger networks, part i. systematic generation of energy optimalnetworks. AIChE Journal, 24(633), 1978.

Linnhoff, B. & Hindmarsh, E., The pinch design method for heat exchanger networks. Computers and ChemicalEngineering, 38(5):745–763, 1983.

Mizutani, F.T.; Pessoa, F.L.P.; Queiroz, E.M.; Hauan, S. & Grossmann, I.E., Mathematical programming modelfor heat exchanger network synthesis including detailed heat exchanger designs. 1. shell-and-tube heat exchangerdesign. In Eng Chem Res, 42:4009–4018, 2003.

Nielsen, J.S.; Hansen, M.W. & Joergensen, S., Heat exchanger network modeling framework for optimal design andretrofiting. Computers and Chemical Engineering, 20:S249–S254, 1996.

Ravagnani, M.A.S.S., Projeto e Otimizacao de Redes de Trocadores de Calor. Tese de d.sc., Faculdade de EngenhariaQuımica, UNICAMP, Campinas, SP, Brasil, 1994.

Ravagnani, M.A.S.S. & Caballero, J., Redes de Trocadores de Calor. Universidade Estadual de Maringa: EDUEM,2012.

Ravagnani, M.A.S.S. & Silva, A.P., Retrofit of heat exchanger networks including the detailed equipment design.Computer Aided Chemical Engineering, 31:235–239, 2012.

Ravagnani, M.A.S.S.; Silva, A.P.; Arroyo, P.A. & et al., , Heat exchanger network synthesis and optimization usinggenetic algorithm. Applied Thermal Engineering, 25:1003–1017, 2005.

Ravagnani, M.A.S.S.; Silva, A.P.; Biscaia Jr., E.C. & Caballero, J.A., An optimisation method for the synthesis ofheat exchanger networks. Hydrocarbon World, 5(1):70–72, 2010.

Salama, A.I.A., Numerical construction of hen composite curves and their attributes. Computers and ChemicalEngineering, 33:181–190, 2009.

Sieniutycz, S. & Jezowski, J., Heat exchanger network synthesis. Energy Optimization in Process Systems and FuelCells, Second Edition:585–620, 2013.

Silva, A.P.; Jr., E.C.B. & Ravagnani, M.A.S.S., Heuristic optimization of heat exchangers networks. In: Proceedingsof the 4th Mercosur Congress on Process Systems Engineering. Rio de Janeiro, Brasil, p. 01–10, 2005.

Silva, A.P.; Ravagnani, M.A.S.S. & Biscaia Jr., E.C., Particle swarm optimisation in heat exchanger network synthesisincluding detailed equipment design. Computer Aided Chemical Engineering, 25:713–718, 2008.

Page 135: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

120 Silva et al.

Silva, A.P.; Ravagnani, M.A.S.S.; Biscaia Jr., E.C. & Caballero, J.A., Optimal heat exchanger network synthesis usingparticle swarm optimization. Optimization and Engineeringg, 11:459–470, 2010.

Tjoe, T.N. & Linnhoff, B., Using pinch technology for process retrofit. Chemical Engineering, 93:47–60, 1986.

Vieira, R.C. & Biscaia Jr., E.C., Metodos Heurısticos de Otimizacao. Disponıvel sob consulta: [email protected]. PEQ/COPPE/UFRJ: Escola Piloto Virtual, 2002.

Yee, T.F. & Grossmann, I.E., Simultaneous optimization models for heat integration: Heat exchanger networksynthesis. Computers and Chemical Engineering, 14(10):1165–1184, 1990.

Yu, H.; Fang, H.; Yao, P. & Yuan, Y., A combined genetic algorithm/ simulated annealing algorithm for large scalesystem energy integration. Computers and Chemical Engineering, 24:2023–2035, 2000.

Zamora, J.M. & Grossmann, I.E., A global minlp optimization algorithm for the synthesis of heat exchanger networkswith no stream splits. Computers and Chemical Engineering, 20(3):367–384, 1998.

Zhu, X., Automated design method for heat exchanger network synthesis using block decomposition and heuristicrules. Computers and Chemical Engineering, 21:1095–1104, 1997.

Page 136: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Capítulo 10

Projeto de Robôs Manipuladores 3R OrtogonaisUsando Técnicas de Otimização Heurísticas

Paulo Roberto Bergamaschi e Romes Antonio Borges∗

Resumo: Na engenharia moderna, o estudo dos mecanismos roboticos e de grande importancia devido asua aplicabilidade em industrias. A utilizacao de robos manipuladores vem substituindo gradativamentea mao-de-obra humana na realizacao de tarefas repetitivas, complexas e, muitas vezes, perigosa para ooperador. Neste sentido, o conhecimento do espaco de trabalho dos robos se faz necessario para o calculodo volume de trabalho, sendo fundamental por causa do impacto sobre o projeto do manipulador e oseu posicionamento no ambiente de trabalho. Neste contexto, o presente trabalho tem por objetivo adeterminacao dos parametros otimos de um manipulador robotico 3R que correspondem a um volume detrabalho especificado utilizando tecnicas de otimizacao heurısticas.

Palavras-chave: Projeto otimo, Robos manipuladores, Tecnicas de otimizacao heurısticas.

Abstract: The study of robotic mechanisms is very important in modern engineering due to its applicabilityin several industries. Human work is being gradually replaced by the use of robot manipulators in industryto perform repetitive and often dangerous tasks for the operator. The behavioral study and analysis ofmechanical systems is very important, especially for the construction of suitable models to represent thereality of the physical system. In this sense, knowledge of the workspace of the robot is needed for calculatingthe volume of work being essential due to the impact over the project of the manipulator and its positioningin the working environment. This work seeks to develop a study of a 3R robotic arm manipulator based onthe formulation of an optimization problem using heuristic optimization techniques to identify the optimalvalues of the parameters that lead to the expected volume workspace.

Keywords: Optimal design, Robotic manipulator, Heuristic optimization techniques.

Conteúdo

1 Introducao ................................................................................................................................1222 Robos Manipuladores 3R e Espaco de Trabalho ......................................................................123

2.1 Modelagem geometrica de robos manipuladores utilizando o metodo de Denavit-Hartenberg .......................................................................................................................124

2.2 Espaco de trabalho de manipuladores 3R........................................................................1253 Tecnicas de Otimizacao Heurısticas .........................................................................................127

3.1 Algoritmos geneticos ........................................................................................................1273.2 Recozimento simulado......................................................................................................1293.3 Colonia de vagalumes.......................................................................................................130

4 Projeto Otimo para o Manipulador Robotico 3R.....................................................................1315 Conclusoes................................................................................................................................131

∗Autor para contato: [email protected]

Lobato et al. (Ed.), (2014) DOI: 10.7436/2014.tica.10 ISBN 978-85-64619-15-9

Page 137: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

122 Bergamaschi & Borges

1. Introdução

O desenvolvimento tecnologico observado nos dias atuais motivou a criacao de maquinas queefetuassem tarefas antes realizadas somente pelo homem. Apos a Revolucao Industrial, as industriasiniciaram a construcao de ins- trumentos que fossem capazes de realizar tarefas especıficas,culminando com a criacao dos robos.

O interesse das industrias em buscar novas tecnologias visando melhorar a sua produtividade ea qualidade de seus produtos aumenta ano apos ano, tornando evidente que se trata de uma eraespecial, a da informatizacao e da robotica. Para o estudo da robotica sao necessarios conhecimentosinterdisciplinares, envolvendo diversas areas, tais como controle, otimizacao, matematica, inteligenciaartificial, programacao de sistemas, cinematica, dinamica, computacao grafica, dentre outras. Estasareas se interligam fazendo da robotica uma area de pesquisa cientıfica multidisciplinar.

Segundo Oliveira (2012), robos sao maquinas controladas por computadores e programadas paramover, manipular objetos e efetuar trabalhos enquanto interagem com o ambiente a sua volta. Emum robo manipulador, o efetuador (ou orgao terminal), objeto responsavel pela execucao da tarefafinal de aplicacao do robo, e precedido por um conjunto de segmentos (elementos ou corpos), querealizam seus movimentos por meio de servo-motores (atuadores - responsaveis pela movimentacaode um elemento em relacao ao outro). As conexoes entre os elementos sao chamadas de juntas (ouarticulacoes) (Tsai, 1999).

Uma das principais caracterısticas de um robo manipulador e o seu espaco de trabalho, definidopelo conjunto dos pontos atingıveis pelo efetu- ador. Neste sentido, diversos trabalhos tem sidodesenvolvidos para a sua analise. Ceccarelli & Lanni (1999) estudaram o projeto de manipuladorescomo um problema de otimizacao que leva em consideracao as caracterısticas do espaco de trabalho.Este mesmo problema foi investigado e solucionado por Lanni et al. (2002) aplicando duas diferentestecnicas numericas, a primeira fazendo uso da programacao quadratica sequencial (SQP) e a segundautilizando a tecnica conhecida como Recozimento Simulado (RS) (Simulated Annealing). Umaformulacao para o espaco de trabalho usada para o projeto de manipuladores foi apresentadapor Ceccarelli & Lanni (2004), na qual considera-se dois objetivos, a maximizacao do volume ea minimizacao das dimensoes do manipulador.

Bergamaschi et al. (2006) obtiveram a formulacao algebrica para a ca- racterizacao da fronteira doespaco de trabalho de robos manipuladores 3R considerando a existencia de vazios e singularidadesno espaco de trabalho. Tal formulacao foi utilizada no desenvolvimento do projeto otimo daestrutura considerando como objetivo a maximizacao do volume de trabalho. Ja Oliveira et al.(2007) propuseram uma metodologia hıbrida para a maximizacao do volume do espaco de trabalhode manipuladores 3R quaisquer. Nesta metodologia, inicialmente aplicava-se metodos sequenciais ea seguir o Algoritmo de Evolucao Diferencial (ED), obrigando o espaco de trabalho a ocupar o maiorconjunto de pontos dentro de uma regiao pre-estabelecida, isto e, um cilindro cujo eixo coincidiacom o eixo de rotacao do espaco de trabalho. Bergamaschi et al. (2008) formularam um problemade otimizacao em que o volume de trabalho de manipuladores 3R e a funcao objetivo. Todavia,neste trabalho, penalidades foram impostas para minimizar os vazios e controlar a area total dasecao radial plana do espaco de trabalho, forcando-a a ocupar uma regiao pre-estabelecida. Para aresolucao do problema de projeto foram empregados diferentes metodos, a saber, SQP, AlgoritmosGeneticos (AG), ED e Otimizacao por Enxame de Partıculas. Mais recentemente, Oliveira (2012)propos a formulacao de um problema multi-objetivo cuja finalidade foi maximizar o espaco detrabalho de robos manipuladores 3R, maximizar a rigidez do sistema de juntas e otimizar a destrezado manipulador sem a imposicao de restricoes. Alem disso, o problema de otimizacao sujeito apenalidades que controlam a topologia, tornando possıvel a obtencao de solucoes que obedecam astopologias pre-estabelecidas foi analisado.

Com o exposto, fica evidente a aplicabilidade de tecnicas de otimizacao visando melhorar oprojeto de robos. Tal ferramenta e de grande importancia na engenharia moderna, pois com ocontınuo avanco da tecnologia e o aumento da capacidade dos computadores digitais, cresce autilizacao das mais variadas tecnicas de otimizacao para a construcao de projetos cada vez maisrobustos, associados a tendencia de se optar por estruturas cada vez mais refinadas a fim de sediminuir as tolerancias de projeto. Segundo Vanderplaats (1999) pode-se entender otimizacao comosendo o processo de ajuste de caracterısticas de um dado projeto, visando encontrar valo- res querepresentem convenientemente seu desempenho. Varias tecnicas de otimizacao tem sido empregadasvisando melhorar diversos tipos de projetos de engenharias e areas afins. O conjunto de tecnicas deotimizacao e, basicamente, formado por tecnicas fundamentadas pelo calculo diferencial e tecnicasde computacao inspiradas em fenomenos que ocorrem na natureza. As primeiras sao denominadasde tecnicas classicas (determinısticas) de otimizacao que, na sua maioria, fazem uso do calculo do

Page 138: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Projeto de robôs manipuladores 3R ortogonais 123

gradiente para orientar o processo iterativo, sendo altamente dependente de uma “boa” estimativainicial para comecar a busca. Ja a segunda classe de metodos e baseada em conceitos inspirados nanatureza, denominadas de tecnicas heurısticas ou evolutivas.

Diante do que foi apresentado, o presente trabalho tem por objetivo o projeto de um manipulador3R ortogonal, isto e, cuja estrutura apresenta angulos retos entre os eixos de suas juntas, atraves daidentificacao de valores dos parametros de projeto via conhecimento do volume de trabalho usandoTecnicas de Otimizacao Heurısticas, a saber, AG, RS, e o Algoritmo de Colonia de Vagalumes (ACV).Este Capıtulo esta estruturado como segue. As Secoes 2 e 3 apresentam aspectos gerais sobre robosmanipuladores e Tecnicas de Otimizacao Heurısticas, respectivamente. Ja a Secao 4 apresenta aformulacao do problema de projeto, bem como os resultados obtidos. Finalmente, as conclusoes saoapresentados na Secao 5.

2. Robôs Manipuladores 3R e Espaço de Trabalho

Denominam-se robos manipuladores seriais aqueles que controlam o movimento do efetuador atravesde uma cadeia cinematica, desde a base ate a extremidade livre onde se localiza o efetuador. Assimsendo, suas estruturas tem a forma de uma cadeia aberta. Ja os manipuladores paralelos sao osque controlam o movimento do efetuador por intermedio de duas ou mais cadeias cinematicas, cujasestruturas cinematicas tem a forma de uma cadeia fechada. Os ditos hıbridos sao compostos pelosdois tipos de cadeias (Bergamaschi, 2004; Oliveira, 2012). O tipo das juntas e um dos fatores quecontribuem para o aspecto do espaco de trabalho de robos manipuladores, sendo as mais empregadasa prismatica (deslizante) e a de revolucao (rotacional). Nas juntas prismaticas, Figura 1(a), omovimento e linear, enquanto que nas rotacionais, Figura 1.(b), o movimento e angular (Bergamaschi,2004). Outros tipos de juntas podem ser encontradas em Tsai (1999).

Figura 1. Junta prismatica (a) e Junta rotacional (b).

Na literatura podem ser encontradas diferentes estruturas para um manipulador robotico. Estasdependem do tipo e da ordem das juntas cine- maticas empregadas nas conexoes entre os segmentosconstituintes de sua estrutura (Megahed, 1993). Considerando que P representa a junta prismaticae R a rotacional, podem-se citar alguns tipos, tais como: robos cartesianos (PPP), robos cilındricos(PRP, RPR, RPP, PRR); robos esfericos (RRP) e robos de revolucao (RRR ou 3R).

Um esquema cinematico dos robos manipuladores 3R, os quais possuem tres juntas rotacionais,pode ser observado na Figura 2 (Bergamaschi, 2004). Acoplado a terceira junta encontra-se oefetuador, que pode ser uma pistola de solda, de pintura ou uma ferramenta qualquer. Conformedescrito anteriormente, um manipulador 3R e dito ortogonal quando os eixos de suas juntas saoortogonais entre si, o que significa que os angulos αi sao angulos retos.

Figura 2. Esquema cinematico de um robo manipulador 3R e seus parametros cinematicos.

A capacidade de um robo desenvolver uma determinada tarefa depende da sua arquitetura eda dimensao de seus membros, assim como da posicao por ele assumida no ambiente de trabalho.

Page 139: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

124 Bergamaschi & Borges

Estas caracterısticas devem ser consideradas no projeto dos manipuladores roboticos, ou melhor,na definicao de sua geometria. No caso de manipuladores com juntas puramente rotacionais, osparametros de projeto sao a1, a2, a3, d2, d3, α1 e α2 (representados na Figura 2 (Bergamaschi,2004)); os termos θ1, θ2 e θ3 representam as variaveis cinematicas. Note que os parametros a1, a2,a3, d2, d3 sao os responsaveis pela dimensao do manipulador.

O calculo exato do espaco de trabalho e muito importante, pois influi no projeto dimensional, noposicionamento do manipulador no ambiente de trabalho e na sua destreza para executar tarefas.Neste estudo, a determinacao do volume do espaco de trabalho necessita do conhecimento da areade sua secao transversal em um plano radial, a qual e obtida por aproximacao atraves de suadiscretizacao em uma malha retangular.

2.1 Modelagem geométrica de robôs manipuladores utilizando o método de Denavit-Hartenberg

Um dos metodos mais usados para descrever geometricamente um robo e aquele que utiliza arepresentacao de Denavit e Hartenberg (Saramago & Steffen, 1999), cujo esquema e exibido naFigura 3 (Bergamaschi, 2004). Basicamente, esta tecnica consiste em construir a matriz detransformacao homogenea, T i

i−1, que representa o sistema XiYiZi, de origem Oi e associado aoi-esimo membro do robo, em relacao ao sistema Xi−1Yi−1Zi−1, de origem Oi−1 e associado ao (i-1)-esimo membro, para cada i variando de 1 a n, sendo n o grau de liberdade do robo.

Atraves da Figura 3 observa-se que a representacao do sistema XiYiZi em relacao ao sistemaXi−1Yi−1Zi−1 percorre quatro etapas bem definidas, representadas pelos quatro parametros αi−1,ai−1, di e θi, que sao conhecidos por parametros de Denavit-Hartenberg. Consequentemente, amatriz de transformacao homogenea T i

i−1 depende da maneira como essas etapas sao percorridas.Neste trabalho, a matriz de transformacao homogenea generica e dada por:

T ii−1 = Rot(αi−1, Xi−1)Trans(ai−1, 0, 0)Trans(0, 0, di)Rot(θi, Zi)

=

Cθi −Sθi 0 ai−1

SθiCαi−1 CθiCαi−1 Sαi−1 diSαi−1

−SθiSαi−1 −CθiSαi−1 Cαi−1 diCαi−1

0 0 0 1

(1)

sendo que Rot(αi−1, Xi−1) significa uma rotacao horaria de um angulo αi−1 em torno do eixo Xi−1,

Figura 3. Representacao de Denavit e Hartenberg para robos manipuladores.

Trans(ai−1, 0, 0) uma translacao de ai−1 unidades sobre o eixo Xi−1, Trans(0, 0, di) uma translacaode di unidades sobre o eixo Zi e Rot(θi, Zi) uma rotacao anti-horaria de um angulo θi em torno doeixo Zi, a0=α0=0, d1=0, Sθi=sen(θi), Cθi=cos(θi), para i=1, 2, 3; Sαj=sen(αj) e Cαj=cos(αj),para j= 1, 2.

A matriz de transformacao homogenea que representa as coordenadas do efetuador em relacao abase, Tn

0 , pode ser obtida atraves da seguinte expressao (Saramago & Steffen, 1999):

Tn0 = T 1

0 · T 21 · T 3

2 · . . . · Tnn−1 (2)

Seja H um ponto escolhido como o centro do efetuador e, portanto, um ponto no sistema X3Y3Z3.Assim, ele sera denotado por H3 e representado por:

H3 = [ a3 0 0 1 ]T

(3)

Page 140: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Projeto de robôs manipuladores 3R ortogonais 125

sendo que T indica o transposto do vetor. Utilizando a Equacao 2, a repre- sentacao vetorial de H3

em relacao a base, denotada por H0, e obtida da seguinte forma:

H0 = T 10 T

21 T

32H3 (4)

Expandindo a Equacao 4 pode-se obter

H2 =

Hx2

Hy2

Hz2

1

= T 32H3 =

a3Cθ3 + a2

a3Sθ3Cα2 + d3Sα2

−a3Sθ3Sα2 + d3Cα2

1

(5)

H1 =

Hx1

Hy1

Hz1

1

= T 21H2 =

Hx2Cθ2 −Hy

2Sθ2 + a1

Hx2Sθ2Cα2 +Hy

2Cθ1Cα1 +Hz2Sα1 + d2Sα1

−Hx2Sθ2Sα1 −Hy

2Cθ2Sα1 +Hz2Cα1 + d2Cα1

1

(6)

e, por fim

H0 = T 10H1 =

Hx1Cθ1 −Hy

1Sθ1

Hx1Sθ1 +Hy

1Cθ1

Hz1

1

(7)

2.2 Espaço de trabalho de manipuladores 3R

O espaco de trabalho de um ponto H situado na extremidade do robo manipulador e o conjunto detodos os pontos que H ocupa quando as variaveis de junta percorrem os seus domınios de definicao(Gupta & Roth, 1982). Ele pode apresentar vazios que sao regioes dentro do espaco de trabalhoque nao sao atingıveis pelo efetuador. A Figura 4(a) exibe o espaco de trabalho seccionado de umparticular manipulador 3R (Bergamaschi, 2004).

Figura 4. Espaco de trabalho de um particular robo 3R (a) e Secao radial plana (b).

Um procedimento para investigar o espaco de trabalho e variar os angulos θ1, θ2 e θ3 sobre seusdomınios de definicao e estimar as coordenadas do ponto H com relacao a base do manipulador.Desta maneira, obtem-se a posicao do orgao terminal, tendo como resultado a representacao vetorialdada por H0 na Equacao 7.

Como pode ser visto na Figura 4(a), o espaco de trabalho de um manipu- lador 3R e um solidode revolucao, tendo Z1 como o seu eixo de revolucao. Desta forma, e natural imaginar que o espacode trabalho e o resultado da rotacao, em torno do eixo Z1, de uma secao radial plana que funcionecomo uma secao geratriz. A Figura 4(b) esboca a secao radial relativa ao espaco de trabalho exibidona Figura 4(a).

Desta forma, o espaco de trabalho de robos com estrutura 3R pode ser obtido por intermedioda extensao radial r e da extensao axial z com relacao a base (Ceccarelli, 1996; Ceccarelli & Lanni,1999). Para esta representacao, r e a distancia de um ponto generico do espaco de trabalho ao eixoZ1 e z e a distancia desse mesmo ponto ao plano X1Y1 (Figura 4(b)). Assim, usando a Equacao 7,as equacoes parametricas (de parametros θ2 e θ3) do lugar geometrico descrito pelo ponto H sobreum plano radial sao:

r2 = (Hx1 )2 + (Hy

1 )2

z = Hz1

(8)

Ao variar os parametros θ2 e θ3 em intervalos de tamanho 2π gera-se uma famılia de curvas quepreenche a regiao dada pela secao radial plana, como exibido na Figura 5 (Bergamaschi, 2004).

Page 141: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

126 Bergamaschi & Borges

Figura 5. Famılia de curvas que compoem a secao radial plana do espaco de trabalho de um particularmanipulador 3R.

Por se tratar de um solido de revolucao, o volume de trabalho (V ) pode ser avaliado usandoo Teorema de Pappus-Guldin (Beer & Johnston, 1994), em acordo com o esquema mostrado naFigura 6 (Bergamaschi, 2004), atraves da equacao:

V = 2πrgA (9)

sendo A e rg, respectivamente, a area e o baricentro da secao radial plana que e coberta pela famıliade curvas.

Figura 6. Esquema para o calculo do volume de trabalho de manipuladores 3R.

O calculo da area da secao radial e realizado a partir da discretizacao da area em uma malharetangular, conforme proposto por Oliveira et al. (2007). Inicialmente, deve-se obter os valoresextremos dos vetores r e z:

rmin = min rrmax = max rzmin = min zzmax = max z

(10)

Adotando-se nr e nz como a quantidade de sub-intervalos desejados para a discretizacao ao longode r e z, respectivamente, pode-se calcular as dimensoes das areas elementares da malha a partirdas seguintes expressoes:

∆r =rmax − rmin

nr

∆z =zmax − zmin

nz

(11)

A Equacao 8 permite calcular todos os pontos da famılia de curvas que compoem a secao radial doespaco de trabalho. Dado um determinado ponto (r, z), determina-se sua posicao dentro da malha

Page 142: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Projeto de robôs manipuladores 3R ortogonais 127

de discretizacao, conforme visto na Figura 7 (Oliveira et al., 2007), atraves do seguinte controle deındices:

i = int

(r − rmin

∆r

)+ 1

j = int

(z − zmin

∆z

)+ 1

(12)

sendo que int(w) e a funcao maior inteiro, ou seja, que assume o maior inteiro menor ou igual a w.

Figura 7. Discretizacao da secao radial usando malha retangular.

Conforme mostrado no esquema da Figura 7, o ponto da malha que pertence ao espaco de trabalho(ET) sera identificado como Pij=1, do contrario tera valor nulo, conforme a equacao a seguir:

Pij =

0 se Pij /∈ ET (H)1 se Pij ∈ ET (H)

(13)

Desta forma, a area total sera obtida pela soma de todas as areas ele- mentares da malha queestao contidas, totalmente ou parcialmente, na secao radial. Na Equacao 14, observa-se que apenasos pontos pertencentes a secao radial plana contribuem para o calculo da area. Ja a coordenada dobaricentro, conforme a Equacao 15, e calculada considerando a soma dos baricentros de cada areaelementar, dividida pela area total da secao radial plana

A =

imax∑i=1

jmax∑j=1

(Pij∆r∆z) (14)

rg =

imax∑i=1

jmax∑j=1

(Pij∆r∆z)((i− 1)∆r + ∆r

2 + rmin

)A

(15)

Finalmente, conhecendo-se os valores da area e do baricentro da secao radial, pode-se calcular ovolume do espaco de trabalho do manipulador usando a Equacao 9.

3. Técnicas de Otimização Heurísticas

3.1 Algoritmos genéticos

A area de Computacao Natural, tambem conhecida como Evolutiva consiste em uma linhade pesquisa e desenvolvimento de tecnicas computacionais essencialmente fundamentadas emconceitos baseados em processos que ocorrem na natureza (Borges et al., 2013). As tecnicas deotimizacao naturais reproduzem de modo artificial os principais componentes dos sistemas evolutivos:populacoes de indivıduos, aptidao, a nocao de mudancas dinamicas nas populacoes devido aonascimento e morte dos indivıduos e conceitos de variabilidade e hereditariedade, admitindo que os

Page 143: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

128 Bergamaschi & Borges

principais fatores evolucionistas sao: a mutacao, a recombinacao genica e a selecao natural (Holland,1975).

Dentre as inumeras estrategias ja propostas para a resolucao de proble- mas de otimizacaorestritas ou irrestritas, os AG (Holland, 1975) foram os primeiros a serem utilizados para esssafinalidade. Basicamente esta metodologia esta fundamentada nos seguintes aspectos (Holland, 1975):i) trabalham com uma codificacao do conjunto de parametros, ii) trabalham com uma populacaoe nao com um unico ponto, como acontece com os metodos baseados em gradiente, iii) nao fazemuso de informacoes do gradiente da funcao objetivo e restricoes para a atualizacao da populacaoe iv) utilizam regras de transicao probabilısticas. Segundo Borges (2003), como princial vantagempode-se citar a capacidade de escapar de otimos locais, o que a caracteriza como um metodo de buscaglobal. Por outro lado, como principal desvantagem pode-se citar o elevado numero de avaliacoes dafuncao objetivo requerida para a resolucao do problema e da dificuldade no tratamento de restricoes(Borges, 2003).

Os AG contemplam a formalizacao matematica e a explicacao dos processos de adaptacao emsistemas naturais, iniciando o desenvolvimento de sistemas artificiais, simulados em computador,conservando os mecanismos originais encontrados nos sistemas naturais, onde a variabilidade entreindivıduos de uma populacao de organismos que se reproduzem sexualmente e produzida pelamutacao ou pela recombinacao genetica (Holland, 1975). A seguir sao apresentados, de formaresumida, os principais aspectos dos AG.

Os AG podem ser codificados usando parametros contınuos ou parame- tros discretos (binarios).Em ambas vertentes as modelagens para a recombinacao genetica e de selecao natural seguem omesmo padrao. Neste contexto, sera exposto uma breve introducao a esta tecnica tendo como basea codificacao binaria.

Seguindo o que diz a evolucao biologica, os AG inicializam-se com uma populacao inicialconstituıda por indivıduos gerados aleatoriamente dentro do espaco de projeto definido pelo usuario.Nesta populacao inicial, as caracterısticas dos melhores indivıduos sao codificadas numa sequencia denumeros binarios. Nesta populacao, dois candidatos sao selecionados aleatoriamente para gerar doisnovos descendentes (candidatos a solucao do problema de otimizacao). A nova sequencia binariados descendentes contem porcoes das sequencias dos dois indivıduos anteriormente selecionados.Estes novos indivıduos substituem os que nao foram selecionados e, por isso, descartados. Novosdescendentes sao gerados ate que se tenha uma popu- lacao com o tamanho da inicial, definida pelousuario. O processo itera- tivo garante que, a cada iteracao, os melhores indivıduos com as melhorescaracterısticas sejam selecionados.

Como qualquer algoritmo de otimizacao, os AG sao estruturados numa sequencia de passos,inicializando pelas definicoes da funcao objetivo, sendo finalizado no instante em que o criteriode parada adotado for satisfeito. Tradicionalmente podem ser empregados os seguintes criteriospara finalizar o algoritmo: i) valor da funcao objetivo, ii) numero maximo de avaliacoes da funcaoobjetivo, iii) numero maximo de geracoes permitidas e iv) tempo de processamento.

Os AG partem da criacao de uma populacao inicial a partir da definicao do tamanho da populacao.Uma populacao inicial suficientemente grande aumenta o custo computacional, porem eleva o nıvelde desempenho do metodo, fornecendo uma cobertura mais ampla do espaco de busca, isto e,assegurando uma nao convergencia prematura do algoritmo. Durante a aplicacao dos operadoresde mutacao e cruzamento, responsaveis pela geracao de novas populacoes de candidatos, os melhorescromossomos sao selecionados para produzir novos “descendentes” que substituirao os que seraodescartados. Alem disso, especificamente no operador de cruzamento, o algoritmo explora o espacode projeto usando as combinacoes dos bits presentes nos cromossomos que constituem a populacaoinicial. A forma mais comum de cruzamento envolve dois cromossomos que produzirao dois novosdescendentes como mostrado na Tabela 1.

Tabela 1. Emparelhamento e cruzamento no processo do ponto unico do cruzamento.

Cromossomo Famılia Codigo binario

1 selecionado1 00100110011101

2 selecionado2 01010110000100

3 descendente1 00100110011100

4 descendente2 01010110000101

Page 144: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Projeto de robôs manipuladores 3R ortogonais 129

Alem do cruzamento, uma populacao pode ser modificada a partir da mutacao. O operadorde mutacao consiste na segunda forma de exploracao do espaco de projeto feita pelo algoritmo.Aleatoriamente, uma pequena porcentagem dos bits da lista de cromossomos e alterada introduzindo-se caracterısticas que nao dependem da populacao original e tentam impedir a convergenciaprematura do algoritmo para mınimos locais. Assim, este operador e responsavel por introduzire manter a diversidade genetica da populacao, alterando arbitrariamente um ou mais componentesde uma estrutura escolhida, como ilustrado na Tabela 2.

Tabela 2. Exemplo da aplicacao do operador de mutacao.

Antes da Mutacao 1111010100011Depois da Mutacao 1111010110011

Desta forma, tal mecanismo assegura que a probabilidade de se chegar a qualquer ponto do espacode busca nunca sera zero, permitindo com essa pequena alteracao que mınimos locais possam serevitados (Holland, 1975).

O numero de geracoes depende do alcance da solucao desejavel ou do numero maximo pretendidopelo projetista, ou seja, apos certo tempo, se todos os cromossomos e seus respectivos custostornarem-se os mesmos, deve se interromper o algoritmo. Mais detalhes sobre os AG podem serencontrados no trabalho de Borges (2003).

O fluxograma apresentado na Figura 8 ilustra o esquema de implementacao da tecnica.

Figura 8. Fluxograma para os AG binarios.

3.2 Recozimento simulado

O recozimento (annealing) e o tratamento termico aplicado aos metais para a obtencao de estadosde baixa energia em sua estrutura interna. De forma geral, esse procedimento consiste emaumentar a temperatura do metal ate a fusao, forcando os atomos a vibrarem violentamente.Se resfriado repentinamente, a microestrutura se organiza em um estado randomico instavel.Entretanto, se resfriado lentamente, os atomos tendem a entrar em padroes relativamente estaveispara as respectivas temperaturas. Metropolis et al. (1953) introduziram um metodo numerico pararepresentar o estado de um conjunto de atomos em equilıbrio a uma temperatura, baseiando-se noprocesso de recozimento utilizado na metalurgia.

Do ponto de vista da otimizacao, o RS tem por objetivo encontrar novos pontos dentro doespaco de projeto atraves da aplicacao de operadores estatısticos para a obtencao de novos pontosque orientam a busca dos valores otimos dentro deste espaco. Neste sentido, a tecnica executauma perturbacao aleatoria que modifica as variaveis independentes, armazenando o melhor valor dafuncao objetivo em cada iteracao. Apos algumas itera- coes, o conjunto que produz o melhor valorem termos da funcao objetivo e tomado como sendo o centro sobre o qual a perturbacao acontecerana proxima reducao de temperatura.

A fim de escapar do provaveis otimos locais, o algoritmo reinicia a busca partindo de variassolucoes iniciais diferentes, utilizando a melhor solucao encontrada como solucao do algoritmo. Estaestrategia aumenta a independencia a solucao inicial, mas acrescenta uma dificuldade quanto adecidir quando interromper o algoritmo, sendo necessario o estabelecimento de adequados criteriosde convergencia.

No algoritmo de RS, a escolha das temperaturas e de essencial importancia, uma vez que todasas iteracoes sao executadas segundo estas temperatu- ras e, completadas estas iteracoes para umadada temperatura, os melhores valores as variaveis de projeto definirao o centro das iteracoes para

Page 145: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

130 Bergamaschi & Borges

a proxi- ma temperatura. Considerando-se a evolucao da temperatura inicial para a final, pode-sedefinir um criterio para a reducao desta temperatura, que consiste na definicao da seguinte constante(Metropolis et al., 1953):

c = exp(stop/start

n− 1

)(16)

onde start e stop sao as temperaturas inicial e final, respectivamente, e n e o numero de temperaturasutilizadas.

No inicio do algoritmo quando a temperatura ainda e muito alta, as solucoes sao aceitasindependentemente de serem ou nao de boa qualidade, mas apos algumas iteracoes, com a reducaoda temperatura, as solucoes que nao sao boas tem menor probabilidade de serem aceitas. No criterioproposto por (Metropolis et al., 1953), um ponto x pode ser aceito ou rejeitado de acordo com:

• se 4f ≤0, entao aceita-se o novo ponto e esta configuracao e usada com ponto de partida paraa proxima iteracao.

• se 4f ≥0, a probabilidade de aceitar o novo ponto e dada pela seguinte equacao:

p(4f) = exp(−4f/(kT )) (17)

onde T e o parametro de temperatura e k e a constante de Boltzmann.

Esse processo iterativo continua ate que uma temperatura suficientemente baixa, na qual nao seobserva nenhuma melhoria no valor da funcao objetivo, e encontrada.

3.3 Colônia de vagalumes

O ACV foi proposto por Xin-She Yang na Universidade de Cambridge em 2007 (Yang, 2008),sendo amplamente aplicada em problemas de otimizacao dos mais variados generos. Esta tecnicade otimizacao e inspirada na caracterıstica de bioluminescencia dos vagalumes, a qual e empregadapara comunicacao, como isca para atracao de eventuais presas, como mecanismo de alerta a possıveispredadores e para a atracao de potenciais parceiros na reproducao (Yang, 2008).

Para a implementacao definida por Yang (2008), tres regras foram definidas com a finalidade dedelinear o funcionamento do algoritmo: (1) os vagalumes nao possuem sexo, assim qualquer vagalumepode atrair ou ser atraıdo; (2) a atratividade e proporcional ao brilho emitido e decai conforme adistancia entre os vagalumes aumenta e (3) o brilho emitido por um vagalume e determinado pelasua avaliacao, isto e, pelo valor da funcao objetivo.

Matematicamente o ACV pode ser descrito por equacoes que modelam a atratividade, aluminosidade e a movimentacao em relacao a distancia. A intensidade de emissao de luz de umvagalume e proporcional a funcao objetivo que decai em funcao da distancia entre os vagalumes,devido a absorcao de luz pelo meio:

I(r) = I0 exp( γr2) (18)

onde I e a intensidade luminosa vista por um vagalume qualquer, r e a distancia euclidiana destevagalume ate a fonte de luz I0 e γ e o coeficiente de absorcao de luz no meio, ou seja, qualquer fatorque interfira na visualizacao entre os vagalumes.

A equacao abaixo representa a atratividade sofrida por um vagalume qualquer, onde β0 e aatratividade em r=0 e, em algumas situacoes, pode ser fixada em β0=1:

β(r) = β0 exp(−γr2) (19)

A movimentacao em um dado espaco de tempo t do vagalume i na direcao do melhor vagalumej, em termos da funcao objetivo, e definida como:

xti = x(it− 1) + β(x

(jt− 1)− x(

it− 1)) + α(rand− 0, 5) (20)

Na equacao acima, a segunda parcela do lado direito insere o fator de atratividade β, enquantoque a terceira parcela contem o parametro α, responsavel por regular a insercao de aleatoriedade nocaminho percorrido pelo vagalume, e rand e um numero aleatorio entre 0 e 1. O processo iterativocontinua ate que o numero maximo de iteracoes seja alcancado.

Page 146: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Projeto de robôs manipuladores 3R ortogonais 131

4. Projeto Ótimo para o Manipulador Robótico 3R

Neste trabalho sao estudados os manipuladores 3R ortogonais. Assim, considera-se α1=-90 eα2=90. Desta forma, o projeto otimo para o manipulador 3R ortogonal consiste da identificacaodos parametros do robo (a1, a2, a3, d2 e d3) que remetem a um volume do espaco de trabalhoespeficifado. Matematicamente, este problema pode ser definido como

min f(x) = |V (x)− Vdesejado| (21)

sujeito axinf ≤ x ≤ xsup (22)

onde V e o volume de trabalho calculado pelo vetor de variaveis de projeto x (definido pelos limitessuperior xsup e inferior xinf ), e Vdesejado e o volume de trabalho especificado pelo usuario. No

presente estudo foram assumidos os valores xinf=0 e xsup=3 (Bergamaschi, 2004).Recentemente, Oliveira (2012) obteve o volume de 2383,379 unidades de volume (u.v.) a partir de

um processo de otimizacao que considerava como objetivos o volume, a rigidez e a destreza usando oMetodo dos Objetivos Ponderados. Foi considerado d2=1,0 com peso de 80% para o volume e 10%para os outros dois objetivos e volume desejado (Vdesejado) o valor de 2800 u.v. Foram utilizados osseguintes parametros no AG: populacao de 100 indivıduos, probabilidade de mutacao igual a 0,01,probabilidade de cruzamento de 0,6 e 50 geracoes. No RS foram utilizadas 40 temperaturas com 100iteracoes para cada uma delas, sendo start=10 e stop=1. Ja no ACV foram utilizados os seguintesparametros: 20 vagalumes com 600 geracoes, sendo o fator de atratividade igual 1.

A Tabela 3 apresenta o projeto otimo obtido com a aplicacao das tecnicas de otimizacaoempregadas, onde Neval e o numero de avaliacoes da funcao objetivo.

Tabela 3. Valores das variaveis de projeto que conduzem ao volume desejado.

a1 a2 a3 d1 d2 Funcao Objetivo Neval

AG 2,9536 2,8737 2,5339 2,9826 2,9804 2E-5 5100RS 2,9012 2,8507 2,8766 2,3636 2,4734 1E-4 4000

ACV 2,9246 2,5860 2,9433 2,4761 2,4875 2E-5 12000

Nesta tabela observa-se que ambos ambos os metodos mostraram-se eficientes na busca pelo otimoda estrutura robotica em questao. Todavia, e importante ressaltar que no ACV o otimo foi obtidoas custas de um elevado numero de avaliacoes da funcao objetivo em relacao aos requeridos pelo AGe pelo RS.

A Figura 9 exibe a secao radial plana originaria da resolucao do proble- ma de projetoconsiderando os resultados obtidos via AG. Pode-se notar que os parametros de projeto obtidosdenotam um manipulador 3R ortogonal que nao apresenta vazios em seu espaco de trabalho,possibilitando uma boa ocupacao do ambiente de trabalho. Percebe-se tambem que a ordenadado ponto da secao radial e que e a projecao deste ponto sobre o eixo de rotacao do manipulador (z)assume valores negativos, indicando que o efetuador do robo atinge pontos abaixo do nıvel da basedo manipulador, o que na pratica e indesejavel. Tal adversidade e solucionada montando-se a basedo manipulador a uma altura do piso de modo que todo o espaco de trabalho fique acima do piso.Para isto, basta que a altura seja maior do que o valor absoluto do mınimo de z.

5. Conclusões

Foi desenvolvido um estudo introdutorio envolvendo Tecnicas de Otimizacao Heurısticas ondeprocurou-se destacar conceitos fundamentais. Foi apre- sentado a modelagem simplificada doproblema fısico, isto e, de um robo manipulador 3R. O projeto otimo proposto neste trabalho consisteda identificacao de parametros de um robo manipulador 3R ortogonal atraves da mininimizacaode uma funcao objetivo fundamentada no volume de espaco de trabalho. De maneira geral, ametodologia proposta mostrou-se eficaz para a aplicacao realizada. Percebe-se pelo resultado daotimizacao que os parametros tenderam aos valores maximos permitidos, principalmente a1, a2 ea3. Fisicamente, esta resposta era esperada ja que o objetivo do problema, implicitamente, foi o deobter um volume de esaco de trabalho maximo (especificado pelo usuario), o que conduz a maioresdimensoes possıveis do robo.

Page 147: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

132 Bergamaschi & Borges

Figura 9. Secao radial plana proveniente da resolucao do problema inverso.

Agradecimentos

Os autores agradecem o suporte financeiro do CNPq, Conselho Nacional de DesenvolvimentoCientıfico e Tecnologico.

ReferênciasBeer, F. & Johnston, E., Mecanica Vetorial Para Engenheiros. 1a edicao. Makron Books, Sao Paulo, Brasil, 1994.

Bergamaschi, P., Projeto Otimo de Robos Manipuladores 3R Considerando as Caracterısticas de seu Espaco de Trabalho.Tese de doutorado, Universidade Federal de Uberlandia, Uberlandia, 2004.

Bergamaschi, P.; Nogueira, A. & Saramago, S., Design and optimization of 3r manipulators using the workspacefeatures. Applied Mathematics and Computation, 172(1):439–463, 2006.

Bergamaschi, P.; Saramago, S. & Coelho, L., Comparative study of sqp and metaheuristics for robotic manipulatordesign. Applied Numerical Mathematics, 58(1):1396–1412, 2008.

Borges, R., Tecnicas Inteligentes de Otimizacao. Dissertacao de mestrado, Faculdade de Engenharia Mecanica,Universidade Federal de Uberlandia, 2003.

Borges, R.; Lobato, F. & Steffen, V., Application of three bioinspired optimization methods for the design of a nonlinearmechanical system. Mathematical Problems in Engineering, 1(1):1–12, 2013.

Ceccarelli, M., A formulation for the workspace boundary of general n-revolute manipulators. IFToMM Jnl Mechanismand Machine Theory, 31(5):637–646, 1996.

Ceccarelli, M. & Lanni, C., Sintesis optima de brazos manipuladores considerando las caracteristicas de su espacio detrabajo. Revista Iberoamericana de Ingenieria Mecanica, 3(1):49–59, 1999.

Ceccarelli, M. & Lanni, C., A multi-objective optimum design of general 3r manipulators for prescribed workspacelimits. Mechanism and Machine Theory, 39(2):119–132, 2004.

Gupta, K. & Roth, B., Design considerations for manipulator workspace. Journal of Mechanical Design, 104(2):704–711, 1982.

Holland, J., Adaptation in Natural and Artificial Systems. 1a edicao. MIT Press, Illinois Genetic Algorithm Laboratory.IlliGAL, University of Illinois at Urbana-Champaign, 1975.

Lanni, C.; Saramago, S. & Ceccarelli, M., Optimal design of 3r manipulators by using classical techniques and simulatedannealing. Revista Brasileira de Ciencias Mecanicas, 24(4):293–301, 2002.

Megahed, S., Principles of Robots Modelling and Simulation. 1a edicao. Wiley, New York, 1993.

Metropolis, N.; Rosenbluth, M.; Rosenbluth, A. & Teller, E., Equation of state calculations by fast computing machines.J Chem Phys, 21(1):1087–1092, 1953.

Oliveira, G., Projeto Otimo de Robos Manipuladores 3R Considerando a Topologia do Espaco de Trabalho. Tese dedoutorado, Universidade Federal de Uberlandia, Uberlandia, 2012.

Oliveira, G.; Bergamaschi, P. & Saramago, S., Optimization of the workspace volume of 3r manipulators using a hybridmethodology. 19th International Congress of Mechanical Engineering, Proc. of COBEM2007 (CD-ROM), Brasılia,ABCM, 2007, p. 1–10, 2007.

Saramago, S. & Steffen, V., Dynamic optimization for the trajectory planning of robot manipulators in the presenceof obstacles. Journal of the Brazilian Society of Mechanical Sciences, Brazil, XXI(3):371–383, 1999.

Tsai, L., Robot Analysis: The Mechanics of Serial and Parallel Manipulators. 1a edicao. John Wiley & Sons, 1999.

Vanderplaats, G., Numerical Optimization Techniques for Engineering Design. 1a edicao. VR&D Inc., ColoradoSprings, CO, USA, 417 pages, 1999.

Yang, X., Firefly Algorithm - Nature-Inspired Metaheuristic Algorithms. 1a edicao. Luniver Press: Cambridge, 2008.

Page 148: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Capítulo 11

Análise Estrutural ConsiderandoIncertezas Paramétricas Fuzzy

Fabian Andres Lara-Molina∗, Edson Hideki Koroishi e Valder Steffen Jr

Resumo: Este capıtulo apresenta uma metodologia para a analise das incertezas nos parametros naresposta dinamica de estruturas. A simulacao numerica e realizada mapeando os parametros fuzzy nomodelo do sistema com ajuda da otimizacao de cortes-α. A aplicacao desta metodologia e demostradamediante o estudo de tres sistemas diferentes: um sistema massa-mola-amortecedor, uma suspensaoautomotiva com dois graus de liberdade e um rotor flexıvel modelado com ajuda do Metodo dos ElementosFinitos Fuzzy. Os resultados obtidos das simulacoes numericas sao a resposta temporal e a Funcao deResposta em Frequencia.

Palavras-chave: Analise de incertezas, Otimizacao, Variaveis fuzzy, Dinamica de rotores.

Abstract: This chapter introduces a straightforward methodology to analyze the effect of parameteruncertainty on the structural dynamic response. The numerical simulation is performed by mapping thefuzzy uncertain parameters on the model of the system by means of the α-level optimization. The applicationof this methodology is demonstrated by studying three different systems: a mass-spring-damping system,an automotive suspension system of two degrees of freedom and a flexible rotor modeled with aid of FuzzyFinite Element Method. The numerical simulations of the fuzzy systems lead to the corresponding timedomain responses and frequency response functions.

Keywords: Uncertainty analysis, Optimization, Fuzzy variables, Rotor dynamics.

Conteúdo

1 Introducao ................................................................................................................................1342 Analise Estrutural com Parametros Fuzzy ...............................................................................135

2.1 Modelos com entradas fuzzy ............................................................................................1352.2 Conjuntos fuzzy ...............................................................................................................1352.3 Otimizacao de cortes-α ....................................................................................................1362.4 Elementos finitos fuzzy ....................................................................................................137

3 Modelo do Rotor Flexıvel.........................................................................................................1374 Resultados e Discussao.............................................................................................................138

4.1 Sistema massa-mola-amortecedor ....................................................................................1384.2 Sistema com dois graus de liberdade ...............................................................................1394.3 Rotor flexıvel....................................................................................................................140

5 Conclusoes................................................................................................................................143

∗Autor para contato: [email protected]

Lobato et al. (Ed.), (2014) DOI: 10.7436/2014.tica.11 ISBN 978-85-64619-15-9

Page 149: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

134 Lara Molina et al.

1. Introdução

Atualmente, as aplicacoes industriais requerem sistemas mecanicos que trabalhem com umdesempenho otimo sob determinadas condicoes de operacao, o que implica: alta confiabilidade,robustez a condicoes ambientais e baixos requisitos operacionais. Consequentemente, faz-senecessario desenvolver modelos numericos realistas que considerem adequadamente as incertezasnos parametros e nas entradas dos sistemas. As incertezas nos modelos tem sido consideradas emdiversas areas da engenharia, tais como dinamica de estruturas (Ghanem & Spanos, 1991), dinamicade rotores (Koroishi et al., 2012), (Didier et al., 2012) e robos manipuladores (Lara-Molina et al.,2012), entre outras.

Na modelagem dos sistemas dinamicos as incertezas sao consideradas utilizando principalmentetres abordagens diferentes (Moller & Beer, 2004). Na primeira abordagem, as incertezas saoconsideradas atraves de uma formulacao probabilıstica (baseada na teoria das probabilidades); assim,as incertezas sao representadas atraves de uma distribuicao de probabilidades. Na segunda, asincertezas sao modeladas atraves de intervalos previamente definidos. Na terceira, as incertezas saoabordadas usando a teoria das possibilidades.

Neste contexto, as incertezas parametricas, nos modelos numericos dos sistemas dinamicos,tem sido tipicamente representadas utilizando uma abordagem probabılistica. Segundo estaabordagem, os parametros concentrados sao modelados atraves de variaveis aleatorias com umafuncao de densidade de probabilidade arbitraria e os campos ou processos aleatorios sao modelosatraves da expansao de Karhunen-Loeve (Ghanem & Spanos, 1991). Fundamentalmente, asimulacao numerica dos modelos estocasticos e realizada com metodos que amostram a funcao dedensidade de probabilidade. Neste caso, o principal metodo e a simulacao de Monte-Carlo, que ecomputacionalmente intenso. Para reduzir o custo computacional e utilizado o hipercubo latino. Poroutro lado, tem-se o Polinomio de Caos, que e um metodo que nao amostra a funcao de distribuicaode probabilidade. Este metodo tem demostrado uma alta eficiencia em simulacoes com poucasvariaveis aleatorias que possuem uma grande dispersao (Xiu, 2010).

Como alternativa aos metodos estocasticos tem-se a utilizacao da logica nebulosa (fuzzy) paramodelar a incerteza. Mediante a logica fuzzy e possıvel descrever informacoes incompletas eimprecisas. A teoria dos conjuntos fuzzy foi formulada inicialmente por Zadeh (1965) para tratardo aspecto vago que pode envolver a informacao. Posteriormente, Zadeh desenvolveu a teoria daspossibilidades baseada nos conjuntos fuzzy, que pode ser comparada a teoria das probabilidades, paraabordar a incerteza da informacao (Zadeh, 1978). Conceitualmente, a teoria dos conjuntos fuzzy edas possibilidades estao intimamente ligadas; portanto, e possıvel tratar a incerteza e imprecisao deum conjunto de informacoes mediante a teoria dos conjuntos fuzzy. Atraves da teoria dos conjuntosfuzzy sao modeladas incertezas nas quais e desconhecido o processo estocastico que as descreve.Neste contexto, Moens & Hanss (2011) apresentam uma revisao da literatura das aproximacoes naoprobabilısticas utilizadas na analise de incertezas parametricas e aplicadas no metodo dos elementosfinitos. As duas aproximacoes principais apresentadas neste trabalho para modelar as incertezassao: analises intervalares e logica fuzzy. Estas duas aproximacoes requerem a solucao de problemasde analise intervalar. Desta forma, atualmente as pesquisas desenvolvidas nesta area visam aimplementacao e solucao do problema de analise intervalar. Na simulacao computacional de modelosfuzzy, as incertezas sao modeladas com medidas fuzzy que utilizam o corte-α. Nestas medidas fuzzy,o valor exato dos parametros e desconhecido, mas limitado em um intervalo ponderado por umafuncao de pertinencia. Por esta razao, para simular os sistemas fuzzy, e utilizada fundamentalmentea analise intervalar de sistemas dinamicos (Puig et al., 2005).

Em conformidade com a abordagem baseada na logica nebulosa, neste capıtulo sera utilizadaa teoria dos conjuntos fuzzy para modelar as incertezas parametricas. A finalidade de utilizaresta abordagem e apresentar um metodo alternativo para modelar a incerteza de uma formanao probabilıstica, e assim simular o modelo numerico de estruturas considerando a variacao dosparametros. Desta forma, e possıvel avaliar o efeito das incertezas na resposta dinamica dasestruturas.

Diante do que foi apresentado, este capıtulo tem como proposito apresentar uma metodologiapara a modelagem e simulacao da resposta dinamica de estruturas com incertezas nos parametrosutilizando uma abordagem baseada em logica fuzzy. Para este proposito, os parametros com incertezados sistemas considerados sao mapeadas no modelo com ajuda da otimizacao de cortes-α (Moller &Beer, 2004). Este capıtulo e composto por quatro Secoes. Na Secao 2 descreve-se a metodologia paraa modelagem e simulacao de incertezas fuzzy nas estruturas e o Metodo dos Elementos Finitos Fuzzy.Na Secao 3 e apresentado o modelo do rotor flexıvel baseado no Metodo dos Elementos Finitos, noqual sera analisado o efeito das incertezas. Na Secao 4 sao apresentados os resultados das simulacoes

Page 150: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Análise estrutural considerando incertezas paramétricas fuzzy 135

numericas para tres sistemas: um sistema massa-mola-amortecedor, uma suspensao automotiva comdois graus de liberdade e um rotor flexıvel. Finalmente, formulam-se as conclusoes e propostas paratrabalhos futuros.

2. Análise Estrutural com Parâmetros Fuzzy

Nesta secao e apresentada uma metodologia para incorporar as incertezas nos parametros materiais egeometricos dos modelos numericos das estruturas. Inicialmente, os modelos com entradas fuzzy saointroduzidos; a seguir, os conjuntos fuzzy e sua respectiva formulacao matematica para representar asincertezas e apresentada. Com o proposito de simular a resposta dinamica apresenta-se a otimizacaode cortes-α e finalmente, os princıpios para a implementacao do Metodo dos Elementos Finitos Fuzzysao mostrados.

2.1 Modelos com entradas fuzzy

No contexto deste trabalho, o modelo matematico descreve o comportamento dinamico de umaestrutura atraves de ferramentas matematicas. A relacao matematica entre as entradas x e as saıdasz do modelo M e caraterizada por uma funcao f na Equacao (1).

M : z = f(x) (1)

A funcao f mapeia as entradas x nas saıdas z, assim x→ z.Ao considerar entradas fuzzy x no modelo, as saıdas corresponderao a variaveis fuzzy resultantes

do mapeamento, utilizando o modelo M , portanto x→ z.Em aplicacoes de engenharia, geralmente a relacao f pode ser definida por um codigo de elementos

finitos, um sistema de equacoes diferenciais, ou uma funcao de resposta em frequencia. Quando asentradas ou os parametros do sistema sao variaveis fuzzy a resposta sera uma funcao fuzzy z(τ),assim

M : z(τ) = f(x, τ) (2)

onde, z e a variavel fuzzy resultante, τ e a variavel independente, x e o vetor de entradas fuzzy. Alemdisso, τ pode representar o tempo, a frequencia ou coordenadas espaciais.

Os principais metodos para simular os sistemas dinamicos com incertezas fuzzy reportados naliteratura sao: metodo “Quantitative Simulation - Qua.Si” (Bonarini & Bontempi, 1994); analiseestrutural baseada na otimizacao de corte-α (Moller et al., 2000); metodo da transformacao, utilizadopara avaliar a resposta dos modelos com incertezas parametricas tipo fuzzy (Hanss, 2002); modelagemde incertezas de natureza epistemica e fuzzy que se fundamenta na aritmetica fuzzy, na qual asincertezas dos parametros sao representadas como numeros fuzzy (Waltz & Hanss, 2013).

2.2 Conjuntos fuzzy

Na teoria classica dos conjuntos, a pertinencia dos elementos a um determinado conjunto e definidapor uma condicao binaria. Neste caso, se a pertinencia corresponde a “1” o elemento pertence aoconjunto, e se a pertinencia e “0”o elemento nao pertence ao conjunto. Portanto, seja X um conjuntoclassico universal e seus elementos x. O conjunto A (onde, A ∈ X) e definido da forma classica pelafuncao de pertinencia µA : X→ 0, 1 (ver Figura 1(a)).

(a) Conjunto fuzzy. (b) Cortes-α.

Figura 1. Conjunto fuzzy e cortes-α.

Por outro lado, um conjunto fuzzy e definido atraves da funcao de pertinencia µA : X→ [0, 1], naqual [0, 1] e um intervalo real e contınuo. A funcao de pertinencia indica o nıvel de compatibilidade

Page 151: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

136 Lara Molina et al.

do elemento x no conjunto fuzzy A. Portanto, valores de µA(x) proximos de “1” indicam uma

pertinencia maior do elemento x no conjunto A. O conjunto fuzzy e completamente definido por:

A = (x, µA(x)) |x ∈ X, onde, 0 ≤ µA ≤ 1 (3)

O conjunto fuzzy A pode ser representado atraves de sub-conjuntos. Estes subconjuntos, quecorrespondem a intervalos reais e contınuos, sao definidos por Aαk e denominados cortes de nıvel oucortes-α (Figura 1(b)), assim:

Aαk = x ∈ X, µA(x) ≥ αk (4)

Para varios subconjuntos de cortes-α do mesmo conjunto fuzzy A tem-se a seguinte propriedade:

Aαk ⊆ Aαi∀αi, αk ∈ (0, 1] com αi ≤ αk (5)

Se (no caso unidimensional) o conjunto fuzzy e convexo, cada conjunto de cortes-α Aαk correspondeao intervalo [xαkl, xαkr] onde:

xαkl = min[x ∈ X|µA(x) ≥ αk] (6)

xαkr = max[x ∈ X|µA(x) ≥ αk] (7)

2.3 Otimização de cortes-α

A otimizacao de cortes-α e um metodo apropriado ao mapeamento do vetor de entrada fuzzy x novetor de saıdas z utilizando o modelo para mapeamento determinıstico da Equacao (1). A otimizacaode cortes-α se compoe de tres etapas apresentadas na Figura 2 e descritas conforme segue:

Figura 2. Fluxograma do algoritmo numerico da otimizacao de cortes-α.

1) Discretizacao dos cortes-α e determinacao do sub-espaco Xαk: para os calculos numericos cada

elemento do vetor de entradas fuzzy x = (x1, . . . , xn) e considerado como um intervalo Xiαk =[xiαkl, xiαkr], onde αk ∈ (0, 1] (dos cortes-α da Equacao (4) e Figura 1(b)). Consequentemente,e definido o sub-espaco Xαk

= (X1αk , . . . , Xnαk) onde Xαk∈ Rn.

2) Problema de otimizacao: consiste em achar o valor maximo e mınimo da saıda do modelo paramapeamento M : z = f(x) assim:

zαkr = maxx∈Xαk

f(x) zαkl = minx∈Xαk

f(x) (8)

zαkr e zαkl correspondem aos extremos do intervalo [zαkr, zαkl] no corte-α αk. O conjuntode intervalos discretizados [zαkr, zαkl] formam a variavel fuzzy resultante z. Na solucao desteproblema de otimizacao e utilizada uma tecnica, que combina o metodo evolutivo, a simulacaode Monte-Carlo e o metodo de gradiente, denominado “modified evolution strategy” (Molleret al., 2000).

3) Pos-processamento: utilizando a propriedade dos cortes-α da Equacao (5) e verificado paracada corte-α que zαkl e zαkr correspondem aos maximos e mınimos globais. Para isto, apropriedade da Equacao (5) deve ser satisfeita para o vetor de variaveis fuzzy de saıda z, docontrario os otimos devem ser calculados novamente. Atraves deste procedimento assegura-seque z correspondera a um conjunto convexo.

Page 152: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Análise estrutural considerando incertezas paramétricas fuzzy 137

2.4 Elementos finitos fuzzy

O Metodo dos Elementos Finitos Fuzzy consiste em considerar um modelo de Elementos Finitoscomo o modelo matematico mostrado na Equacao (2). Considerando problemas independentes dotempo, as incertezas sao descritas atraves de vetores fuzzy x e campos fuzzy x(θ), onde θ representaas coordenadas espaciais. Nos problemas dependentes do tempo as incertezas sao descritas mediantefuncoes fuzzy x(τ) e processos fuzzy x(t). As incertezas fuzzy podem ser levadas em consideracaoutilizando o Princıpio do Trabalho Virtual e princıpios da mecanica variacional. Desta forma, parauma estrutura, o sistema de equacoes diferenciais fuzzy de segunda ordem e obtida:

[M ]˜v+ [D]˜v+ [K]v = F (9)

onde [M ], [D], [K] sao as matrizes fuzzy de massa, amortecimento e rigidez, correspondentemente.

v e F sao os deslocamentos generalizados e as forcas aplicadas fuzzy, respectivamente.A resposta estrutural dos sistemas com incertezas, nas Equacoes (2) e (9), dependem de τ ,

lembrando que τ pode representar o tempo, a frequencia ou coordenadas espaciais. A respostaestrutural destes sistemas baseia-se na otimizacao de cortes-α. Para cada τ e executada a otimizacaode cortes-α para obter a variavel fuzzy resultante z(τ). A funcao fuzzy z(0, τf ) e obtida utilizando arotina apresentada no fluxograma da Figura 3. Detalhes adicionais relacionados a implementaacaodesta metodologia encontram-se em Moller & Beer (2004).

Figura 3. Funcao Fuzzy z(τ) e Fluxograma do algoritmo para a analise de sistemas fuzzy baseado na otimizacaode cortes-α.

3. Modelo do Rotor Flexível

A resposta dinamica do sistema mecanico considerado pode ser modelado pelo uso do princıpio damecanica variacional, chamado o Princıpio de Hamilton. Para este proposito, a energia de deformacaodo eixo e as energias cineticas do eixo e dos discos sao calculadas. Uma extensao do Princıpio deHamilton torna possıvel incluir os efeitos da energia de dissipacao. Os parametros dos mancaissao incluıdos no modelo do sistema pelo uso do princıpio do trabalho virtual. Para propositoscomputacionais, o metodo dos elementos finitos e utilizado para discretizar a estrutura, sendo queas energias calculadas sao concentradas nos pontos nodais. Funcoes de forma sao utilizadas paraconectar os pontos nodais. O modelo assim obtido e representado matematicamente por um conjuntode equacoes diferenciais conforme apresentado pela Equacao (10) (Lalanne & Ferraris, 1998).

[M ]x(t)+ [C + ΩG]x(t)+ [K]x(t) = F (t) (10)

na qual, [M ] = [M ]S + [M ]D, [K] = [K]S + [K]B, [C] = [C]S + [C]P e [G] = [G]S + [G]B sao,respectivamente, as matrizes de massa, rigidez, amortecimento e efeito giroscopico. Os ındices S, D,B e P referem-se, respectivamente, ao eixo, disco, mancal e proporcional. O sistema determinısticoapresentado pela Equacao (10) pode ser analisado atraves da Funcao de Resposta em Frequencia(FRF), a qual pode ser determinada atraves da Equacao (11).

X(ω) =[−ω2[M ] + iω[C + ΩG] + [K]−1

]F (ω) (11)

sendo a matriz de receptancia dada por:

H(ω,Ω) =[−ω2[M ] + iω[C + ΩG] + [K]

]−1(12)

Neste ponto, e importante considerar que, a fim de estudar o comportamento do sistema quandoincertezas sao consideradas, as respostas fuzzy devem ser computadas com respeito a um conjuntode parametros fısicos e/ou geometricos modelados com variaveis fuzzy, associados ao rotor flexıvel

Page 153: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

138 Lara Molina et al.

em estudo. Assim, para avaliar a variacao das respostas associadas com estas incertezas, torna-senecessario fazer uma parametrizacao do Modelo de Elementos Finitos. Este procedimento permitenao so introduzir incertezas no modelo, como tambem analisar a sensibilidade de tais parametros.Apos manipulacoes matematicas, as matrizes do sistema dado pela Equacao (10) sao parametrizadasda forma:

[M ](e)S = ρsAS [M ]

(e)S

Eixo: [K](e)S = EsIS [K]

(e)S (13)

[G](e)S = ρsIS [G]

(e)S

Mancais: [K](e)B = kxx[K]

(e)B + kzz[K]

(e)B (14)

[G](e)s = dxx[C](e)B + dzz[C]

(e)B

sendo, ρS , AS , ES e IS , respectivamente, a densidade de massa, a area da secao transversal, omomento de inercia e o modulo de Young. kxx, kzz, dxx e dzz designam, respectivamente, oscoeficientes de rigidez e amortecimento.

4. Resultados e Discussão

As simulacoes numericas apresentadas nesta secao ilustram a aplicacao da metodologia proposta paraa analise da resposta dinamica de estruturas levando em consideracao as incertezas parametricas nosmodelos numericos.

A presente metodologia exige inicialmente a modelagem das incertezas parametricas atraves devariaveis fuzzy. Com a finalidade de ilustrar as incertezas com a notacao mais simples, estas foramcaraterizadas mediante numeros triangulares fuzzy que sao especificados pelo maior e menor valor(limites do intervalo de incerteza) e tambem o valor nominal do parametro.

Posteriormente a resposta dinamica, levando em consideracao as incertezas fuzzy, e simuladanumericamente com base na otimizacao de cortes-α. A equacao de movimento dos sistemas estudadosfoi resolvida utilizando um codigo desenvolvido numa plataforma MATLAB/SIMULINKr.

A analise de incerteza fuzzy, aplicando a metodologia proposta, e ilustrada nos sistemas mecanicosapresentados a seguir. Inicialmente, sao considerados dois sistemas simples: um sistema massa-mola-amortecedor e uma suspensao automotiva com dois graus de liberdade. Finalmente e consideradoum rotor flexıvel modelado com ajuda do Metodo dos Elementos Finitos. Para cada um dos sistemasfoi caracterizada a resposta no domıno do tempo e a funcao de resposta em frequencia (FRF).

4.1 Sistema massa-mola-amortecedor

O sistema da Figura 4(a) possui um grau de liberdade. Neste modelo consideramos a incerteza

no coeficiente de atrito e rigidez da mola representados por c e k respectivamente. A incertezanos parametros e modelada por um numero triangular fuzzy na Figura 4(b), onde m = 0, 01Kg e

k = (0, 9/1/1, 1)N/m e c = (0, 05/0, 06/0, 07)Ns/m.

x

................

..........................

............................

................

-

-

k

c

mf(t)

(a) Sistema massa-mola-amortecedor.

k

TTTTTTTT

6

-

6

-

µ(c)

N/mNs/m

0, 070, 05 0, 06

c1, 0

10, 9

µ(k)

1, 1

1, 0

TTTTTTTT

(b) Parametros com incertezas fuzzy: m e k.

Figura 4. Sistema massa-mola-amortecedor com incerteza fuzzy.

O modelo do sistema massa-mola-amortecedor e representado pela Equacao (15).

m¨x(t) + c ˙x(t) + kx = f(t) (15)

onde x(t) e o deslocamento da massa e ˙x(t) e a respectiva velocidade. A funcao de resposta emfrequencia (FRF) do sistema, H(ω) na Equacao (16), caracteriza a relacao entre a saıda X(ω) emestado estacionario e a entrada harmonica f(t) = F (ω)eiωt.

Page 154: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Análise estrutural considerando incertezas paramétricas fuzzy 139

X(ω)

F (ω)= H(ω) =

1

−ω2m+ iωc+ k(16)

Utilizando a analise de sistemas com entradas fuzzy baseada na otimizacao de cortes-α descrita nofluxograma da Figura 3, a resposta dinamica do sistema e calculada para os cortes-αk = 0, 1k, ondek = 0, 1 . . . , 9, 10. Desta maneira, a resposta do sistema e obtida na presenca de incertezas fuzzy nodomınio do tempo e da frequencia (ver Figura 5). As barras de tons de cinza na Figura 5 indicam

as funcoes de pertinencia µ(x) e µ(|H(ω)|), respectivamente. O efeito em c e k para uma excitacaodegrau unitario (f(t) = u(t)N) na resposta no domınio do tempo x(t) e aumentar a amplitude e a

frequencia natural amortecida (ver Figura 5(a)). Similarmente, o modulo da FRF |H(ω)| e calculado

e observa-se que os parametros c e k tendem a modificar a margem de ganho e a margem de fase dosistema (ver Figura 5(b)).

0 0.5 1 1.50

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

x

Tempo [s]

0

0.2

0.4

0.6

0.8

1

(a) Resposta no domınio do tempo.

100 101 10210−2

10−1

100

|H(!

)|

![rad/s]

0

0.2

0.4

0.6

0.8

1

(b) RFR do sistema.

Figura 5. Resposta do sistema massa-mola-amortecedor, incertezas: m e c.

4.2 Sistema com dois graus de liberdade

O modelo de um quarto de carro representa a suspensao passiva de um veıculo (ver Figura 6(a)).Este modelo com dois Graus De Liberdade (GDL) e a representacao mais simples da suspensao deum veıculo convencional. Os parametros que tipicamente apresentam incerteza na suspensao sao amassa nao-suspensa m1 (que corresponde a um quarto da massa do veıculo) e o coeficiente de rigidez

do pneu k2 (ver Figura 6(b)). A dinamica do sistema e descrita na Equacao (17).[m1 00 m2

] [¨x1(t)¨x2(t)

]+

[c1 −c1

−c1 c1

] [˙x1(t)˙x2(t)

]+

+

[k1 −k1

−k1 k1 + k2

] [x1(t)x2(t)

]=

[0

k2

]u(t) (17)

onde, [x1(t) x2(t)]T

,[

˙x1(t) ˙x2(t)]T

e[¨x1(t) x2(t)

]Tsao os deslocamentos, velocidades e

aceleracoes da massas suspensa e nao-suspensas respectivamente. A forma do terreno e descritapela funcao u(t) = a sin(ωt). A FRF considerada neste sistema considera a relacao entre X1(ω) eU(ω), assim:

H(ω) =X1(ω)

U(ω)(18)

Os parametros do sistema sao k1 = 80000N/m, c1 = 3500Ns/m e m2 = 320Kg. Aincerteza nos parametros e modela pelos numeros fuzzy triangulares na Figura 6(b), onde m1 =

(2250/2500/2750)Kg e k2 = (450000/500000/550000)N/m.A resposta do sistema e obtida na presenca de incertezas fuzzy no domınio do tempo e da

frequencia para os cortes-αk = 0, 1k, onde k = 0, 1 . . . , 9, 10. Os resultados mostram que a incertezanos parametros m1 e k2 nao afetam significativamente o deslocamento da massa suspensa x1(t). Aentrada considerada nesta simulacao e u(t) com a = 1m e ω = 1rad/s (ver Figura 7(a)). No entanto,o modulo da FRF e sensıvel a incerteza nos parametros: m1 principalmente influencia a primeirafrequencia de ressonancia, e k2 influencia a segunda frequencia de ressonancia (ver Figura 7(b)).

A ultima simulacao considera uma incerteza adicional na frequencia da forma do terreno, assimu(t) = sin(ωt)m, onde ω = (1/1, 25/1, 5)rad/s. O sistema e forcado a operar proximo da primeirafrequencia de ressonancia; assim, pode-se analisar a resposta nesta condicao (ver Figura 8(a)). Alemdisso, e possıvel verificar a resposta fuzzy x1(t) em qualquer instante de tempo, na Figura 8(b) eapresentada a resposta temporal para o caso de t = 2s.

Page 155: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

140 Lara Molina et al.

(a) Sistema de dois graus deliberdade.

5, 5× 105

6

-

6

- TTTTTTTT

TTTTTTTT

5× 105

1, 01, 0

2500 27502250 4, 5× 105

m1 k2

m1 k2

µ(m1) µ(k2)

(b) Parametros fuzzy: m1 e k2.

Figura 6. Sistema de dois GDL, parametros fuzzy : m1 e k2.

0 1 2 3 4 5 6 7 8 9 10−1.5

−1

−0.5

0

0.5

1

1.5

x1

T empo[s]

0

0.2

0.4

0.6

0.8

1

(a) Resposta no domınio do tempo.

100 101 10210−2

10−1

100

101

|H(!

)|

![rad/s]

0

0.2

0.4

0.6

0.8

1

(b) FRF do sistema.

Figura 7. Resposta do sistema de dois GDL, incertezas: m1 e k2.

0 1 2 3 4 5 6 7 8−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

x1

T empo[s]

0

0.2

0.4

0.6

0.8

1

(a) Resposta no domınio do tempo.

0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.20

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1µ(x

1)

x1

(b) Deslocamento de m1, x1(t), t = 2s.

Figura 8. Resposta do sistema de dois GDL, incertezas: m1, k2 e ω.

4.3 Rotor flexível

A metodologia proposta para a analise de incertezas e aplicada numericamente em um rotor flexıvelcujo modelo utiliza o Metodo dos Elementos Finitos Fuzzy. O rotor flexıvel e composto de um eixode aco horizontal, modelado com 20 elementos tipo viga de Euler-Bernoulli, dois discos de aco e tresmancais assimetricos (ver Figura 9).

As propriedades fısicas e geometricas do eixo, discos e mancais sao apresentadas na Tabela 1.Em todas as analises o modelo considera apenas os 6 primeiros modos de vibrar do rotor.

Para verificar o grau de influencia das incertezas introduzidas no sistema sobre as amplitudes dasFRFs e orbitas do rotor, algumas situacoes foram analisadas. Os parametros com incerteza forammodelados mediante numeros fuzzy triangulares na Equacao (19)

a = a(1− p/100 / 1 / 1 + p/100) (19)

Figura 9. Modelo do Rotor (Cavalini Jr et al., 2011).

Page 156: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Análise estrutural considerando incertezas paramétricas fuzzy 141

Tabela 1. Propriedades fısicas e geometricas dos elementos do rotor (Cavalini Jr et al., 2011).

Elementos do Rotor Propriedades Valores

Comprimento [m] 0,588Diametro [m] 0,010

Eixo Modulo de Young (Es) [Pa] 2,0 ×1011

Densidade [Kg/m3] 7800Espessura [m] 0,005Diametro [m] 0,100

Disco D1 Modulo de Young [Pa] 2,0 ×1011

Densidade [Kg/m3] 7800Espessura [m] 0,010Diametro [m] 0,150

Disco D2 Modulo de Young [Pa] 2,0 ×1011

Densidade [Kg/m3] 7800kxx [N/m] 49,0 ×103

Mancais kzz [N/m] 60,0 ×103

B1, B2 e B3 dxx [Ns/m] 5,0dzz [Ns/m] 7,0

Amortecimento Proporcional α 1,0 ×10−1

[C]p = α[M ] + β[K] β 1,0 ×10−5

onde, a representa o valor nominal do parametro, e p a porcentagem maxima de variacao nocorte αk=0. A Tabela 2 apresenta as porcentagens da variacao associadas as incertezas fuzzy dosparametros para diferentes cenarios; estes cenarios sao considerados na simulacao numerica.

Tabela 2. Definicao dos cenarios de incertezas utilizadas nas simulacoes.

Casos Eixo MancaisEs kxx kzz dxx dzz

(a) 15% - - - -(b) - 5% 5% 5% 5%(c) 15% 5% 5% 5% 5%

A resposta dinamica do rotor flexıvel, no domınio do tempo e da frequencia, e calculada para oscorte-αk: α = 0, α = 0, 5, α = 1. Adicionalmente, o algoritmo de Evolucao Diferencial e utilizadona solucao da otimizacao de corte-α conforme apresentado na Figura 2.

Na presente aplicacao sao usados os seguintes parametros no algoritmo de Evolucao Diferencial:7 indivıduos, 100 geracoes, probabilidade de cruzamento igual a 0,8 e estrategia para mecanismode mutacao de/rand/1/bin. Estes parametros sao derivados de contribuicoes previas (Lobatoet al., 2010; Chegury Viana, 2008; Price et al., 2005). As funcoes objetivo utilizadas na otimizacaosao: a norma |H(ω,Ω)| e os deslocamentos generalizados x(t) no calculo da FRF e das orbitasrespectivamente, as expressoes correspondentes encontram-se nas Equacoes (10) e (12). Esta tecnicade otimizacao demostrou um melhor desempenho, em relacao aquela utilizada anteriormente, nasimulacao do Metodo de Elementos Finitos Fuzzy.

A Figura 10 ilustra o envelope obtido para a FRF fuzzy do rotor flexıvel para o nıvel de dispersaoapresentado no caso (a) da Tabela 2. E possıvel observar que, com o aumento da frequencia, aregiao de incerteza torna-se maior, mostrando que a maior influencia da incerteza ocorre nas altasfrequencias.

Como complemento da demonstracao do grau de influencia de incertezas na analise no domıniodo tempo, a orbita fuzzy do rotor no disco D1 foi computada para o caso (a) considerando umavelocidade de rotacao de 600rpm, na qual o rotor opera abaixo das suas primeiras velocidades crıticas.Como pode ser visto na Figura 11, a influencia das incertezas na amplitude do deslocamento nao edesprezıvel. Pode-se concluir que esta influencia e evidente na orbita interna e externa.

A Figura 12 ilustra a FRF para o caso (b) da Tabela 2. Comparando as Figuras 12 e 10, pode-senotar que, ao contrario do que ocorreu no caso anterior, no qual foi considerada a incerteza noModulo de Young do eixo, a dispersao da amplitude da FRF nao se tornou maior com o aumento da

Page 157: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

142 Lara Molina et al.

frequencia, quando incertezas nos parametros de rigidez e amortecimento dos mancais foram levadasem conta. Isto pode ser verificado na faixa de frequencia proxima a 165Hz que exibe um intervalode incerteza pequeno em torno desta frequencia crıtica; tal fato pode ser explicado pela comparacaodos valores dos parametros de rigidez dos mancais em relacao a rigidez do proprio eixo.

0 50 100 150 200 25010−7

10−6

10−5

10−4

10−3

H(!

)

Frequencia [Hz ]

" = 0, 0" = 0, 5" = 1, 0

Figura 10. FRF, caso (a).

−0.025 −0.02 −0.015 −0.01 −0.005 0 0.005 0.01 0.015 0.02 0.025−0.02

−0.015

−0.01

−0.005

0

0.005

0.01

0.015

0.02

z[m

m]

x[mm]

! = 0, 0! = 0, 5! = 1, 0

Figura 11. Envelope das orbitas, caso (a).

0 50 100 150 200 25010−7

10−6

10−5

10−4

10−3

H(!

)

Frequencia [Hz ]

" = 0, 0" = 0, 5" = 1, 0

Figura 12. FRF, caso (b).

A Figura 13 apresenta a resposta em termos da orbita do rotor. Comparando as Figuras 13 e11, pode-se observar que as incertezas introduzidas nos parametros dos mancais resultaram numasignificativa mudanca na rigidez localizada do rotor flexıvel, resultando numa variacao maior nodeslocamento do sistema, como se ve na Figura 13.

As Figuras 14 e 15 apresentam as respostas fuzzy do rotor flexıvel para o caso (c) da Tabela 2, quecorresponde a insercao de incertezas tanto no modulo de Young, como tambem nos parametros dosmancais. A consequencia imediata e a grande influencia das incertezas introduzidas na respostadinamica do rotor flexıvel. Analisando a FRF apresentada na Figura 14 revela-se uma maiorinfluencia da incerteza do modulo de Young nas altas frequencias, enquanto que as incertezas nosparametros dos mancais causam maior influencia nas duas primeiras frequencias naturais.

Quanto as orbitas (ver a Figura 15), as incertezas nos parametros dos mancais exercem maiorinfluencia na orbita, enquanto que a incerteza no modulo de Young influenciou a orbita em umaproporcao menor.

Page 158: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Análise estrutural considerando incertezas paramétricas fuzzy 143

−0.025 −0.02 −0.015 −0.01 −0.005 0 0.005 0.01 0.015 0.02 0.025−0.02

−0.015

−0.01

−0.005

0

0.005

0.01

0.015

0.02

z[m

m]

x[mm]

! = 0, 0! = 0, 5! = 1, 0

Figura 13. Envelope das orbitas, caso (b).

0 50 100 150 200 25010−7

10−6

10−5

10−4

10−3

H(!

)

Frequencia [Hz ]

" = 0, 0" = 0, 5" = 1, 0

Figura 14. FRF, case (c).

−0.025 −0.02 −0.015 −0.01 −0.005 0 0.005 0.01 0.015 0.02 0.025−0.02

−0.015

−0.01

−0.005

0

0.005

0.01

0.015

0.02

z[m

m]

x[mm]

! = 0, 0! = 0, 5! = 1, 0

Figura 15. Envelope das orbitas, caso (c).

5. Conclusões

Este trabalho apresentou uma metodologia para modelar e analisar as incertezas parametricas fuzzyem sistemas mecanicos simples de um e dois graus de liberdade e num rotor flexıvel. Atraves desimulacoes numericas foi caraterizada a resposta no domınio do tempo e da frequencia na presencade incertezas destes sistemas. Os resultados das simulacoes mostraram-se satisfatorios na analise doefeito das incertezas sobre a resposta dos sistemas.

Especificamente, a modelagem fuzzy de um rotor flexıvel foi proposta e implementada. Assim asincertezas nas variaveis de projeto que caracterizam o rotor flexıvel sao inseridas diretamente atravesde uma aproximacao parametrica, feita atraves da simulacao baseada na otimizacao de cortes-α. Asaplicacoes numericas mostram que os envelopes das respostas conduzem a informacoes valiosas emtermos do grau de influencia das variaveis fuzzy no comportamento dinamico do rotor flexıvel. Oprocedimento apresentado provou ser uma ferramenta util para o projeto e analise de sistemasmodificados e otimizacao estrutural. A escolha das variaveis de projeto (rigidez, amortecimento emodulo de Young) como parametros incertos foi feita baseada na analise de suas sensibilidades comrespeito a Funcao de Resposta em Frequencia (FRF). Como demonstrado pelos resultados numericos,as incertezas introduzidas em ambos os parametros associados com o eixo e nos valores de rigideze amortecimento dos mancais representam um aspecto importante para ser investigado durante oprojeto do rotor flexıvel, devido a sua grande influencia nas velocidades crıticas.

Page 159: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

144 Lara Molina et al.

A metodologia utilizada neste trabalho demostrou ser adequada e versatil no estudo das incertezasnos parametros de estruturas simples e complexas, constituindo-se assim em uma ferramenta utilde analise e projeto. A principal desvantagem, observada nas simulacoes, esta relacionada ao custocomputacional intenso devido ao elevado numero de iteracoes requeridas.

Agradecimentos

Os autores agradecem o suporte financeiro do INCT-EIE atraves da FAPEMIG e CNPq. O primeiroautor e grato ao Programa Mineiro de Pos-Doutorado (FAPEMIG – CAPES).

ReferênciasBonarini, A. & Bontempi, G., A qualitative simulation approach for fuzzy dynamical models. ACM transactions on

modeling and computer simulation, 4:285–313, 1994.

Cavalini Jr, A.A.; Galavotti, T.V.; Morais, T.S.; Koroishi, E.H. & Steffen Jr, V., Vibration attenuation in rotatingmachines using smart spring mechanism. Mathematical Problems in Engineering, 2011(340235):14, 2011.

Chegury Viana, F.A., Surrogate Modeling Techniques and Heuristic Optimization Methods Applied to Design andIdentification Problems. Tese de doutorado, Universidade Federal de Uberlandia, 2008.

Didier, J.; Faverjon, B. & Sinou, J.J., Analyzing the dynamic response of a rotor system under uncertain parametersby polynomial chaos expansion. Journal of Vibration and Control, 18(5):587–607, 2012.

Ghanem, R.G. & Spanos, P.D., Stochastic Finite Elements: A Spectral Approach. Courier Dover Publications, 1991.

Hanss, M., The transformation method for the simulation and analysis of systems with uncertain parameters. FuzzySets and Systems, 130(3):277–289, 2002.

Koroishi, E.H.; Cavalini Jr, A.A.; de Lima, A.M.G. & Steffen Jr, V., Stochastics modeling of flexible rotors. Journalof the Brazilian Society of Mechanical Sciences and Engineering, 34(Special Issue):597–603, 2012.

Lalanne, M. & Ferraris, G., Rotordynamics – Prediction in Engineering. New York: John Wiley & Sons, 1998.

Lara-Molina, F.A.; Rosario, J.M.; Dumur, D. & Wenger, P., Generalized predictive control of parallel robots. In:Koz lowski, K. (Ed.), Robot Motion and Control 2011. Springer London, v. 422 de Lecture Notes in Control andInformation Sciences, p. 159–169, 2012.

Lobato, F.S.; Steffen Jr, V. & Silva Neto, A.J., Solution of inverse radiative transfer problems in two-layer participatingmedia with differential evolution. Inverse Problems in Science & Engineering, 18:183–195, 2010.

Moens, D. & Hanss, M., Non-probabilistic finite element analysis for parametric uncertainty treatment inappliedmechanics: Recent advances. Finite Elementsin Analysis and Design, 47(1):2011, 2011.

Moller, B. & Beer, M., Fuzzy Randomness, Uncertainty in Civil Engineering and Computational Mechanics. Springer-Verlag, 2004.

Moller, B.; Graf, W. & Beer, M., Fuzzy structutal analysis using alpha-level optimizaton. Computational Mechanics,26:547–565, 2000.

Price, K.V.; Storn, R.M. & Lampinen, J.A., Differential evolution a practical approach to global optimization. Springer-Verlag, 2005.

Puig, V.; Stancu, A. & Quevedo, J., Simulation of uncertain dynamic systems described by interval models: A survey.In: Proceedings of the 16th IFAC World Congress. v. 16, p. 207–207, 2005.

Waltz, N.P. & Hanss, M., Fuzzy arithmetical analysis of multibody systems with uncertainties. The archive ofmechanical engineering, LX(1):109–125, 2013.

Xiu, D., Numerical Methods for Stochastic Computations: A Spectral Method Approach. Princeton University Press,2010.

Zadeh, L., Fuzzy sets. Information and Control, 8:338–353, 1965.

Zadeh, L., Fuzzy sets as basis for a theory of possibility. Fuzzy Sets and Systems, 1:3–28, 1978.

Page 160: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Capítulo 12

Construção de Sistemas Multi-Classificadorespara Reconhecimento de Padrões

Antonio Carlos Gay Thomé∗ e Marco César Goldbarg

Resumo: Neste capıtulo faz-se uma avaliacao quanto ao emprego de sistemas multi-classificadores, maisespecificamente, comite de agentes neurais, aplicados a area do reconhecimento de padroes. No texto seapresenta e se faz uma analise sobre as principais estrategias usadas nas diferentes etapas da construcaode um comite. O desempenho de algumas destas estrategias, especialmente o emprego da computacaoevolutiva (algoritmos geneticos e transgeneticos) e avaliado usando-se o problema do reconhecimento decaracteres como estudo de caso.

Palavras-chave: Sistemas de multi-classificadores, Comite de agentes neurais, Construcao de comiteshomogeneos, Algoritmos evolucionarios.

Abstract: This chapter presents an assessment of the use of multi-classifiers, more specifically, neuralagents committee, applied to the area of pattern recognition. The text presents and analyzes on key strategiesused in the different stages of construction of a committee. The performance of some of these strategies,especially the use of evolutionary computation (genetic and transgenetic algorithms) is evaluated using thecharacter recognition problem as a case study.

Keywords: Multi-classifier Systems, Neural agents committee, Homogeneous committees construction,Evolutionary algorithms.

Conteúdo

1 Introducao ................................................................................................................................1462 Revisao Bibliografica - O Estado da Arte ................................................................................147

2.1 Geracao dos agentes candidatos.......................................................................................1482.2 Estrategias para composicao do comite ...........................................................................1502.3 Estrategias para tomada de decisao.................................................................................152

3 Construcao de Comites - Metodologia .....................................................................................1533.1 Particao dos dados para construcao do comite ................................................................1533.2 Estrategias para geracao e treinamento dos agentes........................................................1533.3 Estrategias para selecao e composicao do comite ............................................................1533.4 Estrategias para o modulo de decisao ..............................................................................156

4 Experimentos – Objetivos e Resultados ...................................................................................1564.1 Descricao do estudo de caso.............................................................................................1564.2 Segmentacao e extracao de descritores ............................................................................1564.3 A base de dados ...............................................................................................................1564.4 Geracao e treinamento dos agentes..................................................................................1574.5 Selecao e composicao do comite.......................................................................................158

5 Conclusoes................................................................................................................................160

∗Autor para contato: [email protected]

Lobato et al. (Ed.), (2014) DOI: 10.7436/2014.tica.12 ISBN 978-85-64619-15-9

Page 161: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

146 Thomé & Goldbarg et al.

1. Introdução

Leitores robustos sao aqueles capazes de efetuar a leitura automatica de textos contidos em imagenscom elevado grau de complexidade. O principal desafio na construcao destes leitores reside na faltade informacao com relacao ao que se deseja buscar. Via de regra e desconhecida a quantidade decaracteres contidos na imagem (ou mesmo se existem) e, adicionalmente, sao indisponıveis outrostipos de informacao que possam facilitar a busca como, por exemplo, a cor do fundo, a cor, otamanho, o estilo, a inclinacao e a posicao dos caracteres.

Imagem complexa e entendida como aquela capturada em ambiente natural nao controlado,podendo conter um numero elevado de objetos, sejam eles caracteres ou nao. A Figura 1 mostra doisexemplos de imagem complexa, a primeira e a foto de uma porta de vidro que reflete o cenario aofundo, e a segunda e a foto da traseira de um veıculo, onde surgem problemas como sombra, reflexoe inclinacao da placa e do texto.

Figura 1. Exemplos de Imagens Complexas para Leitores Robustos.

Neste capıtulo e feita uma avaliacao sobre o emprego de Agentes Neurais, reunidos em Comites,e aplicados ao problema do leitor robusto, aqui representado pela leitura dos caracteres da placa deveıculos automotores com imagens tomadas em tempo real e com o veıculo em movimento.

Comite e um paradigma de aprendizado no qual uma colecao finita de alternativas para asolucao de um dado problema e avaliada em conjunto com vistas a formular uma unica solucaopara o problema. A ideia da formacao de comites de “indivıduos” (ou agentes) que tenham umbom conhecimento sobre um determinado problema e ao mesmo tempo tenham “opinioes” em certograu distintas dos demais, foi inicialmente proposta por Hansen & Salomon (1990) nos chamadosensembles (que e a terminologia inglesa para o termo comite).

A formacao do Comite, quanto a definicao do seu tamanho e selecao dos agentes mais adequadospara compo-lo, e um problema de otimizacao onde o espaco de busca cresce exponencialmente como numero de agentes candidatos conforme a Equacao 1, onde N e o numero de Agentes Candidatos.

EB =N∑i=1

ciN = 2N − 2 (1)

Metaheurısticas, ou heurısticas modernas, fazem parte das ferramentas computacionais maiseficientes para a solucao de problemas de otimizacao, inclusive aqueles de elevada complexidade,como os problemas pertencentes as classes NP-Completos, NP-Difıceis, PSPACE, etc. Atraves deescolhas aleatorias, do uso de heurısticas e tambem de conhecimento historico sobre resultadosanteriores, estas tecnicas tentam guiar suas buscas de forma a encontrar a solucao otima ou quaseotima, com menor esforco e tempo de processamento computacional.

Dentre as estrategias de metaheurıstica, a Computacao Evolucionaria e uma das mais importantese tradicionais. Os Algoritmos Geneticos, uma das principais ferramentas da computacaoevolucionaria, contam com dezenas de milhares de trabalhos publicados. Outras abordagensemergentes como Colonia de Formigas; Busca em Vizinhanca Variavel; Nuvens de Partıculas; GRASPe Busca Tabu, igualmente contabilizam notavel sucesso na aproximacao ou mesmo na solucao deproblemas de otimizacao de alta complexidade.

A Transgenetica Computacional e uma das estrategias de metaheurıstica mais recentementepropostas na literatura (Goldbarg & Gouvea, 2000). Trata-se de uma metafora evolucionariabaseada na evolucao endossimbiotica intracelular mutualista. A endossimbiose significa uma relacaosimbiotica em que uma especie, dita hospedeira, abriga no interior de seu corpo ou de suas celulasuma segunda especie dita endossimbionte.

Page 162: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Construção de sistemas multi-classificadores para reconhecimento de padrões 147

2. Revisão Bibliográfica - O Estado da Arte

O reconhecimento de caracteres e uma das varias aplicacoes em reconhecimento de padroes. Duasterminologias sao comumente empregadas para classificar os sistemas capazes de efetuar a leituraautomatica de caracteres e de textos escritos a maquina ou manuscritos, em letra de forma ou cursivo.O termo mais antigo e OCR, um acronimo para Optical Character Recognition, o segundo e ICR,um acronimo para Intelligent Character Recognition.

ICR e um termo mais recente, que surgiu com a finalidade de distinguir o OCR quando voltadopara a leitura de caracteres manuscritos, que apresenta desafios muito maiores e mais complexos doque os encontrados na leitura de caracteres impressos.

As pesquisas atuais tem colocado foco na leitura de caracteres e textos, geralmente no formatoimpresso, porem estampado em imagens reais e complexas. Nestes casos existem novas dificuldadestais como reflexos, sombra, inclinacao do texto, diferentes fontes, tamanhos, cores e espacamentos,alem da presenca de muitos outros objetos na cena da imagem que nao sao caracteres. Esta novafrente de pesquisa tem sido caracterizada como Leitores Robustos (Chen et al., 2001; Fabrizio et al.,2009; S. A. R. Jafri, 2008; Jung et al., 2004; Lebourgeis, 1997; Sosa et al., 2003; Lucas, 2005; Lucaset al., 2005).

Basicamente um Leitor Robusto divide o processo de leitura em tres etapas principais: a)aquisicao da imagem (estımulo visual); b) tratamento da imagem e segmentacao dos objetosexistentes (percepcao dos objetos que compoem o cenario da imagem) e; c) reconhecimento ouleitura dos caracteres (identificacao e interpretacao do texto).

Aquisicao e a etapa responsavel por capturar a percepcao visual do ambiente e transforma-laem dados de forma a serem armazenados e interpretados em um computador. Isso pode ser feitoatraves de fotografia ou de vıdeo. A segmentacao dos caracteres e uma das principais etapas egeralmente a mais complexa, pois e a que trata da localizacao e extracao dos objetos de interesse.O seu desempenho afeta fortemente todas as etapas posteriores. E nessa etapa que o Leitor extraida imagem os descritores para representar os objetos segmentados.

A terceira grande etapa de um Leitor e o reconhecimento, responsavel por identificar e darsignificado aos vetores de descritores recebidos da etapa de segmentacao. Tecnicas de aprendizadode maquina e de casamento de padroes sao utilizadas para modelar e construir a maquina dereconhecimento. Nessa etapa espera-se que o caractere chegue da forma mais uniforme possıvel,para que seu tamanho, localizacao e inclinacao nao atrapalhem o processo de reconhecimento.

Sistemas de Multiplos Classificadores - SMCs, do tipo comite, tem sido amplamente utilizadospara resolver os mais variados problemas uma vez que, em geral, apresentam melhor desempenhoque o apresentado pelos classificadores usados como base para formar estes sistemas. Para queisto ocorra, porem, e necessario que os classificadores usados como base sejam tao precisos quantodiversos entre si, conhecido como o dilema da diversidade × acuracia.

Segundo Kittler et al. (1997, 1998); Xu et al. (1992), evidencias teoricas e experimentais indicamque os SMCs sao potencialmente mais precisos que classificadores individuais. Isto se verificaespecialmente quando os classificadores que compoem o sistema sao complementares, no sentidode que seus erros ocorrem em regioes distintas do espaco de atributos (Opitz, 1999).

Sistemas de classificadores que fazem uso de Multiplas Redes Neurais - MRN (Breiman, 1999; Cho& Kim, 1995; Silva, 2006; Ueda, 2000; Opitz & Maclin, 1999; Liu et al., 2003; Drucker, 1999) buscamaumentar o desempenho da classificacao, ou pelo menos reduzir a variancia inerente ao processo detreinamento, combinando redes neurais que sejam potencialmente complementares.

A construcao de um SMC consiste basicamente de um processo composto por tres etapas:

• Etapa 1 – Treinamento e Geracao dos Agentes: Consiste na geracao e treinamento dosagentes que serao os candidatos a compor o sistema. Nesta etapa deve-se buscar um ponto deequilıbrio entre a acuracia de cada agente e a diversidade dele com os demais. Este equilıbrioe fundamental para que se consiga montar um SMC capaz de suprir as falhas de cada agenteindividualmente.

• Etapa 2 – Selecao dos Agentes e Composicao do Comite Ideal: A formacao do SMCe uma etapa importante e algumas questoes ainda carecem de respostas conclusivas, como porexemplo:a) Qual o tamanho ideal do SMC?b) Qual o nıvel de acuracia individual e o grau de diversidade do conjunto para que aumenteas chances de se formar bons sistemas?c) Como encontrar a melhor composicao?d) Como estimar a capacidade de generalizacao das melhores composicoes?

Page 163: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

148 Thomé & Goldbarg et al.

• Etapa 3 – Construcao do Modulo de Tomada de Decisao: Consiste na forma de integrara saıda de cada agente componente do sistema e gerar a saıda que melhor aproxime o comitedo seu potencial teorico (ou Oraculo).

2.1 Geração dos agentes candidatos

Apesar da intensa investigacao realizada nestas ultimas decadas, ainda nao ha um consenso dacomunidade cientıfica sobre metricas nem metodos para se gerar um bom grupo de agentes candidatosque, uma vez reunidos, possam prover sensıveis ganhos de desempenho e generalizacao na solucaodo problema em questao.

2.1.1 O dilema da acurácia × diversidadeKuncheva & Whitaker (2001) mencionam que o problema da dependencia e da independencia entreas respostas providas por diferentes agentes tem levado a inumeros debates e ao surgimento dealguns conceitos como diversidade, complementaridade e ortogonalidade, entre outros. Diz tambemnao haver ainda um consenso sobre o real significado destes novos conceitos dentro de uma percepcaointuitiva. Em outro artigo Kuncheva & Whitaker (2003) alegam que embora o conceito de diversidadeseja importante, sua medicao nao e simples, nao ha consenso e tambem ainda nao se conseguiuconstatar sua real relevancia e correlacao com o desempenho final do comite.

Tang et al. (2006) voltam a falar sobre a falta de consenso sobre as formas de medir diversidadee tambem sobre sua real relevancia na formacao de bons comites. Eles concluem, com base emexperimentos realizados, que os resultados foram confusos e que as metricas avaliadas pareceramineficazes e introduzem um novo conceito que denominam de margem.

Um dos artigos mais recentes abordando o dilema acuracia x diversidade, e escrito por Brown &Kuncheva (2010) onde eles investigam o assunto e sugerem que nem toda diversidade e favoravel aoganho de desempenho. Segundo eles ha diversidades boas e ruins.

O conceito de diversidade entre dois agentes e simples e intuitivo. Representa o grau de naosimilaridade dos erros cometidos pelos mesmos e sua medida deve se aproximar de zero quanto maissimilar forem os erros. Intuitivamente a diversidade esta diretamente relacionada com a melhoriade desempenho do grupo uma vez que eles errem sobre amostras distintas. A dificuldade reside naforma de medir a diversidade nao entre pares de agentes, mas do conjunto como um todo, e avaliarsua relevancia frente a acuracia destes mesmos agentes.

2.1.2 Métricas para medida de diversidadeExiste hoje na literatura um vasto conjunto de metricas propostas para medir a diversidade tantopar-a-par como de grupos de agentes. A seguir sao apresentadas algumas destas metricas.

a) Q-Statistic (Kuncheva & Whitaker, 2003)

Qij =N11N00 −N01N10

N11N00 +N01N10(2)

QL =2

L(L− 1)

L−1∑i=1

L∑j=i+1

Qij (3)

onde Qij representa a diversidade entre os agentes i e j e QL a diversidade media de um conjuntode L classificadores. N11 e o total de amostras corretamente classificadas pelos dois agentes, N00,o total em que ambos erraram, N01 e N10, respectivamente, o numero de amostras que um errou eoutro acertou. O valor de Q varia entre [-1, +1]. Q e positivo quando os agentes tendem a errar asmesmas amostras e negativo quando sao mais diversos.

b) Disagreement (Kuncheva & Whitaker, 2003)

Dij =N10 +N01

N11 +N10 +N01 +N10(4)

O valor de Dij varia entre [0, 1], zero quando nao ha discordancia e um quando esta discordanciae maxima.

c) Descorrelacao (Lima, 2004)

dsij = 1 −∣∣∣ σijσiσj

∣∣∣ (5)

Page 164: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Construção de sistemas multi-classificadores para reconhecimento de padrões 149

onde:

σi =

√√√√ 1

N − 1

N∑k=1

(fi(xk) − fi)2 (6)

σij =1

N − 1

N∑k=1

(fi(xk) − fi)(fj(xk) − fj) (7)

O numero de amostras e dado por N , fi(xk) e a resposta do agente i para a amostra k e fie a media das respostas produzidas pelo agente i. A medida de descorrelacao dsij excursiona nointervalo [0,1]. A diversidade aumenta na medida em que dsij aumenta.

2.1.3 Conceito e métricas para o cálculo da margemSchapire e Freund em 1998 introduzem o conceito de margem com o proposito de explicar o sucessoda estrategia introduzida pelo algoritmo Boosting (Schapire et al., 1998), principalmente em relacaoa estrategia Bagging. Tang e outros tambem exploram o conceito de margem no artigo escrito em2006 (Tang et al., 2006).

Segundo Schapire (Schapire et al., 1998), o erro do comite sobre o conjunto de treino nao esuficiente para prever o desempenho sobre o conjunto de testes. Com o objetivo de considerar o graude confianca do comite eles criaram o conceito de margem como sendo a diferenca entre os votoscorretos e os votos errados para uma determinada amostra (considerando a tomada de decisao porvoto majoritario).

mi =1

L(

∑j∈C/yj=Ti

1 −∑

j∈C/yj 6=Ti

1) (8)

onde Ti e a resposta esperada para a amostra xi e yj e a saıda do j-esimo agente do comite compostopor L agentes.

Caso os votos sejam ponderados por pesos wi, a margem e calculada pela Equacao 9.

mi =1

L

∑j∈C/yj=Ti

wj −maxj∈C/yj 6=Ti(wj) (9)

O valor de mi varia entre [-1, +1] e a saıda do comite e considerada correta somente se este formaior do que zero.

2.1.4 Geração de agentes acurados e diversos entre siGerar agentes que apresentem um bom desempenho individual e que formem um conjunto diversoe, sem duvida, o principal objetivo. Existem diversas estrategias sugeridas na literatura, porem asmais antigas e mais conhecidas sao Bagging e Boosting.

Bagging (Bootstrap aggregating) foi proposto por Breiman (1996), baseado na amostragem porbootstrap proposta por Efron & Tibshirani (1993). Nesta abordagem sao gerados varios conjuntos detreino usando amostragem uniforme, com reposicao, do conjunto original de dados. Cada conjuntogerado e usado para treinar um unico agente. E esperado que as diferencas dos conjuntos de treinoproduzam diversidade entre os agentes.

Boosting foi proposto por Schapire et al. (1990) e aperfeicoado por Freund (1995); Freund& Schapire (1995, 1996). Nesta abordagem, os diferentes conjuntos de treino sao gerados poramostragem uniforme sem reposicao. A probabilidade de escolha de uma amostra depende dasua contribuicao para o erro dos agentes ja treinados, isto e, caso uma amostra nao tenha sidocorretamente classificada por eles, sua probabilidade de escolha aumenta em relacao as demais.

Segundo Drucker et al. (1994) varios estudos sustentam a eficacia deste algoritmo, porem, em1996, Freund & Schapire (1996) propoem uma das atualmente mais utilizadas versoes do algoritmoboosting, que denominaram Adaboost (Adaptive Boosting), em que os conjuntos de treino saoamostrados de forma adaptativa, de tal modo que as amostras que mais contribuem para o errodos agentes ja treinados tem maior probabilidade de compor o conjunto montado para o proximoagente a ser treinado.

Canuto et al. (2011, 2012) investiram numa outra direcao a fim de criar agentes com bom nıvelde acuracia e tambem de diversidade. A estrategia consiste em identificar e selecionar subconjuntos

Page 165: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

150 Thomé & Goldbarg et al.

do espaco de caracterısticas que proporcionem o treinamento de agentes com maior capacidade derotular diferentes classes. Desta forma, em tese, cada agente e treinado com um conjunto distinto decaracterısticas e se torna mais especializado em rotular um subconjunto das classes que compoem oproblema.

2.2 Estratégias para composição do comitê

Com os agentes candidatos ja treinados, a etapa seguinte e escolher os que agregam mais sinergiapara formar um grupo que apresente melhor desempenho que o melhor dos agentes individualmente.Segundo Zhou et al. (2002) a simples inclusao de todos os candidatos no comite geralmente nao euma boa opcao.

2.2.1 Construtiva sem exploraçãoInicialmente todos os agentes candidatos sao ordenados com base no desempenho individual sobre umnovo conjunto de dados nao utilizado para o treinamento. Uma vez ordenados, o melhor candidato eselecionado para compor o comite e, a partir do segundo, o criterio de insercao restringe a aceitacaose o agente contribuir para a melhoria de desempenho do comite. O metodo segue ate o ultimocandidato e ao final tera testado L− 1 possıveis insercoes.

2.2.2 Construtiva com exploraçãoSelecionado o candidato com melhor desempenho, todos, a partir do segundo sao testados 1 a 1 eaquele que apresentar o melhor resultado e selecionado. Este e inserido no comite e a busca reiniciana tentativa de incluir um terceiro candidato e segue assim ate o ultimo candidato ou encerra quandonenhum dos candidatos restantes melhora o desempenho do comite.

2.2.3 Poda sem exploraçãoE semelhante a Construtiva sem Exploracao, porem no sentido inverso. Inicialmente todos oscandidatos fazem parte do comite e vai-se tentando excluı-los a partir do candidato de menordesempenho.

2.2.4 Poda com exploraçãoSegue a linha da Poda sem Exploracao, porem com o comportamento similar a Construtiva comExploracao. Na primeira rodada, de baixo para cima, retira-se o candidato que possibilita um maiorganho de desempenho ao comite. As rodadas se sucedem ate que o desempenho do comite reduza enao mais aumente.

2.2.5 Algoritmos genéticosPertencem a classe dos algoritmos evolutivos que usam tecnicas inspiradas em hereditariedade,mutacao, selecao natural e recombinacao. Sao simulados a partir de uma populacao contendorepresentacoes abstratas da solucao do problema (indivıduos) que e criada e submetida a um processoevolutivo em busca da solucao otima. A evolucao ocorre por meio de geracoes e a adaptacao dosdiferentes indivıduos e avaliada, a cada geracao, atraves de um criterio de merito pre-estabelecido(funcao de fitness). Os indivıduos selecionados para formar a nova populacao sao submetidos a umprocesso de recombinacao ou de mutacao. Este processo e cıclico ate que um criterio de parada sejasatisfeito e o indivıduo melhor adaptado da geracao final e escolhido como solucao do problema.

A funcao-objetivo (fitness) e o objeto de otimizacao e o processo de selecao e outra parte chavedo algoritmo. O algoritmo de selecao por “roleta” e o mais usado, onde os indivıduos sao ordenadosde acordo com sua adaptacao a funcao-objetivo e recebem probabilidades decrescentes de seremescolhidos. A escolha e feita aleatoriamente de acordo com essas probabilidades. Com a roleta epossıvel escolher como pais os indivıduos mais bem adaptados, sem deixar de lado a diversidade dosmenos adaptados.

A reproducao e tradicionalmente dividida em tres etapas: acasalamento, recombinacao e mutacao.O acasalamento e a escolha de dois indivıduos para se reproduzirem. A recombinacao (oucruzamento) imita o processo biologico da reproducao sexuada onde os descendentes recebem emseu codigo genetico parte do codigo genetico dos pais. A recombinacao garante que os melhoresindivıduos sejam capazes de trocar entre si as informacoes que os leva a ser mais apto a sobrevivere, assim, gerar descendentes ainda mais aptos. Por ultimo as mutacoes sao feitas com probabilidade

Page 166: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Construção de sistemas multi-classificadores para reconhecimento de padrões 151

mais baixa que os cruzamentos e tem como objetivo permitir uma maior diversidade genetica napopulacao, impedindo que a busca fique estagnada em um mınimo local.

2.2.6 Algoritmos transgenéticosSegundo Goldbarg & Goldbarg (2009), a Transgenetica e uma metafora evolucionaria que tomapor base a evolucao endossimbiotica mutualista. Endossimbiose e uma relacao ecologica, onde umorganismo (o endossimbionte) vive dentro do corpo ou das celulas de outro organismo (o hospedeiro).Quando a endossimbiose beneficia ambos os organismos ela e dita mutualista. Nesta forma deassociacao, cada organismo e um ser independente e possui DNA proprio.

A Evolucao Endossimbiotica Serial e basicamente uma teoria para a endossimbiose intracelularmutualista, onde o processo evolucionario apresenta um conjunto peculiar de caracterısticas sobreas quais se fundamenta a mimetizacao evolucionaria dos algoritmos transgeneticos (Goldbarg et al.,2009): a) Saltos evolucionarios podem ocorrer na evolucao natural com a formacao de organismoshıbridos, compostos pela reuniao de uma ou mais celulas independentes e possuidoras de materialgenetico proprio (Gould et al., 2008); b) A evolucao biologica, tal como conhecida, aproveita todasas informacoes geneticas que foram acumuladas em processos evolucionarios anteriores. A evolucaoe um processo de bricolagem criativa, nao de invencao (Jacob, 1977); c) A formacao de uma quimeraimplica na condicao de um organismo vivendo dentro de outro. O organismo maior ou externo edenominado de hospedeiro e o menor de endossimbionte. Assim, o hospedeiro tende a direcionar aevolucao do endossimbionte que habita seu citoplasma. O direcionamento implica em um processode reducao do genoma do endossimbionte a sua expressao mınima necessaria a manutencao desuas habilidades peculiares. Funcoes redundantes sao eliminadas e transferidas para o hospedeiro(Kuwaha et al., 2008). Esse processo de modulacao metabolica e tambem denominado de absorcaodos endossimbiontes (Wernegreen, 2005) e ; d) As trocas de informacoes geneticas entre hospedeiroe endossimbiontes utilizam os mecanismos naturais de transferencia lateral de genes, eventualmentecom algumas modificacoes peculiares e verificadas somente no caso da endossimbiose (W, 1999).

Os tres elementos fundamentais da metafora transgenetica computacional sao: 1) A evolucaoocorre atraves de transformacoes geneticas no interior de uma celula hospedeira que foi invadidaou fagocitou outras unidades vivas. Esta premissa postula que a evolucao transgenetica ocorreno interior de um pequeno ecossistema que recicla e transforma seu repositorio genetico. Nestetrabalho o Hospedeiro mimetiza o eucariota Paramecium Aurelia. Os endossimbiontes mimetizamos procariotas Kappa. A Figura 2 representa graficamente este processo de mimetizacao; 2)A evolucao da quimera, formada pelo hospedeiro e endossimbiontes, ocorre de forma guiada einfluenciada pelo DNA do hospedeiro. As solucoes do problema modelado sao representadas atravesdos endossimbiontes. A populacao inicial de endossimbiontes pode ser formada atraves de estrategiassemelhantes as empregadas para a formacao da populacao inicial dos algoritmos geneticos. Ohospedeiro, todavia, pode possuir informacoes obtidas a priori. A obtencao de informacoes a priorinao e condicao indispensavel para o funcionamento da metaheurıstica, todavia, contrariamente aoparadigma classico, representa o melhor alinhamento para a mimetizacao proposta. O hospedeirocoleciona as melhores informacoes obtidas ao longo da evolucao artificial, que representam oconhecimento adquirido a posteriori e; 3) O processo de troca de informacoes geneticas necessarioa evolucao e realizado exclusivamente atraves de mecanismos de transferencia horizontal de genes.A transgenetica preve o emprego de vetores (ou operadores) que mimetizam os processos naturaisde transferencia horizontal de genes. Os vetores da transgenetica mais usuais sao os plasmıdeos, ostransposons e os plasmıdeos recombinados. O processo evolucionario e realimentado na medida emque emergem novas e melhores solucoes na populacao de endossimbiontes.

O esquema transgenetico pressupoe a existencia de tres contextos: 1) Uma populacao decromossomos ou endossimbiontes (representando cada um uma solucao candidata do problema).2) Um hospedeiro que possui informacoes capazes de influenciar a evolucao da populacao decromossomos endossimbiontes. 3) Uma populacao de vetores transgeneticos que transportainformacao do hospedeiro para os cromossomos endossimbiontes, alterando seus codigos geneticose, por consequencia, promovendo as variacoes necessarias ao processo de busca. A populacao devetores e volatil, podendo ser criados, preservados ou destruıdos livremente ao longo do processoevolucionario. A populacao de vetores tambem nao necessita possuir tamanho constante, permitindo-se que diferentes tipos de vetores atuem em diferentes fases da evolucao. Os vetores tıpicos sao oplasmıdeo, o plasmıdeo recombinado, o vırus e o transposon.

As informacoes geneticas residentes e preservadas no hospedeiro podem ser do tipo a priori,obtidas a partir de algum conhecimento previo sobre o problema, e a posteriori, que emergemdurante o processo evolutivo.

Page 167: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

152 Thomé & Goldbarg et al.

Figura 2. A mimetizacao da transgenetica computacional. Fonte: (Goldbarg & Goldbarg, 2009).

Segundo a simbologia adotada, todo vetor transgenetico consiste de uma 3-Upla dada por: λ =(I,Φλ,∆lambda), onde I e a informacao transportada, Φλ e o metodo atraves do qual o vetor λmanipula o cromossomo alvo e ∆lambda e o metodo utilizado pelo vetor λ para obter a informacaoI. Importante ressaltar que um vetor nao realiza uma manipulacao em qualquer cromossomo semantes avaliar a viabilidade da acao. Esta sondagem preliminar e denominada ataque.

Os transposons sao exclusivamente dedicados a adaptacao individual do codigo genetico dosendossimbiontes. Os plasmıdeos e os vırus sao plataformas exclusivamente dedicadas a troca deinformacoes entre hospedeiro e os endossimbiontes.

2.2.7 Sem seleçãoTodos os candidatos treinados fazem parte do comite.

2.3 Estratégias para tomada de decisão

O modulo de decisao consiste da estrategia adotada para sintetizar as diferentes respostas dos agentesselecionados para comporem o comite em uma unica resposta. Diversas sao as estrategias sugeridasna literatura, onde algumas sao descritas a seguir.

2.3.1 Média simplesA resposta do comite e gerada pelo computo da media simples das saıdas de todos os agentes que ocompoe:

Y k =1

L

L∑k=1

yki (10)

onde L e o numero de agentes que compoe o comite, yki e a resposta do agente i a k-esima amostrade entrada e Y k e a resposta do comite para a respectiva amostra.

2.3.2 Média ponderada sem biasOs pesos sao calculados com base na minimizacao do erro gerado pelo comite sobre o conjunto detreino do comite.

Y k =1

L

L∑k=1

wki yki (11)

onde L e o numero de agentes do comite, Y k e a resposta do comite a k-esima amos-tra, yki e aresposta do agente i a k-esima amostra de entrada e wki e o peso atribuıdo a cada agente no tocantea k-esima amostra. Os pesos de ponderacao sao calculados de forma a minimizar o erro do comite.

2.3.3 Média ponderada com biasUm termo independente wk0 e adicionado ao calculo com yk0 = 1.

Page 168: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Construção de sistemas multi-classificadores para reconhecimento de padrões 153

Y k =1

L

L∑k=0

wki yki (12)

O calculo de wk e igual ao da media ponderada sem bias.

2.3.4 Voto majoritárioA resposta do comite e igual a saıda que for fornecida pelo maior numero de classificadores (maioria

simples). E importante observar que nesta estrategia, para espacos de solucao maiores que binario,pode haver casos em que o comite nao gere resposta, uma vez que e possıvel nao se caracterizar umamaioria.

3. Construção de Comitês - Metodologia

Nesta secao faz-se uma descricao da avaliacao realizada sobre cada uma das etapas previamentecitadas considerando que: a) a arquitetura escolhida para o sistema e a paralela (comite); b) acomposicao do sistema e homogenea, sendo formado exclusivamente por agentes neurais do tipoMLP.

3.1 Partição dos dados para construção do comitê

Idealmente se particiona o conjunto de amostras existentes em pelo menos 03 conjuntos comas seguintes finalidades: a) Conjunto de treinamento dos agentes individuais - para gerar osclassificadores a serem candidatos ao comite; b) Conjunto de treinamento do comite - para avaliar acapacidade de generalizacao dos agentes e montar o comite; e c) Conjunto de teste do comite - paraavaliar a capacidade de generalizacao comite.

3.2 Estratégias para geração e treinamento dos agentes

Neste trabalho optou-se por fazer uso e avaliar comparativamente apenas as estrategias que buscamprover uma maior diversidade entre os agentes atraves do emprego de: 1) diferentes conjuntos dedados para treinamento; 2) diferentes configuracoes para as redes MLP; 3) diferentes pontos departida (conjunto de pesos) para inıcio do treinamento e 4) diferente numero de ciclos para treino.Para a geracao de diferentes conjuntos de treino foram comparadas as estrategias Bagging e Adaboost.

Com o objetivo de prover uma base consistente para analise, foram gerados 10 diferentes conjuntosnos quais se variou a composicao dos mesmos, entre 30 e 100 agentes candidatos.

3.3 Estratégias para seleção e composição do comitê

O objetivo principal foi avaliar, comparativamente, algumas heurısticas existentes na literaturacom propostas de solucao via emprego da computacao evolutiva. Foram avaliadas as seguintesestrategias: a) Construtiva sem Exploracao (CS); b) Construtiva com Exploracao (CC); c) Evolutivavia Algoritmo Genetico; e d) Evolutiva via Algoritmo Transgenetico.

3.3.1 Seleção por algoritmo genéticoPara que cada indivıduo da populacao possa representar uma solucao completa do problema, i.e.,definir o tamanho do comite e tambem apontar os agentes selecionados para sua composicao,foi adotada uma representacao binaria para o cromossomo. A dimensao do cromossomo tem otamanho da populacao de agentes candidatos e cada gene representa um agente. O valor “1” dogene representa a selecao do agente. A Figura 3 exemplifica um cromossomo tıpico que contem asseguintes informacoes: a) o numero de agentes candidatos e 10; b) o comite e composto por 4 agentese; c) os agentes selecionados para comporem o comite sao [1, 4, 5 e 8].

Figura 3. Estrutura do cromossomo.

A populacao e composta por 100 indivıduos e a funcao de merito (fitness) e o desempenhoalcancado pelo comite e expressado pelo numero de erros cometidos na rotulacao dos caracteres.Osoperadores usados foram os mais conhecidos: cruzamento e mutacao.

Page 169: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

154 Thomé & Goldbarg et al.

O criterio de parada usado foi exclusivamente o numero de ciclos de evolucao e, a cada geracao,uma elite de 10% da populacao foi preservada. Com vistas a pressionar para que a populacao evoluıssecom qualidade nas diferentes geracoes, adotou-se como criterio que filhos resultantes dos cruzamentosso seriam aceitos se apresentassem desempenho igual ou melhor que os pais. As sucessivas iteracoesdo algoritmo genetico seguem os seguintes passos:

Passo 1 - Geracao da populacao inicialDepois de varios experimentos observou-se que a melhor estrategia para gerar a populacao inicial naoera completamente aleatoria, mas sim forcar uma aleatoriedade que privilegiasse solucoes (comites)que fossem compostas por um numero reduzido de agentes. Assim, dividiu-se o processo de geracaoem tres faixas, cada uma composta por 1

3 da populacao total: na primeira faixa os genes foram

gerados com 34 de probabilidade de ter valor “0” (nao inclusao do respectivo agente); na segunda

faixa esta taxa muda para 35 e na terceira para 1

2 .Passo 2 - Acasalamento

A selecao dos pares de indivıduos para reproducao (recombinacao) e feita com uso da “roleta”montada com base no nıvel de adaptacao dos indivıduos da populacao corrente. Adotou-se umpercentual de 70% da populacao corrente para ser considerada apta a reproduzir.

Passo 3 - ReproducaoCada par de indivıduos selecionados para acasalamento e submetido ao processo de recombinacaopodendo gerar 01, 02 ou 06 filhos dependendo do metodo de recombinacao usado, que poderia serum dos seguintes: a) recombinacao uniforme, gerando apenas 01 filho, que herda aleatoriamente dospais, com 50% de probabilidade, cada um dos seus genes; b) recombinacao por partes com ponteirounico, gerando 02 filhos, formados cada um de uma sequencia de genes de um dos pais e a sequenciarestante do outro pai; c) recombinacao por partes com duplo ponteiro, gerando 06 filhos, formadoscada um por diferentes sequencias de genes de cada um dos pais.Os filhos gerados sao avaliados e somente aqueles que apresentarem nıvel de adaptacao igual oumelhor que o mais adaptado dos pais e preservado para participar do processo de selecao da novageracao. Observou-se que a recombinacao uniforme, pelo menos para este estudo de caso, apresentoumelhor eficacia que as outras duas, alem de ser mais rapida.

Passo 4 - MutacaoA mutacao consiste em trocar a polaridade dos genes, i.e., mudando o gene de “1” para “0” e vice-versa. A taxa de selecao de indivıduos para mutacao foi fixada em 5% da populacao corrente e a taxade mutacao de cada indivıduo foi fixada em ate 10% do numero de genes (3 no caso da populacaoser formada por indivıduos que representem 30 agentes candidatos).Uma vez que o algoritmo, com os parametros adotados, apresentava uma rapida convergencia e aseguir uma estagnacao evolutiva, adotou-se provocar um choque de mutacao sempre que um perıodode estagnacao fosse detectado. O choque de mutacao consiste em aumentar a taxa de selecao deindivıduos de 5% para 50% e a taxa de mutacao de 10% para 50%. O choque dura apenas 01 geracaoe os resultados foram bastante positivos.

Passo 5 - Selecao da Nova GeracaoA selecao dos indivıduos para a proxima geracao e feita com base em regras e no criterio unico deadaptacao (acuracia do comite) da seguinte forma: a) uma elite de 10% e extraıda da populacaocorrente; b) todos os indivıduos que sofreram mutacao; e c) selecao do restante da populacao pelocriterio da “roleta” sobre o universo composto pelos filhos gerados por recombinacao e dos indivıduosrestantes da populacao corrente.

Passo 6 - Criterio de ParadaAdotou-se como criterio unico o numero de geracoes igual a 100. Caso nao satisfeita, retorna aopasso 2.

3.3.2 Seleção por algoritmo transgenéticoO contexto transgenetico foi criado similar ao do genetico para que se pudesse comparar as vantagense desvantagens de cada um. O endossimbionte e um vetor de dimensao variavel, onde cada genecontem o rotulo de um agente candidato. Ao final da cadeia genetica de cada um sao acrescidas03 informacoes que sintetizam o nıvel de adaptacao daquele endossimbionte segundo os criterios deacuracia, diversidade e margem.

O hospedeiro possui inicialmente 04 informacoes geneticas adquiridas a priori, onde 03 delassao baseadas na ordem de acuracia dos agentes candidatos e uma na ordem de diversidade par-a-par. No decorrer das iteracoes do algoritmo estas informacoes podem ser substituıdas ou somadas ainformacoes adquiridas a posteriori. Adotou-se empiricamente, limitar em 11 o numero maximo deinformacoes geneticas mantidas no hospedeiro.

Page 170: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Construção de sistemas multi-classificadores para reconhecimento de padrões 155

Como vetores transgeneticos foram criados um plasmıdeo, um transposon e um plasmıdeorecombinado. Cada vetor, antes de aplicar sua manipulacao genetica, realiza um ataque para verificara validade (eficacia) da sua acao e a aplica somente se o resultado do ataque for positivo. A selecaodo vetor a ser aplicado e feita segundo o esquema da evolucao pontuada e, uma vez selecionado, ovetor ataca toda a populacao. O esquema de evolucao pontuada que apresentou melhores resultadosquanto a convergencia do algoritmo, foi um que alterna as participacoes conforme a Figura 4.

Figura 4. Evolucao pontuada adotada nos experimentos com AT.

O plasmıdeo e encarregado de transmitir informacoes geneticas do hospedeiro para osendossimbiontes e sua operacao ocorre sobre toda a populacao da seguinte forma: 1o)Seleciona, aleatoriamente, uma dentre as cadeias geneticas residentes no hospedeiro; 2o) Seleciona,aleatoriamente, o ponto inicial e o numero de genes a serem transmitidos; 3o) Seleciona,aleatoriamente, o tipo de manipulacao genetica a realizar: a) insercao da cadeia genetica ou b)substituicao; 4o) Se substituicao, para cada endossimbionte seleciona, aleatoriamente, os genes aserem substituıdos; 5o) Conclui o ataque (avalia quanto a acuracia, diversidade e margem) e verificase a manipulacao e viavel e; 6o) Se viavel efetua a manipulacao, caso contrario descarta.

O plasmıdeo recombinado e um agente que ao ser acionado gera dinamicamente o codigo geneticoa ser transmitido e, uma vez gerado o codigo, opera de forma igual ao vetor plasmıdeo. A geracaodinamica do codigo genetico a ser transmitido foi construıda da seguinte forma: 1o) Seleciona,aleatoriamente, o tamanho do codigo a ser gerado (mınimo de 02 e maximo de 50% do numero deagentes candidatos); 2o)Seleciona, aleatoriamente, o ponto inicial (estado de partida da maquinaexecutora do processo de geracao) a partir do qual serao gerados os genes a serem transmitidos;3o)Seleciona, aleatoriamente, o processo a ser usado na geracao do codigo genetico (fez-se uso de 03processos distintos); 4o)Se processo 1, toma o agente selecionado em 2 (considerando o conjunto deagentes candidatos ordenados em ordem decrescente de acuracia) como primeiro gene selecionado erealiza o metodo construtivo sem exploracao ate completar o numero requerido de genes ou pararpelo criterio do metodo; 5o)Se processo 2, extrai os genes de uma lista ordenada pela diversidade par-a-par comecando pelo ponto inicial selecionado em 2; 6o)Se processo 3, a partir do agente selecionadoem 2 (considerando o conjunto de agentes candidatos ordenados em ordem decrescente de acuracia)busca completar a cadeia genetica requerida com novos genes que proporcionem um aumento damargem.

O transposon opera da seguinte forma: 1o) Seleciona, aleatoriamente, o tamanho do codigogenetico a ser manipulado; 2o) Seleciona o tipo de operacao: insercao, substituicao ou extracao;3o) Se insercao ou substituicao, seleciona aleatoriamente os genes a serem incluıdos ou substituıdostomando por base todo o conjunto de agentes candidatos; 4o) Realiza o ataque a cada endossimbiontee executa a manipulacao se viavel.

Cada iteracao do algoritmo termina com a atualizacao a posteriori das informacoes residentes nohospedeiro.

Numa rapida analise sobre a media dos resultados alcancados com as duas estrategias (AG e AT),observou-se que: a) as duas praticamente convergem para solucoes com a mesma acuracia; b) o AGconverge para a solucao mais rapidamente que o AT; c) a populacao do AT mantem-se mais diversaque a populacao do AG, na qual a maioria dos indivıduos tende a ser de clones da melhor solucao

Page 171: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

156 Thomé & Goldbarg et al.

alcancada; e d) o codigo do AG e muito mais simples e o custo computacional e bem menor que odo AT.

3.4 Estratégias para o módulo de decisão

No trabalho reportado neste capıtulo, a analise restringiu-se as seguintes estrategias: voto majoritariopor maioria simples; media simples e media ponderada sem bias.

4. Experimentos – Objetivos e Resultados

4.1 Descrição do estudo de caso

O problema abordado como estudo de caso e o da construcao de um leitor robusto capaz de reconheceros caracteres da placa de um veıculo em movimento. Esta aplicacao e bastante complexa, naoso porque envolve varias etapas de processamento que antecedem o reconhecimento, mas tambemporque as imagens geralmente apresentam caracterısticas bastante distintas para uma mesma classede letras. Esta distincao provem das proprias imagens que nao se parecem, das condicoes ambientaisdo local e da hora em que as mesmas foram capturadas. A Figura 5 exemplifica algumas diferencasvisıveis entre duas imagens tomadas de veıculos distintos e em diferentes condicoes de iluminacao.

Uma vez obtida a imagem do veıculo, o leitor precisa: a) localizar a placa extraindo-a do restanteda imagem; b) segmentar a placa separando os caracteres que a compoem; c) extrair descritores dosobjetos segmentados; d) reconhecer cada caractere e; e) validar o caractere.

Figura 5. Imagens capturadas em rodovias com limite de velocidade de 80 Km/h.

4.2 Segmentação e extração de descritores

A localizacao da placa e feita atraves de um processo de filtragem focando a identificacao debordas com orientacao vertical. Os descritores sao obtidos pela extracao de momentos estatısticosbidimensionais (de 1a, 2a, 3a, e 4a ordens) de cada uma das 7 janelas adaptativas (3 verticais e4 horizontais), que sao projetadas, com superposicao, sobre a imagem do caractere. O vetor dedescritores tem dimensao original de 84 reduzida para 51 com o uso do algoritmo PCA - PrincipalComponent Analysis. A figura 6 mostra a imagem de um caractere e o janelamento usado paraextracao dos momentos bidimensionais.

Figura 6. Imagem de um caractere inserido em um quadrado de16 x 16 pixels e janelamento adaptativo com superposicao.

4.3 A base de dados

Sao duas, uma de dıgitos com 6.057 caracteres e outra de letras com 14.992 caracteres. Cada dıgitoou letra e representado por um vetor de caracterısticas com 51 atributos (momentos estatısticosbidimensionais). Os experimentos aqui reportados envolvem o uso apenas da base de dıgitos dividida,aleatoriamente, em 03 conjuntos: a) de treinamento dos agentes – (Conjunto A) com 3052 dıgitos;b) para selecao do comite – (Conjunto B) com 1211 dıgitos e; c) para testes do comite – (ConjuntoC) com 1794 dıgitos.

Page 172: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Construção de sistemas multi-classificadores para reconhecimento de padrões 157

4.4 Geração e treinamento dos agentes

Uma serie de experimentos foi realizada com o objetivo de: a) Comparar as estrategias Bagging eAdaboost na geracao de agentes diversos e acurados; b) Comparar diferentes metricas (Q-Statistics,Disagreement, Descorrelacao e Disagreement modificado) para avaliar a diversidade dos diferentesconjuntos de agentes; c) Calcular a margem dos conjuntos e tentar identificar alguma relacao destacom a acuracia e / ou a diversidade; d) Avaliar a relacao entre o tamanho do conjunto de candidatose o potencial de desempenho do comite (oraculo).

Experimento 1 – execucao de 20 treinos sucessivos para cada uma das possıveis configuracoes (20a 40 neuronios na camada escondida, variando de um em um) e selecao das 05 melhores. Para todosos treinos foram usados os seguintes parametros: a) funcao de propagacao dos neuronios - sigmoidal;b) algoritmo de treinamento das redes - trainrp; c) numero maximo de ciclos de treino - 500; d)estrategia de parada por validacao - 50 repeticoes.

Como resultado, o conjunto com as 05 melhores configuracoes para emprego nos proximosexperimentos foi: [29; 40; 32; 37 e 22] neuronios na camada escondida.

Tabela 1. Resumo comparativo dos 2 conjuntos de agentes.

Bagging Adaboost

Melhor Acuracia 69 59Pior Acuracia 98 85Acuracia Media 80,4 73,83Variancia da Acuracia 7,0300 5,1333Oraculo 8 8Margem 0,8672 0,8781Diversidade QL 0,9609 0,9687

Experimento 2 – montado para comparar as estrategias Bagging e Adaboost na geracao de agentessegundo as medidas de acuracia, diversidade e margem. As medidas de diversidade escolhidaspara avaliacao foram as seguintes: a) Q-Statistics (QL); b) Disagreement (DL); c) DisagreementModificado (DM) e; d) Descorrelacao (DD). A Tabela 1 apresenta um resumo com a media dosresultados alcancados.

Uma analise dos resultados possibilita dizer que: a) em termos de acuracia individual e doconjunto (acuracia media), o melhor resultado foi obtido com a estrategia Adaboost ; b) todas asmetricas de diversidade mostraram basicamente as mesmas tendencias; c) por pequena diferenca, amelhor margem foi apresentada pela estrategia Adaboost e d) os 02 conjuntos estimam resultadossimilares a serem obtidos com a formacao dos comites.

Experimento 3 – montado com o objetivo de gerar diferentes conjuntos de agentes candidatos comvariabilidade tanto da acuracia quanto de diversidade. Os conjuntos gerados sao: a) Conjunto 1 -30 agentes, usando Bagging ; configuracao aleatoriamente selecionada dentre o conjunto de [29; 40;32; 37 e 22] neuronios na camada escondida e numero maximo de ciclos de treino especificado em50; b) Conjunto 2 - 30 agentes, usando Adaboost ; configuracao aleatoriamente selecionada dentre oconjunto de [29; 40; 32; 37 e 22] e numero maximo de ciclos de treino especificado em 100; c) Conjunto3 - 30 agentes, usando Adaboost ; configuracao aleatoriamente selecionada dentre o conjunto de [29;40; 32; 37 e 22] e numero maximo de ciclos de treino especificado em 50; d) Conjunto 4 - 60agentes (juncao dos conjuntos 2 e 3); e) Conjunto 5 - 60 agentes, usando Adaboost ; configuracaoaleatoriamente selecionada dentre o conjunto de [30, 35, 40 45, 50, 60] e numero maximo de ciclosde treino selecionado entre [100, 200] e estrategia de parada por validacao desligada e Conjunto 6- 100 agentes, usando Adaboost ; configuracao aleatoriamente selecionada dentre [30, 35, 40 45, 50,60] e numero maximo de ciclos de treino aleatorio dentre [30, 50, 100, 200] e estrategia de paradapor validacao desligada. A Tabela 2 mostra um quadro comparativo dos conjuntos gerados.

Observa-se que: a) existe uma correlacao direta entre o numero de agentes candidatos e o potencialteorico do conjunto (oraculo). Quanto maior o conjunto melhor o oraculo; b) a medida de margemindica que em termos de generalizacao, o conjunto 5 deve apresentar o melhor resultado e o piordeve ser apresentado pelo conjunto 6; c) com excecao da metrica DIFF, todas as demais medidasde diversidade mostram resultados coerentes com relacao a maior diversidade, i.e., o conjunto mais

Page 173: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

158 Thomé & Goldbarg et al.

Tabela 2. Resumo comparativo dos 6 Conjuntos de Agentes.

Cj 1 Cj 2 Cj 3 Cj 4 Cj 5 Cj 6

Nr. Agentes 30 30 30 60 60 100Melhor Acuracia 71 64 71 64 63 66Pior Acuracia 95 88 101 101 87 182Acuracia Media 80 75,13 85,17 80,15 74,23 97,91Variancia da Acuracia 5,589 6,257 8,090 8,775 5,630 23,183Oraculo 10 9 7 6 5 2Margem 0,867 0,875 0,859 0,867 0,877 0,838Diversidade QL 0,965 0,965 0,955 0,959 0,966 0,923

diverso e o sexto, porem esta coerencia nao se repete quanto ao conjunto menos diverso e d) aestrategia Adaboost gerou agentes mais diversos e com maior variedade de acuracia.

4.5 Seleção e composição do comitê

Neste item o foco da investigacao foi no sentido de responder aos seguintes questionamentos: a)Qual a estrategia que garante um melhor desempenho e generalizacao (emprego de um unico agente(o melhor); emprego de um comite formado por todos os agentes candidatos ou emprego de umcomite formado por um subconjunto dos candidatos)? b) Qual, se e que existe, a relevancia relativaentre acuracia, diversidade e margem com vistas a capacidade de generalizacao do comite? c) Existealguma relacao otima entre o numero de agentes candidatos, a acuracia e a diversidade do conjuntocom vistas a formacao de bons comites? e d) Qual a estrategia mais eficiente e eficaz para ser usadana selecao e formacao de um comite?

Figura 7. Evolucao do desempenho em funcao do tamanho do comite.A linha de baixo em ambos os graficos representa o desempenho sobre o

conjunto de validacao e a superior sobre o conjunto de teste (fonte: (Schapire et al., 1998)).

Intuitivamente a probabilidade de haver um subconjunto de agentes candidatos que apresentedesempenho e generalizacao melhores que as de todo conjunto e grande, principalmente se esteconjunto possui agentes com diferentes nıveis de acuracia e diversidade. Robert Schapire, YoavFreund e outros (Schapire et al., 1998), com a finalidade de comparar a eficacia das estrategiasBagging e Boosting, mostram uma aparente contradicao ao princıpio de Ockham (Figura 7), onde oerro do comite, em ambas as estrategias, consistentemente decresce na medida em que o tamanhodo comite aumenta. Neste artigo eles introduzem o conceito de margem. A tendencia descrita porSchapire nao foi comprovada nos experimentos realizados.

Experimento 1 – montado para avaliar a tendencia de desempenho de comites formados com umnumero crescente e cumulativo de componentes iniciando com 10 e terminando com 250.Os resultados obtidos nao apresentaram qualquer tendencia monotonica de alta ou de baixa (Figura8). Os comites foram gerados cumulativamente a partir de um conjunto com 250 agentes geradosconforme descrito no experimento 3 da secao anterior.

O grafico mostra que o tamanho do comite nao influiu no desempenho em qualquer dos casos(conjunto B – serie 1 e conjunto C – serie 2). O desempenho medio dos comites praticamente se

Page 174: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Construção de sistemas multi-classificadores para reconhecimento de padrões 159

Figura 8. Desempenho Medio dos Comites Globais (Todos os Agentes), serie 01 representa o desempenho dosdiferentes comites sobre o conjunto B e a serie 02 sobre o conjunto C (generalizacao).

manteve igual para os dois conjuntos, embora parecam diferentes em termos de erros absolutos (53,38erros num universo de 1211 amostras do Conjunto B – 95,67% de acerto) e (77,23 num universo de1794 do Conjunto C – 95,69% de acerto).

Figura 9. Desempenho Medio dos Comites (Todos os Agentes) formadoscumulativamente pelos melhores agentes disponıveis.

Experimento 2 - montado para verificar se o desempenho individual dos agentes influi na formacaoe no desempenho dos comites. Foram gerados os mesmos comites do experimento 1, tomando agoracomo base os agentes ordenados por valor decrescente de desempenho. Os resultados mais uma veznao apresentaram qualquer tendencia de alta nem de baixa (Figura 9).

Formados com os melhores agentes, os comites apresentaram uma piora sistematica em relacaoaos comites formados com agentes aleatoriamente escolhidos. A perda de desempenho variou entre2% e 14% sobre o conjunto B e de 6% a 18% sobre o conjunto C. O fato do comite formadopelos melhores agentes (selecionados com base no desempenho sobre o conjunto B) apresentar umdesempenho inferior, sobre o proprio conjunto B, que outro comite formado pelo mesmo numerode agentes, porem com desempenho inferior que do primeiro conjunto, so pode ter como explicacaoplausıvel o fato do primeiro conjunto possuir uma diversidade que compense a menor acuraciaindividual.

Experimento 3 - montado com o objetivo de comparar o desempenho das estrategias: CS -Construtiva sem Exploracao; CC - Construtiva com Exploracao; AG - Algoritmo Genetico e AT- Algoritmo Transgenetico. As 04 estrategias foram aplicadas sobre 08 conjuntos de teste. AsTabelas 3 e 4 mostram, de forma resumida, os resultados.

Embora os resultados obtidos sobre os 07 conjuntos nao tenham sido conclusivos ficou evidenteque o emprego de apenas um agente e sempre a pior alternativa. As estrategias CS e CC apresentaram

Page 175: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

160 Thomé & Goldbarg et al.

Tabela 3. Resultado com 1 agente, todos agentes e subconjunto gerado por CS.

Unico Global Construtivo S.

Cj N.Ag TC MSV MST TC MSV MST TC MSV MST

0 30 1 69 125 30 60 85 10 46 901 30 1 71 127 30 56 87 7 50 952 30 1 64 108 30 50 82 7 42 823 30 1 71 135 30 59 87 6 50 964 60 1 64 108 60 54 88 6 42 825 60 1 64 109 60 51 74 6 45 796 100 1 66 108 100 52 80 9 44 88

Media 1 67 117 49 55 83 7 46 87

de forma consistente os piores desempenhos, provavelmente pelo fato fazerem a selecao privilegiandounicamente o desempenho individual dos agentes.

5. Conclusões

Neste capıtulo se descreveu o emprego de Agentes Neurais reunidos em Sistemas de Comite(ensemble), aplicados a problemas de reconhecimento de padroes. Como estudo de caso foi escolhido oproblema da leitura dos caracteres da placa de veıculos automotores extraıdos de imagens complexascapturadas com o veıculo em movimento.

Quanto a geracao do conjunto de agentes para construcao do comite, as principais conclusoessao: a) conjuntos grandes e diversos aumentam a probabilidade de sucesso na composicao do comite;b) a estrategia Adaboost gera agentes com maior ındice de complementaridade do que a estrategiaBagging e c) no caso de comites formados por agentes neurais, e importante reforcar a diversidadepelo uso de diferentes configuracoes e ciclos de treinamento.

Tabela 4. Resultado gerado com CC, AG e AT.

Construtivo C. Alg. Geneticos Alg. Transgenetico

Cj N.Ag TC MSV MST TC MSV MST TC MSV MST

0 30 03 52 94 10 47 85 07 44 881 30 05 48 95 07 46 99 07 46 932 30 05 40 89 11 38 82 11 38 823 30 03 49 100 09 50 85 07 44 924 60 05 40 90 11 36 82 13 36 805 60 04 46 80 18 49 58 16 39 596 100 05 46 87 16 39 86 16 35 75

Media 4 46 91 12 44 82 11 40 81

As principais dificuldades quanto as estrategias de busca pelo comite otimo (tamanho eidentificacao dos agentes a serem selecionados) sao: a) o espaco de busca cresce exponencialmentecom o numero de agentes candidatos; b) quanto maior o numero de candidatos maior a possibilidadede haver um subconjunto que mais se aproxime do oraculo; c) o emprego de um ou todos os agentesnao e a estrategia potencialmente melhor; d) reduzir excessivamente o tamanho do comite podemelhorar o desempenho sobre o conjunto de treino, mas isto nao potencializa a capacidade degeneralizacao. E como se ocorresse um overfitting no processo de construcao do comite; e) estrategiasque privilegiam somente a acuracia individual dos agentes como criterio de selecao tendem a comporcomites com desempenho mais fraco; f) o problema da composicao de comites e multiobjetivoe somente estrategias que levam em consideracao esta caracterıstica tem mais probabilidade deencontrar o melhor comite; g) as estrategias evolucionistas se mostraram melhores que as gulosas(CS e CC); h) o algoritmo transgenetico apresenta um custo computacional maior, porem, terminacom uma populacao e um conjunto de possıveis solucoes mais diverso, que podem melhor contemplarcaracterısticas como acuracia, diversidade e margem.

Quanto as estrategias para decisao do comite, ressalta-se que: o uso da Media Simples ou daMedia Ponderada sem Bias e praticamente equivalente; b) o Voto Majoritario por Maioria Simples

Page 176: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

Construção de sistemas multi-classificadores para reconhecimento de padrões 161

se mostrou inferior aos outros dois em quase 100% dos casos, porem, se os casos em que a maioria dosvotos nao se concretiza (empate entre duas ou mais alternativas) forem tratados e nao simplesmenteconsiderados como erro, a estrategia pode se equivaler e ate superar as outras duas.

Agradecimentos

O autor Marco Cesar Goldbarg agradece ao CNPq pelo apoio financeiro ao projeto 300778/2010-4.

ReferênciasBreiman, L., Bagging predictors. Machine Learning, 24(2):123–140, 1996.

Breiman, L., Multi-net systems. In: A.Sharkey, (Ed.), Combining Artificial Neural Nets: Ensemble and ModularMulti-Net Systems. Heidelberg: Springer-Verlag, Perspectives in Neural Computing, p. 31–50, 1999.

Brown, L. & Kuncheva, L., Good and bad diversity in majority vote ensembles, multiple classifier. In: Gayar, N.E.;Kittler, J. & Roli, F. (Eds.), Multiple Classifier Systems. Heidelberg: Springer-Verlag, v. 5997 de Lecture Notesin Computer Science, p. 124–133, 2010.

Canuto, A.M.P.; Karliane, M.O. & Feitos, A., A reinforcement-based mechanism to select features for classifiersin ensemble systems. International Journal of Computer Information Systems and Industrial ManagementApplications, 03:324–335, 2011.

Canuto, A.M.P.; Karliane, M.O.; Feitos, A. & Signoretti, A., Reinsel: A class-based mechanism for feature selectionin ensemble of classifiers. Applied Soft Computing, 12:2517–2529, 2012.

Chen, D.; Boulard, H. & Thiran, J.P., Text identification in complex background using svm. In: Proceedings of the2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. p. 621–626, 2001.

Cho, S. & Kim, J.H., Combining multiple neural networks by fuzzy integral for robust classification. IEEE Transactionson Systems, Man and Cybernetics, 25(02):380–384, 1995.

Drucker, H., Boosting neural networks. In: Sharkey, A. (Ed.), Combining Artificial Neural Nets: Ensemble andModular Multi-Net Systems. Heidelberg: Springer-Verlag, Perspectives in Neural Computing, p. 51–77, 1999.

Drucker, H.; Cortes, C.; Jackel, L.L.D.; LeCun, Y. & Vapnik, V., Boosting and other ensemble methods. NeuralComputation, 6(6):1289–1301, 1994.

Efron, B. & Tibshirani, R., An Introduction to the Bootstrap. 1st edicao. New York: Chapman & Hall, 1993.

Fabrizio, J.; Marcotegui, B. & Cord, M., Text segmentation in natural scenes using toggle-mapping. In: IEEEInternational Conference on Image Processing. p. 2373–2376, 2009.

Freund, Y., Boosting a weak algorithm by majority. Information and Computation, 121(02):256–286, 1995.

Freund, Y. & Schapire, R.E., A decision-theoretic generalization of on-line learning and an application to boosting. In:Proceedings EuroCOLT-94. p. 23–27, 1995.

Freund, Y. & Schapire, R.E., Experiments with a new boosting algorithm. In: Proceedings of the ThirteenthInternational Conference on Machine Learning. p. 149–156, 1996.

Goldbarg, E.F.G. & Goldbarg, M.C., Transgenetic algorithm: A new endosymbiotic approach for evolutionaryalgorithms. In: Abraham, A.; Hassanien, A.E.; Siarry, P. & Engelbrecht, A. (Eds.), Foundations of ComputationalIntelligence Volume 3. Heidelberg: Springer-Verlag, v. 203 de Studies in Computational Intelligence, p. 425–460,2009.

Goldbarg, M.C.; Bagi, L.B. & Goldbarg, E.F.G., Transgenetic algorithm for the traveling purchaser problem. EuropeanJournal of Operational Research, 199(01):36–45, 2009.

Goldbarg, M.C. & Gouvea, E.F., Transgenetica computacional. In: Anais do XXXII Simposio Brasileiro de PesquisaOperacional. v. 01, p. 1534–1569, 2000.

Gould, S.B.; Waller, R.F. & McFadden, G.I., Plastid evolution. Annual Review of Plant Biology, 59:491–517, 2008.

Hansen, L. & Salomon, P., Neural network ensembles. IEEE Transactions on Pattern Analysis and MachineIntelligence, 12(10):993–1001, 1990.

Jacob, F., Evolution and tinkering. Science, New Series, 196(4295):1161–1166, 1977.

Jung, K.; Kim, K. & Jain, A., Text information extraction in images and videos: A survey. Pattern Recognition,37(5):977–997, 2004.

Kittler, J.; Hatef, M.; Duin, R.P.W. & Matas, J., On combining classifiers. IEEE Transactions on Pattern Analysisand Machine Intelligence, 20(03):226–239, 1998.

Kittler, J.; Hojjatoleslami, A. & Windeatt, T., Strategies for combining classifiers employing shared and distinctpattern representations. Science, New Series, 18:1373–1377, 1997.

Kuncheva, J.L.I. & Whitaker, C.J., Measures of diversity in classifier ensembles and their relationship with the ensembleaccuracy. Machine Learning, 51(03):181–207, 2003.

Kuncheva, L.I. & Whitaker, C.J., Ten measures of diversity in classifier ensembles: Limits for two classifiers. In:Proceedings of IEE Workshop on Intelligent Sensor Processing. p. 1001–1010, 2001.

Page 177: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia

162 Thomé & Goldbarg et al.

Kuwaha, H.; Takaki, T.; Yoshida, Y.; Shimamura, S.; Takishita, K.; Reimer, J.D.; Kato, C. & Maruyama, T., Reductivegenome evolution in chemoautotrophic intracellular symbionts of deep-sea calyptogena clams. Extremophiles,02:365–374, 2008.

Lebourgeis, F., Robust multifont ocr system from gray level images. In: Proceedings of the Fourth InternationalConference on Document Analysis and Recognition. p. 1–5, 1997.

Lima, C.A.M., Comite de Maquinas: Uma Abordagem Unificada Empregando Maquinas de Vetores de Suporte. Tese dedoutorado, Universidade Estadual de Campinas - UNICAMP - DCA FEEC, Campinas, Sao Paulo, Brasil, 2004.

Liu, Y.; Yao, X. & Higuchi, T., Evolutionary ensembles with negative correlation learning. IEEE Transactions onEvolutionary Computation, 04(04):380–387, 2003.

Lucas, S.M., Icdar 2005 text locating competition results. In: Proceedings of Eighth International Conference onDocument Analysis and Recognition. IEEE Press, p. 80–84, 2005.

Lucas, S.M.; A.Panaretos, ; Sosa, L.; Tang, A. & et al., , Icdar 2003 robust reading competitions: entries, results, andfuture directions. Journal of Document Analysis and Recognition (IJDAR), 07(2-3):105–122, 2005.

Opitz, D.W., Feature selection for ensembles. In: Proceedings of 16th National Conference on Artificial. Intelligence.AAAI Press, p. 379–384, 1999.

Opitz, D.W. & Maclin, R., Popular ensemble methods: An empirical study. Journal of Artificial Intelligence Research,11:169–198, 1999.

S. A. R. Jafri, M.B.E.J.D., Automatic text area segmentation in natural images. In: IEEE International Conferenceon Image Processing. p. 416, 2008.

Schapire, R.E.; Freund, Y.; Bartlett, P.; Lee, P. & Wee, S., The strength of weak learnability. Machine Learning,5:197–227, 1990.

Schapire, R.E.; Freund, Y.; Bartlett, P.; Lee, P. & Wee, S., Boosting the margin: A new explanation for the effectivenessof voting methods, annals of statistics. Annals of Statistics, 26:1651–1686, 1998.

Silva, V.S.R., Um Comite de Redes Neurais para Reconhecimento de Caracteres Manuscritos. Dissertacao de Mestrado.Dissertacao de mestrado, Instituto de Matematica, Nucleo de Computacao Eletronica, Universidade Federal doRio de Janeiro, Rio de Janeiro, RJ, Brasil, 2006.

Sosa, L.P.; Lucas, S.M.; Panaretos, A.; Sosa, L.; Tang, A.; Wong, S. & Young, R., Icdar 2003 robust readingcompetitions. In: Proceedings of the Seventh International Conference on Document Analysis and Recognition.IEEE Press, p. 682–687, 2003.

Tang, K.; Suganthan, P.N. & Yao, X., An analysis of diversity measures. Machine Learning, 65(01):247–271, 2006.

Ueda, N., Optimal linear combination of neural networks for improving classification performance. IEEE Transactionson Pattern Analysis and Machine Intelligence, 22(02):207–215, 2000.

W, F.D., Lateral genomics. Trends in Cell Biolology, 9(12):M5–M8, 1999.

Wernegreen, J.J., For better or worse: genomic consequences of intracellular mutualism and parasitism. Genetics &Development, 15:572–583, 2005.

Xu, L.; Krzyzak, A. & Suen, C.Y., Methods of combining multiple classifiers and their applications to handwritingrecognition. IEEE Transactions on Systems, Man and Cybernetics, 22(03):418–435, 1992.

Zhou, Z.H.; Wu, J. & Tang, W., Ensembling neural networks: Many could be better than all. Artificial Intelligence,137(1-2):239–263, 2002.

Page 178: Técnicas de inteligência computacional com aplicações em problemas inversos de Engenharia