Template Cobem2015 LatexTemplate Cobem2015 Latex

Embed Size (px)

DESCRIPTION

Template Cobem2015 Latex

Citation preview

  • PROJETO DE CONTROLADOR ROBUSTO LQG/LTR EMMANIPULADOR ROBTICO VIA MODELO GENTICO NEURONAL

    Ivanildo Silva AbreuUniversidade Estadual do Maranho, Cidade Universitria Paulo VI, s/no, Tirirical, CEP 65055970, So Lus, [email protected] Costa Oliveira JuniorUniversidade Estadual do Maranho, Cidade Universitria Paulo VI, s/no, Tirirical, CEP 65055970, So Lus, [email protected]

    Resumo. O presente trabalho descreve o projeto e anlise de um controlador robusto LQG/LTR em um manipuladorrobtico usando um modelo inteligente gentico neuronal. O manipulador robtico a ser controlado atua diretamentesobre o ambiente-alvo que deve ser controlado, de modo que as foras de impacto e as foras de estado estacionrio nodanifiquem o alvo. A dinmica do manipulador em malha fechada dada de forma desacoplada, pelas dinmicas daplanta nominal com realimentao direta dos estados e do observador estocstico de estados. Desta forma, objetiva-serecuperar as propriedades de desempenho e estabilidade robustos que so perdidas com a insero de um estimadorestocstico. A metodologia do projeto LQG/ LTR, atravs do qual estas propriedades de robustez so recuperadas, formulada pela definio da malha objetivo e em seguida, por meio de um procedimento assinttico que recupera ascaractersticas de resposta em freqncia dessa malha, ajustando um parmetro que iro gerar valores singulares cadavez mais prximos, usando um algoritmo gentico, em um diagrama de Bode multivarivel. A sintonia realizadapor variaes paramtricas na equao de Riccati coordenadas por um algoritmo gentico e decomposio em valoressingulares. Os resultados oriundos do projeto LQG/LTR permitiram um melhor desempenho com relao a robustez, oque tambm foi comprovado ao se avaliar as barreiras de desempenho e estabilidade robustas.

    Palavras-chave: algoritmo gentico, rede neuronal, equao de Riccati, decomposio em valores singulares, diagramade Bode multivarivel.

    1. INTRODUO

    Este pesquisa apresenta os conceitos bsicos de controle robusto para sistemas lineares e invariantes no tempo (LIT),em particular, um manipulador robtico. O desenvolvimento deste trabalho realizado nos domnios do tempo e dafreqncia, utilizando-se o diagrama de Bode multivarivel. Discute-se as questes de estabilidade e desempenho robustosem malha fechada, utilizando-se a tcnica LQG/LTR. Um dos itens de maior ateno da comunidade cientfica de controle o estudo da robustez dos sistemas de realimentao (Doyle and Stein, 1979).

    A robustez uma caracterstica desejvel dos sistemas de controle por duas razes. A primeira diz respeito a preocu-pao permanente do projetista com que os sistemas de controle funcionem de forma satisfatria, ainda que as condiesde operao sejam distintas daquelas consideradas no modelo de projeto (nominal). E em segundo lugar, as condiesde robustez devem ser utilizadas com o objetivo de se adotar um modelo de projeto intencionalmente simplificado parafacilitar a anlise, e seu impacto sobre a complexidade do controlador resultante.

    A metodologia consiste de uma tcnica de projeto de controladores utilizada em sistemas dinmicos multivariveis.Justifica-se seu uso pela robustez do controlador garantida em face de uma ampla classe de erros de modelagem, a tcnica empregada em sistemas MIMO, o procedimento do projeto de natureza sistemtica e que a metodologia se fundamentanuma abordagem freqncial em sistemas MIMO (da Cruz, 1996).

    As ferramentas empregadas para o desenvolvimento do projeto do controlador robusto LQG/LTR, so o projeto doRegulador Linear Quadrtico (LQR) e o Filtro de Kalman (FK) que justifica o projeto LQG (Linear Quagrtico Gaussiano).Estas ferramentas no sero interpretadas de forma usual em controle timo estocstico, mas utilizadas em funo de suaspropriedades. Neste trabalho, apresenta-se uma metodologia de projeto que permita a determinao de um compensador,a ser localizado no ramo direto da malha de controle, de modo que sejam atendidos os requisitos de desempenho eestabilidade. A seguir, descreve-se o manipulador robtico, onde ser empregada a abordagem de controle robusto.

    O procedimento de recuperao das propriedades de robustez, perdidas com a estimao das variveis de estados, ,segundo Doyle and Stein (1979), realizado pelo procedimento LTR (Recuperao da Malha de Transferncia), uma vezque o manipulador robtico em questo possui zeros de transmisso no semiplano esquerdo (zeros de fase mnima). Oprocedimento de recuperao da malha de transferncia est associado matriz de funo de transferncia de malha,K(s)GN (s), que corresponde a abertura da malha na entrada da planta (ponto (i)), ver Figura 1. Neste procedimento,

  • Ivanildo S. Abreu, Alfredo C. O. JuniorPROJETO DE CONTROLADOR ROBUSTO LQG/LTR EM MANIPULADOR ROBTICO VIA MODELO GENTICO NEURONAL

    supe-se fixada convenientemente a princpio a matriz K do compensador, enquanto que a matriz L do observador deestado varivel.

    Esta alternativa consistente com a anlise atravs dos valores singulares de K(s)GN (s) considerada para traduziras especificaes do sistema de controle por meio das restries do seu diagrama de Bode multivarivel. Alm disso,admite-se que a matriz L tenha sido escolhida de modo que Real[i(AKC)] < 0, i = 1, . . . , n, em quanto o ganho doobservador de estados L varivel (da Cruz, 1996).

    Como se trata de um problema de controle robusto, a avaliao do desempenho e estabilidade robustas do controladorLQG/LTR proposto, deu-se por meio da anlise das barreiras de desempenho e estabilidade, segundo da Cruz (1996).

    Figure 1. Diagrama de blocos do sistema para estudo do procedimento LTR.

    2. MANIPULADOR ROBTICO

    Os manipuladores robticos modernos que atuam diretamente sobre o ambiente devem ser controlados de modo queas foras de impacto, bem como as foras em regime permanente, no danifiquem os objetos. Ao mesmo tempo, omanipulador deve fornecer uma fora suficiente para executar a tarefa. Ento, para desenvolver um sistema de controlepara regular essas foras, o manipulador robtico e o ambiente devem ser modelados. Admitindo o modelo ilustrado naFigura 2 tem-se um sistema de quarta ordem com representao no espao de estados. O esquema a seguir consiste demanipulador, sensor, e ambiente (Chiu and Lee, 1997).

    O manipulador deve posicionar o sensor sobre a superfcie de contato de forma controlada para no causar danos anenhum dos componentes, ento, a sada do sistema o deslocamento do sensor, e a entrada seria um excitao u(t). Osistema inclui ainda dois regimes, um sem contato e outro com contato do sensor superfcie de contato. Porm o sistema um s, ento deve ser encontrada uma nica funo que descreva a dinmica do sistema como um todo. O sistema naFigura 2 ilustra dois regimes, um sem contato com o meio ambiente e o outro com contato com o meio ambiente. Paracada regime a dinmica do sistema diferente. Desta forma ser analisado o regime sem contato para testar a metodologia.

    Figure 2. Manipulador robtico e ambiente.

    Apresenta-se o modelo matemtico em representao no espao de estados do manipulador robtico e ambiente, pararecuperao das propriedades de robustez. O manipulador controlvel e observvel.

    xr + 2xr + 2xr xs xs = u(t);xr xr + xs + xs + xs = 0 (1)

    Assumem-se as variveis de estado como x1 = xr;x2 = xr;x3 = xs;x4 = xs. Desta forma, discute-se a questo decomo escolher o compensador K (s) de modo que o sistema de malha fechada seja estvel e ainda tenha graus de liberdadeem nmero suficiente para dar forma malha, de modo que satisfaa as condies de desempenho e estabilidade. Paraisso, admite-se que todas as variveis de estados sejam mensurveis e que estejam disponveis para realimentao e umavez que, o manipulador robtico seja controlvel e observvel, todos os autovalores de malha fechada do sistema poderoser alocados em qualquer posio desejada, por meio de uma realimentao de estados, desde que seja empregada umamatriz de ganho apropriada. Ento, para a busca deste ganho timo, neste projeto de pesquisa, utiliza-se o projeto doRegulador Linear Quadrtico (LQR).

  • 23rd ABCM International Congress of Mechanical Engineering (COBEM 2015)December 6-11, 2015, Rio de Janeiro, RJ, Brazil

    3. CONTROLADOR INTELIGENTE LQR

    O problema do LQR formulado por uma estrutura de otimizao no-linear, cujo foco consiste em minimizar umndice de desempenho quadrtico. Este problema tem como gargalo, a seleo das matrizes de ponderao de estado e decontrole, Q e R, respectivamente, e resolver a equao algbrica de Riccati (EAR), de modo que, possa alocar autovalorese autovetores especificados e que garanta a estabilidade e desempenho robustos do sistema de controle. So apresentadasas evolues de duas abordagens de inteligncia computacional para resolver o problema do LQR. Estas evolues soresultados de pesquisas utilizando um AG na seleo das matrizes de ponderao Q e R e na soluo da (EAR) por meiode uma (RNR), conforme Wang et al. (1998) e Abreu and Fonseca (2010).

    3.1 Modelagem Clssica do Projeto LQR

    O modelo clssico de controle do projeto LQR, busca o vetor de controle u que minimiza um funcional J(.) comrestries para o modelo do sistema. Sabe-se que uma das vantagens do projeto LQR a margem de estabilidade garan-tida, ou seja, margem de fase de 60o e margem de ganho infinita, possuindo desta maneira, qualidade de robustez deestabilidade. Tal problema formulado pela Eq. 2.

    min J = 12 Tt0

    [xT Qx+ uT Ru

    ]s.a x = Ax+Bu

    (2)

    sendo x Rn e u Rm , o par (A,B) controlvel, (A,C ) observvel, C 0 (semidefinida positiva) e R > 0(definida positiva). As metodologias de Clculo Variacional, ?, so utilizadas para resolver o problema de otimizao(2). Este mtodo fornece a lei de controle que minimiza o ndice de desempenho quadrtico J e satisfaz as restries deequaes no espao de estado. A lei de controle u = Kx sendo K = R1BTP , o ganho do controlador. Este ganhodepende da soluo simtrica e definida positiva da equao algbrica de Riccati (EAR):

    ATP + PA PBR1BTP + Q = 0 (3)

    3.2 Modelagem Inteligente via Algoritmo Gentico

    Um dos grandes desafios na teoria de controle, utilizando o projeto do regulador linear quadrtico, a seleo dasmatrizes de ponderao Q e R. Nesta pesquisa, utiliza-se uma abordagem de inteligncia computacional para realizar abusca das mesmas, o AG. Os parmetros matriciais do projeto LQR so utilizados para realizar a sintonia do ganho timodo compensador. Apresenta-se o modelo matemtico no-linear para exibir estas matrizes, conforme Eq. 4.

    MinQ,R

    ni=1

    pisi(Q,R)

    s.a si(Q,R) 1, i = 1, ..., ni,esq. i,aloc.(Q,R) i,dir., i = 1, ..., n

    (4)

    sendo pi os pesos das i-simas sensibilidades Si/i normalizadas com relao i-sima especificao de projeto i. Estemodelo aborda desde a representao gentica das matrizes de ponderao, passando pelas operaes cromossmicas, atchegar s avaliaes de fitness (desempenho).

    Percebe-se que a mesma constitui uma estrutura de otimizao muito complexa, uma vez que, envolve a soluo doprojeto LQR e o clculo dos autovalores de malha fechada. O desempenho de cada cromossomo do indivduo que compea populao QRnind.xg avaliado e cada indivduo QRz pontuado. Kz o ganho gerado por um indivduo, Az amatriz de malha fechada para o ganho Kz , enquanto que z, Vz,Wz constituem os autovalores e autovetores direitae esquerda, respectivamente. J Sz so as sensibilidades associadas com cada autovalor. As operaes genticas sorepresentadas pelos modelos de seleo, crossover e mutao, que podem ser consultados em (Neto and Abreu, 2007).

    Realizada a computao da auto-estrutura de malha fechada, a estratgia de pontuao de cada indivduo realizada daseguinte forma: para cada autovalor, dentro da margem especificada na estrutura de otimizao no linear pelo projetista,atribui-se valor um (01) ao indivduo QR, e um centsimo (0.01) para cada autovetor associado que possua sensibilidadenormalizada, Sz < 1. O indivduo que possuir maior pontuao ser considerado o timo, e para o critrio de empate,ser considerado melhor, aquele que possuir menor soma das sensibilidades normalizadas.

    3.2.1 Desempenho da Populao Inicial

    O perfil da populao inicial pode ser definido pelos valores da funo objetivo apresentados na Figura 3. Percebe-seclaramente uma diversidade gentica, sendo a mesma baixa entre o vigsimo e o trigsimo indivduo. Outros indivduosmostram melhor diversidade. Essas concluses a respeito do processo de inicializao da populao inicial, implicam emuma populao satisfatria no processo de busca do indivduo QR timo.

  • Ivanildo S. Abreu, Alfredo C. O. JuniorPROJETO DE CONTROLADOR ROBUSTO LQG/LTR EM MANIPULADOR ROBTICO VIA MODELO GENTICO NEURONAL

    Figure 3. Sensibilidade total de cada indiv-duo.

    Figure 4. Evoluo do processo-funo obje-tivo mdia e melhor funo objetivo das ger-

    aes.

    3.2.2 Desempenho da Populao final

    Os valores da funo objetivo para a populao final, em comparao com a mdia da funo objetivo para cadaindivduo da populao, durante o processo de busca, so apresentados na Figura 4. Os valores mdios de cada indivduoda populao final apresentaram melhorias at o trigsimo indivduo; a partir deste indivduo, no percebe-se muitasmelhorias.

    A busca realizada pelo AG, encontrou cinco indivduos viveis, que esto presentes na Tabela 1 e consequentemente,como esperado, os resultados computacionais para resposta ao sinal impulso mostraram uma ligeira diferena entre todasas solues viveis apresentadas (Neto and Abreu, 2007).

    Table 1. Pop. final AG-sensibilidades e funo objetivo dos indivduos viveis.

    Indiv. s1 s2 s3 s4si

    1 20 0.975 0.815 0.694 0.589 3.0733 13 0.919 0.831 0.677 0.57 2.9975 17 0.967 0.845 0.684 0.586 3.0827 14 0.996 0.883 0.686 0.586 3.1519 48 0.986 0.986 0.683 0.586 3.11

    QLQR =

    41.436 5.494 4.069 5.1235.494 44.103 9.148 3.1024.069 9.148 29.682 6.9515.123 3.102 6.951 22.067

    ,RLQR = [ 15.225 2.5172.517 11.568], (5)

    A Tabela 1 foi escolhida para realizar os testes de avaliao entre os indivduos. Como pode ser visto, todos os indiv-duos viveis esto prximos das restries de sensibilidade e da funo objetivo. Alm disso, a condio de positividadedas matrizes so mostradas em termos dos traos e autovalores. As matrizes de ponderao timas Q e R do melhorindivduo factvel, so dadas por Eq. 5. Na Tabela 2, os autovalores e os traos, confirmam a positividade das matrizesde ponderao. A positividade pode ser usada para orientar o processo de busca do AG, de modo que evite a formaoindesejvel de nicho.

    O processo de busca do AG com a configurao de seus parmetros, produziu solues muito prximas uma das outras,ou seja, o conjunto soluo matricial QR apresentada pelo AG, tem apenas pequenas discrepncias. As sensibilidades dapopulao final e a mdia da funo de fitness de cada gerao apresentada na Figura 5.

    4. SOLUO DA EQUAO DE RICCATI VIA REDE NEURONAL

    Para resolver a EAR, usa-se problema de otimizao combinatria, tendo como restries as matrizes de ponderaesda Eq.(5). Esta estrutura formulada para minimizar uma funo energia monotnica, no decrescente e limitada inferior-mente, (g, h) (Wang, 1998). As matrizes A,B ,Q e R so apresentadas, sendo que seu objetivo encontrar uma soluomatricial simtrica e definida positiva, P. A seguir tem-se o problema de programao no-linear na forma vetorial (Eq.

  • 23rd ABCM International Congress of Mechanical Engineering (COBEM 2015)December 6-11, 2015, Rio de Janeiro, RJ, Brazil

    Table 2. Melhor indivduo da populao final-autovalores e traos das matrizes de ponderao.

    Indiv. s1 s2 s3 s4si

    1 20 0.975 0.815 0.694 0.589 3.0733 13 0.919 0.831 0.677 0.57 2.9975 17 0.967 0.845 0.684 0.586 3.0827 14 0.996 0.883 0.686 0.586 3.1519 48 0.986 0.986 0.683 0.586 3.11

    Figure 5. Fitness normalizada de cada gerao e de cada indivduo.

    6).

    minP,L

    ni=1

    nj=1

    {eij [gij(P)] + eij [hi,j(P , L)]} (6)

    onde g(P )=

    nk=1

    nl=1

    piksklplj n

    k=1

    (akipkj + pikakj) qij , eij : R R uma funo matricial convexa. O prob-

    lema para sntese do projeto LQR pode ser considerado como um problema de otimizao irrestrito. A rede neuralartificial recorrente um sistema dinmico no-linear contnuo. A estabilidade dos sistemas dinmicos no-lineares podeser analisado usando o mtodo direto de Lyapunov. As condies de estabilidade e soluo simtrica definida da equaoalgbrica de Riccati esto garantidas nos teoremas I e II em Wang et al. (1998).

    4.1 Modelo Neuronal para Resolver a EAR

    O modelo recursivo da RNAR baseado na rede neural desenvolvida por (Wang et al., 1998). A estrutura de otimizao dada por um conjunto de equaes diferenciais e funes de ativao F linear saturada que constituem a arquitetura darede neural na forma matricial. A mesma dada pela Eq. 7.

    dV (t)dt = v

    [V (t)SU(t) + U(t)SV (t)AU(t) U(t)AT Y (t)

    ]dZ(t)dt = zY (t)Z(t)

    (7)

  • Ivanildo S. Abreu, Alfredo C. O. JuniorPROJETO DE CONTROLADOR ROBUSTO LQG/LTR EM MANIPULADOR ROBTICO VIA MODELO GENTICO NEURONAL

    Figure 6. Arquitetura da RNAR para EAR.

    onde Z(t) Rnn so matrizes quadradas dos estados de ativaes; F = [.] um campo vetorial de funes de ativaesno decrescente; V (t) Rnxn a soluo da EAR, Z(t) Rnn uma matriz triangular inferior dos estados dofator de Cholesky. Os parmetros positivos de ajuste da rede neuronal so os pesos v e z . A matriz S representa naequao anterior a influncia da matriz de ponderao R, sendo dada por S = BR1BT , considerando que os ganhosdo controlador timo so ajustados tendo por base as variaes nas matrizes Q e R. A Figura 6 ilustra a arquiteturada rede neuronal para resolver a EAR, sendo formada por quatro camadas conectadas bidirecionalmente. A camadade sada V (t), representa a soluo da EAR, Z(t) representa o fator de Cholesky de P. O mtodo de Runge-Kutta dequarta ordem utilizado para computar os valores de V e Z. A funo de desempenho para mensurar o processo detreinamento da RNAR a funo Erro Mdio Quadrtico, EMQ, que representa a funo energia, sendo a mesma dadapela combinao dos erros associados a EAR e ao fator de Cholesky. Consequentemente, o EMQRNAR de aprendizagemda RNAR, EMQRNAR = 12 (eEAR + eFC )

    2, sendo seus componentes dados por: eEAR = Q (ATP + PA PSP

    )e eFC = LLT P .

    4.2 Soluo da EAR via Rede Neural Recorrente No Supervisionada

    Esta seo compreende os mtodos de ajuste de convergncia e anlise da RNAR para resolver a equao de Riccati.Os parmetros de ajustes, v , z , do modelo neuronal, so suportados pela norma do infinito e superfcies da funoenergia da soluo da equao de Riccati. A norma do infinito e a superfcie da funo energia, como funes dosparmetros (pesos) de dimensionamento v , z , so avaliadas para definir uma configurao para melhorar a estabilidadede convergncia e caractersticas de solvabilidade da RNAR. Na Figura 7 apresentada a superfcie da norma do infinitoda matriz de entrada U, sendo que os intervalos de modificao para os parmetros v , z so respectivamente, [100010000] e [1 10]. Os pesos escolhidos dos parmetros v e z e so 1000 e 1, respectivamente.

    A soluo neuronal da equao de Riccati, fundamentado no modelo neuronal que resolve a estrutura de otimizaoque minimiza a funo energia, camada de sada da RNAR, V, dada pela Eq. 8.

    PRNAR =

    17.884 2.228 2.533 1.8382.228 19.229 2.760 2.2452.533 2.760 13.596 4.1001.838 2.245 4.100 10.859

    (8)5. FILTRO DE KALMAN PARA ESTIMAO DOS ESTADOS

    Nesta seo formula-se o Filtro de Kalman, FK, de forma a alocar os autovalores e autovetores no problema deestimao de estado estocstica. Esta nova formulao permite a utilizao de tcnicas de computao evolutiva paradeterminar um observador estocstico para estimar os estados com uma dinmica desejada. Fazendo-se uso das restriesde autoestrutura, restries de autovalores e autovetores, pode-se formular o problema de estimao de estado estocstica,que encontrar L =

    (,)C T 1 do FK, de modo que sejam satisfeitas as restries. Este problema pode ser

    formulado, como um problema de otimizao, permitindo a determinao de um estimador estocstico L(,) por meiode tcnicas de busca aleatria direcionada.

    Um AG para a busca das matrizes de covariancias da perturbao do estado e do rudo de medida para o Filtrode Kalman desenvolvido. Para tanto, tem-se interesse em realizar um algoritmo numrico, que possa ser utilizado emqualquer problema de estimao de estado estrocstico, objetivando-se a determinao de um ganho L(,) de forma a

  • 23rd ABCM International Congress of Mechanical Engineering (COBEM 2015)December 6-11, 2015, Rio de Janeiro, RJ, Brazil

    Figure 7. Superfcie da norma do infinito para v = 1000 10000 e z = 1 10.

    alocar autovalores e autovetores. Utiliza-se o mesmo procedimento para o projeto LQR.A Figura 8 a seguir, exibe os resultados da Filtragem de Kalman. Nela verifica-se as trajetrias dos estados versus os

    estados estimados. Nota-se que, apesar da presena de rudos, a ao reguladora detectada em todos os estados. Parauma anlise mais precisa, a Figura 9 ilustra o erro de estimao em cada estado. Observou-se que o Estado 4 apresentao menor erro de estimao, enquanto que o maior erro de estimao foi verificado para o Estado 5 (Abreu and Fonseca,2010).

    Figure 8. Trajetrias dos estados vesus os esti-mados. Figure 9. Erro de estimao para cada estado.

    6. BARREIRAS DE DESEMPENHO E ESTABILIDADE

    Tendo em vista que esta pesquisa se trata de um projeto de controlador robusto, importante verificar os compromissosde desempenho e estabilidade robusta. Para esta anlise, considerou-se como dinmica desconhecida, o efeito do rudoprovocado por dois polos, conforme 9.

    Gd =625

    s2+50s+625 (9)

  • Ivanildo S. Abreu, Alfredo C. O. JuniorPROJETO DE CONTROLADOR ROBUSTO LQG/LTR EM MANIPULADOR ROBTICO VIA MODELO GENTICO NEURONAL

    A Eq. 9 apresenta a funo de transferncia do rudo de medio (da Cruz, 1996). Ento, a proposta , ainda segundoda Cruz (1996), analisar o projeto do controlador LQG de maneira que o sistema real (Planta nominal, Gn, mais efeito dorudo, Gd) em malha fechada, satisfaa as seguintes especificaes:

    acompanhamento do sinal de referncia e rejeio de perturbaes com erro no superior a 10% para 0, 5rad/s.

    sensibilidade a variaes na planta no superior a 15% para 0, 7rad/s.

    Para se ter acompanhamento do sinal de referncia e rejeio de perturbaes com erro no superior a 10% para 0, 5rad/s, ou seja , r e d 0, 1, a barreira de desempenho para estas condies dada por:

    20 log10(0, 1) para 0, 5rad/s

    Para se ter sensibilidade a variaes da planta com erro no superior a 15% para 0, 7rad/s, ou seja , s 0, 15,a barreira de desempenho para estas condies dada por:

    20 log10(0, 15) para 0, 7rad/s

    A barreira da estabilidade foi determinada encontrando-se o inverso do maior valor singular do rudo de medio,variando-se a constante de 0,1 a 1,0 , para uma dada frequncia. A variao em toda a frequncia fornece a barreira daestabilidade.

    A Figura 10 mostra o valor singular do sistema nominal aumentado juntamente com as barreiras de desempenho ede estabilidade. Por esta figura, nota-se que o sistema nominal aumentado est dentro dos limites considerados para esteprojeto. Portanto, o sistema atende aos compromissos de sistema que consideram os erros com relao ao rastreamentodo sinal de entrada, rejeio a perturbao e sensibilidade a variao da planta. Alm disso, importante destacar que osistema se mantm estvel mesmo na presena do rudo, Gd.

    Figure 10. Sistema nominal aumentado (azul) e as barreiras de desempenho (vermelho) e de estabilidade (preto).

    frequncia

    Sistema com LQG e barreiras de desempenho e estabilidade

    7. CONTROLADOR LQG/LTR

    O problema LQG/LTR com recuperao da malha de realimentao, formulado como um problema de otimizaoque aplicado na recuperao da malha pela entrada. As metodologias do projeto LQG/LTR, apresentadas em Doyleand Stein (1979), fornecem importantes resultados tericos, mas a abordagem desprovida de modelos, algoritmos e

  • 23rd ABCM International Congress of Mechanical Engineering (COBEM 2015)December 6-11, 2015, Rio de Janeiro, RJ, Brazil

    procedimentos eficientes, no sentido do mtodo de busca, ajuste de ganho de malha e sua recuperao, salvo mtodos detentativas e erros. Nesta pesquisa, um procedimento de projeto para ajustar os ganhos dos observadores apresentadopara recuperar a malha fa funo de transferncia na entrada. O ajuste do ganho baseado em modificaes automticasno parmetro v, tomando como referncia as matrizes de covarincias determinadas pelo FK, para determinar o ganhotimo do observador de estado, para recuperar as propriedades de robustez, conforme a estrutura de otimizao que serformulada.

    7.1 Modelo de ajuste de ganho LTR

    O problema LQG/LTR para recuperao das propriedades de robustez da malha da funo de transferncia formuladocomo um problema de otimizao. O ndice de desempenho a melhor escolha que minimiza o erro da freqncia dadecomposio em valores da estrutura de controle dos projetos LQR e LQG. Destacam-se como objetivos a determinaodo controlador KLQR/LTR, Seo 4, a seleo das matrizes de ponderao Q e R do problema LQR, Seo 3, e a deter-minao do ganho do observador LLQR/LTR, considerando a recuperao pela entrada, o problema de LQG associadocom a seleo das matrizes de covarincias. O uso de procedimentos por tentativa e erro para o projeto LTR justifica odesenvolvimento de um algoritmo que fornece um mtodo timo para determinar o ganho de recuperao de malha. Oganho K do controlador, fixado no procedimento, foi determinado no primeiro relatrio.

    O procedimento para a recuperao do ganho de malha do LTR na entrada, mostra que escolhas apropriadas dasmatrizes de covarincias funo de um parmetro vi, que pode aproximar a malha de controle LTR da malha de controleLQR. A abordagem de recuperao das propriedades de robustez do projeto de pesquisa, utilizando algoritmo gentico eredes neuronais foi motivada no artigo de Sergi (2012).

    7.2 Modelo de Busca LTR

    A seleo das matrizes (Q,R) e (,) so as duas alternativas para recuperao de malha do projeto LQR. Narecuperao pela entrada, a busca direcionada para as matrizes. As variaes das matrizes de ponderaes tm comoreferncia as matrizes (Q0, R0) e a lei para esta variao conforme Eq. 11.

    (Qi = vi2Q0 + CC

    T , R = vi2R0) (10)

    A Eq. 11 funo de um escalar vi. Na recuperao pela entrada, a busca direcionada para o par de matrizes (,),sendo que as matrizes de covarincias tm como referncia as matrizes de covarincias (,) e uma lei que estabelecesuas variaes i = vi20 +BBT , = vi20 como funo de um escalar vi.

    O problema modelado como uma estrutura de otimizao combinatria, permitindo a determinao do ganho docontrolador K = R1BTPLQR(Q,R) ou ganhos do observador de estado L, que recupera o ganho de malha LLQRpor meio do projeto LLQR/LTR. A recuperao da malha do projeto LQR realizada no domnio da freqncia. Umavez o sistema aberto no Ponto 1, Figura 1, a funo de transferncia de malha aberta dada por L(s)LTR

    input=

    F (s)G(s) = KrLCB, onde L(s)LTRinput a funo de transferncia na entrada. O problema formulado de

    maneira que se determine os ganhos L, do observador de estado o qual recupera a malha da funo de transfernciaL(s)LQR , suportado por uma estrutura de otimizao combinatria.

    min(

    LLQRi

    KrLCBi

    )L,

    s.a |L,| i,esq. calc. i,dir.Si , i = 1, ..., n.

    (11)

    onde |L,| so restries operacionais do problema.A soluo da recuperao do projeto LTR na entrada dada pela seleo do par de matrizes de covarincias, que

    realizada pelo modelo de busca LTR,, sendo que essas matrizes constituem os parmetros matriciais da equaoalgbrica de Riccati, A + AT +G(20 +BBT )GT CT (20)1C = 0, sendo v o parmetro escalar usadopara ajustar as matrizes de covarincias. A soluo da equao algbrica de Riccati utilizado para computar os ganhosdo observador L

    LTR= CT (20)

    1, onde LLTR so os ganhos do observador do Filtro de Kalman.

    7.3 Desempenho AG LQR/LTR

    O desempenho do projeto do AG- LQG/LTR verificado, comparando-se os valores singulares do projeto LQR e doprojeto LTR. A implementao do algoritmo considera uma populao composta por quartoze indivduos e um ciclo debusca de sete geraes. O parmetro de operao de crossover tem como valores 0.1 e 0.05. A operao de mutao temprobabilidade de ocorrncia probmut = 5%.

  • Ivanildo S. Abreu, Alfredo C. O. JuniorPROJETO DE CONTROLADOR ROBUSTO LQG/LTR EM MANIPULADOR ROBTICO VIA MODELO GENTICO NEURONAL

    Figure 11. Valores singulares da recuperao das propriedades de robustez.

    A Figura 11 ilustra os valores singulares da recuperao das propriedades de robustez do projeto LQR via projeto LTR,usando algoritmo gentico. Verificou-se que quando v 0, as propriedades de robustez, perdidas com a estimao, socompletamente recuperadas. Segundo Lewis and Vassilis (1995), os limites para garantir as propriedades de robustez sodadas em termos dos valores singulares mnimos, sendo grandes nas baixas freqncias (para desempenho da robustez) eos valores singulares mximos so pequenos nas altas freqncias (para estabilidade de robustez).

    8. CONCLUSO

    Um modelo hierrquico de algoritmos genticos para recuperao da malha de transferncia na entrada foi apresen-tado como uma soluo para ajuste de ganhos de controladores e observadores no espao de estados. O desenvolvimentodos controladores LQR, LQG e LQG/LTR e mtodos de projeto de observadores baseados em uma hierarquia de modelosde algoritmos genticos e redes neurais artificiais foram utilizados para ajustar os ganhos de malha. Baseado na imple-mentao o modelo e implementao do controlador e observador e o mtodo de ajuste proposto podem ser vistos comouma boa alternativa para aplicaes prticas em tempo real. Esta soluo inteligente representa o desenvolvimento de ummodelo gentico artificial para ajuste dos ganhos de recuperao da malha de transferncia.

    9. AGRADECIMENTOS

    Universidade Estadual do Maranho pelo suporte tcnico ao utilizar o Laboratrio de Automao e Controle, aCAPES e ao Programa de Ps-Graduao em Engenharia de Computao e Sistemas.

    10. REFERNCIAS

    Abreu, I. and Fonseca, N., 2010. Neural-genetic state space controllers synthesis based on linear quadratic regulatosdesign for eigenstrucutre assignment. Systems, man, and Cybernetics, part B; Cybernetics, IEEE Transaction on.

    Chiu, D.K. and Lee, S., 1997. Design and experimentation of a jump impact controller. IEEE.da Cruz, J.J., 1996. Controle robusto multivarivel. DUSP.Doyle, J.C. and Stein, G., 1979. Robustness with observers. In IEEE Transactions on Automatic Control.Lewis, F.L. and Vassilis, L.S., 1995. Optimal control. Inc.. USA.Neto, J.V. and Abreu, I., 2007. A genetic algorithm convergence and models for eigenstrucuture assignment via linear

    quadratic regulator. Revista IEEE Amrica Latina.Sergi, F., 2012. Design and characterization of a compact rotary series elastic actuator for knee assistance during

    overground walking. Roma, Italy.Wang, J., Wub and Guang, 1998. A multilayer recurrent neural network for solving continuous-time algebraic riccati

    equations.