4
Controle Ótimo por Modos Deslizantes para Sistemas Multivariáveis de Tempo Discreto Igor B. Ferraço, Marco H. Terra, João P. Cerri Depto de Engenharia Elétrica, EESC, USP - São Carlos, 13566-590, São Carlos, SP E-mail: [email protected], [email protected], [email protected]. 30 de maio de 2011 Palavras-chave: Controle ótimo, método de mínimos quadrados, função penalidade, sistemas lineares. Resumo: Este trabalho aborda o problema de controle ótimo por modos deslizantes para sistemas multivariáveis de tempo discreto. Será proposta uma estrutura matricial alternativa baseada no problema de mínimos quadrados ponderados e funções penalidade para solucionar este problema. 1 Introdução Neste artigo será tratado o problema de controle ótimo por modos deslizantes para sistemas multivariáveis de tempo discreto. Este tipo de controle é caracterizado pela capacidade robusta de estabilizar sistemas lineares em tempo discreto através da minimização de um índice de desempenho quadrático, ver [4] e [2]. Será proposto neste trabalho uma procedimento alternativo para encontrar a lei de controle ótimo por modos deslizantes proposta em [4]. A nova abordagem desenvolvida baseia-se na combinação do problema de mínimos quadrados ponderados e funções penalidade. A unificação destas técnicas no tratamento de problemas de minimização de funcionais quadráticos com re- strições de igualdade linear tem permitido lidar de forma apropriada com problemas de controle recursivos de diversas categorias de sistemas lineares, veja [1] para maiores detalhes. A motivação para desenvolver esta nova abordagem é explorar futuramente o problema de controle por modos deslizantes para sistemas multivariáveis sujeitos a incertezas nas matrizes de parâmetros. Preliminarmente, para atingir esse objetivo, pretende-se neste trabalho somente verificar a eficácia desta técnica para resolver o problema de controle ótimo por modos deslizantes para sistemas multivariáveis nominais. 2 Resultados preliminares Considere o problema de mínimos quadrados ponderados definido por min xR m {J (x)} , (1) sendo J (x)= Ax b2 W =(Ax b) T W (Ax b), W R n×n (matriz de ponderação) simétrica definida positiva, A R n×m e b R n assumidos conhecidos e x R m o vetor incógnita. O método de função penalidade é definido da seguinte forma. Considere o seguinte problema de minimização restrita min xΩ {f (x)} , (2) 244 ISSN 2317-3300

Controle Ótimo por Modos Deslizantes para Sistemas ... · sendo µ uma constante real positiva. Para acada µ > 0, seja bx ... temos que a lei de controle é dada por: u ... ,N,

  • Upload
    hanhan

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Controle Ótimo por Modos Deslizantes para SistemasMultivariáveis de Tempo Discreto

Igor B. Ferraço, Marco H. Terra, João P. Cerri

Depto de Engenharia Elétrica, EESC, USP - São Carlos,

13566-590, São Carlos, SP

E-mail: [email protected], [email protected], [email protected].

30 de maio de 2011

Palavras-chave: Controle ótimo, método de mínimos quadrados, função penalidade, sistemaslineares.

Resumo: Este trabalho aborda o problema de controle ótimo por modos deslizantes para sistemasmultivariáveis de tempo discreto. Será proposta uma estrutura matricial alternativa baseada noproblema de mínimos quadrados ponderados e funções penalidade para solucionar este problema.

1 Introdução

Neste artigo será tratado o problema de controle ótimo por modos deslizantes para sistemasmultivariáveis de tempo discreto. Este tipo de controle é caracterizado pela capacidade robustade estabilizar sistemas lineares em tempo discreto através da minimização de um índice dedesempenho quadrático, ver [4] e [2].

Será proposto neste trabalho uma procedimento alternativo para encontrar a lei de controleótimo por modos deslizantes proposta em [4]. A nova abordagem desenvolvida baseia-se nacombinação do problema de mínimos quadrados ponderados e funções penalidade. A unificaçãodestas técnicas no tratamento de problemas de minimização de funcionais quadráticos com re-strições de igualdade linear tem permitido lidar de forma apropriada com problemas de controlerecursivos de diversas categorias de sistemas lineares, veja [1] para maiores detalhes.

A motivação para desenvolver esta nova abordagem é explorar futuramente o problema decontrole por modos deslizantes para sistemas multivariáveis sujeitos a incertezas nas matrizesde parâmetros. Preliminarmente, para atingir esse objetivo, pretende-se neste trabalho somenteverificar a eficácia desta técnica para resolver o problema de controle ótimo por modos deslizantespara sistemas multivariáveis nominais.

2 Resultados preliminares

Considere o problema de mínimos quadrados ponderados definido por

minx∈Rm

J(x) , (1)

sendo J(x) = ‖Ax− b‖2W = (Ax− b)TW (Ax− b), W ∈ Rn×n (matriz de ponderação) simétrica

definida positiva, A ∈ Rn×m e b ∈ R

n assumidos conhecidos e x ∈ Rm o vetor incógnita.

O método de função penalidade é definido da seguinte forma. Considere o seguinte problemade minimização restrita

minx∈Ω

f(x) , (2)

244

ISSN 2317-3300

com solução ótima xo. Considere o problema (2) reescrito da seguinte forma:

minx∈Rn

f(x) + µh(x) , (3)

sendo µ uma constante real positiva. Para acada µ > 0, seja x(µ) a solução ótima do problema(3). Então, xo = limµ→+∞ x(µ). O termo µhT (x)h(x) é chamado de função penalidade.

Lema 2.1 [1] Sejam V ∈ Rn×n definida positiva, N ∈ R

k×n posto linha pleno e M ∈ Rk×n posto

coluna pleno. Seja o seguinte funcional quadrático J(x) := (Mx− z)TV (Mx− z), e considere oproblema de minimização com restrição:

minx∈Rm

J(x)

s. a Nx = w,(4)

sendo z ∈ Rn, x ∈ R

m e w ∈ Rk. Associado a (4) tem-se para cada µ > 0 o seguinte problema

de minimização sem restrição:min

x(µ)∈RmJ (x(µ)) , (5)

sendo J (x(µ)) = (Gx(µ)−B)TV(µ)(Gx(µ)−B), G =

[M

N

], V(µ) =

[V 00 µI

]e B =

[z

w

]. Então:

(i) para cada µ > 0, a solução ótima x(µ) do problema de minimização sem restrição (5) édada por

[x(µ)

J (x(µ))

]

=

[0 B

I 0

]T [V−1(µ) G

GT 0

]−1 [

B

0

]

. (6)

(ii) limµ→+∞ x(µ) = xo, sendo xo a solução ótima do problema de minimização (4) dada por

[xo

J(xo)

]

=

0 z

0 w

I 0

T

V −1 0 M

0 0 N

MT NT 0

−1

z

w

0

. (7)

3 Controle Ótimo por Modos Deslizantes

Considere o sistema linear de tempo discreto:

xk+1 = Fxk +Guk, k = 0, . . . , N. (8)

sendo F ∈ Rn×n e G ∈ R

n×m matrizes conhecidas, xk ∈ Rn o vetor de estado e uk ∈ R

m aentrada de controle. Considere que o par (F,G) é controlável.

As múltiplas superfícies deslizantes serão definidas da seguinte forma: sk = Cxk + φk = 0,sendo C ∈ R

m×n e CG uma matriz não-singular. Veja que sk = [s1,k s2,k . . . sm,k]T , en-

tão para cada superfície que compõe sk teremos uma lei de controle associada, pois uk =[u1,k u2,k . . . um,k]

T . A superfície deslizante sk = 0 será formada pela interseção das super-fícies deslizantes que a compõe.

Para se obter um modo deslizante ideal, a seguinte condição deve ser satisfeita: sk+1 = sk =0, ∀k. A partir desta condição é possível encontrar a lei de controle equivalente do sistema (8),dada por:

uek = −(CG)−1[CFxk + φk+1].

O projeto da lei de controle chaveado é beseada na lei de alcançabilidade definida por [3],que é dada por: |si,k+1| < |si,k| , ∀i. Utilizando a lei de controle equivalente uek, temos:

−1 <CiG(−uek + uk)

|si,k|< 1, e suponha que Wi,k =

CiG(−uek + uk)

|si,k|, ∀i. (9)

245

ISSN 2317-3300

Então, |Wi,k| < 1. A matriz Wk é uma matriz diagonal, ou seja, Wk = diag(W1,k, . . . ,Wm,k), ∀k.A partir de (9) temos que a lei de controle é dada por:

uk = −(CG)−1[CFxk + φk+1 −Wksk]. (10)

Realimentado o sistema (8) com a lei de controle (10), obtém-se:

yk+1 = Fyk + Gvk, (11)

sendo vk = φk+1 − φk, yk = [xTk , φk]T ,

F =

[F −G(CG)−1(CF −WkC) G(CG)−1(Wk − I)

0 I

]

e G =

[−G(CG)−1

1

]

.

Baseado em [4], tem-se o seguinte funcional custo quadrático:

J = xTk+1Pk+1xk+1 +∞∑

k=0

(xTkQxk + uTk uk), (12)

sendo Pk+1 0 e a matriz Q 0 assumida conhecida. Realimentando o funcional custoquadrático (12) com a lei de controle (10), obtém-se:

J = yTk+1Pk+1yk+1 +∞∑

k=0

(yTk Qyk + 2yTk Svk + vTk Rvk), (13)

sendo:Pk+1 =

[Pk+1 00 0

]

; R =[(CG)−1

]T(CG)−1; S =

[(CF − rC)TR

(I −Wk)TR

]

;

Q =

[Q+ (CF −WkC)TR(CF −WkC) (CF −WkC)TR(I −Wk)

(I −Wk)TR(CF −WkC) (I −Wk)

TR(I −Wk)

]

.

Assim, tem-se o seguinte problema de otimização com restrição de igualdade:

minyk+1,vk

yTN+1PN+1yN+1 +

N∑

j=0

Ωj(yj , vj)

(14)

s. a yk+1 = Fyk + Gvk, k = 0, . . . , N,

sendo Ωj(yj , vj) = yTj Qyj + 2yTj Svk + vTj Rvj , cuja solução fornecerá a seguinte sequência ótima

(y∗k+1, v∗k)

Nk=0. O problema de minimização (14) pode ser resolvido de forma recursiva utilizando

programação dinâmica como mostrado no próximo lema.

Lema 3.1 O problema de minização definido em (14), pode ser resolvido recursivamente pormeio da minimização de

miny1,v0

L0(y0, u0) + min

y2,v1

L1(y1, u1) + · · ·+ min

yi,vi−1

Li−1(yi−1, ui−1) + · · ·+

+ minyN+1,vN

LN (yN , uN ) + yTN+1PN+1yN+1

· · ·

(15)

sujeito a yk+1 = Fyk + Gvk, k = 0, . . . , N.

Prova 1 Omitida.

246

ISSN 2317-3300

Pelos Lemas (2.1) e (3.1) pode-se reescrever o problema (14) da seguinte forma:

minyk+1,vk

Jµk (yk+1, vk)

, (16)

Jµk(yk+1, vk) =

I 00 00 I

0 00 00 0I −G

[yk+1

vk

]

000−I

00F

yk

T

Pk+1 I 0 0 0 0 0I 0 0 0 0 0 00 0 R ST I 0 00 0 S Q 0 I 00 0 I 0 0 0 00 0 0 I 0 0 00 0 0 0 0 0 µI

(

)

.

A solução recursiva do problema de otimização (16) será mostrada no teorema a seguir.

Teorema 3.1 A solução ótima recursiva é dada por:

Lk

Kk

Pk

=

0 0 00 0 00 0 00 0 −I

0 0 00 0 00 0 F

I 0 00 I 0

T

0 I 0 0 0 0 0 I 0I −Pk+1 0 0 0 0 0 0 00 0 0 0 I 0 0 0 I

0 0 0 0 0 I 0 0 00 0 I 0 −R −ST 0 0 00 0 0 I −S −Q 0 0 00 0 0 0 0 0 0 I −G

I 0 0 0 0 0 I 0 00 0 I 0 0 0 −GT 0 0

−1

000−I

00F

00

. (17)

Prova 2 Omitida.

Lema 3.2 A solução recursiva (17) proposta no Teorema 3.1 pode ser reescrita como:

y∗k+1 =[

F − G(R+ GTPk+1G)

−1(ST + GTPk+1F)

]

︸ ︷︷ ︸

Lk

y∗k (18)

v∗k = −G(R+ GTPk+1G)

−1(ST + GTPk+1F)

︸ ︷︷ ︸

Kk

y∗k, (19)

para todo k = 0, . . . , N , sendo:

Pk = (F − GR−1

ST )T

[

Pk+1 − Pk+1G(R+ GTPk+1G)

−1GTPk+1

]

(F − GR−1

ST ) + (Q− SR

−1ST ), (20)

para todo k = N, . . . , 0.

Prova 3 Omitida.

4 Conclusão

Este trabalho propõe uma estrutura alternativa para o problema de controle ótimo por mo-dos deslizantes multivariável. A principal característica desta nova abordagem é a matriz deparâmetro do sistema realimentado, o ganho do controlador e a solução da equação de Riccatique são apresentadas em uma única matriz. Equivalente à solução padrão fornecidos em [4] e[2], a recursividade do algoritmo permanece válida.

Referências

[1] J.P. Cerri, “Regulador Robusto Recursivo para Sistemas Lineares de Tempo Discreto noEspaço de Estado”, Dissertação de mestrado, EESC-USP, São Carlos, 2009.

[2] A.J. Koshkouei and A.S.I. Zinober, Sliding Mode Control of Discrete-Time Systems, Journalof Dynamic Systems, Measurement, and Control, 122(2000) 793-802.

[3] S.Z. Sarpturk, Y. Istefanopulos and O. Kaynak, On the stability of discrete-time slidingmode control systems, IEEE Transactions on Automatic Control, 32(1987) 930-932.

[4] R. Xu, “Optimal Sliding Mode Control and Stabilization of Underactuated Systems”, Ph.D.Thesis, Ohio State University, 2007.

247

ISSN 2317-3300