Upload
renan-godinho
View
192
Download
1
Embed Size (px)
Citation preview
Instituto Federal de Educação, Ciência e Tecnologia do Pará (IFPA)
Engenharia de Controle e Automação Engenharia de Controle I
Regulador Linear Quadrático
Pedro Santos
Renan Godinho
Barbara Gonçalves
Abner Barbosa
Rodrigo Pena
Belém/PA
Setembro/2013
SUMÁRIO
INTRODUÇÃO.......................................................................................................3
DESENVOLVIMENTO.............................................................................................4
1. PROBLEMAS DE CONTROLE ÓTIMO.................................................................4
a) PROBLEMA DO CONTROLE ÓTIMO QUADRÁTICO:.........................4
b) TEMPO MÍNIMO DE CONTROLE:....................................................6
c) CONTROLE TERMINAL:...................................................................6
d) MÍNIMO ESFORÇO DE CONTROLE:.................................................6
e) O SERVOMECANISMO ÓTIMO:.......................................................6
f) PROBLEMA DO REGULADOR ÓTIMO:...............................................7
2. O Problema do Regulador Linear Quadrático Invariante no Tempo.7
3. Motivação física para o Regulador Linear Quadrático......................10
4. As Matrizes Q e R................................................................................13
5. Projeto de Regulador Linear Quadrático no MATLAB.....................18
6. Conclusão.............................................................................................21
7. Bibliografia............................................................................................22
INTRODUÇAO
O Regulador linear quadrático (LQR do inglês Linear Quadratic
Regulator) possui grande aplicação em controle ótimo. A teoria do controle
ótimo lida com operação de um sistema dinâmico com custo mínimo. Sabemos
que a natureza não é linear, portanto por meio de uma linearização podemos
conduzir a uma solução que se aproxime da solução real do problema.
O LQR é uma estratégia de controle,criada pelo matemático Kalman em
1960, que é baseada na realimentação de estados , ou seja , tem a vantagem
de se apresenta a solução do problema através das variáveis de estado, é
fundamental para o LQR que os ganhos do controlador sejam calculados pelas
matrizes que regem o desempenho do sistema.
Esses ganhos obtidos são encontrados por meio da solução da equação
de Riccati, que é uma equação diferencial não-linear de primeira ordem, a
resolução de problemas de controle ótimo através de sistemas lineares é bem
conhecida e seus estudos são bastantes consolidados , entretanto quando o
sistema não é linear a solução do problema torna-se complexa. Com o objetivo
de amenizar esse problema parcialmente Al´brekht (1962) estudou o problema
de controle ótimo de maneira geral considerando um sistema de equações não-
lineares , mas analíticas e invariantes no tempo. Lukes (1969) utilizou esses
conceitos e estendeu a teoria do LQR a sistemas não-lineares, mas analíticos
em torno da origem, invariantes no tempo e com horizonte infinito. Willemstein
(1975) mostrou que essa extensão é valida para sistemas não-lineares, mas
analíticos em torno da origem, variantes no tempo e com horizonte finito. A
situação onde a dinâmica do sistema é descrita por um conjunto de equações
diferenciais lineares é descrita por uma função quadrática, denominada de
problema linear quadrático.
DESENVOLVIMENTO
O controle ótimo está desempenhando um papel cada vez mais
importante nos projetos de sistemas modernos com o objetivo a maximização
do retorno de, ou a minimização do custo de, a operação do processo físico e
econômico.
A situação onde a dinâmica do sistema é descrita por um conjunto de
equações diferenciais lineares é descrita por uma função quadrática,
denominada de problema linear quadrático.
Nos projetos via Regulador Linear Quadrático, o projetista deverá atribuir
ponderações as matrizes que definem a importância relativa dos estados e do
esforço de controle, no entanto o LQR não possui um método para definir
antecipadamente os parâmetros de desempenho do sistema em função do
tempo em função das ponderações impostas pelo projetista, mostrando-se
basicamente empírica.
1. PROBLEMAS DE CONTROLE ÓTIMO:
a) PROBLEMA DO CONTROLE ÓTIMO QUADRÁTICO:
*Regulador de tempo contínuo:
O sistema dinâmico abaixo descrito pelas equações de estados:
(1)
Onde u = -kx
Com função custo dada por:
∫
(2)
A minimização do valor custo é representada pela seguinte lei de
controle de retroalimentação:
(3)
Sendo P encontrado através da solução da Equação de Ricatti(*) dada
abaixo:
(4)
* Equação de Ricatti é uma equação diferencial ordinária não-linear de
primeira ordem, na forma:
(5)
Onde a(x),b(x) e c(x) são três funções que dependem de
Se conhecermos uma solução particular da equação, por exemplo , a
seguinte mudança de variável transformará a equação em equação linear:
(6)
=
(7)
*Regulador de tempo discreto:
Sendo o sistema de tempo discreto descrito por:
(8)
Função custo definida por:
A lei de controle de realimentação é:
(9)
Onde: (10)
(11)
E P é a solução para a Equação de Ricatti discreta:
(12)
O objetivo do controle ótimo é determinar o vetor de controle u(t)
que forçará o comportamento do sistema a minimizar algum tipo de
função custo, enquanto ao mesmo tempo satisfaz as limitações físicas
do sistema.
b) TEMPO MÍNIMO DE CONTROLE:
O problema resumisse em encontrar o vetor u(t) de modo que o tempo
exigido seja mínimo, ou seja, a . Onde este tempo é calculado pela
função custo abaixo :
∫
(13)
c) Controle terminal :
Dada a função abaixo:
( ) ( ) ( ) (14)
Onde ξ( é o valor final desejado para , S é a matriz de estados
terminais, ou seja, S está relacionada com os estados finais fixos, os quais são
os estados desejados, positiva semidefinida de pesos. Neste caso, o interesse
é definir u(t), tal que o erro x(tf) – ξ(tf) seja mínimo.
d) Mínimo esforço de controle:
Dada a função :
∫
(15)
Na expressão acima J representa a energia consumida pelo vetor de
controle u(t) na ação de controlar o sistema, onde R é um matriz de peso
semidefinida positiva com t Є (
e) O servomecanismo ótimo:
Dada a função de custo:
∫ ∫
(16)
Onde Q é uma matriz de pesos real semidefinida positiva para t Є (tf,t0) e
ξ(t) é a trajetória pré-especificada, desejada, do vetor de estado x(t). O vetor de
e = x(t) – ξ(t) é o erro que se deseja minimizar. Isto deve ser completado pela
escolha de um u(t) adequado.
Neste tipo de problema, frequentemente inclui-se tanto o esforço de
controle, quanto o problema de controle terminal:
( ) ( ) [ ( ) ( )]
∫
} (17)
f) Problema do regulador ótimo:
Dada a função de custo abaixo:
∫
(18)
Aqui o objetivo é restabelecer o estado de equilíbrio do sistema após este
ser submetido a uma perturbação. Em projetos de controle ótimo envolvendo
este tipo de problema, nos quais não se requer estados finais fixos, a função de
custo J se reduz a:
∫
(19)
2. O Problema do Regulador Linear Quadrático Invariante no Tempo
Para iniciar, será exposto o problema do LQR, sua solução e hipóteses
usadas na obtenção da solução. Será dado o teorema abaixo, avaliado sem
provas, somente hipóteses acerca do LQR, abordando a existência da solução
do problema.
Teorema 1: Dada a dinâmica do sistema:
(19)
(20)
Com x(t) Є Rn e u(t) Є Rm ao longo de uma combinação linear de estados,
deixando pequena
(21)
Com y(t) Є Rp. Define-se a função custo quadrática:
∫
(22)
No qual o tamanho dos estados de interesse, z(t) é comparado
relativamente à ação de controle equivalente de u(t), através da matriz de
pesos R. Considerando, sem prova formal, se as seguintes hipóteses são
corretas:
a) O vetor de estado x(t) está inteiramente disponível para realimentação;
b) [A B] é estabilizável e [A C] é detectável;
c) R = RT>0;
Então:
i) O controlador linear quadrático é único, ótimo e a lei de controle de
realimentação de estados total é:
Com:
Que minimiza a função custo J, sujeito à restrição dinâmica imposta pela
dinâmica de malha aberta em eq.1.
ii) S é uma matriz única, simétrica, positiva e semidefinida, a qual é
solução da equação algébrica de Riccati:
iii) A dinâmica em malha fechada, através da substituição de 2 em 1:
(23)
(24)
(25)
(26)
(27)
O qual é garantido haver estabilidade.
iv) O mínimo valor do funcional quadrático de custo J na equação 11 é:
A prova (simplificada) do teorema anterior decorre do sistema dado na
equação 1 e da função de Lyapunov
Com S>0 calculada a partir da equação de Riccati. Derivando em relação
ao tempo, obtem-se:
Cuja integral de 0 a +∞ fornece
( ) ( ) ∫
Com ρ = R sendo escalar (no caso geral de uma única entrada u(t)).
3. Motivação física para o Regulador Linear Quadrático
O problema do LQR e o custo podem ser motivados da seguinte maneira.
Dado o sistema da equação 1, que está inicialmente excitado, e o resultado
desta excitação está refletido no vetor de estado x0. Esta condição inicial pode
ser considerada como um desvio indesejável da posição de equilíbrio do
sistema, x(t)=0. Uma vez conhecido esse desvio, o objetivo de controle pode
ser essencialmente visto como a seleção do vetor de controle u(t) que regula o
vetor de estado x(t)=0 tão rapidamente o possível.
(28)
(29)
[30]
(31)
0]
Se a equação 1 é controlável, então é possível levar o sistema de x(t) para
zero em um curto período de tempo arbitrário. Isto irá requerer altos valores do
sinal de controle (grande esforço de controle), o qual do ponto de vista da
engenharia é inaceitável. Altos valores para sinais de controle irão saturar os
atuadores e se implementados na forma de realimentação, irá requerer projetos
com grandes larguras de banda que por sua vez, irão excitar dinâmicas não
modeladas. Por este motivo, fica óbvio que deve existir no projeto um balanço
entre o desejo de regular perturbações em estado de equilíbrio e a magnitude
do sinal de controle necessário.
Minimizando o funcional quadrático de custo da equação 11 é uma forma
de quantificar o desejo do engenheiro de controle em alcançar este balanço.
Compreender que a natureza quadrática de ambos os termos no custo
(32)
(33)
Assegura que estes termos são não-negativos para todo t. Ora, avaliando o
efeito de R e CTC = Q no desempenho do sistema, é possível chegar às
seguintes conclusões:
i) Se Q>>R>0
O peso do sinal de controle no cálculo do critério é reduzido;
O sinal de controle pode atingir valores elevados;
O sistema responde com maior velocidade;
Há a possibilidade de saturação dos atuadores;
ii) Em contrapartida, se 0≤Q<<R:
A energia de controle tem maior peso no cálculo do critério;
As componentes do ganho de realimentação de estado serão de
pequeno valor absoluto;
O sistema não apresentará uma resposta rápida.
Exemplo:
Considere-se o sistema mostrado na Figura 2.1. Admitindo-se que o sinal de controle seja: u(t) = - Kx(t)
Determinar a matriz de ganho de realimentação K ótima tal que o seguinte índice de desempenho seja minimizado:
∫
Onde:
[
]
Fig.2.1. Sistema de controle
A partir da figura acima, acha-se a equação de estado para o processo é:
Onde [
], B =[ ]
Será demonstrado o uso da equação matricial de Riccati reduzida no projeto do sistema de controle ótimo, como:
Observando-se que a matriz A é real e que a matriz Q é real e simétrica, a matriz P é uma matriz real simétrica. Portanto, esta última equação pode ser escrita como:
Esta equação pode ser simplificada para
A partir da qual se obtém as três equações seguintes
Resolvendo-se estas três equações simultâneas em p11, p12, p22, com o requisito de que P seja definida positiva, obtém-se:
Pode-se obter a matriz de ganho de realimentação K ótima como sendo:
Assim, o sinal de controle ótimo é
Note-se que a lei de controle dada pela equação acima conduz a um resultado ótimo para qualquer estado inicial sob o índice de desempenho dado. Além disso, observa-se que a matriz Q só afeta o segundo elemento da matriz de ganho de realimentação K.
4. As Matrizes Q e R.
Um problema do LQR é a determinação das matrizes de ponderação que
satisfazem determinadas condições, onde, Q é uma matriz de ponderação
associada aos estados do sistema e R é uma matriz de ponderação associada às
variáveis de controle. A determinação dessas matrizes influencia para o cálculo
do ganho. Diversas técnicas foram desenvolvidas para determina-las que tem por
base métodos determinísticos e Heurísticos. A liberdade de escolha das matrizes
de ponderação do projeto LQR são variáveis de projeto livres que são utilizadas
para a sintonia dos ganhos de controle ótimo.
O principal enfoque deste tópico é fazer uma breve explanação dos métodos
de busca das matrizes de ponderação Q e R que compõem índice de
desempenho J.
a) Métodos Heurísticos: são métodos que constituem uma das primeiras
técnicas concebidas para a seleção das matrizes de ponderação. Uma
abordagem dessa metodologia é o chamado quadrado do inverso ou Método de
Bryson, cuja idéia básica é normalizar as saídas e o termo controle dentro da
função de índice de desempenho quadrático. Esta normalização é normalmente
realizada usando o máximo de valores antecipados (ou derivados) do controle e
das saídas individuais. Porém, sua desvantagem é por ser um método intuitivo.
Os parâmetros Q e R geralmente necessitam ser sintonizados até um
comportamento satisfatório ser obtido, ou até o projetista se satisfazer com o
resultado.
Uma conjectura inicial é escolher uma diagonal de Q e R
b) [
] [
]
Onde Q e R têm diagonais positivas, dentre as quais:
c)
d)
e)
Onde m é o numero de estados e k é o número de atuadores do sistema de
controle. O desempenho desejado do sistema obtido pelo ajuste das matrizes
de ponderações são escolhidas pelas equações 4.3 e 4.4.
O número Δximax está baseado na faixa/intervalo de operação dos estados.
A outra quantidade Δuimax tem um significado similar para a i-ésima
[4.1]
[4.2]
[4.3]
[4.4]
componente da entrada u, e está baseada no máximo esforço de controle ou
valor máximo de operação de atuadores. Partindo desta conjectura inicial os
valores das diagonais principais de Q e R devem ser ajustados por método de
tentativa e erro, sistematicamente.
Na figura 4.1 apresenta-se um algoritmo ilustrando o procedimento de
determinação das matrizes de ponderação Q e R, implementando o método de
Bryson.
b) Metodologia usando Controle ótimo Modal
O objetivo do controle ótimo modal é determinar uma lei de realimentação
de estado, utilizando a equação 4.4:
de modo que a matriz do sistema de malha fechada
tenha os seus autovalores pré estabelecidos. O controle ótimo modal é
baseado na convencional alocação de pólos, que em vez de escolher o ganho
de realimentação diretamente, os parâmetros de projeto da função quadrática
são posicionados de acordo com as matrizes Q e R até atingir os objetivos do
projeto de controle.
c) Projeto do Regulador com Condições de Estabilidade.
Neste método troca-se a determinação das localizações exatas de todos os
pólos à malha fechada pela simples especificação de uma região do semipleno
complexo esquerdo onde deverão estar os pólos a malha fechada. Este
método explora ainda as propriedades do regulador de potência mínima e a
equação de Riccati é usada para determinar as matrizes de ponderação
apropriadas.
[4.5]
Figura 4.1 - Método de Bryson
Figura 4.2 - Controle modal
Figura 4.3 - Algoritmo do regulador em condições de estabilidade
5. Projeto de Regulador Linear Quadrático no MATLAB
Exemplo 1:
Considerando uma equação multivariável de espaço de estado
determinada por
Selecionando a matriz diagonal Q = diag(10, 8, 2, 0) e a matriz
identidade R = I, podemos obter a matriz de realimentação de estados através
de
A matriz K de realimentação de estados e a solução P para a equação de
Ricatti pode ser obtida por
E os polos em malha fechada são −6.3396,−12.7427,−23.5384 e −27.8096.
Exemplo 2: Regulador Linear Quadrático para um motor DC
A representação dos estados do motor de corrente contínua é dado abaixo:
Onde y é a velocidade angular da carga e u a tensão de alimentação de tal forma que o sistema em malha fechada
1. Seja estável e acompanhe um degrau unitário com erro nulo em regime permanente.
2. Não apresente sobre-elevação no sinal de saída, em relação ao degrau de entrada, no domínio do tempo.
Considere o modelo do motor de corrente contínua. Resolvemos o problema linear quadrático para:
A = 0 1.0000 -0.1429 -1.0714 B = 0 1 C = 0.0714 0 D = 0 Q = 1 0 0 1 R = 25 Logo, para [k,P] = lqr(A,B,Q,R) são: k = 0.1029 0.1092 P = 3.4271 2.5726 2.5726 2.7289 E 1 ≤ρ ≤ 25. Obtemos o Gráfico a seguir:
0 5 10 15 20 25 30 35 400
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
REGULADOR LINEAR QUADRATICO PARA MOTOR DC
Time (sec)
Am
plitude
Sem Regulação
Com Regulação
Figura 5.1
6. Conclusão
Neste trabalho apresentamos de forma breve o Regulador Linear
Quadrático, muito usado em sistemas de Controle Ótimo. Onde o LQR pode
proporcionar ganhos de controle ótimo desde que seja feita uma escolha
adequada das matrizes Q e R da função desejada para minimização de custo.
Podemos concluir também que o LQR garante excelentes margens de
estabilidade e boa rejeição de distúrbios, porém o projetista é obrigado a testar,
de forma intuitiva, índices de desempenhos até se chegar o qual ele desejar.
No caso do Regulador Linear Quadrático, o índice de desempenho é um
mapeamento dos espaços dos vetores de estados e de controle ponderados
pelas matrizes constantes Q e R, respectivamente. Aponta-se também como
vantagem do LQR a margem de estabilidade garantida. Foi discutido a
problemática relacionada com a solução da Equação de Ricatti, a escolha das
matrizes de ponderação e suas relações com métodos de busca ótima.
7. Bibliografia
OGATA, Katsuhiko. Engenharia de Controle Moderno. Prentice Hall do Brasil. 2ª ed. Rio de Janeiro. 1982.
BURNS, Roland. Advanced Control Engineering. Butterwoth-
Heinemann. 1ª ed. Oxford. 2001.
KIRK, Donald. Optimal Control Theory. Dover Publications, 1970.