25
Dise˜ no ´ Optimo de un Dispositivo Mecatr´ onico Inteligente Tipo TEDS En este informe se describen, en forma resumida, los resultados que se obtuvieron al desarrollar el proyecto denominado Dise˜ no ´ optimo de un dispositivo mecatr´onico inteligente Tipo TEDS, el cual fue apoyado por la Secretaria de Investigaci´on y Posgrado del Instituto Polit´ ecnico Nacional, bajo el registro SIP 20071607. Adem´ as, se cont´ o con el apoyo de un alumno de la UPIITA, F´ ederico Miranda Almaz´ an, el cual participo en el Programa Institucional de Formaci´ on de Investigadores. Este informe t´ ecnico nal esta organizado de la siguiente manera. En la secci´ on 1 se da un resumen del proyecto. En la secci´ on 2 se describe claramente el problema a resolver, la metodolog ´ ia empleada para el dise˜ no ´ optimo. En la secci´ on 3 se describe la aplicaci´ on de la metodolog ´ ia para el dise˜ no de un sistema particular. En la secci´ on 4 se dan los resultados que se obtienen con base al desarrollo dado en la secci´ on 3. Finalmente, en la secci´ on 5 se analizan y discuten los resultados obtenidos, adem´ as se plantean posibles problemas en un trabajo futuro. 0.1. Resumen El dise˜ no de sistemas integrales de automatizaci´ on exige que los elementos o modulos que lo com- ponen tengan un grado de autonom ´ ia tal que permita que el sistema central se dedique a funciones de planeaci´on y optimizaci´ on del proceso completo, y que no se este invirtiendo tiempo ni recursos en la soluci´ on de problemas particulares que se puedan presentar en el funcionamiento del proceso. Esto se ha resuelto parcialmente al emplear un esquema de control jer´ arquico, en el cual existe una computadora central, denominada maestra, y computadoras/controladores esclavos. Sin embargo presentan algunos inconvenientes: El volumen de los m´ odulos es grande, la conguraci´ on es com- pleja, la computadora/controlador posee capacidades excesivas. Con el avance de la electr´onica, se ha integrado a los sensores y actuadores con la electr´ onica necesaria para que su uso sea f´ acil, compacto y econ´ omico. Estos dispositivos se denominan ”Smart Sensors” (sensores inteligentes) y ”smart actuators” (actuadores inteligentes). Los cuales poseen la caract ´ istica de ser de uso f´acil, conexi´on al sistema sencilla, al igual que su conguraci´ on. Debido a que las caracter ´ isticas de los sensores o actuadores puede cambiar, seg´ un sea el punto de operaci´ on, es importante que se ajusten los par´ ametros usados para su control o para su monitoreo, lo cual diculta la naturaleza autom´ atica del funcionamiento del proceso, para lo cual se han creado los dispositvos denominados TEDS (Transducer Electronic Data Shees) los cuales son dipositivos con una base electr´onica de datos acerca de su descripci´ on interna para diferentes condiciones de operaci´ on, y que permite enviar la informaci´ on adecuada al sistema general, para una correcta conguraci´ on del dispositivo. En este proyecto se plantea una metodolog ´ ia que permita el dise˜ no integral ´ optimo de dispositivos mecatr´ onicos tipo TEDS. Palabras clave: Dise˜ no ´optimo, Dispositivo TEDS. 1

Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

Diseno Optimo de un Dispositivo MecatronicoInteligente Tipo TEDS

En este informe se describen, en forma resumida, los resultados que se obtuvieron al desarrollar elproyecto denominado Diseno optimo de un dispositivo mecatronico inteligente Tipo TEDS, el cualfue apoyado por la Secretaria de Investigacion y Posgrado del Instituto Politecnico Nacional, bajoel registro SIP 20071607. Ademas, se conto con el apoyo de un alumno de la UPIITA, FedericoMiranda Almazan, el cual participo en el Programa Institucional de Formacion de Investigadores.Este informe tecnico final esta organizado de la siguiente manera. En la seccion 1 se da un resumendel proyecto. En la seccion 2 se describe claramente el problema a resolver, la metodologia empleadapara el diseno optimo. En la seccion 3 se describe la aplicacion de la metodologia para el diseno deun sistema particular. En la seccion 4 se dan los resultados que se obtienen con base al desarrollodado en la seccion 3. Finalmente, en la seccion 5 se analizan y discuten los resultados obtenidos,ademas se plantean posibles problemas en un trabajo futuro.

0.1. Resumen

El diseno de sistemas integrales de automatizacion exige que los elementos o modulos que lo com-ponen tengan un grado de autonomia tal que permita que el sistema central se dedique a funcionesde planeacion y optimizacion del proceso completo, y que no se este invirtiendo tiempo ni recursosen la solucion de problemas particulares que se puedan presentar en el funcionamiento del proceso.Esto se ha resuelto parcialmente al emplear un esquema de control jerarquico, en el cual existe unacomputadora central, denominada maestra, y computadoras/controladores esclavos. Sin embargopresentan algunos inconvenientes: El volumen de los modulos es grande, la configuracion es com-pleja, la computadora/controlador posee capacidades excesivas. Con el avance de la electronica,se ha integrado a los sensores y actuadores con la electronica necesaria para que su uso sea facil,compacto y economico. Estos dispositivos se denominan ”Smart Sensors” (sensores inteligentes) y”smart actuators” (actuadores inteligentes). Los cuales poseen la caractistica de ser de uso facil,conexion al sistema sencilla, al igual que su configuracion.Debido a que las caracteristicas de los sensores o actuadores puede cambiar, segun sea el punto deoperacion, es importante que se ajusten los parametros usados para su control o para su monitoreo,lo cual dificulta la naturaleza automatica del funcionamiento del proceso, para lo cual se han creadolos dispositvos denominados TEDS (Transducer Electronic Data Shees) los cuales son dipositivoscon una base electronica de datos acerca de su descripcion interna para diferentes condiciones deoperacion, y que permite enviar la informacion adecuada al sistema general, para una correctaconfiguracion del dispositivo.En este proyecto se plantea una metodologia que permita el diseno integral optimo de dispositivosmecatronicos tipo TEDS.Palabras clave: Diseno optimo, Dispositivo TEDS.

1

Page 2: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

0.2. Introduccion

La evolucion de los dispositivos tipo TEDS inicia con los avances de la electronica y con el disenoconcurrente, en el cual se busca sinergia en el producto final. Se integra el funcionamiento delsensor/actuador, una interfaz electronica y un protocolo de comunicaciones que permite la conexioncon algun ente externo.En particular, el sensor inteligente se define como el dispositivo capaz de:

1. Proporcionar una senal digital.

2. Comunicar a traves de un bus digital bidireccional.

3. Ejecutar funciones y ordenes logicas.

Ademas, se desea que el sensor inteligente realice las siguientes funciones extras, compensacion deparametros secundarios (por ejemplo, la temperatura), la prevencion y deteccion de fallos, auto-test y autocalibracion. El desarrollo de estos sensores aumentara las capacidades de los sistemas decontrol y la instrumentacion.Internamente, el sensor inteligente esta constituido por un sensor, electronica analogica, multi-plexor, convertidor analogico/digital y un microprocesador. Estos elementos permiten las sigu-ientes funciones: procesamiento de la senal, el control y la manipulacion de las senaes digitales y lacomunicacion con el exterior mediante un bus de senales.Las senales que registran los sensores normalmente son bajas de amplitud y la interfaz del sensorpresenta una alta impedancia en las frecuencias de funcionamiento normal. La integracion de laelectronica de la interfaz y los circuitos que procesan la senal, dentro del mismo sensor, tienen lassiguientes funciones: la amplificacion de la senal, la transformacion de la impedancia, el filtrado dela senal, elevar la potencia (mediante los buffers) y el multiplexado.Uno de los principales requisitos para los sensores inteligentes es su compatibilidad con sistemasdigitales y basados en microprocesadores. La mayoria de los sensores de alto rendimiernto debenproporcionar una senal digital para poder acceder a un bus digital. Una vez digitalizados los datoscaptados por el sensor, se puede realizar una variedad de procesados de senal para corregir varioserrores. Estos incluyen la correcion de desviacion, una autocalibracion, deteccion y correccion defallas, y la correcion de la linealidad. Mientras que algunas de estas funciones se pueden conseguircon circuitos analogicos, las tecnicas de procesamiento digital de senal se aplican con mayor facilidad.Una vez digitalizada la senal del sensor se pueden realizar varias funciones. La autocalibracion esuna funcion importante de los sensores inteligentes. Pues los sensores normales, con el tiempo seve modificado su funcionamiento y los parametros de configuracion de fabrica ya no son adecuados.Ademas de la calibracion y de la compensacion, el autotest y el diagnostico son dos funcionesnecesarias para los sensores inteligentes. La capacidad de auto-test es importante ya que permiteconocer la funcionalidad del sensor sin tener que quitarlo fisicamente de su lugar de funcionamiento.Otra caracteristica importante para varios sistemas de control y de monitoreo, es la fiabilidad.Esto es, en algunos sistemas donde el acceso a un determinado sensor no es sencillo, se requiereque sean extremadamente seguros. El metodo mas sencillo para mejorar la fabilidad es agregandoredundancia al sensor, mediante una replica del sensor dentro del mismo chip. Tambien es posibleduplicar los bloques asociados al sensor y situarlos en el chip para aumentar el rendimiento general.

2

Page 3: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

Otra posibilidad para mejorar el rendimiento y la fiablidad seria minimizando el numero de bloquesen el chip. De este modo la posibilidad de fallo del dispositivo se disminuye.Un actuador inteligente, tendra elementos semejantes, con la inclusion de un actuador y sensoresque peritan monitorear y controlar su funcionamiento.

0.2.1. Diseno del Sistema

El sistema fisico depende de las senales a medir, en el caso de los sensores, y de la variable acontrolar, en el caso, de los actuadores. Sin embargo ellos tendran en esencia: Un sistema mecanicoy un sistema electronico, y anivel de software un algoritmo de control y una interfaz de comunicacion.Se describira la optimizacion de los sistemas que se integran.

Diseno mecanico

En esta seccion se realiza el diseno de la estructura del manipulador con el proposito de construirlo.Para tal proposito se sigue el procedimiento indicado en la Fig. 1.

Estructuracion

del

Dispositivo

-

Analisis

de

Resistencia

-

Adaptacion

de

Elementos

Fig. 1 Procedimiento del Diseno Mecanico.

Es necesario proponer una configuracion, disposicion de elementos, y en caso necesario distribuir loselementos y asi evitar desbalanceo en el funcionamiento del sistema y por lo tanto disminucion devibraciones indeseables. Todo esto es considerado en la primera etapa del procedimiento del disenomecanico.En la segunda etapa del procedimiento del diseno mecanico se considera la realizacion de un analisisde fuerzas de reaccion con el proposito de dimensionar adecuadamente los elementos a utilizar, eltipo de material y la resistencia mecanica de cada uno de ellos.En la etapa de adaptacion de elementos se reestructurara el diseno con base a los elementos real-izables a escala, y asi obtener un diseno factible. Por consecuencia es necesario el calculo de losparametros del sistema para la obtencion de una ley de control adecuada al sistema fisico.

Sintesis mecanica En esta subseccion se plantea el procedimiento para el diseno optimo.Se analizan los fenomenos basicos que suceden en cuerpos interconectados, iniciando con el analisisde las fuerzas de reaccion

3

Page 4: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

El movimiento de un cuerpo rıgido esta descrito por las dos leyes de movimiento de Euler,

ΣF =dL

dt,

ΣMc =dHc

dt

donde ΣF es la resultante de las fuerzas aplicadas, L es el momento lineal del cuerpo (L =Rvdm =

mvc, donde vc es la velocidad del centro de masa), ΣMc es la resultante de los momentos debido alas fuerzas externas y Hc es el momento angular del cuerpo con respecto al centro de masa. Estasdos leyes determinan las fuerzas y momentos necesarios para que el cuerpo posea un movimientodeterminado.Si el cuerpo se mueve en el plano alrededor del eje z, entonces las fuerzas y momentos de reaccionnecesarios, estan dados por las leyes de Euler, que en forma escalar se expresan como

ΣFx = 0,

ΣMcx = Icxzα− Icyzw2,

ΣMcy = Icyzα+ I

cxzw

2,

ΣMcz = Iczzα.

Cuando un cuerpo rigido es montado sobre soportes este puede girar debido a un momento alrededordel soporte, se dice que esta balanceado (por rotacion alrededor de este eje) si las reacciones aplicadaspor los soportes sobre el cuerpo son las requeridas para soportar el peso del cuerpo. Hay dos causaspor las cuales un cuerpo que gira puede estar fuera de balance,

• Si el centro de masa esta localizado fuera del eje de rotacion.- Entonces, a medida que elcuerpo gira, habra fuerzas que producen e igualan mac. Estas fuerzas estaran cambiandoconstantemente de direccion (con respecto al marco inercial) y en magnitud (solo si la velocidadangular cambia, si no la magnitud permanece constante)

• Si los productos de inercia IPxz y/o IPyz son diferente de cero, donde z es el eje de rotacion y Pes un punto sobre ese eje. Si el cuerpo esta estaticamente balanceado (un cuerpo que puedegirar, se puede balancear si se mueve el centro de masa sobre el eje de rotacion, anadiendo oeliminando masa), los productos de inercia generan los “momentos de union” ΣMcx y ΣMcy.

Dimensionamiento optimo Para calcular los parametros del sistema se hara con base a lossiguientes objetivos

• Minimizar fuerzas y momentos de reaccion dinamicas en las uniones,• Minimizar el par aplicado a las uniones, para generar el movimiento deseado,• Maximizar el indice de acoplamiento, y asi asegurar la transmision efectiva del par de entrada.

En el primer objetivo, se trata de reducir las reacciones dinamicas y momentos dinamicos, pues estosdeterminan las caracteristicas de los elementos que forman las uniones. Ademas, las dimensiones deelementos dependen de los esfuerzos que deben soportar. El segundo objetivo considera el problema

4

Page 5: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

de optimizar el desempeno del sistema, mediante la reduccion de los pares aplicados, en todas lasposiciones de trabajo y en todas las combinaciones existentes de velocidad y aceleracion angulares.Finalmente, el tercer objetivo es importante, pues para que el desempeno del sistema sea aceptable,es necesario que exista una transmision efectiva de las fuerzas de entrada.El primer y segundo objetivo se pueden cuantificar mediante los criterios siguientes,

f1 (x) = maxq1maxq2maxq1maxq2maxq1maxq2|M1|2 ,

f2 (x) = maxq1maxq2maxq1maxq2maxq1maxq2|M2|2 ,

f3 (x) = maxq1maxq2maxq1maxq2maxq1maxq2|F1|2 ,

f4 (x) = maxq1maxq2maxq1maxq2maxq1maxq2|F2|2 ,

donde x =(x1, x2) es el vector de las variables de diseno,Mi es el vector de momentos existente enla i− ava union, Fi es el vector de fuerzas existente en la i− ava union.El problema de maximizar el ındice de acoplamiento, ρc, puede plantearse de manera semejante alos anteriores criterios, esto es

f5 (x) = maxq1maxq2maxq1maxq2maxq1maxq2

¯¯ 1ρc

¯¯2

.

Por lo tanto, se puede plantear el siguiente problema de optimizacion,

minx(f1 (x) , f2 (x) , f3 (x) , f4 (x) , f5 (x))

sujeto a

qmini ≤ qi ≤ qmaxi , qmini ≤ qi ≤ qmaxi , qmini ≤ qi ≤ qmaxi ,

xmin ≤ x ≤ xmax.Este problema puede resolverse con diferentes tecnicas de optimizacion.

Diseno electronico

En esta subseccion se desarrolla basicamente la interface necesaria para el manejo de los actuadoresy sensores mediante una computadora digital. La conversion de senales electricas de digital aanalogica, y viceversa, sera llevada a cabo por una tarjeta de adquisicion de datos de propositogeneral.La tarjeta de adquisicion de datos de National Instruments, NI-DAQ, modelo PCI-6025E, con lassiguientes caracterısticas basicas,

• 16 entradas analogicas bipolares de 12 bits de resolucion, con velocidad de muestreo maximade 200 000 muestras/segundo.

• 2 salidas analogicas bipolares de 12 bits de resolucion.Ademas, cuenta con 32 entradas/salidas digitales y 2 contadores de 24 bits de resolucion.Para medir la senal proveniente de los codificadores digitales de posicion se hara uso de los contadoresintegrados en la tarjeta NI-DAQ.

5

Page 6: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

Etapa de potencia Existen diferentes tipos de configuraciones para construir la etapa de poten-cia para alimentar un servomotor de CD. Estas configuraciones pueden clasificarse en la naturalezadel voltaje aplicado al motor. En la primera clase se convierte la corriente alterna en corrientedirecta la cual se aplica al motor, al variar la magnitud y polaridad del voltaje de CD se modificanlas caracterısticas de velocidad del motor. En la segunda clase se hace uso de un elemento llamadochopper para cambiar un voltaje constante de CD a un voltaje de CD discontinuo con dos niveles,voltaje cero y voltaje maximo, al cambiar la duracion de los niveles de voltaje se cambia el voltajepromedio aplicado al motor de CD. Esta ultima clase es ampliamente usada, teniendose dos config-uraciones comunes denominadas puentes tipo T y tipo H. La configuracion puente tipo T presentala desventaja de necesitar dos fuentes de alimentacion, mientras que la de tipo H solo hace uso deuna sola fuente.La configuracion tipo H permite cambiar el sentido de giro del motor en forma sencilla. Basicamenteesta configuracion esta formada por una etapa de PWM (Pulse Width Modulation), etapa de controlde giro y la etapa de potencia. En la Fig. 2 se muestra la estructura del puente tipo H, conectadaa un sistema de computo.

Sistema

de

Computo

-

-Generador

dePWM

Etapa

deControl

?

-

-

Etapa

de

Potencia½¼¾»

Fig. 2 Estructura basica del puente tipo H.

El sistema de computo consta de una computadora digital y de una tarjeta de adquisicion de datos.Mediante el sistema de computo se establece el sentido de giro del motor y la cantidad de voltajeaplicado. En la etapa de PWM se genera una senal cuadrada de perıodo constante, T , pero contiempo de duracion del nivel alto, talto, variable, el cual depende de un voltaje analogico provenientede la tarjeta DAQ. En la etapa de control se realizan operaciones logicas para combinar la senalPWM con las senales digitales provenientes de la tarjeta DAQ. En la etapa de potencia se conviertenlos niveles de voltaje de baja potencia provenientes de la etapa de control en senales de potenciacapaces de alimentar al servomotor a utilizar.La etapa de PWM esta formada por un circuito generador de pulsos cuadrados, un integrador y uncomparador, segun se muestra en la Fig. 3.

6

Page 7: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

Fig. 3 Generador de PWM.

El generador de pulsos consta de un oscilador de relajacion construido a partir del amplificadoroperacional (AO) LM324 con retroalimentacion positiva. El voltaje en la entrada no inversoradel AO esta dado por el divisor de voltaje de las resistencias de 10kΩ, alimentado por el voltajede salida; mientras que el voltaje en la terminal inversora del AO esta dado por el voltaje en elcapacitor C1 de un circuito RC, tambien alimentado por el voltaje de salida. Si el voltaje inicial enel capacitor es cero, entonces la entrada diferencial del AO es positiva, por lo que el AO se saturacerca del valor positivo de la fuente de alimentacion (80%Vcc), lo que ocasiona que el capacitor secargue hacia este valor en forma exponencial con una constante de tiempo RC. En algun instante elvoltaje en el capacitor iguala el voltaje en la entrada no inversora, por lo que la entrada diferenciales negativa, haciendo que el AO cambie de estado, i.e. la salida se hace casi igual a cero voltios,por lo que el capacitor empieza a descargarse hacia este valor hasta que la entrada diferencial sevuelve otra vez positiva, y ası sucesivamente. Por consecuencia el voltaje en el AO forma una senalcuadrada simetrica. Si se considera que el AO es un amplificador ideal el perıodo de oscilacion estadado por,[?],

T = 2.2R1C1.

El generador de pulsos es construido de tal manera que se frecuencia de oscilacion es fija. Elintegrador es usado para obtener una senal triangular. Los valores de la resistencia R2 y el capacitorC2 determinan la pendiente de la senal triangular.El comparador compara la senal triangular con el voltaje D/A, y si la diferencia es positiva la salidadel AO es de nivel alto (≈ 4.0V ), mientras que si la diferencia es negativa la salida es cero voltios,por lo que variando el nivel del voltaje D/A se varia el tiempo talto.La etapa de control esta formada por compuertas logicas AND cuyas entradas son la senal PWM ydos bits de control, vease Fig. 4. Los bits de control determinan el sentido de giro del motor. Si unbit de control es igual a 1 logico, la salida de la compuerta es semejante a la senal PWM, mientrasque si el bit de control es 0 logico la salida de la correspondiente compuerta es cero. Si los bits son0 logicos, el motor estara en reposo. Para que el motor se encuentre activo es necesario que solouno de los dos bits de control sea 1 logico.

7

Page 8: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

Fig. 4 Etapa de control del puente tipo H

La etapa de potencia del puente H es mostrada en la Fig. 5, [?]. La cual esta formada basicamentepor transistores de potencia funcionando como interruptores electronicos. La etapa de potencia soloposee dos entradas, cada una de las cuales determina el sentido de giro del motor. Si el Bit 1 decontrol es 1 logico y el Bit 2 es 0 logico, los interruptores Q1 − Q10 estan activos, permitiendo elpaso de la corriente de izquierda a derecha del motor. Si el Bit 1 de control es 0 logico y el Bit 2 es1 logico, los interruptores Q2−Q20 estan activos, permitiendo el paso de la corriente de derecha aizquierda del motor.

Fig. 5 Etapa de potencia de puente tipo H.

El voltaje promedio aplicado al motor a traves de la etapa de potencia esta dado por la formula

Vprom =1

T

Z T

0Vcc (t) dt

donde Vprom es el voltaje promedio aplicado al motor, T es el periodo de la senal cuadrada, y Vcc (t)es el voltaje aplicado al motor; puesto que los transistores funcionan como interruptores, el voltajeaplicado al motor es constante por intervalos, siendo diferente de cero durante el tiempo talto, porlo tanto

Vprom =VccT

Z talto

0dt =

taltoTVcc.

8

Page 9: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

Algoritmo de optimizacion

El problema de optimizacion planteado anteriormente constituye un problema de optimizaciondinamica parametrica, puesto que hay que determinar el vector de parametros w∗ que minimiceel tiempo final, sujeto a una restriccion diferencial y a restricciones algebraicas. El problema deoptimizacion dinamica parametrica es un caso especial del problema de control optimo, en el queel control es constante. La solucion, para esta clase de problemas, presenta las siguientes carac-teristicas,

• La solucion w∗ depende del estado inicial del sistema dinamico, y no necesariamente serauna solucion optima para otros estados iniciales, a menos que w∗ sea tambien la solucion delproblema de optimizacion correspondiente.

• No es posible determinar soluciones en lazo cerrado (con retroalimentacion de los estados).

Para determinar la solucion optima, w∗, existen condiciones necesarias de primer orden, dadasen [12]. Las condiciones dadas no consideran restricciones de desigualdad, pero estas pueden sertransformadas en restricciones de igualdad usando variables pasivas o funciones de ponderacion.Sin embargo, la utilizacion de estas condiciones no permite determinar una solucion analıtica, peropueden ser utilizadas en un esquema de calculo numerico.Existen inconvenientes al utilizar las condiciones de optimalidad dadas en [12]. Principalmente, esnecesario determinar los multiplicadores de Lagrange que satisfagan algunas ecuaciones diferencialesmatriciales de perturbacion, condiciones algebraicas y condiciones de frontera. Para simplificar eldesarrollo de un esquema de optimizacion, se plantea una metodologıa que permite determinar elvector de parametros w y el tiempo tf mediante un enfoque de optimizacion estatica.Las caracteristicas de un problema de optimizacion dinamica parametrica son diferentes a las de unproblema de optimizacion estatica, debido a que la solucion es funcion del tiempo y de los parametrosdebido a que los estados del sistema dinamico tambien dependen del tiempo y de los parametros.Sin embargo, se puede establecer una conexion entre optimizacion dinamica y optimizacion estatica,si se considera que el estado final del sistema dinamico parametrico (??) se encuentra sobre unasuperficie S (qj, qj;w, tf) = 0, j ∈ A, la cual representa un sistema estatico. De esta manera, esposible realizar un proceso de minimizacion estatica. Ademas, se puede mostrar que la variacion delvector de parametros w y el tiempo final tf definen una superficie continua S (qj, qj;w, tf), j ∈ A,si w y tf , varian suavemente, [7, pag. 83].Puesto que no es posible resolver analıticamente el problema de optimizacion, debido a que larestriccion (??) no es integrable, se usan metodos numericos para obtener una solucion aproximadade los valores optimos de los parametros w1, w2 y tf . Por lo cual se plantea el siguiente algoritmonumerico de optimizacion recursiva de trayectorias fuera de lınea, en el cual se realiza un procesode minimizacion estatica.

Algoritmo de Optimizacion Recursiva (AOR)

Paso 1 Asignar valores iniciales a los parametros w y tf .

Paso 2 Resolver numericamente para qj la restriccion dinamica; esto es posible debido a quese conoce la condicion inicial qj (to), j ∈ A, y qi (t), i ∈ A, es una trayectoria parametricaconocida.

9

Page 10: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

Paso 3 Si las restricciones algebraicas se satisfacen y si tf es minimo, el algoritmo termina.

Paso 4 Si las restricciones no se satisfacen, o si tf no es minimo, calcular nuevos parametros.Ir al Paso 2.

Al terminar, el algoritmo entrega los parametros optimos w∗ y t∗f .

Algoritmo numerico

El esquema que selecciona los parametros de decision w y tf , usado en el algoritmo AOR, resuelveun problema de optimizacion estatica no lineal con restricciones.En forma general, un problema de minimizacion estatica no lineal con restricciones puede ser escritocomo

min f (x) ,

sujeto a ci (x) = 0, i ∈ Eci (x) ≤ 0, i ∈ I

donde x ∈ Rm es el vector de parametros de decision, f es la funcion objetivo a minimizar, cadaci es una restriccion escalar, I y E son los conjuntos ındice para las restricciones de desigualdad eigualdad, respectivamente. Para tomar en cuenta las restricciones en el esquema de minimizacion,se considera la siguiente funcion Lagrangiana,

L (x,λ) = f (x) +Xi∈E∪I

λici (x)

donde la λi son los multiplicadores de Lagrange. La solucion optima x∗ se encuentra al usar un

esquema iterativo, en el cual en cada iteracion

xk+1 = xk + αdk,

donde xk representa la solucion x en la iteracion k, dk (= ∆xk = xk+1 − xk) es la direccion dedescenso o busqueda y α es una longitud de paso. En la iteracion siguiente se calcula una nuevadireccion de busqueda y una nueva longitud de paso.El algoritmo numerico es implementada en tres fases [2][4][5][6]: Programacion secuencial cuadratica,actualizacion de la matriz Hessiana y calculo de la longitud de paso (busqueda de lınea).

• Se usa un metodo de programacion cuadratica secuencial (SQP, de sus siglas en ingles) pararesolver el problema no lineal en forma secuencial. SQP es una generalizacion del metodo deNewton para optimizacion no restringida, el cual encuentra la iteracion siguiente mediante laminimizacion de un modelo cuadratico del problema. En cada iteracion, SQP determina ladireccion del siguiente paso resolviendo un subprograma cuadratico, donde la funcion objetivoes una aproximacion cuadratica del punto actual y las restricciones no lineales son linealizadas.

En cada iteracion, la direccion del paso dk es calculado mediante un subproblema de progra-macion cuadratica de la forma

min f (xk) +∇f (xk)T dk + 12dTkHkdk

sujeto a ci (xk) +∇ci (xk)T dk = 0, i ∈ Eci (xk) +∇ci (xk)T dk ≤ 0, i ∈ I

10

Page 11: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

donde xk es el punto actual, Hk es una estimacion definida positiva de la Hessiana del La-grangiano (∇2xxL (xk,λk)). Ademas, las restricciones impuestas son las aproximaciones linealeslocales de las restricciones no lineales. Al iniciar el algoritmo, se escoge H0 de tal manera quesea definida positiva. La solucion dk a este subproblema define la direccion de descenso. Ladistancia desplazada en la direccion del paso dk es determinada por una busqueda de lineapara minimizar una funcion merito.

• Para asegurar convergencia es necesario construir una estimacion definida positiva de la Hes-siana del Lagrangiano, para la cual se utiliza la formula BFGS (Broyden-Fletcher-Goldfarb-Shanno),

Hk+1 = Hk +qkq

Tk

qTk sk− HT

k HksTkHksk

donde

sk = xk+1 − xk,qk = ∇f (xk+1) +

nPi∈E∪I

λi ·∇ci (xk+1)−Ã∇f (xk) +

nPi∈E∪I

λi ·∇ci (xk)!.

Se obtiene una matriz Hessiana definida positiva si qTk sk es positiva en cada actualizacion yH0, inicializacion de Hk, es una matriz definida positiva.

• Para determinar una mejor aproximacion de la solucion, xk+1 = xk + αdk, se determina unaposible solucion xk+1 a lo largo de la direccion dk, a partir de la iteracion xk, que haga menorel valor de una funcion merito. La funcion merito consiste de la funcion objetivo y una funcionpenalizadora basada en la violacion de las restricciones. En esta fase, denominada busquedade linea, se genera un numero limitado de longitudes de paso (distancia a moverse a lo largode la direccion dk) de prueba hasta que se encuentra uno que decremente suficientemente lafuncion merito. La funcion merito busca mejorar en la restriccion o en la funcion objetivo,al menos que el subproblema no sea factible, en cuyo caso solo se tolera una reduccion en larestriccion maxima.

0.2.2. Optimizacion dinamica-parametrica [12].p. 104-114

Notacion,

• n dimension del espacio de estado del sistema• m dimension del espacio de control del sistema

• q numero de restricciones en el control• r es el numero de funciones costo.• p es el numero de restricciones en el estado final.

11

Page 12: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

La clase de problemas que se consideran son en los que, para una seleccion dada de un vector decontrol constante u ∈ U , el estado x del sistema es una funcion del tiempo definida por medio deuna edo autonomo (invariante en el tiempo) de la forma

x = f (x, u) (1)

donde f (·) : Rn×Rs → Rn es una funcion C1 que depende del vector de estado x = [x1, x2, ..., xn]T ,

y vector de control (compuesto) u = [u1, ..., um]T ∈ U , donde U ⊆ Rm es un subconjunto regular

del espacio de control compuesto, independiente del estado, dado por

U = u ∈ Rm |h (u) ≥ 0donde h (·) : Rm → Rq es C1. En la ausencia de restricciones de desigualdad U = Rm.Dado x en el tiempo t = 0. Entonces para cualquier u ∈ U finita la unica solucion de (1) es dadopor x = ξ (t;u)1, donde ξ (·) : R1 ×Rm → Rn es C1, y satisface

∂ξ

∂t= f (ξ (t;u) , u) (2)

para todo t. Puesto que f (·) es C1 sobre Rn × Rm, ası una solucion siempre existe. Ademas, lasolucion es C1 en el estado inicial x (0) para una u dada. En lo que sigue se asume que el estadoinicial es especificado.Puesto que el estado en tiempo t, ξ (t;u), depende no solo del vector de parametros u sino tambiendel tiempo, claramente las caracterısticas de un problema de optimizacion son algo diferente de laoptimizacion estatica. Sin embargo, una clara conexion puede ser vista si se considera cualquier sis-tema dinamico parametrico estable asintoticamente de la forma (1), para el cual el estado evolucionaasintoticamente a un valor constante con el tiempo. Con lo cual se define un punto de equilibrio,f (x, u) = 0, lo cual representa un sistema estatico.Puesto que el estado del sistema no es estatico, se considera el criterio de costo de tal manera querefleje la naturaleza dinamica del estado. Se considera el caso donde el vector de costo acumulativoen tiempo t es definida por

G =Z t

0γ (x, u) dt

donde γ (·) : Rn × Rm → Rr es C1 y es evaluada a lo largo de x = ξ (t;u). Entonces la razontemporal de cambio del vector del costo en el tiempo t puede ser expresada como una funcion delvector de estado x y el vector de control u como

G = γ (x, u) . (3)

Dada una solucion para (1), existe una solucion unica para (3) dada por G = z (t;u) donde z (·) :R1 ×Rm → Rr es C1 y satisface

∂z

∂t= γ (ξ (t;u) , u) (4)

para toda t, con el costo inicial z (0, u) igual a cero, por conveniencia.Las suposiciones para los problemas a considerarse son

1Por notacionx = x (variables; parametros) .

12

Page 13: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

1. Se especifican los estados iniciales en t = 0,

• Para un tiempo final dado t = tf > 0, el estado final es no restringido, o• En un tiempo final optimo t = tf > 0, el estado final es restringido a ser un elemento deun subconjunto dado del espacio de estado, el cual depende del control parametrico u,

2. Para todo 0 < t < tf el estado x es determinado unicamente por (1).

Perturbaciones en la funcion costo como funciones del tiempo

El objetivo es,

Desarrollar condiciones de optimalidad local, para determinar un control parametrico u ∈ U queoptimice la funcion costo G, donde su razon de cambio esta dada por (3), y la razon de cambiodel estado esta dado por (1), y el vector de control u ∈ U es constante para todo el intervalode tiempo.

Las condiciones de optimalidad se derivan a partir de examinar como el valor de la funcion costo Gvarıa en una pequena vecindad de un punto solucion. Para sistemas dinamicos las perturbacionesson funciones del tiempo.Sea u∗ ∈ U un control optimo y sea

x = ξ (t;u∗) ,

G = z (t;u∗)

el vector estado y vector costo en el tiempo t determinado a partir de las soluciones de (1) y (3).B denota una bola alrededor de u∗, e ∈ TU denota un vector tangente a U , donde TU es el conotangente a U en u∗, y δu (·) genera e, esto es, u∗ + αδu (α) ∈ U para toda α > 0 suficientementepequena con δu (α)→ e a medida que α→ 0. t∗ denota el tiempo terminal (especificado u optimo)y t∗ + αδt denota una perturbacion en el tiempo terminal. Si

δG.= z (t∗ + αδt, u∗ + αδu (α))− z (t∗, u∗) (5)

denota la perturbacion correspondiente en el vector costo, donde δt ∈ R1. Si se obtiene la primeraaproximacion de (5)2,

z (t∗ + αδt, u∗ + αδu (α)) = z (t∗, u∗) +·

∂z∂t

∂z∂u

¸(t,u)=(t∗,u∗)

αδt

αδu (α)

+R (α)donde R (α) /α→ 0 y δu (α)→ e a medida que α→ 0. Por lo que

δG =∂z (t∗, u∗)

∂tαδt+

∂z (t∗, u∗)∂u

αδu (α) +R (α) ,

2La primera aproximacion de una funcion f (x), alrededor de x∗, esta dada por

f (x) = f (x∗ +∆x) ' f (x∗) + df (x)

dx

¯x=x∗

∆x

13

Page 14: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

usando (4),

δG = α

"γ (ξ (t∗;u∗) , u∗) δt+

∂z (t∗, u∗)∂u

δu (α) +R (α)

α

#. (6)

La ecuacion (6) representa la perturbacion del vector costo como una funcion del tiempo debido,ya sea, a pequenos cambios en el tiempo final o a pequenos cambios en el control, o ambos. Paraevaluar el lado derecho de (6), se conoce explıcitamente γ (·) pero la funcion ∂z (·) /∂u no se conoceexplıcitamente a menos que se disponga de la solucion analıtica de (1) y (3), pero en general, estono es el caso. Sin embargo ∂z (·) /∂u se puede obtener indirectamente a partir de (2) y (4).Puesto que f (·) y γ (·) son C1 y

ξ (t;u∗) = ξ (0;u∗) +Z t

0f [ξ (τ ;u∗) , u∗] dτ

y

z (t;u∗) =Z t

0γ [ξ (τ ;u∗) , u∗] dτ ,

se sigue a partir de la regla de Leibniz que, para un estado inicial fijo,

∂ξ (t;u∗)∂u

=Z t

0

(∂f [ξ (τ ;u∗) , u∗]

∂x

∂ξ (τ ;u∗)∂u

+∂f [ξ (τ ;u∗) , u∗]

∂u

)dτ

y∂z (t;u∗)

∂u=Z t

0

(∂γ [ξ (τ ;u∗) , u∗]

∂x

∂ξ (τ ;u∗)∂u

+∂γ [ξ (τ ;u∗) , u∗]

∂u

)dτ .

Si se definen las matrices

Λ (t;u∗) =

"∂ξ (t;u∗)

∂u

#n×m

=

ξ1 (t;u∗)

ξ2 (t;u∗)

...

ξn (t;u∗)

∂ (u1, u2, ..., um)

,

Γ (t;u∗) =

"∂z (t;u∗)

∂u

#r×m

,

entonces,

∂ξ (t;u∗)∂u| z

Λ(t;u∗)

=Z t

0

∂f [ξ (τ ;u∗) , u∗]

∂x

∂ξ (τ ;u∗)∂u| z

Λ(t;u∗)

+∂f [ξ (τ ;u∗) , u∗]

∂u

dτy

∂z (t;u∗)∂u| z

Γ(t;u∗)

=Z t

0

∂γ [ξ (τ ;u∗) , u∗]

∂x

∂ξ (τ ;u∗)∂u| z

Λ(t;u∗)

+∂γ [ξ (τ ;u∗) , u∗]

∂u

dτ ,

14

Page 15: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

derivando con respecto al tiempo, se tiene que la matriz Λ (t;u∗) es la solucion del problema devalor inicial,

Λ = ∂f [ξ(t;u∗),u∗]∂x

Λ+ ∂f [ξ(t;u∗),u∗]∂u

Λ (0;u∗) = [0](7)

y la matriz Γ (t;u∗) es la solucion del problema de valor inicial,

Γ = ∂γ[ξ(t;u∗),u∗]∂x

Λ+ ∂γ[ξ(t;u∗),u∗]∂u

,

Γ (0;u∗) = [0] .(8)

Las condiciones iniciales, Λ (0;u∗) y Γ (0;u∗) corresponden a los estados iniciales fijos y costo inicialcero, respectivamente.La matriz Λ (t;u∗) se llama matriz de perturbacion del estado y la matriz Γ (t;u∗) se llama matrizde perturbacion del costo.Para emplear la ecuacion (6), la ec. (1) y las ecs. (7) y (8) son integradas simultaneamente.

Entonces, a partir de (6) y de la definicion Γ (t;u∗) = ∂z(t;u∗)∂u

, se tiene

δG = α

"γ (ξ (t∗;u∗) , u∗) δt+ Γ (t∗;u∗) δu (α) +

R (α)

α

#,

la cual incluye el efecto de primer orden de una perturbacion de control u∗ + αδu (α) alrededor delcontrol optimo nominal u∗ y el efecto de primer orden de una perturbacion en el tiempo t∗ + αδtalrededor de un tiempo fijo nominal t∗.

Pregunta Si la funcion objetivo, G, no depende del vector de control u ni de los estados x, se tieneque Γ (t;u∗) = [0] para todo t ≥ 0, ¿la ecuacion anterior no refleja la variacion de G si cambiael vector de control u? La ecuacion anterior se obtiene para el problema de tiempo final dadot = tf > 0 con estado final no restringido, por lo que al cambiar u solo cambia x y no cambiat, por lo que δG = 0.

Conjuntos objetivo y condiciones de frontera

Las condiciones para los problemas considerados son,

Condiciones Se asume que el estado inicial se especifica en t = 0. Ademas se asume que lascondiciones de frontera terminales especifican el tiempo final con el estado final no especificado,o que el estado final es restringido a algun subconjunto del espacio de estado con el tiempoterminal no dado.

Tiempo final dado Se considera el caso en que se especifica el tiempo final t = t∗ > 0, sinninguna restriccion en el estado final.Sea u∗ ∈ U un control que representa un control que satisface un concepto de solucion optimizadora(min, min-max, Nash, Pareto, etc) y sea u∗+αδu (α) ∈ U , para toda α > 0 suficientemente pequena,

15

Page 16: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

una perturbacion en u∗, con δu (α)→ e ∈ TU a medida que α→ 0, donde TU es el cono tangente aU en u∗. Puesto que δt = 0 en t = t∗ para tiempo terminal fijo, se tiene

δG = α

"Γ (t∗;u∗) δu (α) +

R (α)

α

#.

Para α > 0 suficientemente pequena, δu (α)→ e, donde e es un vector tangente a U , en u∗, R(α)α→ 0,

y los signos de las componenete de δG son determinados por las componentes de Γ (t∗;u∗) e, acondicion de que estas componentes no sean cero.

Estado final restringido En este caso, no se especifica el tiempo terminal. El estado final no seespecifica a priori pero se requiere que se encuentre en un conjunto objetivo regular

Θ = x ∈ Rn| θ (x, u) ≤ 0, u ∈ U (9)

donde θ (·) : Rn × Rm → Rp es C1. Se busca el mejor estado terminal ξ (t∗;u∗) en Θ y este puntopuede encontrarse ya sea en la frontera de Θ o en el interior de Θ, dependiendo en la funcioncosto especificada para el problema. Objetivos definidos en terminos de sistemas de restriccionesde igualdad, esto es, ψ (x, u), pueden ser especificados en la forma (9) usando θ = (ψ,−ψ),

θ =

θ1θ2

= ψ (x, u)

−ψ (x, u)

.Control optimo parametrico

Se analizaran problemas de minimizacion de funcion costo escalares (r = 1) en algun tiempo finalt = t∗(fijo u optimo), donde G satisface

G = γ (x, u) (10)

donde γ (·) : Rn × Rm → R1 es C1 y z (·) es la solucion a (10) generada por un control constanteu ∈ U , con z (0, u) = 0. El vector de estado x = ξ (t;u) satisface (1) con el estado inicial especificado.El vector de control constante u es restringido a un subconjunto U de Rm definido por

U = u ∈ Rm |h (u) ≥ 0 (11)

donde h (·) : Rm → Rq es C1 en una bola alrededor de un punto u∗ que minimiza G = z (t, u) en eltiempo t = t∗.

Tiempo final dado La solucion u∗ para un problema de control optimo parametrico es funciondel estado inicial. En la teorıa de control optimo, donde el control no es generalmente una constante,se encuentran dos tipos de control: control en lazo abierto u∗ (t) y control de lazo cerrado (retroal-imentado) u∗ [x]. El control optimo parametrico u∗ [x (0)] no corresponde directamente a algunostipos de control de control no constante. Ademas, en teorıa del control optimo cada porcion de unatrayectoria optima es optima y trayectorias optimas no se intersectan para sistemas autonomos, engeneral estas condiciones no se mantienen para sistemas optimos parametricos. Sı u∗ es un control

16

Page 17: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

optimo parametrico que genera la trayectoria x∗ (t) iniciando a partir de x∗ (0) entonces u∗ no esnecesariamente el control opmio parametrico que inicia a partir de otros puntos de x∗ (t) al menosque u∗ = cte es tambien la solucion del problema de control optimo correspondiente.Para el caso en que el tiempo final t∗ es especificado y el estado final x (t∗) no es restringido, setiene el siguiente teorema.

Teorema. 1. Si u∗ ∈ U genera una solucion x∗ (t) = ξ (t∗;u∗) de (1) definida sobre [0, t∗]. Si u∗ esun control regular minimo local para la funcion costo escalar G = z (t∗, u), donde t∗ es un tiempofinal especificado y z (·) es la solucion a (10), entonces existe una matriz de perturbacion de estadon×m Λ (t;u∗) = ∂ξ (t;u∗) /∂u, que satisface

Λ = ∂f [ξ(t;u∗),u∗]∂x

Λ+ ∂f [ξ(t;u∗),u∗]∂u

,

Λ (0;u∗) = [0] ,

una matriz de perturbacion de costo 1×m Γ (t;u∗) = ∂z (t;u∗) /∂u que satisface

Γ = ∂γ[ξ(t;u∗),u∗]∂x

Λ+ ∂γ[ξ(t;u∗),u∗]∂u

,

Γ (0;u∗) = [0] ,

y un vector µ ∈ Rq tal que

Γ (t∗;u∗) = µT∂h (u∗)∂u

,

µTh (u∗) = 0,

µ ≥ 0,h (u∗) ≥ 0

Donde las cuatro ultimas relaciones expresan condicione de frontera terminales.

Si las ecuaciones de estado (1) y la ecuacion de costo (10), pueden ser integradas directamente,una condicion necesaria simple puede ser empleada para determinar el control parametrico optimo,segun se ilustra en el siguiente ejemplo.

Observacion Para derivar las condiciones necesarias de optimizacion, usando la teoria de controloptimo, se hace lo siguiente. Se quiere minimizar

G =Z t

toγ (x, u) dt

sujeto ax = f (x, u) .

Si se defininen los siguientes estados

xn+1 = u1,

xn+2 = u2,...

xn+m = um

17

Page 18: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

se forma el siguiente vector de estados

x =

xu

n+m×1

,

por lo que

dx

dt=

f (x)0

= F (x)Si se forma la funcion costo aumentada,

Ga =Z t

to

"γ (x) + ΛT

ÃF (x)− dx

dt

!#dt,

usando la relacion Z tf

t0ΛTdx

dtdt = ΛT (tf) x (tf)− ΛT (t0) x (t0)−

Z tf

t0ΛT xdt

se tiene

Ga = ΛT (t0) x (t0)− ΛT (tf) x (tf) +Z t

to

hγ (x) + ΛTF (x) + ΛT x

idt,

cuyo incremento esta dado por

δGa = ΛT (t0) δx (t0)− ΛT (tf)x (tf) +Z t

to

"∂γ (x)

∂xδx+ ΛT

∂F (x)

∂xδx+ ΛT δx

#dt

Si se considera que

Λ =

λβ

n+m×1

y x =

xu

n+m×1

entonces

δGa = λT (t0) δx (t0) + βT (t0) δu− λT (tf) δx (tf)− βT (tf) δu

+Z t

to

"∂γ (x, u)

∂xδx+

∂γ (x, u)

∂uδu+ λT

∂f (x, u)

∂xδx+ λT

∂f (x, u)

∂uδu+ λ

Tδx+ β

Tδu

#dt

puesto que

ΛT∂F (x)

∂xδx =

·λT βT

¸ ∂f(x,u)∂x

∂f(x,u)∂u

0 0

δxδu

= λT∂f (x, u)

∂xδx+ λT

∂f (x, u)

∂uδu

Como β es el multiplicador de lagrange asociado a una constante β es constante, por lo que

δGa = λT (t0) δx (t0)− λT (tf) δx (tf) +Z t

to

"Ã∂γ (x, u)

∂x+ λT

∂f (x, u)

∂x+ λ

T!δx

#

+Z t

to

"Ã∂γ (x, u)

∂u+ λT

∂f (x, u)

∂u

!δu

#dt

18

Page 19: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

si se quiere que δGa = 0, entonces se debe satisfacer

λT= −∂γ (x, u)

∂x− λT

∂f (x, u)

∂x,

0 =Z t

to

Ã∂γ (x, u)

∂u+ λT

∂f (x, u)

∂u

!dt

si se hace

B =∂γ (x, u)

∂u+ λT

∂f (x, u)

∂u

con las condicionesB (t0) = [0] y B (tf) = [0] ,

Observacion Sea el problema de encontrar el control u (t) ∈ Rm y los parametros w ∈ Rnw queminimiza el funcional

J = φ (x (tf) , w) +Z tf

t0L (x (t) , u (t) , w) dt (12)

sujeto a

x = f (x, u,w) ,

0 = c (x, u,w)

0 ≤ d (x, u, w)0 = ψ0 (x (t0) , w)

0 = ψf (x (tf) , u) ,

(13)

donde x (t) ∈ Rn denota el vector de estados, f : Rn+m+nw → Rn las ecuaciones dinamicas,c : Rn+m+nw → Rp un conjunto de restricciones de igualdad en los estados y en la variable decontrol (0 ≤ p < n+m+nw), y d : Rn+m+nw → Rl un conjunto de restricciones de desgualdaddel estado y del control (0 ≤ l). ψ0 : Rn+nw → Rqo y ψf : R

n+nw → Rqf denotan restriccionesen el estado inicial y final, respectivamente, con q0 + qf ≤ 2n+ nw.Problemas de este tipo, se tienen por ejemplo, a) en problemas de control de tiempo optimodonde la variable tiempo es normalizada con respecto a un parametro desconocido; b) Proble-mas de parametrizacion del control donde la variable de control se discretiza sobre el dominiodel tiempo de interes y es tratado como un polinomio a trozos con coeficientes desconocidos.

Una tecnica para resolver el problema es convertir el problema de optimizacion dinamicaen un problema de optimizacion estatica de parametros (dimension finita). En este enfoquelos estados y el control son parametrizadas usando una aproximacion polinomial a trozos, oexpansion global. los coeficientes del polinomio aproximador son tratados como parametrosdesconocidos adicionales.

Las tecnicas numericas para resolver problemas de optimizacion dinamicas (dimension infinita)pueden sr divididos en metodos gradiente y metodos de segundo orden. Los metodos gradienteutilizan a lo mucho derivadas de primer orden de la funcion costo (12) y de las restricciones

19

Page 20: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

(13), mientras que los metodos de segundo orden requieren derivadas de segundo orden deestas ecuaciones.

Generalmente estos metodos incluyen reduccion directa de la funcional de costo durante algunafase del algoritmo. Un metodo indirecto seria aquel que no trate reducir el valor de la funcioncosto, como por ejemplo se puede encontrar la solucion a las condiciones necesarias de primerorden para optimlidad. Las condiciones necesarias pueden ser escritas en la forma de unproblema con valores en la frontera en dos puntos que involucre ecuaciones diferenciales-algebraicas.

Para considerar las restricciones de desigualdad, se usa el metodo de de penalizacion defunciones, para transformar (12-13) en un problema que no contiene restricciones de de-sigualdad. Esto es hecho aumentando la funcion costo original con una funcion penalty queincrementa rapidamente si las restricciones de desigualdad son violadas. Se usa la funcionpenalty cuadratica extendida,

Di =

1/di, di ≥ σ

(1/σ)h3− 3 (di − σ) + (di/σ)

2i, di < σ

(14)

De (14) puede ser visto que σ actua como un punto de transiccion desde la funcion penalty bar-

rera inversa (interior) (1/di) a la funcion penalty (exterior) cuadraticah3− 3 (di − σ) + (di/σ)

2i/σ.

La funcion penalty extendida (14) permite trayectorias que violan la retriccion de desigual-dad (trayectoria no factible) para ser consideradas durante el proceso de solucion numerica.Mientras que la funcion penalty interior estandar no permite considerar tales trayectorias nofactibles.. Usando (14) se rescribe el problema de optimizacion como: Encontrar el controlu (t) ∈ Rm y parametros w ∈ Rnw, que minimizan la funcional

J (ρk) = φ (x (tf) , w) +Z tf

t0

"L (x (t) , u (t) , w) + ρk

lXi=1

Di (x (t) , u (t) , w, ρk)

#dt (15)

sujeto a

x = f (x, u,w) ,

0 = c (x, u,w)

0 = ψ0 (x (t0) , w)

0 = ψf (x (tf) , u) ,

(16)

donde σ =√ρk, ρk > 0, 0 < ρk+1 < ρk y limk→∞ ρk = 0. La solucion (12-13) se encuentra

resolviendo una secuencia de problemas (15-16) en el limite a medida que el parametro penaltyρk → 0. A medida que el parametro penalty ρk se aproxima a cero la funcion penalty extendidase hace equivalente a la funcion penalty barrera inversa (interior).

Para obtener las condiciones necesarias de primer orden se hace la primera variacion de lafuncional (15). El problema con restricciones se convierte en un problema sin restricciones alusar el metodo de multiplicadores de Lagrange para unir la restricciones de igualdad (16) a

20

Page 21: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

la funcional costo (15) para obtener

Ja (ρk) = φ (x (tf) , w) + νT0 ψ0 (x (t0) , w) + νTf ψf (x (tf) , u)

+Z tf

t0[L (x (t) , u (t) , w) + ρk

lXi=1

Di (x (t) , u (t) , w, ρk)

+λ (t)T (f (x (t) , u (t) , w)− x (t)) + µT (t) c (x (t) , u (t) , w)]dt

donde λ (t) ∈ Rn, µ (t) ∈ Rp, ν0 ∈ Rq0 y νf ∈ Rqf son multiplicadores de Lagrange. Tomandola primera variacion de Ja,

δJa =

"νT0

∂ψ0∂x

#t=t0

δx (t0) +

"∂φ

∂x+ νTf

∂ψf∂x

#t=tf

δx (tf)

+

ÃνT0 ∂ψ0∂w

!t=t0

+

Ã∂φ

∂w+ νTf

∂ψf∂w

!t=tf

δw+Z tf

t0[

̶L

∂x+ ρk

lXi=1

∂Di∂x

+ λ (t)T∂f

∂x+ µT (t)

∂c

∂x

!δx (t)

+

̶L

∂u+ ρk

lXi=1

∂Di∂u

+ λ (t)T∂f

∂u+ µT (t)

∂c

∂u

!δu (t)

+

̶L

∂w+ ρk

lXi=1

∂Di∂w

+ λ (t)T∂f

∂w+ µT (t)

∂c

∂w

!δw

−λ (t)T δx (t)]dt

Integrando por partes el ultimo terminoZ tf

t0λT δx (t) dt = λT δx

¯t=tf− λT δx

¯t=t0−Z tf

t0λTδxdt,

definiendo el Hamiltoniano

H (x, u,w,λ, µ) = L+ ρk

lXi=1

Di + λTf + µT c

se tiene

δJa =

"νT0

∂ψ0∂x

#t=t0

δx (t0) +

"∂φ

∂x+ νTf

∂ψf∂x

#t=tf

δx (tf)

+

ÃνT0 ∂ψ0∂w

!t=t0

+

Ã∂φ

∂w+ νTf

∂ψf∂w

!t=tf

δw+Z tf

t0[∂H

∂xδx (t) +

∂H

∂uδu (t) +

∂H

∂wδw]dt

− λT δx¯t=tf

+ λT δx¯t=t0

+Z tf

t0λTδxdt

21

Page 22: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

ordenando

δJa =

"λT + νT0

∂ψ0∂x

#t=t0

δx (t0) +

"−λT + ∂φ

∂x+ νTf

∂ψf∂x

#t=tf

δx (tf)

+

ÃνT0 ∂ψ0∂w

!t=t0

+

Ã∂φ

∂w+ νTf

∂ψf∂w

!t=tf

+Z tf

t0

∂H

∂wdt

δw+Z tf

t0[

̶H

∂x+ λ

T!δx (t) +

∂H

∂uδu (t)]dt

Para que una trayectoria sea un extremo la primera variacion δJa se debe desvanecer, para locual, se selecciona la variable de coestado, λ (t), tal que el coeficiente de δx (t) sea cero, esto

es, λ (t) = −³∂H∂x

´T= −HT

x . Y definiendo la nueva variable

γ (t)T =∂H

∂w,

se tiene

δJa =

"λT + νT0

∂ψ0∂x

#t=t0

δx (t0) +

"−λT + ∂φ

∂x+ νTf

∂ψf∂x

#t=tf

δx (tf)

+

ÃνT0 ∂ψ0∂w− γT

!t=t0

+

Ã∂φ

∂w+ νTf

∂ψf∂w

+ γT!t=tf

δw + Z tf

t0

∂H

∂uδu (t) dt

Finalmente, puesto que x (t0) , x (tf) , w, y u (t) son arbitrarios es necesario hacer los coefi-cientes de δx (t0) , δx (tf) , δw, y δu (t) igual a cero, por lo que las condiciones de optimalidadson

x = HTλ = f (x, u,w) ,

λ (t) = −Ã∂H

∂x

!T= −HT

x ,

γ (t) = HTw ,

0 = HTu ,

0 = HTµ = c (x, u, w)

0 = ψ0 (x (t0) , w) ,

0 = λ (t0) +

Ã∂ψ0 (x (t0) , w)

∂x

!Tν0,

0 = γ (t0)−Ã∂ψ0 (x (t0) , w)

∂w

!Tν0,

0 = ψf (x (tf) , u) ,

0 = λ (tf)−Ã∂φ (x (tf) , w)

∂x

!T−Ã∂ψf (x (tf) , w)

∂x

!Tνf

0 = γ (tf) +

Ã∂φ (x (tf) , w)

∂w

!T+

Ã∂ψf (x (tf) , w)

∂w

!Tνf

22

Page 23: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

0.3. Discusion

El desarrollo de dispositivos con naturaleza compleja como los mecatronicos difiiculta el empleo demetodologias tradicionales de diseno. Aunque el software comercial disponible ha evolucionado, detal manera que permite la simulacion de sistemas compuestos por elementos de naturaleza mecanica,hidraulica, neumatica y electronica, en combinacion con esquemas de control, no permite en formamediata la aplicacion de los resultados para un control en tiempo real. Por lo que la investigaciondebe dirigirse hacia una descripcion analitica del sistema completa e implementar esquemas deoptimizacion y control que sean factibles de trasladarse hacia el ambito de control en tiempo real.

23

Page 24: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

Bibliography

[1] Albro, J. V., G. A. Sohl, J. E. Bobrow and F.C. Park (2000). On the Computation of Op-timal High-Dives. Proceedings of the 2000 IEEE International Conference on Robotics andAutomation, Sn. Francisco, California, pp. 3958-3963.

[2] Bonnans, J.F., J. Ch. Gilbert, C. Lemarechal, and C. A. Sagastizabal (2003). Numerical Op-timization. Spinger Verlag, NY, USA.

[3] Brockett, R. W. (1983) Asymptotic Stability and Feedback Stabilization. Differential geometriccontrol theory (R. W. Brockett, R.S. Millmann, H.J. Sussmann eds.) Birkhauser, Boston, pp.181-191.

[4] Dennis, Jr. J. E. and R. B. Schnabel (1996). Numerical Methods for unconstrained Optimizationand Nonlinear Equations. Classics In Applied Mathematics, SIAM, USA.

[5] Gill, P. E., W. Murray and M. H. Wright (1986). Practical Optimization. Academic Press.London, UK.

[6] Kelley, C.T. (1999). Iterative methods for Optimization. Frontiers in Applied mathematics,SIAM. USA.

[7] Khalil, H. K. (1992) Nonlinear Systems. Macmillan Publishing Company, N.Y. USA.

[8] Kobayashi, K. and T. Yoshikawa (2000). Controllability of Under-Actuated Planar Manipulatorwith One Unactuated Joint. 2000 IEEE/RSJ Int. Conf. on Intell. Rob. and Syst., Takamatsu,Japon, pp. 133-138.

[9] Luan, N., A. Ming and M. Kajitani (2001) Generation of Optimal Trajectory for Real Systemof an Under-Actuated Manipulator. Proceedings of the 2001 IEEE International Conference onRobotics and Automation. Seoul, Korea, pp. 3308-3313.

[10] Rosas-Flores, J.A., J. Alvarez-Gallegos and R. Castro-Linares (2002). Control of an Underac-tuated Planar 2R Manipulator: Experimental Results. Procc. of the International Federationof Automatic Control 15th IFAC World Congress, Barcelona, Spain, july 21-26.

[11] Spong, M. W. and M. Vidyasagar (1989). Robot Dynamics and Control. John Wiley & Sons,N.Y., USA.

[12] Vincent, T.L. and W. J. Grantham (1981). Optimality in Parametric Systems. A Wiley-Interscience Publication, John Wiley&Sons, USA.

24

Page 25: Dise˜no Optimo de un Dispositivo Mecatr´´ onico ...sappi.ipn.mx/cgpi/archivos_anexo/20071607_5633.pdf · los dispositvos denominados TEDS (Transducer Electronic Data Shees) los

[13] Wen, J. T. and D. O. Popa (2001). Human Assisted Impedance Control of Overhead Cranes.Proceedings of the 2001 IEEE International Conference on Control Applications. Cd. deMexico, Mexico, pp. 383-387.

25