162
MATERIAL DIDÁCTICO MATEMÁTICAS ESTRATEGIAS PARA MEJORAR LA APLICABILIDAD DE MÉTODOS ITERATIVOS QUE UTILIZAN DIFERENCIAS DIVIDIDAS 10 José Antonio Ezquerro Fernández Miguel Ángel Hernández Verón

Estrategia metodos iterativos

  • Upload
    lmdm

  • View
    226

  • Download
    0

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Estrategia metodos iterativos

MATERIAL DIDÁCTICOMATEMÁTICAS

ESTRATEGIAS PARA MEJORARLA APLICABILIDAD DEMÉTODOS ITERATIVOSQUE UTILIZANDIFERENCIAS DIVIDIDAS

10

José Antonio Ezquerro Fernández

Miguel Ángel Hernández Verón

Page 2: Estrategia metodos iterativos
Page 3: Estrategia metodos iterativos

ESTRATEGIAS PARA MEJORAR LA

APLICABILIDAD DE MÉTODOS ITERATIVOS

QUE UTILIZAN DIFERENCIAS DIVIDIDAS

Page 4: Estrategia metodos iterativos

MATERIAL DIDÁCTICO Matemáticas

nº 10

Page 5: Estrategia metodos iterativos

José Antonio Ezquerro Fernández

Miguel Ángel Hernández Verón

ESTRATEGIAS PARA MEJORAR LA

APLICABILIDAD DE MÉTODOS ITERATIVOS

QUE UTILIZAN DIFERENCIAS DIVIDIDAS

UNIVERSIDAD DE LA RIOJA

SERVICIO DE PUBLICACIONES 2014

Page 6: Estrategia metodos iterativos

EZQUERRO FERNÁNDEZ, José Antonio Estrategias para mejorar la aplicabilidad de métodos iterativos que utilizan diferencias divididas [Recurso electrónico] / José Antonio Ezquerro Fernández, Miguel Ángel Hernández Verón. – Logroño : Universidad de La Rioja, Servicio de Publicaciones, 2014. VII, 145 p. – (Material didáctico. Matemáticas ; 10) ISBN 978-84-695-9421-6 1. Métodos iterativos (Matemáticas). 2. Ecuaciones diferenciales no lineales. 3. Resolución numérica de ecuaciones. I. Hernández Verón, Miguel Ángel. II. Título. III. Universidad de La Rioja. Servicio de Publicaciones. IV. Serie. 519.6 517.9 PBKS – IBIC 1.1

Estrategias para mejorar la aplicabilidad de métodos iterativos que utilizan diferencias divididas

de José Antonio Ezquerro Fernández y Miguel Ángel Hernández Verón (publicado por la Universidad de

La Rioja) se difunde bajo una Licencia

Creative Commons Reconocimiento-NoComercial-SinObraDerivada 3.0 Unported.

Permisos que vayan más allá de lo cubierto por esta licencia pueden solicitarse a los titulares del copyright.

-

© José Antonio Ezquerro Fernández, Miguel Ángel Hernández Verón

© Universidad de La Rioja, Servicio de Publicaciones, 2014 publicaciones.unirioja.es

E-mail: [email protected]

ISBN 978-84-695-9421-6

Edita: Universidad de La Rioja, Servicio de Publicaciones

Page 7: Estrategia metodos iterativos

A María, la luz.José A.

A Mercedes, por la vida tan intensaque me ha proporcionado duranteestos últimos más de treinta años.Por la ternura y el cariñoque me da cada día.

Michel

Page 8: Estrategia metodos iterativos
Page 9: Estrategia metodos iterativos

Prólogo

Uno de los problemas más antiguos de las matemáticas, y por extensión de las ciencias ylas ingenierías, es la resolución de ecuaciones no lineales; y, en particular, la aproximación delas soluciones de las ecuaciones con suficiente exactitud. Así, nos podemos encontrar con unagran cantidad de problemas que se pueden reescribir en términos de ecuaciones a resolver,lo que conduce a una gran variedad de ecuaciones: sistemas finitos e infinitos, ecuacionesdiferenciales ordinarias y en derivadas parciales sujetas a condiciones iniciales o de contorno,o una combinación de ambas, y ecuaciones integrales o integrodiferenciables. Además, gene-ralmente, estas ecuaciones son no lineales. Las variables de las ecuaciones pueden ser númerosreales o complejos (ecuaciones algebraicas simples con una sola variable), vectores (sistemasde ecuaciones) o funciones (ecuaciones diferenciales o integrales).

Sin embargo, desde el punto de vista del análisis funcional, todas estas ecuaciones se pue-den expresar en función de operadores que aplican algún espacio lineal en otro espacio lineal,de manera que las soluciones buscadas son elementos o puntos del espacio correspondien-te. En consecuencia, los esquemas numéricos que, en este marco tan general, aproximan lassoluciones de esta gran variedad de problemas conducen al desarrollo de métodos efectivosy fiables que aproximan soluciones, con suficiente exactitud, de las ecuaciones en el espaciooriginal o en un espacio relacionado. Excepto en casos especiales, los esquemas numéricos deresolución más comúnmente utilizados son métodos iterativos que proporcionan una sucesiónque converge, a partir de una o varias aproximaciones iniciales, a una solución de la ecuacióna resolver. Como estos métodos tienen la misma estructura recursiva, los hemos introducidoy estudiado dentro de un marco general: el de los espacios de Banach.

Durante los últimos años, los estudios de los métodos iterativos incluyen un esfuerzosustancial en la identificación de propiedades que garanticen su convergencia en algún sentido.Una gran cantidad de estos resultados consisten en aplicar recursivamente métodos iterativospunto a punto o con memoria. En este texto, analizamos algunos de estos métodos.

Este texto es fruto de la tarea docente de sus autores, a lo largo de los últimos años,en cursos de doctorado enfocados a la resolución de ecuaciones no lineales para tituladosen Matemáticas e Ingeniería. Su contenido va dirigido a estudiantes titulados en carrerascientíficas y técnicas que deseen conocer, de manera asequible, sencillos métodos iterativosque les permitan afrontar, con sencillez y rigor, cuestiones relacionadas con la resolución deecuaciones no lineales. Hemos procurado, en todo momento, huir de un texto reducido auna colección de métodos iterativos. Hemos insistido en desarrollar técnicas de demostraciónasociadas a la materia aquí presentada, así como en el planteamiento de los problemas, en losconceptos fundamentales que intervienen, en las estrategias de resolución y en las cuestionesrelacionadas con la convergencia. Se ha buscado un equilibrio entre la claridad del desarrolloy la profundidad de los conceptos. Y uno de nuestros objetivos ha sido un acercamiento de lasmatemáticas puras y aplicadas, que, a menudo, son vistas por los estudiantes sin conexión.

v

Page 10: Estrategia metodos iterativos

vi PRÓLOGO

El principal objetivo de este texto es presentar una visión general de algunos resultadosteóricos básicos sobre ecuaciones no lineales en espacios de Banach, así como analizar algunosde los métodos iterativos que resuelven numéricamente estas ecuaciones. También esperamosproporcionar un texto para cursos superiores del análisis numérico relacionado con estostópicos y, para facilitarlo, hemos tratado de hacer un texto tan autosuficiente como nos hasido posible. Para ello, hemos escrito un primer capítulo introductorio y probado gran partede los resultados con todo detalle.

Mientras que las clases se pueden desarrollar en un contexto más o menos riguroso, he-mos escrito este texto utilizando métodos y hábitos de argumentación pedagógicos. Los pre-rrequisitos del texto son el cálculo, el álgebra lineal y nociones menores de programacióncomputacional. También cierta familiaridad con las técnicas básicas para resolver ecuacionessimples de una variable, así como de sistemas de ecuaciones lineales, resulta beneficioso. Sique es cierto que los estudiantes con conocimientos de los principios del análisis numéricotienen cierta ventaja, ya que los esquemas y conceptos generales se siguen fácilmente si ya seconocen métodos y casos particulares. Sin embargo, dicho conocimiento no es prerrequisitoindispensable para entender el material aquí tratado. Ocurre lo mismo con los conocimientosdel análisis funcional y de los espacios de Banach en particular. Todo el material necesario yrequerido para la teoría desarrollada a lo largo del texto está recogido en el capítulo 1.

Dos son principalmente las cuestiones que más nos han preocupado y a las que hemos tra-tado de dar respuesta. Por una parte, el análisis de la convergencia de métodos iterativos, conmemoria y punto a punto, que utilizan diferencias divididas cuando se aplican a la resoluciónde ecuaciones no lineales. Para ello, presentamos tres técnicas diferentes de demostración: elprincipio de la mayorante de Kantorovich, una técnica basada en relaciones de recurrenciay una modificación novedosa de la técnica anterior. Por otra parte, la obtención de aproxi-maciones iniciales suficientemente buenas para que los métodos iterativos aquí consideradosconverjan empezando en ellas.

Hemos dividido el texto en tres partes con cinco capítulos y el texto trata de ser auto-suficiente. Cada capítulo contiene varios resultados que se han ilustrado con aplicaciones ala resolución de sistemas de ecuaciones no lineales que surgen de procesos de discretizaciónde ecuaciones diferenciales e integrales no lineales que aparecen con cierta frecuencia en lasciencias y las ingenierías.

La primera parte del texto consta de un solo capítulo, el capítulo 1, donde presentamos unaintroducción básica del marco general en el que se desarrollan los principales contenidos queaparecen en el texto. Para ello, hacemos una descripción escueta de lo que son los espaciosde Banach y de las características de los operadores que se van a tratar. También damosuna descripción muy general de los esquemas iterativos en la que se estudia su convergencia,haciendo especial hincapié en el método de Newton, que es el origen de los métodos iterativosque posteriormente se describen y estudian. La aplicación del método de Newton pasa porla evaluación de la derivada primera del operador implicado en cada paso de iteración. Bienporque esta derivada no exista o sea costosa de evaluar, los métodos iterativos que no utilizanderivadas son especialmente interesantes. Un procedimiento para construir métodos iterativosque no utilicen derivadas consiste en aproximar éstas mediante diferencias divididas. De estetipo de métodos nos ocupamos ya en el resto del texto.

La segunda parte del texto centra su atención en una familia de métodos iterativos tiposecante que surge a partir de las interpretaciones geométricas de los métodos de Newton y dela secante, y que son métodos iterativos con memoria. Presentamos un resultado de conver-

Page 11: Estrategia metodos iterativos

vii

gencia semilocal ya conocido, basado en relaciones de recurrencia, vemos cuál es su principalproblema y lo resolvemos utilizando dos procedimientos: la construcción, en el capítulo 2, deun método iterativo híbrido (predictor-corrector) y, en el capítulo 3, la modificación de latécnica de demostración de la convergencia presentada en el capítulo 2. Destacamos en el ca-pítulo 3 que la técnica desarrollada para demostrar la convergencia de la familia de métodostipo secante tiene la ventaja, con respecto a la presentada en el capítulo 2, de que permitetratar ecuaciones en las que el operador implicado puede ser diferenciable o no diferenciable.

La tercera parte del texto está dedicada al método de Steffensen, que es un métodoiterativo punto a punto que tiene la misma velocidad de convergencia y la misma eficienciacomputacional que el método de Newton. Veremos por qué, a pesar de lo anterior, estemétodo es mucho menos utilizado que el método de Newton y qué es lo que podemos hacerpara mejorar su utilización. En el capítulo 4, realizamos un análisis desde el punto de vistade la teoría de Kantorovich que nos permite considerar situaciones en las que el operadorimplicado es diferenciable. En el capítulo 5 lo hacemos desde el punto de vista de una teoríabasada en relaciones de recurrencia, que nos permite considerar situaciones en las que eloperador implicado, puede se tanto diferenciable como no diferenciable. En ambos capítulosproponemos la utilización de un método iterativo híbrido (predictor-corrector).

Al final del texto hemos añadido algunas referencias bibliográficas que nos han servidode inspiración a lo largo de los últimos años. Por supuesto, ni están todas las que son, ni sontodas las que están. Pero seguro que servirán para afianzar el interés de los estudiantes in-teresados en los contenidos del texto, de manera que este interés les conduzca a una búsquedabibliográfica más detalla y acorde a sus futuras inquietudes.

No queremos terminar sin dar las gracias a todos aquellos que nos han acompañado a lolargo de todo este tiempo. En particular, a los que, año tras año, se acercan a las Jornadasde Análisis Numérico y Aplicaciones, y ya van ocho, que celebramos en la Universidad deLa Rioja durante el mes de noviembre. Y, en particular, a nuestros compañeros del grupo deinvestigación PRIENOL (https://prienol.unirioja.es).

Logroño, La Rioja J. A. EzquerroJulio de 2014 M. A. Hernández-Verón

Page 12: Estrategia metodos iterativos
Page 13: Estrategia metodos iterativos

Contenidos

Prólogo V

I PRELIMINARES 1

1. Conceptos generales 51.1. Espacios de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.1.1. Espacios lineales normados . . . . . . . . . . . . . . . . . . . . . . . . . 61.1.2. Operadores lineales y acotados en espacios de Banach. Inversión de

operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.2. Diferenciación de operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.3. Integración de operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221.4. Diferencias divididas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261.5. Métodos iterativos en espacios de Banach . . . . . . . . . . . . . . . . . . . . . 36

1.5.1. Convergencia semilocal del método de Newton . . . . . . . . . . . . . . 381.5.2. Accesibilidad del método de Newton . . . . . . . . . . . . . . . . . . . 43

1.6. Algunas ecuaciones no lineales en espacios de Banach . . . . . . . . . . . . . . 461.6.1. Ecuaciones integrales de Hammerstein . . . . . . . . . . . . . . . . . . 471.6.2. Problemas conservativos . . . . . . . . . . . . . . . . . . . . . . . . . . 48

II MÉTODOS TIPO SECANTE 51

2. Situación diferenciable 552.1. Método corrector: los métodos tipo secante . . . . . . . . . . . . . . . . . . . . 55

2.1.1. Convergencia semilocal . . . . . . . . . . . . . . . . . . . . . . . . . . . 552.1.2. Accesibilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

2.2. Método predictor: el método simplificado de la secante . . . . . . . . . . . . . 612.2.1. Convergencia semilocal . . . . . . . . . . . . . . . . . . . . . . . . . . . 612.2.2. Accesibilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

2.3. Método iterativo híbrido (predictor-corrector) . . . . . . . . . . . . . . . . . . 682.3.1. Construcción del método . . . . . . . . . . . . . . . . . . . . . . . . . . 682.3.2. Convergencia semilocal del método . . . . . . . . . . . . . . . . . . . . 70

2.4. Aplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

ix

Page 14: Estrategia metodos iterativos

x CONTENIDOS

3. Situación (no)-diferenciable 773.1. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 773.2. Mejora de la accesibilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 783.3. Aplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

3.3.1. Sistema de ecuaciones no lineales diferenciable . . . . . . . . . . . . . . 853.3.2. Sistema de ecuaciones no lineales no diferenciable . . . . . . . . . . . . 87

III EL MÉTODO DE STEFFENSEN 91

4. Situación diferenciable 954.1. Método corrector: el método de Steffensen . . . . . . . . . . . . . . . . . . . . 96

4.1.1. Convergencia semilocal . . . . . . . . . . . . . . . . . . . . . . . . . . . 964.1.2. Accesibilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

4.2. Método predictor: el método simplificado de Newton . . . . . . . . . . . . . . 1014.2.1. Convergencia semilocal . . . . . . . . . . . . . . . . . . . . . . . . . . . 1024.2.2. Accesibilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

4.3. Método iterativo híbrido (predictor-corrector) . . . . . . . . . . . . . . . . . . 1064.3.1. Construcción del método . . . . . . . . . . . . . . . . . . . . . . . . . . 1064.3.2. Convergencia semilocal del método . . . . . . . . . . . . . . . . . . . . 108

4.4. Aplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

5. Situación (no)-diferenciable 1155.1. Método corrector: el método de Steffensen . . . . . . . . . . . . . . . . . . . . 116

5.1.1. Convergencia semilocal . . . . . . . . . . . . . . . . . . . . . . . . . . . 1165.1.2. Accesibilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1205.1.3. Aplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

5.2. Método predictor: el método simplificado de Steffensen . . . . . . . . . . . . . 1275.2.1. Convergencia semilocal . . . . . . . . . . . . . . . . . . . . . . . . . . . 1275.2.2. Accesibilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

5.3. Método iterativo híbrido (predictor-corrector) . . . . . . . . . . . . . . . . . . 1315.3.1. Construcción del método . . . . . . . . . . . . . . . . . . . . . . . . . . 1315.3.2. Convergencia semilocal del método . . . . . . . . . . . . . . . . . . . . 133

5.4. Aplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1365.4.1. Sistema de ecuaciones no lineales diferenciable . . . . . . . . . . . . . . 1365.4.2. Sistema de ecuaciones no lineales no diferenciable . . . . . . . . . . . . 139

Bibliografía 143

Page 15: Estrategia metodos iterativos

Parte I

PRELIMINARES

1

Page 16: Estrategia metodos iterativos
Page 17: Estrategia metodos iterativos

3

En el análisis matemático ordinario trabajamos con el sistema de los números reales ocomplejos. El análisis funcional se basa en la utilización de espacios lineales, que son genera-lizaciones de estos sistemas de números. El poder del análisis funcional reside en que permitetratar una gran variedad de problemas que surgen del hecho de que los espacios lineales estáncompuestos de interesantes objetos matemáticos como son los vectores con un número finitoo infinito de componentes o las funciones que satisfacen ciertas condiciones dadas. Muchastransformaciones y ecuaciones importantes del álgebra y del análisis matemático ordinarios sepueden formular en términos de operadores lineales en dichos espacios. El análisis funcionallineal, que es la teoría de los espacios lineales, operadores y ecuaciones, se ha desarrolladocomo una amplia disciplina matemática con multitud de aplicaciones.

Entre los espacios lineales, los espacios normados completos, que se denominan espaciosde Banach, juegan un papel importante. Se denominan así en honor de Stefan Banach yson uno de los objetos de estudio más importantes en el análisis funcional. Los espacios deBanach son típicamente espacios de funciones de dimensión infinita.

Presentamos una introducción básica mínima de esta teoría en esta primera parte deltexto con el objetivo de que éste sea autosuficiente.

Por otra parte, es bien conocido que encontrar soluciones de ecuaciones en espacios deBanach, donde el operador implicado es no lineal, es un problema común en las ciencias yla ingeniería. Aunque algunas ecuaciones se pueden resolver analíticamente, generalmentebuscamos aproximaciones numéricas de las soluciones, ya que encontrar soluciones exactashabitualmente es difícil. Utilizamos normalmente métodos iterativos para aproximar estassoluciones. Así, introducimos algunas ideas básicas acerca de los métodos iterativos en es-pacios de Banach y, en particular, del método de Newton, que es el método iterativo másconocido y utilizado para resolver ecuaciones no lineales en espacios de Banach. Finalmente,presentamos algunas ecuaciones no lineales que aparecen frecuentemente en la literatura ma-temática, que posteriormente utilizamos como aplicaciones para ilustrar los resultados quepresentamos en las partes dos y tres del texto.

Page 18: Estrategia metodos iterativos
Page 19: Estrategia metodos iterativos

Capítulo 1

Conceptos generales

El origen de la teoría de los espacios de Banach se encuentra en la publicación del clásicoThéorie des opérations linéaires [8] por parte del matemático polaco Stefan Banach (1892–1945) en 1932. Desde su nacimiento, esta teoría estuvo relacionada con el resto de ramas delanálisis matemático.

Tras unos años de auge, la teoría parecía condenada al ostracismo. Sin embargo, durantelos años setenta y principios de los ochenta, la teoría tuvo un nuevo periodo de gran actividad,se resolvieron viejos problemas y, lo que es más importante, se plantearon otros nuevosy se establecieron nuevas conexiones con otras ramas del análisis matemático, tales comoanálisis armónico, funciones de variable compleja, series ortonormales, teoría de aproximacióno probabilidad. De la bibliografía acerca de los espacios de Banach podemos destacar lostextos clásicos de Dunford-Schwarz [19] y Day [16], donde se recogen los principales resultadosde la época comprendida entre los años treinta y cincuenta. Resultados más recientes puedenencontrarse en los textos de Lindenstrauss-Tzafriri [31],[32] y Beauzamy [10].

Como dice Wojtaszczyk en su introducción [48], no podemos esperar de los espacios deBanach que nos resuelvan los problemas que estemos tratando, pero sí que nos hagan verdichos problemas con un nuevo enfoque y nos permitan aislar sus características esenciales,obteniendo así una gran generalidad en los resultados. Además, en muchos casos, utilizarlas técnicas y los teoremas generales de los espacios de Banach puede sugerirnos nuevosproblemas. Al trabajar con espacios de Banach, abarcamos una gran amplitud de situaciones,tales como ecuaciones en el campo real o complejo, sistemas de ecuaciones reales o complejas,ecuaciones diferenciales o ecuaciones integrales.

A continuación, damos una introducción de los conceptos básicos de la teoría de losespacios de Banach que son esenciales en el tratamiento posterior de la resolución, mediantemétodos iterativos que utilizan diferencias divididas, de ecuaciones con operadores no linealesen espacios de Banach. Para un estudio más detallado se puede consultar cualquiera de losnumerosos tratados que hay en la bibliografía matemática, entre los que citamos los textosde Berberian [11], Rudin [40] y Curtain-Pritchard [15].

Gran cantidad de problemas de las ciencias y la ingeniería se pueden expresar comoecuaciones con operadores no lineales en espacios de Banach. En general, para resolver es-tas ecuaciones, recurrimos a métodos iterativos. Entre éstos, destaca especialmente, por susimplicidad y eficiencia, el método de Newton. Este método proporciona una herramientapoderosa para la investigación teórica y numérica de las ecuaciones con operadores no li-neales. En este capítulo, introducimos la teoría del método de Newton desde dos puntos de

5

Page 20: Estrategia metodos iterativos

6 CAPÍTULO 1. CONCEPTOS GENERALES

vista: el principio de la mayorante de Kantorovich y una alternativa basada en relaciones derecurrencia, desarrollada por los autores del texto, que proporciona buenos resultados y essencilla de aplicar.

Terminamos el capítulo presentando algunos tipos importantes de ecuaciones diferencia-bles e integrales no lineales en espacios de Banach. A continuación, les aplicamos procesos dediscretización para transformarlas en sistemas de ecuaciones no lineales que posteriormenteresolvemos mediante los métodos iterativos presentados en este texto.

1.1. Espacios de BanachLos espacios de Banach son una clase importante de espacios lineales normados que reciben

su nombre a partir de las contribuciones fundamentales del matemático polaco Stefan Banachal análisis funcional lineal [8].

1.1.1. Espacios lineales normadosEn términos abstractos, un espacio vectorial lineal es un conjunto de elementos, llamados

habitualmente puntos o vectores, con dos operaciones, la adición y la multiplicación por unescalar, que satisfacen ciertas condiciones. En particular, se requiere que la adición tenga lasmismas propiedades algebraicas que la adición de los números reales o complejos.

Cada espacio lineal X tiene asociado un campo escalar K, que es el campo de los númerosreales R o el de los complejos C. Llamamos escalar a un número perteneciente a K y se diceque X es un espacio lineal real o complejo según sea K = R o K = C.

La estructura algebraica de los espacios lineales es similar a la del sistema de los númerosreales o complejos, permitiendo extender muchas técnicas algebraicas a problemas en unmarco más general. Sin embargo, al tratar con otros conceptos de importancia teórica ycomputacional, como la exactitud de aproximación o la convergencia de sucesiones o series,es necesario introducir una estructura adicional en estos espacios. La estructura métrica (otopológica) que consideramos aquí se basa en una simple generalización de la idea de valorabsoluto de un número real o módulo de un número complejo.

Supongamos que, para cada elemento x de un espacio lineal X, se define norma de x comoel número real no negativo ‖x‖ que satisface las siguientes tres condiciones:

N1: ‖x‖ > 0 si x 6= 0, ‖0‖ = 0,N2: ‖λx‖ = |λ|‖x‖ para todo λ ∈ K,N3: ‖x+ y‖ ≤ ‖x‖+ ‖y‖, para todo y ∈ X.

Entonces, un espacio lineal X en el que hay definida una norma se llama espacio linealnormado.

Es fácil ver que R y C son espacios lineales normados con ‖x‖ = |x|. Desde un punto devista geométrico, podemos interpretar ‖x‖ como la distancia del origen 0 del espacio al puntox o como la longitud del vector x.

La distancia d(x, y) de un punto x a un punto y se define en un espacio lineal normadoX como d(x, y) = ‖x− y‖. Por tanto, si consideramos y como una aproximación a x, el errorde la aproximación es ‖x− y‖.

Page 21: Estrategia metodos iterativos

1.1. ESPACIOS DE BANACH 7

En general, en un espacio lineal se pueden introducir diferentes normas. Por ejemplo, enRn y Cn se definen

‖x‖p =(

n∑i=1|xi|p

) 1p

, 1 ≤ p <∞, (1.1)

y‖x‖∞ = max

(i)|xi|, i = 1, 2, . . . , n, (1.2)

donde x = (x1, x2, . . . , xn). Obviamente estas definiciones satisfacen las condiciones N1 y N2.Para verificar N3 se utiliza la desigualdad de Minkowski [29]:(

n∑i=1|xi + yi|p

) 1p

≤(

n∑i=1|xi|p

) 1p

+(

n∑i=1|yi|p

) 1p

, 1 ≤ p ≤ ∞.

La norma infinito es el caso límite cuando p → ∞. Para verlo, suponemos que ‖x‖∞ =|x1| 6= 0 y escribimos

‖x‖p = |x1|(

1 +n∑i=2

∣∣∣∣xix1

∣∣∣∣p) 1

p

.

Como∣∣∣∣∣xix1

∣∣∣∣∣ ≤ 1, entonces

lımp→∞‖x‖p = |x1| = ‖x‖∞.

Los espacios Rn y Cn con la norma ‖x‖p se denotan, respectivamente, por Rnp y Cn

p . Designa-mos con R∞ (o C∞) al conjunto de sucesiones de números reales (o complejos). En R∞, porejemplo, para p = 1 la serie infinita

‖x‖1 =∞∑i=1|xi|

convergerá en un subconjunto de R∞. Este subconjunto es un subespacio normado de R∞que se denota por `1.

De la misma forma, para 1 ≤ p < ∞, podemos definir `p como el subconjunto de R∞ (oC∞) formado por los vectores x tales que

‖x‖p =( ∞∑i=1|xi|p

) 1p

<∞.

Para ver que estos subconjuntos son espacios normados, debemos considerar la desigualdadde Minkowski para series infinitas [29],( ∞∑

i=1|xi + yi|p

) 1p

≤( ∞∑i=1|xi|p

) 1p

+( ∞∑i=1|yi|p

) 1p

, 1 ≤ p <∞,

y comprobar las condiciones de subespacio.El espacio `∞ es el conjunto de todas las sucesiones acotadas reales (o complejas) con la

norma definida en (1.2):

‖x‖∞ = sup(i)|xi|, x = (x1, x2, . . . ).

Page 22: Estrategia metodos iterativos

8 CAPÍTULO 1. CONCEPTOS GENERALES

Se verifica la siguiente relación de contenido [40]:

`1 ⊆ `2 ⊆ · · · ⊆ `∞.

Es natural, para espacios de funciones, reemplazar el sumatorio en la definición de normapor una integral. Por ejemplo, el subconjunto L1([0, 1]) del espacio F ([0, 1]) de todas lasfunciones reales x = x(t), con 0 ≤ t ≤ 1, para las cuales la integral de Riemann

‖x‖1 =∫ 1

0|x(t)| dt

existe y es finita, es un espacio normado, como lo son los espacios Lp([0, 1]) de las funcionesreales para los cuales las integrales

‖x‖p =(∫ 1

0|x(t)|p dt

) 1p

, 1 ≤ p <∞,

existen y son finitas. El espacio L∞([0, 1]) está formado por todas las funciones reales acotadascon la norma

‖x‖∞ = supt∈[0,1]

|x(t)|.

Los conjuntos Lp([0, 1]) cumplen la siguiente relación [40]

L1([0, 1]) ⊇ L2([0, 1]) ⊇ · · · ⊇ L∞([0, 1]).

Indicamos, a continuación, cómo relacionar las diferentes normas que podemos definir enun espacio lineal. El concepto que las relaciona es el de normas equivalentes. Así, se dice quedos normas diferentes ‖x‖ y ‖x‖′ de un espacio lineal son equivalentes si existen constantesa, b tales que 0 < a < b y

a‖x‖ ≤ ‖x‖′ ≤ b‖x‖, para todo x ∈ X.

Es conocido que todas las normas son equivalentes en un espacio lineal de dimensión finita[29].

1.1.2. Operadores lineales y acotados en espacios de Banach. In-versión de operadores

En un espacio lineal normado X podemos definir las nociones analíticas de convergenciay límite de una sucesión de elementos del espacio. Denominamos límite de una sucesión xnde elementos de X a un elemento x∗ tal que

lımn→∞

‖xn − x∗‖ = 0 (1.3)

es decir: si, dado ε > 0, existe N ∈ N tal que ‖x∗ − xn‖ < ε para n > N . Si se cumple (1.3),decimos entonces que la sucesión xn converge a x∗ y denotamos lımn→∞ xn = x∗.

Una serie infinita x1 + x2 + x3 + · · · de elementos de un espacio lineal normado es con-vergente si la sucesión xn de sumas parciales

xn =n∑i=1

xi

Page 23: Estrategia metodos iterativos

1.1. ESPACIOS DE BANACH 9

converge. En este caso, denominamos suma de la serie infinta al límite x∗ de xn.Una clase importante de los espacios lineales normados son los llamados espacios de

Banach. El asunto a tratar en la resolución de muchos problemas es la existencia de un límitex∗ de una sucesión xn en un espacio lineal normado X; situación común en el análisismatemático clásico vinculada a la idea de completitud.

Para introducir la propiedad anterior veamos un ejemplo ilustrativo. Consideramos lasucesión qn de números racionales definida por

q0 = 1, qn+1 = 12

(qn + 3

qn

), n = 0, 1, . . . (1.4)

Es conocido que no existe ningún número racional q∗ que pueda interpretarse como límite deesta sucesión. Sin embargo, si estudiamos la sucesión anterior en el ámbito de los númerosreales, vemos que tiene límite q∗ y que además es solución de la ecuación x2 = 3, [38]. Algeneralizar esta propiedad que poseen los números reales a otros espacios aparece la idea decompletitud. Es interesante destacar que la completitud no se deduce de las propiedades delos espacios normados, sino que es una propiedad adicional que un espacio puede tener o no.

Definición 1.1. Una sucesión xn de elementos de un espacio lineal normado se dice deCauchy si

lımn→∞

lımm→∞

‖xn+m − xn‖ = 0.

La elección de una norma puede ser de suma importancia cuando tratamos con procesosinfinitos en espacios de dimensión infinita.

Definición 1.2. Se dice que un espacio normado X es completo si toda sucesión de Cauchyes convergente a un límite que es un elemento de X.

Así, la sucesión de números racionales definida por (1.4) es una sucesión de Cauchy, perono tiene un límite racional. En consecuencia, el conjunto Q de los números racionales no escompleto. Sin embargo, la sucesión anterior vista como una sucesión de números reales sí quetiene límite. De hecho, el conjunto R de los números reales es completo.

Definición 1.3. Un espacio de Banach es un espacio normado completo.

A continuación, damos algunos ejemplos de espacios de Banach.

Ejemplo 1.4. Los espacios Rn y Cn con las normas ‖ · ‖p, 1 ≤ p ≤ ∞, definidas en (1.1) y(1.2) son espacios de Banach.

Demostración. Si un espacio normado de dimensión finita es completo para una norma,es completo para cualquier otra norma equivalente. Por consiguiente, será suficiente probarlopara la norma ‖ · ‖∞.

Si xm = (xm1, xm2, . . . , xmn) es una sucesión de Cauchy en uno de estos espacios, en-tonces las sucesiones xmi, i = 1, . . . , n, son de Cauchy en R o C.

Por ser estos espacios completos, existen los números x∗i , i = 1, 2, . . . , n, tales que

lımm→∞

|xmi − x∗i | = 0, i = 1, 2, . . . , n.

Se cumple entonces

xmi → x∗i , 1 ≤ i ≤ n, si y sólo si xm → x∗,

Page 24: Estrategia metodos iterativos

10 CAPÍTULO 1. CONCEPTOS GENERALES

con x∗ = (x∗1, x∗2, . . . , x∗n). Por tanto, la sucesión xm tiene por límite x∗. Luego, tanto Rn

como Cn son completos. También podemos probar, de la misma forma que en el ejemplo 1.4, que `p, con 1 ≤ p ≤ ∞,

es un espacio de Banach.Si ahora pensamos en los espacios de funciones y, por tanto, en sucesiones de funciones,

la idea de convergencia de una sucesión de funciones admite ciertos matices.

Definición 1.5. Sean un subconjunto S del espacio normado X, una sucesión de funcionesfnn≥1 tales que fn : S −→ X y una función f : S −→ X. Decimos que la sucesión fnn≥1converge puntualmente a f en S si, para s ∈ S, la sucesión fn(s)n≥1 converge a f(s); esdecir: fijado s ∈ S, para todo ε > 0, existe N ∈ N tal que ‖f(s)− fn(s)‖ < ε para n > N .

Es fundamental observar en la definición anterior que la elección de N se hace después deconocer s y ε, de modo que N depende de ambos valores.

Notemos que si bien en los espacios de dimensión finita la elección de una norma nomodifica el carácter de completitud, ya que todas las normas son equivalentes ([40]), enespacios de dimensión no finita sí puede determinar la completitud del espacio. Veamos acontinuación, como ejemplo, que el espacio C([a, b]) de las funciones reales de una variableque son continuas en el intervalo cerrado [a, b] no es un espacio completo con la norma

‖x‖ =(∫ b

a|x(t)|2 dt

) 12

.

Por ejemplo, si [a, b] = [0, 1], la sucesión de funciones continuas xm(t) definida por

xm(t) =

2mtm+1, 0 ≤ t ≤ 1

2 ,

1− 2m(1− t)m+1,12 ≤ t ≤ 1,

es una sucesión de Cauchy con la norma anterior (figura 1.1) y tiene por límite la sucesión(figura 1.2)

x∗(t) =

0, 0 ≤ t <12 ,

12 , t = 1

2 ,

1, 12 < t ≤ 1,

pero x∗(t) /∈ C([0, 1]).Acabamos de ver que el límite de una sucesión de funciones continuas tiene como límite

una función que no lo es, lo que implica que el espacio C([a, b]) no sea completo con la normautilizada. La idea de que la función límite conserve las propiedades que tiene el conjuntode funciones que definen la sucesión pasa por un concepto de convergencia más sutil, el deconvergencia uniforme que definimos a continuación.

Definición 1.6. Sean un subconjunto S del espacio normado X, una sucesión de funcionesfnn≥1 tales que fn : S −→ X y una función f : S −→ X. Decimos que la sucesión fnn≥1converge uniformemente a f en S si, para cada ε > 0, existe N ∈ N tal que ‖f(s)−fn(s)‖ < εpara n > N y s ∈ S.

Page 25: Estrategia metodos iterativos

1.1. ESPACIOS DE BANACH 11

0.0 0.2 0.4 0.6 0.8 1.0

0.2

0.4

0.6

0.8

1.0

Figura 1.1: Representación gráfica de xm(t).

0.2 0.4 0.6 0.8 1.0

0.2

0.4

0.6

0.8

1.0

Figura 1.2: Representación gráfica de x∗(t).

Destacamos que en la definición anterior el valor deN es el mismo para todos los elementoss ∈ S, mientras que, en la convergencia puntual, N depende de ε y s ∈ S. Este hecho vaa permitir que la función límite uniforme herede propiedades de las funciones que formanla sucesión. Así, por ejemplo, si fnn≥1 es una sucesión de funciones continuas con límiteuniforme f , entonces f es una función continua. En el siguiente ejemplo utilizamos lo anteriorpara ver que C([a, b]) es un espacio de Banach con la norma del máximo.Ejemplo 1.7. El espacio C([a, b]) es un espacio de Banach con la norma

‖x‖∞ = maxt∈[a,b]

|x(t)|.

Demostración. Sea xm una sucesión de Cauchy en C([a, b]). Entonces, dado ε > 0,existe un número natural N tal que, para todo m y n tales que m,n > N , se tiene

‖xm − xn‖∞ = maxt∈[a,b]

|xm(t)− xn(t)| < ε. (1.5)

Fijado cualquier t0 ∈ [a, b],

|xm(t0)− xn(t0)| < ε, m, n > N,

y x1(t0), x2(t0), . . . es una sucesión de Cauchy de números reales. Como R es completo,xm(t0) → x(t0) cuando m → ∞. De esta forma, podemos asociar a cada t ∈ [a, b] un únicox(t). Esto define una función x en [a, b]. Veamos que x ∈ C([a, b]) y xm → x.

De (1.5), cuando n→∞, se tiene

maxt∈[a,b]

|xm(t)− x(t)| ≤ ε, m > N.

Por tanto, para cada t ∈ [a, b], tenemos

|xm(t)− x(t)| ≤ ε, m > N,

lo que implica que xm converge a x uniformemente en [a, b]. Como las funciones xm soncontinuas y la convergencia es uniforme, la función límite x es continua en [a, b].

Page 26: Estrategia metodos iterativos

12 CAPÍTULO 1. CONCEPTOS GENERALES

Ejemplo 1.8. También se puede ver que los espacios Cn ([a, b]) son espacios de Banach conlas normas

‖x‖∞ = max‖x‖, ‖x′‖, . . . , ‖x(n)‖y

‖x‖1 = ‖x‖+ ‖x′‖+ · · ·+ ‖x(n)‖,donde ‖ · ‖ denota la norma en C ([a, b]), [8].

En cálculo se trabaja con funciones reales definidas sobre un intervalo real. En análisisfuncional, consideramos espacios más generales, tales como espacios métricos o normados yaplicaciones entre dichos espacios. En este caso, a estas aplicaciones se les llama operadores.Diremos que un operador T aplica el espacio X en Y si a un elemento x ∈ X le hacecorresponder un elemento T (x) ∈ Y . En principio, T no tiene por qué estar definido sobretodo el espacio X ni recorrer todos los valores de Y . Al conjunto de puntos de X donde estádefinido T lo llamamos dominio de T , y lo denotaremos por D(T ), y al conjunto de valoresde Y que toma el operador T lo llamamos rango de T , y lo denotamos por R(T ).

De especial interés son aquellos operadores que conservan las operaciones algebraicas delos espacios donde están definidos.

Definición 1.9. Un operador L que aplica un espacio lineal X en otro espacio lineal Y ,ambos espacios sobre el mismo cuerpo K, se dice lineal si, para todo x1, x2 ∈ X, tenemos

L(x1 + x2) = L(x1) + L(x2),

y, para todo x ∈ X y todo λ ∈ K,L(λx) = λL(x).

Es muy corriente en análisis funcional emplear la notación Lx en lugar de L(x) para losoperadores lineales.

Definición 1.10. Un operador T entre dos espacios normados X e Y se dice acotado siexiste un número real c tal que, para todo x ∈ D(T ), se cumple

‖T (x)‖ ≤ c‖x‖. (1.6)

Observamos que la norma de la izquierda es la del espacio Y y la de la derecha la delespacio X, aunque las hayamos denotado igual.

Notemos que en el caso de operadores acotados, la imagen no tiene por qué estar aco-tada, lo que verifican estos operadores es que transforman conjuntos acotados en conjuntosacotados.

Si X e Y son dos espacios lineales sobre un mismo cuerpo K, entonces el conjunto detodos los operadores lineales y acotados entre X e Y , que denotamos a partir de ahora porL(X, Y ), es un espacio lineal sobre el cuerpo K con las operaciones

(L1 + L2)(x) = L1x+ L2x, para todo x ∈ X,

(λL)x = λ(Lx), para todo x ∈ X y todo λ ∈ K.

A continuación, vamos a definir una norma en el conjunto de operadores acotados. Dejandoa un lado el caso en que x = 0, nos podemos preguntar cuál es el menor número c que verifica(1.6). De aquí surge la idea para definir la norma de un operador.

Page 27: Estrategia metodos iterativos

1.1. ESPACIOS DE BANACH 13

Definición 1.11. Sea T un operador acotado. Definimos la norma de T como

‖T‖ = ınfc; ‖T (x)‖ ≤ c‖x‖, x ∈ D(T ), x 6= 0 = supx∈D(T )x 6=0

‖T (x)‖‖x‖

·

Como consecuencia, si T es acotado, entonces

‖T (x)‖ ≤ ‖T‖‖x‖. (1.7)

Otra fórmula alternativa para la norma anterior, cuando el operador T es lineal, es lasiguiente:

‖T‖ = supx∈D(T )‖x‖=1

‖T (x)‖. (1.8)

Que estas fórmulas son equivalentes y que todas ellas son normas puede verse en [29].Además, el espacio L(X, Y ) con Y completo y la norma (1.8) es un espacio completo [29].

Antes de considerar propiedades generales de los operadores lineales acotados veamosalgunos ejemplos típicos.

Ejemplo 1.12. El operador identidad, I : X → X, definido por Ix = x, es un operadoracotado y su norma es ‖I‖ = 1.

Ejemplo 1.13. El operador cero, 0 : X → X, definido por 0x = 0 para todo x ∈ X, es unoperador acotado y su norma es ‖0‖ = 0.

Ejemplo 1.14. Sea X el espacio normado de todos los polinomios en J = [0, 1] con la norma‖x‖ = max |x(t)|, t ∈ J . El operador diferenciación T , definido en X por

Tx(t) = x′(t),

es lineal, pero no acotado. En efecto, sea xn(t) = tn con n ∈ N. Entonces ‖xn‖ = 1 y

Txn(t) = x′n(t) = ntn−1.

Por tanto, ‖Txn‖ = n y ‖Txn‖‖xn‖

= n. Como n ∈ N, no existe un número fijo c tal que

‖Txn‖‖xn‖

≤ c. A partir de lo anterior y de (1.6), se concluye que T no es acotado.

Teorema 1.15. ([29]) Si un espacio normado X es de dimensión finita, entonces cada ope-rador lineal en X es acotado.

Ejemplo 1.16. Sean X = Rm e Y = Rn. Como X e Y son espacios de dimensión finita, elconjunto de operadores lineales deX en Y es L(X, Y ) y, por tanto, existe una correspondenciabiyectiva entre L(X, Y ) y el conjuntoMn×m(R) de las matrices reales de n filas y m columnasde la siguiente manera.

Si L ∈ L(X, Y ) y A = (aij), 1 ≤ i ≤ n, 1 ≤ j ≤ m, es su matriz asociada, entonces

y = Lx = Ax, para todo x ∈ D(X),

Page 28: Estrategia metodos iterativos

14 CAPÍTULO 1. CONCEPTOS GENERALES

donde x = (x1, x2, . . . , xm) ∈ X, y = (y1, y2, . . . , yn) ∈ Y e

yj =m∑k=1

αjkxk, j = 1, 2, . . . , n.

Además, la norma de ‖L‖ viene definida por

‖L‖ = supx∈D(L)x 6=0

‖Lx‖Y‖x‖X

= supx∈D(L)x 6=0

‖Ax‖Y‖x‖X

·

En el espacio de las matrices de n filas y m columnas podemos definir varias normas. Sidenotamos la norma en el espacio X por ‖ · ‖X y la norma en el espacio Y por ‖ · ‖Y , diremosque una norma ‖ · ‖ en el espacio de las matrices es compatible con ‖ · ‖X y ‖ · ‖Y si

‖Ax‖Y ≤ ‖A‖‖x‖X .

Se cumple entonces que la norma definida por

‖A‖ = supx∈Xx 6=0

‖Ax‖Y‖x‖X

es compatible con ‖ · ‖X y ‖ · ‖Y . Esta norma se denomina a menudo norma natural definidapor ‖ · ‖X y ‖ · ‖Y .

Si consideramos en X e Y la norma infinito definida en (1.2), se tiene que la norma naturales

‖A‖ = maxi

m∑j=1|aij|.

Definición 1.17. Un operador T entre dos espacios normados X e Y se dice continuo enun punto x ∈ X si, para toda sucesión xn tal que lım

n→∞xn = x, se tiene lım

n→∞T (xn) = T (x).

Además, diremos que un operador es continuo si lo es en todos los puntos de su dominio.

La definición anterior generaliza la idea de función continua del cálculo en una variable.Los operadores lineales tienen la siguiente propiedad.

Teorema 1.18. Sea T un operador lineal entre dos espacios normados. Entonces,

(i) T es continuo si y sólo si es acotado.

(ii) Si T es continuo en un punto, entonces T es continuo en todos los puntos de su dominio.

Demostración. Comenzamos probando el apartado (i). En primer lugar, probamos quesi T es acotado, entonces es continuo. Para T = 0 resulta trivial. Si T 6= 0, entonces ‖T‖ 6= 0.Suponemos que T es acotado y x ∈ D(T ). Dado ε > 0, para cada x ∈ D(T ) tal que

‖x− x‖ < δ, donde δ = ε

‖T‖,

obtenemos, al ser T lineal,

‖Tx− T x‖ = ‖T (x− x)‖ ≤ ‖T‖ ‖x− x‖ < ‖T‖δ = ε.

Page 29: Estrategia metodos iterativos

1.1. ESPACIOS DE BANACH 15

Como x ∈ D(T ), entonces T es continuo.Recíprocamente, suponemos que T es continuo y x ∈ D(T ). Entonces, dado ε > 0, existe

δ > 0 tal que

‖Tx− T x‖ < ε, para todo x ∈ D(T ), cumpliendo ‖x− x‖ < δ.

Sea y ∈ D(T ) tal que y 6= 0. Consideramos |θ| < δ y x = x+ θ

‖y‖y perteneciente a D(T )

por ser T lineal. Como x− x = θ

‖y‖, entonces ‖x− x‖ < δ. Aplicando (1.7), por ser T lineal,

obtenemos‖Tx− T x‖ = ‖T (x− x)‖ =

∥∥∥∥∥T(

θ

‖y‖y

)∥∥∥∥∥ = |θ|‖y‖‖Ty‖,

lo que implica|θ|‖y‖‖Ty‖ < ε y ‖Ty‖ < ε

|θ|‖y‖.

Podemos escribir entonces ‖Ty‖ ≤ c‖y‖, donde c = ε

|θ|. Y, como para y = 0 resulta trivial,

T es acotado.Veamos ahora el apartado (ii). Si T es continuo en un punto, por la segunda parte de la

demostración de (i), T es acotado, lo que implica, de nuevo por (i), que T es continuo entodos sus puntos.

Como consecuencia del teorema 1.18, a los operadores lineales continuos entre espaciosnormados se les suele llamar también operadores lineales acotados.

A continuación, introducimos los conceptos de Lipschitz continuidad y Hölder continuidadpara un operador.

Definición 1.19. Un operador T entre dos espacios normados X e Y se dice que satisfaceuna condición Lipschitz (o que es Lipschitz continuo) si existe una constante C ≥ 0 tal que

‖T (x)− T (y)‖ ≤ C ‖x− y‖, ∀x, y ∈ X.

En tal caso, C se llama la constante de Lipschitz del operador T .

Notemos que si un operador satisface una condición de Lipschitz, en particular es continuo.Una generalización conocida de la propiedad de que un operador sea Lipschitz continuo

es que sea Hölder continuo.

Definición 1.20. Un operador T entre dos espacios normados X e Y se dice que satisfaceuna condición (C, p)-Hölder (o que es (C, p)-Hölder continuo) si existen dos constantes C ≥ 0y p ∈ [0, 1] tales que

‖T (x)− T (y)‖ ≤ C ‖x− y‖p, ∀x, y ∈ X.

En tal caso, p se llama exponente de la condición de Hölder. Observamos que si p = 1,entonces el operador anterior T satisface una condición Lipschitz.

Ahora introducimos el operador inverso de uno dado, operador fundamental para resolverecuaciones de la forma Lx = y, donde L es un operador lineal.

Page 30: Estrategia metodos iterativos

16 CAPÍTULO 1. CONCEPTOS GENERALES

Definición 1.21. Sea L es un operador lineal y acotado de X en Y . Si existe un operadorL−1 que aplica R(L) en D(L), de manera que

L−1Lx = x, para todo x ∈ D(L),

LL−1y = y, para todo y ∈ R(L),

diremos que L tiene inverso y que L−1 es el inverso de L.

Se puede probar que si L−1 existe, entonces también es un operador lineal. Una propiedadalgebraica que garantiza la existencia del inverso es la siguiente: si de la relación Lx = 0 sededuce que x debe ser cero, entonces L tiene inverso. Esta condición es además una condiciónnecesaria [38].

La condición anterior es en general difícil de comprobar. Necesitaremos entonces unacaracterización analítica del concepto de inversión. Para ello, los siguientes resultados sonfundamentales [27],[38].

Lema 1.22. (Lema de Banach) Sea L un operador lineal acotado en un espacio de BanachX verificando

‖L‖ ≤ k < 1.

Entonces, el operador I − L tiene inverso continuo y cumple

‖(I − L)−1‖ ≤ 11− k ·

Demostración. Si L1 y L2 son operadores en X, entonces, por (1.7), se cumple que‖L1L2‖ ≤ ‖L1‖‖L2‖. Aplicando reiteradamente lo anterior, obtenemos

‖Ln‖ ≤ ‖L‖n, n = 1, 2, . . . (1.9)

Consideramos ahora la serie

S = I + L+ L2 + · · ·+ Ln + · · · ,

que converge, ya que ‖L‖ < 1 y está mayorada por la serie numérica convergente

1 + ‖L‖+ ‖L‖2 + · · ·+ ‖L‖n + · · ·

Como L(X,X) es completo, S converge y es un operador de L(X,X). Además,

S(I − L) = (I + L+ · · ·+ Ln + · · · )(I − L) = I

y, análogamente, (I − L)S = I. Por tanto, S = (I − L)−1. Finalmente, por (1.9),

‖S‖ ≤ ‖I‖+ ‖L‖+ · · ·+ ‖Ln‖+ · · · ≤ 1 + k + · · ·+ kn + · · · = 11− k

que da la cota para (I − L)−1.

Unas ligeras variantes del lema anterior son los siguientes resultados.

Page 31: Estrategia metodos iterativos

1.1. ESPACIOS DE BANACH 17

Lema 1.23. Sea L un operador lineal acotado en un espacio de Banach X. Existe L−1 si ysólo si existe un operador inversible M en X tal que

‖I −ML‖ < 1.

En este caso,

L−1 =∞∑n=0

(I −ML)nM y ‖L−1‖ ≤ ‖M‖1− ‖I −ML‖

·

Demostración. Tomando I−ML en lugar de L en el lema 1.22 se asegura la existenciadel operador continuo inverso de I − (I −ML) = ML, que está dado por

(ML)−1 =∞∑n=0

(I −ML)n.

Por ser M inversible, se tieneL−1 =

∞∑n=0

(I −ML)nM.

Por otro lado, teniendo que

‖(ML)−1‖ ≤ 11− ‖I −ML‖

,

obtenemos

‖L−1‖ = ‖L−1M−1M‖ = ‖(ML)−1M‖ ≤ ‖(ML)−1‖ ‖M‖ = ‖M‖1− ‖I −ML‖

·

Finalmente la condición necesaria se prueba tomando M = L−1, ya que

‖I −ML‖ = ‖I − I‖ = 0 < 1.

Lema 1.24. Sea L un operador lineal acotado en un espacio de Banach X. Existe L−1 si ysólo si existe un operador lineal acotado M en X tal que existe M−1 y

‖M − L‖ < 1‖M−1‖

·

En este caso,

L−1 =∞∑n=0

(I −M−1L)nM−1

y

‖L−1‖ ≤ ‖M−1‖1− ‖I −M−1L‖

≤ ‖M−1‖1− ‖M−1‖‖M − L‖

·

Demostración. Para la condición suficiente tomamos M−1 en lugar de M en el le-ma 1.23, cumpliéndose entonces

‖I −M−1L‖ = ‖M−1(M − L)‖ ≤ ‖M−1‖‖M − L‖ < 1.

La condición necesaria se prueba tomando M = L.

Page 32: Estrategia metodos iterativos

18 CAPÍTULO 1. CONCEPTOS GENERALES

1.2. Diferenciación de operadoresEn esta sección presentamos algunos de los conceptos y resultados básicos del cálculo

diferencial en espacios de Banach. A parte del interés que esta sección pueda tener por símisma, se establece en ella el contexto que permitirá estudiar la aproximación de solucionesde ecuaciones con operadores no lineales mediante métodos iterativos.

Comenzamos dando una primera definición de derivada para operadores definidos enespacios de Banach.

Definición 1.25. Dado x0 ∈ X, si existe un operador L ∈ L(X, Y ) que, para todo x ∈ X,cumple

lımh→0

F (x0 + hx)− F (x0)h

= L(x), (1.10)

se dice entonces que F es diferenciable Gateaux (o diferenciable débilmente) en x0. En estasituación, el operador lineal L es la derivada Gateaux de F en x0 y denotamos L = F ′(x0).

Sin embargo, la derivada Gateaux no es una buena generalización del concepto de derivadapara funciones escalares, como prueba el hecho de que existan funciones derivables Gateauxy no continuas. Por ejemplo, la función F : R2 → R definida por

F (x, y) =

xy2

x2 + y4 , si (x, y) 6= (0, 0),

0, si (x, y) = (0, 0),

es derivable Gateaux en el punto (0, 0) y, sin embargo, no es continua en dicho punto. Paraestar seguros de que las funciones diferenciables son continuas, introducimos el siguienteconcepto más fuerte de derivada.

Definición 1.26. Si el límite de la ecuación (1.10) es uniforme en el conjunto x ∈ X; ‖x‖ =1, entonces se dice que F es diferenciable Fréchet (o simplemente diferenciable) en x0. Eneste caso, el operador lineal L = F ′(x0) se llama derivada de F en x0.

Equivalentemente, el concepto de diferenciabilidad se puede expresar de la siguiente forma.Dado x0 ∈ X, si existe un operador lineal y continuo L de X en Y de manera que

lım‖v‖→0

‖F (x0 + v)− F (x0)− Lv‖‖v‖

= 0,

entonces F es diferenciable Fréchet en x0 y el operador F ′(x0) = L se denomina derivada deF en x0.

Como consecuencia de la definición anterior, tenemos las siguientes propiedades de laderivada, cuyas demostraciones pueden consultarse en [27]:

(i) Si F es diferenciable Fréchet en x0, entonces F es diferenciable Gateaux en x0.

(ii) Si un operador es diferenciable en un punto x0, entonces es continuo en dicho punto.

(iii) Si L es un operador lineal de X en Y , entonces L′(x) = L para todo x ∈ X.

Page 33: Estrategia metodos iterativos

1.2. DIFERENCIACIÓN DE OPERADORES 19

(iv) Si P y Q son operadores de X en Y , la suma P + Q es el operador definido por(P +Q)(x) = P (x) +Q(x), x ∈ X. Si P y Q son diferenciables en x0, entonces

(P +Q)′(x0) = P ′(x0) +Q′(x0).

(v) Sean X, Y y Z espacios de Banach, Q un operador de X en Z y P un operador de Zen Y . La composición PQ es un operador de X en Y definido por

PQ(x) = P (Q(x)) , x ∈ X.

Si Q es diferenciable en x0 y P es diferenciable en z0 = Q(x0), entonces PQ es diferen-ciable en x0 y

(PQ)′(x0) = P ′ (Q(x0))Q′(x0) = P ′(z0)Q′(x0).

(vi) Combinando (iii) y (v) tenemos que si L es un operador lineal acotado de Z en Y y Qes operador de X en Z diferenciable en x0, entonces LQ es diferenciable en x0 y

(LQ)′(x0) = LQ′(x0).

Observamos, por tanto, que en el cálculo diferencial en espacios de Banach los operadoreslineales acotados juegan un papel similar al de las constantes en el cálculo diferencial real ocomplejo.

Notemos que si F es un operador de Rn en Rm que, a una n-tupla (x1, x2, . . . , xn) ∈Rn, le hace corresponder (F1(x1, x2, . . . , xn), F2(x1, x2, . . . , xn), . . . , Fm(x1, x2, . . . , xn)) ∈ Rm,tenemos que la derivada F ′ en un punto x0 =

(x

(0)1 , x

(0)2 , . . . , x(0)

n

)se representa por la matriz

jacobiana

F ′(x0) =

∂F1∂x1

∂F1∂x2

· · · ∂F1∂xn

∂F2∂x1

∂F2∂x2

· · · ∂F2∂xn

... ... . . . ...∂Fm

∂x1∂Fm

∂x2· · · ∂Fm

∂xn

x=x0

.

Para ver esto, notamos que la matriz F ′(x0) =(∂Fi∂xj

)x=x0

es un operador lineal acotado de

Rn en Rm, puesto que es una matriz m× n con coeficientes constantes [38].A continuación, presentamos ejemplos del cálculo de derivadas de operadores en algunos

espacios de Banach.

Ejemplo 1.27. Sea el operador F en C([0, 1]) definido por

[F (x)](s) = x∫ 1

0h(s, t)x(t) dt,

Page 34: Estrategia metodos iterativos

20 CAPÍTULO 1. CONCEPTOS GENERALES

donde h(s, t) = s

s+ ty 0 ≤ s ≤ 1. Como

[F (x0 + hx)− F (x0)] (s) = x0(s)∫ 1

0

s

s+ t(hx)(t) dt

+ (hx)(s)∫ 1

0

s

s+ tx0(t) dt+ (hx)(s)

∫ 1

0

s

s+ t(hx)(t) dt,

lımh→0

[F (x0 + hx)− F (x0)] (s)h

= lımh→0

(x0(s)

∫ 1

0

s

s+ tx(t) dt

+x(s)∫ 1

0

s

s+ tx0(t) dt+ x(s)

∫ 1

0

s

s+ t(hx)(t) dt

)

= x0(s)∫ 1

0

s

s+ tx(t) dt+ x(s)

∫ 1

0

s

s+ tx0(t) dt

= L(x)(s)

y L es un operador lineal acotado en C([0, 1]), entonces F es diferenciable Gateaux en x0.Además, como

lım‖v‖→0

‖F (x0 + v)− F (x0)− Lv‖‖v‖

= 0,

F es diferenciable Fréchet en x0.

Ejemplo 1.28. Definimos el operador integral de tipo Hammerstein mixto F en C([a, b]) por

[F (x)](s) = x(s)− f(s)−∫ b

aG(s, t)H(t, x(t)) dt, s ∈ [a, b], (1.11)

para x ∈ C([a, b]), donde f es una función dada, G(s, t) es el núcleo de un operador integrallineal en C([a, b]) y H(t, u) es una función continua para t ∈ [a, b] y u ∈ (−∞,∞). Como

[F (x0 + hx)− F (x0)](s) = hx(s)−∫ b

aG(s, t)

(H(t, x0(t) + hx(t))−H(t, x0(t))

)dt,

lımh→0

[F (x0 + hx)− F (x0)](s)h

= x(s)−∫ b

aG(s, t)

(lımh→0

H(t, x0(t) + hx(t))−H(t, x0(t))h

)dt

= x(s)−∫ b

aG(s, t)H ′2(t, x0(t))x(t) dt

= [L(x)](s),

y L es un operador lineal acotado en C([a, b]), entonces F es diferenciable Gateaux en x0.Además, como

lım‖v‖→0

‖F (x0 + v)− F (x0)− Lv‖‖v‖

= 0,

F es diferenciable Fréchet en x0.

Ejemplo 1.29. Consideramos ahora el operador

[F (x)](t) = d2x(t)dt2

+ φ(x(t)) (1.12)

Page 35: Estrategia metodos iterativos

1.2. DIFERENCIACIÓN DE OPERADORES 21

de C2([a, b]) en C([a, b]), donde φ(u) es una función continua para u ∈ (−∞,∞). Como

[F (x0 + hx)− F (x0)](t) = hd2x(t)dt2

+ φ(x0(t) + hx(t))− φ(x0(t)),

lımh→0

[F (x0 + hx)− F (x0)](t)h

= d2x(t)dt2

+ lımh→0

φ(x0(t) + hx(t))− φ(x0(t))h

= d2x(t)dt2

+ φ′(x0(t))x(t)

= [L(x)](t),

y L es un operador lineal acotado en C([a, b]), entonces F es diferenciable Gateaux en x0.Además, como

lım‖v‖→0

‖F (x0 + v)− F (x0)− Lv‖‖v‖

= 0,

F es diferenciable Fréchet en x0.

Por otra parte, uno de los resultados que se pierden al pasar de los números reales aespacios más generales es el Teorema del Valor Medio, que asegura que si f es una funcióndiferenciable en un intervalo [a, b], entonces

f(b)− f(a) = f ′(ξ)(b− a), donde ξ ∈ (a, b).

Veremos ahora una desigualdad que generaliza al Teorema del Valor Medio. Para ello,dados dos puntos x e y, definimos el segmento que los une como

[x, y] = x+ θ(y − x); θ ∈ [0, 1].

Diremos que un conjunto Ω es convexo si, para cualesquiera x, y ∈ Ω, el segmento [x, y] queune x e y está contenido en Ω.

Teorema 1.30. (Teorema del Valor Medio) Sean X e Y dos espacios de Banach y F : X → Yun operador diferenciable en un conjunto convexo Ω ⊂ X. Entonces, si x0, x1 ∈ Ω, se tiene

‖F (x1)− F (x0)‖ ≤ sup0<θ<1

‖F ′ (x0 + θ(x1 − x0))‖ ‖x1 − x0‖.

Demostración. Dada una función lineal acotada g : Y → R, definimos:

φ(t) = g(F (x0 + tv)), v = x1 − x0, t ∈ [0, 1].

Teniendo en cuenta que g′ = g por ser lineal, se obtiene

φ′(t) = g (F ′(x0 + tv)(v)) .

Aplicando ahora el Teorema del Valor Medio a φ, se sigue

φ(1)− φ(0) = φ′(θ), 0 < θ < 1,

y sustituyendo por sus expresiones, se tiene

g (F (x1)− F (x0)) = g (F ′(x0 + θv)(v)) .

Page 36: Estrategia metodos iterativos

22 CAPÍTULO 1. CONCEPTOS GENERALES

Por tanto,|g (F (x1)− F (x0))| ≤ ‖g‖ sup

0<θ<1‖F ′ (x0 + θv) ‖‖v‖.

Por el Teorema de Hanh-Banach [29], podemos elegir g 6= 0 tal que

g (F (x1)− F (x0)) = ‖g‖‖F (x1)− F (x0)‖.

Y finalmente,

‖F (x1)− F (x0)‖ ≤ sup0<θ<1

‖F ′ (x0 + θ(x1 − x0))‖ ‖x1 − x0‖.

Corolario 1.31. Con la notación anterior se tiene que

‖F (x1)− F (x0)− F ′(x)(x1 − x0)‖

≤ sup0<θ<1

‖F ′ (x0 + θ(x1 − x0))− F ′(x)‖ ‖x1 − x0‖ con x ∈ [x0, x1].

La demostración del corolario anterior se obtiene aplicando el teorema 1.30 al operadorF − F ′(x).

Si F es un operador diferenciable entre dos espacios de Banach X e Y , entonces podemosinterpretar F ′ como un operador de X en L(X, Y ). El espacio L(X, Y ) también es un espaciode Banach con la norma

‖L‖ = sup‖x‖=1

‖Lx‖.

En consecuencia, se puede pensar en derivar el operador F ′. El resultado de derivar esteoperador en un punto x0 es lo que se conoce como la derivada segunda de F en x0 y se sueledenotar por F ′′(x0).

Observamos también que F ′′(x0) ∈ L (X,L(X, Y )), y así tenemos que F ′′ es un operadorde X en L (X,L(X, Y )), que también es un espacio de Banach. Si volvemos a derivar esteoperador en un punto x0, obtenemos la derivada tercera F ′′′(x0). Continuando este proceso,en el caso de que existan las derivadas que van apareciendo, se obtienen las derivadas deórdenes superiores, cuyo estudio no vamos a desarrollar, dado que no se van a utilizar a lolargo de todo este texto. Los estudiantes interesados pueden consultar [27].

1.3. Integración de operadoresA continuación comentamos algunos aspectos sobre el cálculo integral en espacios de

Banach. En primer lugar, definimos la integral en el sentido de Riemann para una funciónde variable real y con valores en un espacio de Banach. A continuación, apoyándonos enla definición anterior, definimos la integral de una función entre dos espacios de Banach engeneral.

Definición 1.32. Sea F definida en un intervalo real [a, b] y con valores en un espacio deBanach Y . Entonces podemos definir la integral de F como el límite de la siguiente suma

n−1∑k=0

F (τk)(tk+1 − tk),

Page 37: Estrategia metodos iterativos

1.3. INTEGRACIÓN DE OPERADORES 23

donde a = t0 < t1 < · · · < tn = b y τk ∈ [tk, tk+1], cuando max(k)tk+1 − tk tiende a cero. Si el

límite anterior existe, lo llamamos integral de F y lo denotamos por∫ b

aF (t) dt.

Evidentemente, si la integral existe, es un elemento de Y . Una condición suficiente paraque exista dicha integral es que la función F sea continua en el intervalo cerrado [a, b].

Las propiedades de esta integral se deducen de las conocidas para la integral de Riemannen el caso real. De entre ellas, destacamos las siguientes tres por su utilidad [27]:

(i) Si consideramos un operador lineal y acotado L ∈ L(Y, Z), entonces∫ b

aL(F (t)) dt = L

(∫ b

aF (t) dt

).

(ii) Si F (t) = φ(t)y0, donde y0 es un elemento fijo de Y y φ es una función real integrable,entonces ∫ b

aF (t) dt = y0

∫ b

aφ(t) dt.

(iii)∥∥∥∥∥∫ b

aF (t) dt

∥∥∥∥∥ ≤∫ b

a‖F (t)‖ dt.

Definición 1.33. Supongamos ahora que T es un operador definido en un segmento [x0, x1] ⊆X y con valores en el espacio L(X, Y ). En este caso, definimos:∫ x1

x0T (x) dx =

∫ 1

0T (x0 + t(x1 − x0)) (x1 − x0) dt.

Notemos que la función T (x0 + [·](x1 − x0)) (x1 − x0) está en las condiciones de la defi-nición 1.32 con [a, b] = [0, 1].

Si en la definición anterior se considera el caso particular T = F ′, donde F es un operadorde X en Y que tiene derivada continua en el segmento [x0, x1], tenemos el siguiente teoremaque generaliza la conocida regla de Barrow del cálculo.

Teorema 1.34. Si F es un operador de X en Y con derivada continua en el segmento[x0, x1] ⊂ X, entonces ∫ x1

x0F ′(x) dx = F (x1)− F (x0). (1.13)

Demostración. Sea 0 = t0 < t1 < · · · < tn = 1 una partición del intervalo [0, 1] conλ = max

0≤k≤n−1tk+1 − tk y τk ∈ [tk, tk+1]. Entonces,

∫ x1

x0F ′(x) dx = lım

λ→0

n−1∑k=0

F ′ (x0 + τk(x1 − x0)) (x1 − x0)(tk+1 − tk)

= lımλ→0

n−1∑k=0

F ′(xk)∆xk,

Page 38: Estrategia metodos iterativos

24 CAPÍTULO 1. CONCEPTOS GENERALES

donde xk = x0 + τk(x1 − x0) y ∆xk = (tk+1 − tk)(x1 − x0) para k = 0, . . . , n − 1. Por otrolado,

F (x1)− F (x0) =n−1∑k=0

[F (x0 + tk+1(x1 − x0))− F (x0 + tk(x1 − x0))]

=n−1∑k=0

[F (xk+1)− F (xk)] ,

donde xk = x0 + tk(x1 − x0).Aplicando el corolario 1.31, como xk ∈ [xk, xk+1], se tiene

‖F (xk+1)− F (xk)− F ′(xk)∆xk‖ ≤ ‖∆xk‖ sup0<θ<1

‖F ′(xk + θ∆xk)− F ′(xk)‖

= ‖x1 − x0‖(tk+1 − tk) sup0<θ<1

‖F ′(xk + θ∆xk)− F ′(xk)‖,

de manera que∥∥∥∥∥n−1∑k=0

[F (xk+1)− F (xk)− F ′(xk)∆xk]∥∥∥∥∥ ≤

n−1∑k=0‖F (xk+1)− F (xk)− F ′(xk)∆xk‖

≤ ‖x1 − x0‖n−1∑k=0

(tk+1 − tk) sup0<θ<1

‖F ′(xk + θ∆xk)− F ′(xk)‖.

Como F ′ es continuo y también uniformemente continuo en [x0, x1], [27], considerando ellimite cuando λ→ 0, se obtiene el resultado.

Corolario 1.35. (Integración por partes) Si P (t) es un operador de [a, b] en Y y Q(t) esuna función escalar tales que P ′(t) y Q′(t) son integrables, entonces

P (b)Q(b)− P (a)Q(a) =∫ b

aP (t)Q′(t) dt+

∫ b

aP ′(t)Q(t) dt. (1.14)

Demostración. Si F (t) = P (t)Q(t), entonces F ′(t) = P (t)Q′(t) +P ′(t)Q(t). Aplicandoahora el teorema 1.34, tenemos∫ b

aF ′(t) dt = F (b)− F (a) = P (b)Q(b)− P (a)Q(a).

Por otro lado, de∫ b

aF ′(t) dt =

∫ b

a(P (t)Q′(t) + P ′(t)Q(t)) dt =

∫ b

aP (t)Q′(t) dt+

∫ b

aP ′(t)Q(t) dt,

se deduce el resultado.

De la propiedad (iii) de la integral se sigue el siguiente resultado que nos permite acotarla integral de un operador que esté acotado por una función real.Lema 1.36. Sea T un operador en las condiciones de la definición 1.33 y φ(t) una funciónreal definida en [0, 1] e integrable. Si

‖T (x0 + τ(x1 − x0))‖ ≤ φ (t0 + τ(t1 − t0)) , τ ∈ [0, 1], y ‖x1 − x0‖ ≤ t1 − t0,

entonces ∥∥∥∥∫ x1

x0T (x) dx

∥∥∥∥ ≤ ∫ t1

t0φ(t) dt.

Page 39: Estrategia metodos iterativos

1.3. INTEGRACIÓN DE OPERADORES 25

Demostración. En efecto,∥∥∥∥∫ x1

x0T (x) dx

∥∥∥∥ =∥∥∥∥∫ 1

0T (x0 + τ(x1 − x0)) (x1 − x0) dτ

∥∥∥∥≤

∫ 1

0‖T (x0 + τ(x1 − x0))‖ ‖x1 − x0‖ dτ

≤∫ 1

0φ (t0 + τ(t1 − t0)) (t1 − t0) dτ

=∫ t1

t0φ(t) dt.

Como caso particular del lema anterior, tenemos el siguiente resultado.

Corolario 1.37. Si se cumple la desigualdad

‖T (x)‖ ≤ φ(t),

para x y t tales que ‖x− x0‖ ≤ t− t0, entonces∥∥∥∥∫ x1

x0T (x) dx

∥∥∥∥ ≤ ∫ t1

t0φ(t) dt,

donde x1 es un elemento tal que ‖x1 − x0‖ ≤ t1 − t0.

Demostración. Si x ∈ [x0, x1] y t ∈ [t0, t1], entonces

x = x0 + τ(x1 − x0) y t = t0 + τ(t1 − t0) con τ ∈ [0, 1],

de manera que

‖x− x0‖ = τ‖x1 − x0‖ ≤ τ(t1 − t0) = t− t0, τ ∈ [0, 1].

Por consiguiente,

‖T (x0 + τ(x1 − x0))‖ ≤ φ (t0 + τ(t1 − t0)) , τ ∈ [0, 1],

y se satisfacen las condiciones del lema anterior, del que se sigue el resultado.

Terminamos con el Teorema de Taylor. Aunque hay varios enunciados similares [13], hemoselegido el siguiente por su comodidad a la hora de utilizarlo.

Teorema 1.38. (Teorema de Taylor) Supongamos que F es un operador n veces diferenciableen la bola B(x0, r) y que F (n) es integrable en el segmento [x0, x1] con x1 ∈ B(x0, r). Entonces,

F (x1) = F (x0) +n−1∑k=1

1k!F

(k)(x0)(x1 − x0)k +Rn(x0, x1), (1.15)

donde

Rn(x0, x1) = 1(n− 1)!

∫ x1

x0F (n)(x)(x1 − x)n−1 dx

= 1(n− 1)!

∫ 1

0F (n) (x0 + t(x1 − x0)) (x1 − x0)n(1− t)n−1 dt.

(1.16)

Page 40: Estrategia metodos iterativos

26 CAPÍTULO 1. CONCEPTOS GENERALES

Demostración. Procedemos por inducción. Para n = 1, por el teorema 1.34, se cumpletrivialmente. Suponemos que es cierto para n = m−1. Consideramos ahora la función escalar

Q(t) = (1− t)m−1

(m− 1)! ,

cuya derivada esQ′(t) = −(1− t)m−2

(m− 2)! · (1.17)

Además, siP (t) = F (m−1) (x0 + t(x1 − x0)) (x1 − x0)m−1, (1.18)

entoncesP ′(t) = F (m) (x0 + t(x1 − x0)) (x1 − x0)m.

De (1.16), (1.17) y (1.18), se sigue

Rm−1(x0, x1) = −∫ 1

0P (t)Q′(t) dt.

Aplicando ahora la fórmula de integración por partes (1.14), se deduce

Rm−1(x0, x1) = −P (1)Q(1) + P (0)Q(0) +∫ 1

0P ′(t)Q(t) dt

= 1(m− 1)! F

(m−1)(x0)(x1 − x0)m−1

+ 1(m− 1)!

∫ 1

0F (m) (x0 + t(x1 − x0)) (x1 − x0)m(1− t)m−1 dt

= 1(m− 1)! F

(m−1)(x0)(x1 − x0)m−1 +Rm(x0, x1).

Esto establece (1.15) por inducción, con lo que queda probado el teorema.

Notemos que (1.15) es equivalente a

F (x1) = F (x0) +n∑k=1

1k!F

(k)(x0)(x1 − x0)k + Rn(x0, x1),

dondeRn(x0, x1) = 1

(n− 1)!

∫ x1

x0

(F (n)(x)− F (n)(x0)

)(x1 − x)n−1 dx.

1.4. Diferencias divididasEn esta sección trataremos resumidamente alguno de los conceptos que posteriormente

serán utilizados en el desarrollo de este texto. Somos conscientes de que lo aquí abordadonecesita de un desarrollo más detallado del presentado. Es por ello que fundamentalmen-te nos esforzaremos simplemente en resumir ordenadamente algunos de los resultados queposteriormente se utilizan.

Page 41: Estrategia metodos iterativos

1.4. DIFERENCIAS DIVIDIDAS 27

El concepto de diferencia dividida en espacios de Banach fue introducido por J. Schröder[42] generalizando el concepto de diferencia dividida de una función escalar de la misma formaque la derivada Fréchet de un operador en espacios de Banach generaliza el de la derivadade una función escalar.

Así, de forma natural, al considerar una diferencia dividida como una aproximación de unaderivada, si F es un operador entre dos espacios de Banach X e Y , a partir de la estimación

F (x) ≈ F (y) + F ′(y)(x− y) ⇒ F (x)− F (y) ≈ F ′(y)(x− y)

y teniendo en cuenta que F ′(y) ∈ L(X, Y ), es claro que una diferencia dividida en espacios deBanach, al ser una aproximación de la derivada, debe ser un operador lineal acotado de X enY que, al aplicarlo a (x− y), es igual a F (x)− F (y). Definimos formalmente a continuaciónel concepto de diferencia dividida de primer orden de un operador F en espacios de Banach.

Definición 1.39. Sean X e Y dos espacios de Banach, F : Ω ⊂ X → Y un operador y Ωun subconjunto abierto convexo no vacío de X. Se dice que un operador Θ ∈ L(X, Y ) es unadiferencia dividida de primer orden de F en los puntos x e y, x 6= y, si

Θ(x− y) = F (x)− F (y). (1.19)

En adelante, si Θ ∈ L(X, Y ) es una diferencia dividida de primer orden del operador Fen los puntos x e y, la denotaremos también por Θ = [x, y;F ].

La condición (1.19) no determina la unicidad de la diferencia dividida a menos que ladimensión de X sea uno (diferencia dividida en R). Se puede probar que si dim(X) = dy dim(Y ) = d′, entonces existen d′(d − 1) + 1 operadores lineales de E1 en E2, donde E1es un espacio normado completo y E2 es un espacio normado, cumpliendo (1.19) y que sonlinealmente independientes [37].

Podemos consultar [7] para la existencia de diferencias divididas de un operador y [46] paraejemplos en algunos espacios particulares. A continuación, damos dos ejemplos en espaciosde dimensión finita.

Ejemplo 1.40. Consideramos el caso X = Y = R2 y denotamos las componentes del opera-dor F por F1 y F2. Es decir,

para x = x1

x2

∈ R2, tenemos F (x) = F1(x1, x2)F2(x1, x2)

.Entonces, cada uno de los operadores lineales A1 y A2, dados respectivamente por las matrices

A1 =

F1(x1, y2)− F1(y1, y2)

x1 − y1

F1(x1, x2)− F1(x1, y2)x2 − y2

F2(x1, y2)− F2(y1, y2)x1 − y1

F2(x1, x2)− F2(x1, y2)x2 − y2

A2 =

F1(x1, x2)− F1(y1, x2)

x1 − y1

F1(y1, x2)− F1(y1, y2)x2 − y2

F2(x1, x2)− F2(y1, x2)x1 − y1

F2(y1, x2)− F2(y1, y2)x2 − y2

,

Page 42: Estrategia metodos iterativos

28 CAPÍTULO 1. CONCEPTOS GENERALES

verifican (1.19).Por otra parte, si F es diferenciable y su derivada Fréchet F ′ es continua en el segmento

[x, y] = x+ t(y − x); t ∈ [0, 1], el operador lineal dado por

A3 =∫ 1

0F ′(x+ t(y − x)) dt

también verifica (1.19). Esto significa que cualquiera de los tres operadores anteriores sondiferencias divididas del operador F en los puntos x e y. Además, cualquier combinaciónconvexa de A1, A2 y A3 es también una diferencia dividida de F en x e y.

Ejemplo 1.41. Sea D un dominio abierto de Rn y F un operador definido en D con valoresen Rn y tal que F (x) = (F1(x), . . . , Fn(x)).

Sean x e y dos puntos distintos de D y definimos [x, y;F ] como la matriz con entradas

[x, y;F ]ij = 1xj − yj

(Fi(x1, . . . , xj, yj+1, . . . , yn)− Fi(x1, . . . , xj−1, yj, . . . , yn)) .

Es sencillo comprobar que el operador anterior [x, y;F ] ∈ L(Rn,Rn) verifica la condición(1.19). En efecto, vemos que se cumple

([x, y;F ](x− y))i = (F (x)− F (y))i ,

puesto que

([x, y;F ](x− y))i =n∑j=1

[x, y;F ]ij(xj − yj)

=n∑j=1

(Fi(x1, . . . , xj, yj+1, . . . , yn)− Fi(x1, . . . , xj−1, yj, . . . , yn))

= (Fi(x1, y2, . . . , yn)− Fi(y1, y2, . . . , yn))

+ (Fi(x1, x2, y3, . . . , yn)− Fi(x1, y2, . . . , yn))

+ · · ·+ (Fi(x1, . . . , xn−1, yn)− Fi(x1, . . . , xn−2, yn−1, yn))

+ (Fi(x1, . . . , xn)− Fi(x1, . . . , xn−1, yn))

= Fi(x1, . . . , xn)− Fi(y1, . . . , yn)

= (F (x)− F (y))i .

A menudo, se requiere que la aplicación [·, ·;F ] : X × Y → L(X, Y ) tal que (x, y) →[x, y;F ] ∈ L(X, Y ) satisfaga una condición Lipschitz en algún dominio, lo que implica queel operador F sea diferenciable, tal y como veremos después. Nosotros utilizaremos dichacondición en la forma en que lo hace Laarsonen en [30].

Definición 1.42. Sean X e Y dos espacios de Banach, F : Ω ⊂ X → Y un operador,Ω un subconjunto abierto convexo no vacío de X y x e y dos puntos distintos de Ω que

Page 43: Estrategia metodos iterativos

1.4. DIFERENCIAS DIVIDIDAS 29

tienen asociada una diferencia dividida de primer orden [x, y;F ] ∈ L(X, Y ). Diremos que ladiferencia dividida de primer orden [x, y;F ] es Lipschitz continua en Ω si existe una constanteK ≥ 0 tal que

‖[x, y;F ]− [u, v;F ]‖ ≤ K (‖x− u‖+ ‖y − v‖); ∀x, y, u, v ∈ Ω; x 6= y, u 6= v. (1.20)

Veamos en el siguiente lema que la condición anterior implica que F es diferenciableFréchet en Ω, [37].

Lema 1.43. Sean X e Y dos espacios de Banach, F : Ω ⊂ X → Y un operador, Ω unsubconjunto abierto convexo no vacío de X y x e y dos puntos distintos de Ω que tienenasociada una diferencia dividida de primer orden [x, y;F ] ∈ L(X, Y ) cumpliendo (1.20).Entonces,

[x, x;F ] = F ′(x), (1.21)‖F ′(x)− F ′(y)‖ ≤ 2K ‖x− y‖, K ≥ 0. (1.22)

Demostración. Sea x ∈ Ω. SiK > 0, elegimos ε > 0 tal queB(x, ε/K) ⊂ Ω y denotamosδ = ε/K. Para ‖∆x‖ ≤ δ, se tiene entonces

‖F (x+ ∆x)− F (x)− [x, x;F ] (∆x)‖ = ‖[x+ ∆x, x;F ] (∆x)− [x, x;F ](∆x)‖= ‖ ([x+ ∆x, x;F ]− [x, x;F ]) (∆x)‖≤ ‖[x+ ∆x, x;F ]− [x, x;F ]‖ ‖∆x‖≤ K ‖∆x‖ ‖∆x‖.

Esta condición prueba (1.21) cuando K 6= 0 y ‖∆x‖ → 0, puesto que

lım‖∆x‖→0

‖F (x+ ∆x)− F (x)− [x, x;F ](∆x)‖‖∆x‖ = 0.

SiK = 0, por (1.20), existe un operador L ∈ L(X, Y ) tal que [x, y;F ] = L para todo x, y ∈ Ω.Entonces, por (1.19), podemos tomar cualquier δ en lo anterior y se tiene F ′(x) = L.

Para completar la demostración vemos (1.22). Sean x, y ∈ Ω y, por (1.20), tenemos

‖F ′(x)− F ′(y)‖ = ‖[x, x;F ]− [y, y;F ]‖ ≤ K (‖x− y‖+ ‖x− y‖) = 2K‖x− y‖.

Notemos que en las condiciones indicadas se tiene que F ′ cumple una condición Lipschitzde la forma (1.22) con constante de Lipschitz 2K.

Una consecuencia inmediata de (1.20) y (1.21) es:

‖[x, y;F ]− F ′(z)‖ ≤ K (‖x− z‖+ ‖y − z‖) , K ≥ 0, ∀x, y, z ∈ Ω. (1.23)

Recíprocamente, si suponemos que F es diferenciable Fréchet en Ω y que su derivadaFréchet satisface (1.22), entonces se sigue que F tiene tiene una diferencia dividida de primerorden Lipschtz contínua en Ω. En efecto, para ello, podemos tomar por ejemplo

[x, y;F ] =∫ 1

0F ′(x+ t(y − x)) dt. (1.24)

Sin embargo, con la excepción del caso dim(X) = 1, sabemos que (1.24) no es la únicadiferencia dividida de primer orden Lipschitz contínua de F .

Page 44: Estrategia metodos iterativos

30 CAPÍTULO 1. CONCEPTOS GENERALES

Ejemplo 1.44. En el ejemplo 1.28 hemos visto que el operador (1.11) es diferenciable conderivada

[F ′(x0)x](s) = x(s)−∫ b

aG(s, t)H ′2(t, x0(t))x(t) dt.

Si utilizamos (1.24), se sigue

([x, y;F ]− [u, v;F ]) z(s) =∫ 1

0(F ′(y + τ(x− y))− F ′(v + τ(u− v))) z(s) dτ

= −∫ 1

0

(∫ b

aG(s, t) (H ′2(t, (y + τ(x− y))(t))−H ′2(t, (v + τ(u− v))(t))) z(t) dt

)dτ.

Suponiendo ahora que H ′2 es Lipschitz continua con constante de Lipschitz C y teniendo encuenta

‖[x, y;F ]− [u, v;F ]‖ = sup‖z‖=1

‖([x, y;F ]− [u, v;F ]) z ‖ , (1.25)

‖([x, y;F ]− [u, v;F ]) z ‖ ≤ C

∥∥∥∥∥∫ b

aG(s, t) dt

∥∥∥∥∥∫ 1

0‖y + τ(x− y)− (v + τ(u− v))‖ dτ ‖z‖

≤ C

∥∥∥∥∥∫ b

aG(s, t) dt

∥∥∥∥∥∫ 1

0‖τ(x− u) + (1− τ)(y − v))‖ dt ‖z‖

≤ C

2

∥∥∥∥∥∫ b

aG(s, t) dt

∥∥∥∥∥ (‖x− u‖+ ‖y − v‖) ‖z‖,

se sigue que la diferencia dividida de primer orden [x, y;F ] es Lipschitz continua en C([a, b])

con constante de Lipschitz C

2

∥∥∥∥∥∫ b

aG(s, t) dt

∥∥∥∥∥.En el siguiente teorema se da una caracterización de las diferencias divididas de primer

orden de la forma (1.24), [37].Teorema 1.45. Sea [·, ·;F ] : Ω×Ω → L(X, Y ) un operador que satisface las condiciones(1.19) y (1.20). Las siguientes afirmaciones son equivalentes(i) La igualdad (1.24) se cumple para todo x, y ∈ Ω.

(ii) Para todo par de puntos u, v ∈ Ω tales que 2v − u ∈ Ω, se tiene

[u, v;F ] = 2[u, 2v − u;F ]− [v, 2v − u;F ]. (1.26)

Demostración. Sustituyendo w = v − u, podemos reescribir (1.26) de la forma

[u, u+ w;F ] + [u+ w, u+ 2w;F ] = 2 [u, u+ 2w;F ] . (1.27)

Entonces, la implicación (i) ⇒(ii) se sigue de forma inmediata observando que∫ 1

0F ′(u+ tw)dt+

∫ 1

0F ′(u+ w + tw)dt = lım

n

1n

n∑j=1

F ′(u+ j

nw) +

n∑j=1

F ′(u+ w + j

nw)

= 2 lımn

12n

2n∑j=1

F ′(u+ j

2n2w)

= 2∫ 1

0F ′(u+ t2w)dt.

Page 45: Estrategia metodos iterativos

1.4. DIFERENCIAS DIVIDIDAS 31

Para probar la implicación (ii)⇒(i), observamos en primer lugar que (1.27) implica

2n[u, u+ 2nw;F ] =2n∑j=1

[u+ (j + 1)w, u+ jw;F ], para todo n ∈ N. (1.28)

Esto se puede probar fácilmente por inducción. Para verlo, consideramos los primeros cuatrosumandos. Teniendo en cuenta

[u, u+ w;F ] + [u+ w, u+ 2u;F ] + [u+ 2w, u+ 3w;F ] + [u+ 3w, u+ 4w;F ]

= 2 [u, u+ 2w;F ] + 2 [u+ 2w, u+ 4w;F ] = 4 [u, u+ 4w;F ] ,es obvio que se sigue la inducción.

Consideramos ahora la igualdad (1.28) para u = x y w = 2−n(y − x) y utilizando (1.23),obtenemos

‖ [x, y;F ]− 2−n∑2n

k=j F′(x+ jw)‖ = 1

2n‖∑2n

k=j ([x+ (j − 1)w, x+ kw;F ]− F ′(x+ jw))‖

≤ 2−n2nk‖w‖ = 12nk‖y − x‖.

Ahora, si n→∞, obtenemos (1.24). A continuación, exponemos brevemente algunas condiciones de tipo Lipschitz para las

diferencias divididas de primer orden que han sido utilizadas por otros autores.La condición Lipschitz (1.20) ha sido utilizada, por ejemplo en [26], [30] y [36]. Utilizando

la noción anterior de diferencia dividida, Schmidt en [41] y Sergeev en [43] generalizan elconocido método de la secante a espacios de Banach. Para probar la convergencia de dichométodo ambos consideran una condición Lipschitz de la forma:

‖[x, y;F ]− [y, z;F ]‖ ≤ K‖x− z‖, x, y, z ∈ Ω, K ≥ 0. (1.29)

Es fácil ver que (1.29) implica (1.20), puesto que

‖ [x, y;F ]− [u, v;F ] ‖ ≤ ‖ [x, y;F ]− [y, u;F ] ‖+‖ [y, u;F ]− [u, v;F ] ‖ ≤ K‖x−u‖+K‖y−v‖.

Por otro lado, tomando x = z en (1.29), se sigue [x, y;F ] = [y, x;F ].Numerosos ejemplos importantes de diferencias divididas satisfacen la condición (1.20),

pero no cumplen la relación simétrica anterior y, en consecuencia, no verifican (1.29). Notemosque en el ejemplo 1.40, A1 y A2 no son simétricas, mientras que A3 y 1

2A1 + 12A2 si que lo

son.Por otra parte, Schmidt [41] y Dennis [18] prueban la convergencia del método de la

secante bajo la condición

‖[x, y;F ]− [y, z;F ]‖ ≤ a‖x− z‖+ b (‖x− y‖+ ‖y − z‖) , a, b ≥ 0. (1.30)

Además, sustituyendo la condición (1.20) por (1.30) en el lema 1.43, se obtiene la mismaconclusión con K = a+ b, [18], [34].

Para operadores F cuya derivada F ′ satisface una condición Lipschitz con constante C, sesigue fácilmente la siguiente estimación para la distancia del operador a su parte local lineal

‖F (y)− F (x)− F ′(x)(y − x)‖ ≤ C

2 ‖y − x‖2, (1.31)

Page 46: Estrategia metodos iterativos

32 CAPÍTULO 1. CONCEPTOS GENERALES

sin más que tener en cuenta

F (x)− F (y)− F ′(u)(x− y) =∫ 1

0(F ′(y + t(x− y))− F ′(u)) dt(x− y). (1.32)

Notemos que si utilizamos una diferencia dividida de primer orden Lipschitz continua conconstante K, entonces F ′ es Lipschitz continua con constante 2K (lema 1.43) y (1.31) tieneque ser reemplazada por una de las estimaciones que aparecen en el siguiente resultado.

Teorema 1.46. Si [x, y;F ] es una diferencia dividida de primer orden que satisface (1.23),entonces cada una de las siguientes cuatro expresiones

e1 = K (‖x− u‖+ ‖y − u‖+ ‖u− v‖) ‖x− y‖,

e2 = K (‖x− v‖+ ‖y − v‖+ ‖u− v‖) ‖x− y‖,e3 = K (‖x− y‖+ ‖y − u‖+ ‖y − v‖) ‖x− y‖,e4 = K (‖x− y‖+ ‖x− u‖+ ‖x− v‖) ‖x− y‖,

es una estimación para‖F (x)− F (y)− [u, v;F ](x− y)‖.

Demostración. Será suficiente dar la demostración para e1 y e3 porque la demostraciónde e2 se obtiene de e1 intercambiando u y v y, de forma similar, la demostración de e4 se puedeobtener considerando x en lugar de y en los lugares apropiados. Para probar e1, obsérveseque de (1.32) y

‖F ′ (y + t(x− y))− F ′(u)‖ ≤ 2K(t‖x− u‖+ (1− t)‖y − u‖)

se sigue

‖F (x)− F (y)− F ′(u)(x− y)‖ ≤ 2K(

12‖x− u‖+ 1

2‖y − u‖)‖x− y‖

= K (‖x− u‖+ ‖y − u‖) ‖x− y‖.

Además, como‖F ′(u)− [u, v;F ]‖ ≤ K‖u− v‖,

tenemos

‖F (x)− F (y)− [u, v;F ](x− y)‖ ≤ K (‖x− u‖+ ‖y − u‖+ ‖u− v‖) ‖x− y‖

y se cumple e1.Para la demostración de e3 consideramos

‖F (x)− F (y)− [u, v;F ](x− y)‖ ≤ ‖F (x)− F (y)− F ′(y)(x− y)‖+ ‖ (F ′(y)− [u, v;F ](u, v)) (x− y)‖

≤ K ‖x− y‖2 +K (‖y − u‖+ ‖y − v‖) ‖x− y‖.

A continuación, generalizamos la condición de Lipschitz continuidad para la diferenciadividida [x, y;F ] ∈ L(X, Y ) a una condición de Hölder continuidad, que también implica ladiferenciabilidad del operador F .

Page 47: Estrategia metodos iterativos

1.4. DIFERENCIAS DIVIDIDAS 33

Definición 1.47. Sean X e Y dos espacios de Banach, F : Ω ⊂ X → Y , Ω un subcon-junto abierto convexo no vacío de X y x e y dos puntos distintos de Ω que tienen asociadauna diferencia dividida de primer orden [x, y;F ] es (K, p)-Hölder continua en Ω si existenconstantes K ≥ 0 y p ∈ [0, 1] tales que

‖[x, y;F ]− [u, v;F ]‖ ≤ K (‖x− u‖p + ‖y − v‖p) ; ∀x, y, u, v ∈ Ω; x 6= y, u 6= v. (1.33)

Observamos que si p = 1, entonces [x, y;F ] es Lipschitz continua en Ω.

Ejemplo 1.48. En el ejemplo 1.29 hemos visto que el operador (1.12) es diferenciable conderivada

[F ′(x0)x](t) = d2x(t)dt2

+ φ′(x0(t))x(t).

Si utilizamos (1.24), se sigue

([x, y;F ]− [u, v;F ]) z(t) =∫ 1

0(F ′(y + τ(x− y))− F ′(v + τ(u− v)) ) z(t) dτ

=∫ 1

0

(φ′((y + τ(x− y))(t)

)− φ′

((v + τ(u− v))(t)

))z(t) dτ.

Suponiendo ahora que φ′ es (C, p)-Hölder continua y teniendo en cuenta (1.25) y

‖([x, y;F ]− [u, v;F ]) z‖ ≤ C∫ 1

0‖y + τ(x− y)− (v + τ(u− v))‖p dτ ‖z‖

= C∫ 1

0‖τ(x− u) + (1− τ)(y − v)‖p dt ‖z‖

≤ C

1 + p(‖x− u‖p + ‖y − v‖p ) ‖z‖,

se sigue que la diferencia dividida de primer orden es (K, p)-Hölder continua en C([a, b]) conK = C

1+p .

Además, una consecuencia inmediata de (1.21) y (1.33) es:

‖[x, y;F ]− F ′(z)‖ ≤ K (‖x− z‖p + ‖y − z‖p), K ≥ 0, p ∈ [0, 1], ∀x, y, z ∈ Ω. (1.34)

En el caso (1.34) es conocido que la derivada Fréchet F ′ existe en Ω, satisface (1.21) y F ′es (2K, p)-Hölder continua en Ω, [4].

Una generalización interesante de (1.30) es la dada por Argyros en [4] y que se puederesumir en el siguiente resultado.

Lema 1.49. Sea Ω un conjunto abierto convexo no vacío de X. Suponemos que, para todox, y ∈ Ω, existe una diferencia dividida de primer orden [x, y;F ] ∈ L(X, Y ). Si z ∈ Ω,entonces

‖[x, y;F ]− [y, z;F ]‖ ≤ a ‖x− z‖p + b (‖x− y‖p + ‖y − z‖p), (1.35)donde p ∈ (0, 1] y a, b ≥ 0. Además,

(i) [x, x;F ] = F ′(x), x ∈ int(Ω),

Page 48: Estrategia metodos iterativos

34 CAPÍTULO 1. CONCEPTOS GENERALES

(ii) ‖F ′(x)− F ′(y)‖ ≤ 2(a+ b)‖x− y‖p.

Demostración. Veamos el apartado (i). Elegimos x ∈ int(Ω) y δ > 0 tales que B(x, δ) ⊂Ω. Para ‖∆x‖ ≤ δ se tiene

‖F (x+ ∆x)− F (x)− [x, x;F ] (∆x)‖ = ‖[x+ ∆x, x;F ] (∆x)− [x, x;F ](∆x)‖= ‖ ([x+ ∆x, x;F ]− [x, x;F ]) (∆x)‖≤ ‖[x+ ∆x, x;F ]− [x, x;F ]‖ ‖∆x‖≤ (a+ b) ‖(∆x)‖p ‖∆x‖.

Esta desigualdad prueba (i) cuando a+ b 6= 0 y ‖∆x‖ → 0, ya que

lım‖∆x‖→0

‖F (x+ ∆x)− F (x)− [x, x;F ](∆x)‖‖∆x‖ = 0.

Para solventar el caso a+ b = 0, notamos que a = b = 0 y por (1.35) existe un L ∈ L(X, Y )tal que [x, y;F ] = L para cada x, y ∈ Ω. Por tanto, por (1.19), podemos elegir δ arbitrario yF ′(x) = L.

El apartado (ii) se sigue de (1.35) y

‖F ′(x)− F ′(y)‖ ≤ ‖[x, x;F ]− [x, y;F ]‖+ ‖[x, y;F ]− [y, y;F ]‖≤ a ‖x− y‖p + b ‖x− y‖p + a ‖x− y‖p + b ‖x− y‖p

= 2(a+ b) ‖x− y‖p,

lo que completa la demostración.

Todavía podemos generalizar más las condiciones de Lipschitz y Hölder continuidad parala diferencia dividida [x, y;F ] ∈ L(X, Y ) suavizando ambas condiciones mediante la condi-ción:

‖[x, y;F ]− [u, v;F ]‖ ≤ ω(‖x− u‖, ‖y − v‖); x, y, v, w ∈ Ω, (1.36)

donde ω : R+×R+ → R+ es una función continua y no decreciente en sus dos componentes.En el siguiente teorema veremos que la condición (1.36) implica (1.21) cuando ω(0, 0) = 0,

[23].

Teorema 1.50. Sea Ω un conjunto abierto convexo no vacío de un espacio de Banach X.Suponemos que, para cada par de puntos x, y ∈ Ω, existe una diferencia dividida de primerorden [x, y;F ] ∈ L(X, Y ) satisfaciendo (1.36) y ω(0, 0) = 0. Entonces, se verifica la condición(1.21).

Demostración. Sea xn ⊂ Ω tal que lımn→∞

xn = x. Si consideramos An = [xn, x;F ] ∈L(X, Y ), entonces

‖An − Am‖ = ‖[xn, x;F ]− [xm, x;F ]‖ ≤ ω(‖xn − xm‖, 0).

Como xn es convergente, se tiene que An es una sucesión de Cauchy y, por tanto, existelımn→∞

An = A ∈ L(X, Y ) y podemos definir [x, x;F ] = A = lımn→∞

An. Demostramos entonces

Page 49: Estrategia metodos iterativos

1.4. DIFERENCIAS DIVIDIDAS 35

que A = F ′(x):

‖F (x+ ∆x)− F (x)− [x, x;F ] (∆x)‖ = ‖[x+ ∆x, x;F ] (∆x)− [x, x;F ](∆x)‖= ‖ ([x+ ∆x, x;F ]− [x, x;F ]) (∆x)‖≤ ‖[x+ ∆x, x;F ]− [x, x;F ]‖ ‖∆x‖≤ ω(‖∆x‖, 0)‖∆x‖.

En consecuencia,

lım‖∆x‖→0

‖F (x+ ∆x)− F (x)− [x, x;F ](∆x)‖‖∆x‖ ≤ lım

‖∆x‖→0ω(‖∆x‖, 0) = ω(0, 0) = 0.

Es fácil ver ahora que la condición (1.36) generaliza la condición (1.33), sin más queconsiderar ω(s, t) = K(sp + tp).

Por otra parte, también podemos observar que si F no es diferenciable, entonces la funciónω dada en (1.36) es tal que ω(0, 0) > 0, como puede verse en el siguiente ejemplo.

Ejemplo 1.51. Dado el siguiente sistema de ecuaciones no lineales x2 − y + 1 + 19 |x− 1| = 0,

y2 + x− 7 + 19 |y| = 0,

lo podemos escribir como F (x) = 0, donde x = (x1, x2) ∈ R2 y F : R2 → R2 con F = (F1, F2)y

F1(x1, x2) = x12 − x2 + 1 + 1

9 |x1 − 1|, F2(x1, x2) = x22 + x1 − 7 + 1

9 |x2|.

Tomando x = (x1, x2) ∈ R2 y la norma ‖x‖ = ‖x‖∞ = max1≤i≤2

|xi|, la norma correspondientepara A ∈ R2 × R2 es

‖A‖ = max1≤i≤2

2∑j=1|aij|.

Ahora, si v, w ∈ R2, podemos definir [v, w;F ] ∈ L(R2,R2) como, [37],

[v, w;F ]i1 = Fi(v1, w2)− Fi(w1, w2)v1 − w1

, [v, w;F ]i2 = Fi(v1, v2)− Fi(v1, w2)v2 − w2

, i = 1, 2.

Entonces,

[v, w;F ] =

v2

1 − w21

v1 − w1−1

1 v22 − w2

2v2 − w2

+ 19

|v1 − 1| − |w1 − 1|

v1 − w10

0 |v2| − |w2|v2 − w2

‖[x, y;F ]− [v, w;F ]‖ ≤ ‖x− v‖+ ‖y − w‖+ 2

9 ,

de manera que ω(s, t) = s + t + 29 y ω(0, 0) > 0. Observamos que esta situación surge del

hecho de que la función F sea no diferenciable.

Page 50: Estrategia metodos iterativos

36 CAPÍTULO 1. CONCEPTOS GENERALES

1.5. Métodos iterativos en espacios de BanachDado un operador F : Ω ⊂ X → Y definido en un dominio abierto convexo no vacío

Ω contenido en un espacio de Banach X y con valores en un espacio de Banach Y , nosplanteamos la aproximación de una solución x∗ de la ecuación

F (x) = 0. (1.37)

En estas condiciones tan generales, la ecuación (1.37) puede representar una ecuación escalar,un sistema de ecuaciones, una ecuación diferencial, una ecuación integral, etc.

Encontrar una solución exacta de (1.37) suele ser difícil y, por eso, se recurre habitualmentea su aproximación mediante métodos iterativos de la forma

dados x−k, x−k+1, . . . , x−1, x0 en Ω,xn+1 = G(xn−k, xn−k+1, . . . , xn−1, xn), n ≥ 0,

(1.38)

donde x−k, x−k+1, . . . , x−1, x0 son aproximaciones iniciales de x∗. Los métodos iterativos (1.38)con k = 0 se llaman métodos iterativos punto a punto (sin memoria) y si k ≥ 1, se llamanmétodos iterativos con memoria.

Un método iterativo de la forma (1.38) persigue que, a partir de las aproximacionesiniciales x−k, x−k+1, . . . , x−1, x0, la sucesión de valores que define, xn, sea tal que los valoresxn sean mejores aproximaciones de x∗ a medida que n crece y que además lımn xn = x∗. Estoes lo que llamamos convergencia del método iterativo.

A la hora de estudiar la convergencia de un método iterativo, existen tres tipos de resul-tados de convergencia: locales, semilocales y globales. En primer lugar, los resultados de con-vergencia local, que, a partir de determinadas condiciones que tiene que cumplir el operadorF y exigiendo condiciones a la solución x∗, proporcionan la denominada bola de convergenciadel método iterativo, que nos indica la accesibilidad de x∗ a partir de aproximaciones ini-ciales consideradas en dicha bola. En segundo lugar, tenemos los resultados de convergenciasemilocal, que, a partir de determinadas condiciones que tiene que cumplir el operador F yexigiendo condiciones a las aproximaciones iniciales x−k, x−k+1, . . . , x−1, x0, proporcionan eldominio de parámetros asociado a las condiciones que deben satisfacer las aproximacionesiniciales para tener asegurada la convergencia de la sucesión xn a x∗. Por último, tenemoslos resultados de convergencia global, que, a partir de determinadas condiciones que tieneque cumplir el operador F , e independientemente de las aproximaciones iniciales, aseguranla convergencia de la sucesión xn a x∗.

Como vemos, todos los resultados anteriores pasan por exigir determinadas condicionesal operador F . Sin embargo, la exigencia de condiciones para la solución, para las aproxi-maciones iniciales, o para ninguna de éstas, determinan los diferentes tipos de resultados deconvergencia. Por un lado, el estudio de la convergencia local tiene el inconveniente de te-ner que asegurar que la solución x∗, que desconocemos, satisfaga determinadas condiciones.Por otro lado, la ausencia de condiciones para las aproximaciones iniciales, e incluso parala solución x∗, hace que el estudio de la convergencia global sea, en general, excesivamenteparticular en cuanto al tipo de operadores a tratar.

Por otra parte, cuando estudiamos la aplicabilidad de un método iterativo (1.38) pararesolver (1.37), aparece un problema importante: la localización de aproximaciones inicia-les x−k, x−k+1, . . . , x−1, x0 suficientemente buenas como para que la sucesión xn, dada por

Page 51: Estrategia metodos iterativos

1.5. MÉTODOS ITERATIVOS EN ESPACIOS DE BANACH 37

(1.38), converja a una solución empezando en ellas. El conjunto de estas aproximaciones ini-ciales es lo que permite medir la accesibilidad del método iterativo (1.38). Podemos observarla accesibilidad del método (1.38) de forma experimental, mediante cuencas de atracción y re-giones de accesibilidad, al considerar ecuaciones particulares, y/o de forma teórica, mediantedominios de parámetros, para cualquier ecuación.

La cuenca de atracción es el conjunto de todos los puntos de salida a partir de los cuales elmétodo iterativo (1.38) converge a una solución de una ecuación particular una vez fijada unatolerancia o un número máximo de iteraciones. La región de accesibilidad permite visualizar,a partir de condiciones de convergencia, qué puntos podemos utilizar como puntos de salidapara que el método iterativo converja, empezando en ellos, a una solución de una ecuaciónparticular. Y el dominio de parámetros establece gráficamente, en el plano real, la relaciónentre los parámetros iniciales que se definen a partir de las condiciones impuestas a los puntosde salida en un resultado teórico de convergencia.

En este texto vamos a hacer hincapié solo en el estudio de la convergencia semilocal delos métodos iterativos que aparecen en él, pero realizándolo mediante diferentes técnicas dedemostración y viendo qué es lo que aporta cada una de ellas en el estudio de los métodositerativos aquí presentados.

También sabemos que las propiedades de convergencia dependen de la elección de ladistancia ‖ · ‖, pero la velocidad de convergencia de una sucesión xn, para una distanciadada, se caracteriza por la velocidad de convergencia de la sucesión de números no negativos‖xn− x∗‖, donde x∗ = lım

n→+∞xn. Una medida muy utilizada habitualmente de la velocidad

de convergencia es el R-orden de convergencia, que definimos a continuación.

Definición 1.52. Sean xn una sucesión en un espacio de Banach X que converge a unpunto x∗ ∈ X, un número τ ≥ 1 y

en(τ) =n si τ = 1,τn si τ > 1, n ≥ 0.

i) Decimos que τ es un R-orden de convergencia de la sucesión xn si existen dos cons-tantes b ∈ (0, 1) y B ∈ (0,+∞) tales que

‖xn − x∗‖ ≤ Bben(τ).

ii) Decimos que τ es el R-orden de convergencia de la sucesión xn si existen constantesa, b ∈ (0, 1) y A,B ∈ (0,+∞) tales que

Aaen(τ) ≤ ‖xn − x∗‖ ≤ Bben(τ), n ≥ 0.

En general, comprobar la doble acotación de ii) es complicado, por eso normalmente solose buscan acotaciones superiores como las de i). Por tanto, si encontramos un R-orden deconvergencia τ de la sucesión xn, entonces se dice que la sucesión xn tiene R-orden deconvergencia al menos τ . Este es el argumento utilizado habitualmente para estudiar el ordende convergencia de un método iterativo en espacios de Banach.

A continuación, vamos a focalizar todo lo que acabamos de describir para un métodoiterativo concreto, el método de Newton, con el objetivo de mejorar su entendimiento.

Page 52: Estrategia metodos iterativos

38 CAPÍTULO 1. CONCEPTOS GENERALES

1.5.1. Convergencia semilocal del método de NewtonDe entre los métodos iterativos de la forma (1.38), que se pueden utilizar para aproximar

una solución x∗ de la ecuación (1.37), el más conocido de todos ellos es, sin lugar a dudas,el método de Newton, que destaca por su sencillez, fácil aplicación y eficiencia. Este métodotiene el siguiente algoritmo:

dado x0 en Ω,xn+1 = xn − [F ′(xn)]−1F (xn), n ≥ 0.

El primer resultado de convergencia semilocal para el método de Newton en espacios deBanach fue dado por Kantorovich [27], se conoce universalmente como teorema de Newton-Kantorovich y se demuestra, bajo las condiciones que se exigen a continuación al operador Fy al punto inicial x0, mediante el conocido principio de la mayorante.

En primer lugar, suponemos que se satisfacen las siguientes tres condiciones:

(A1) ‖F (x0)‖ ≤ δ,(A2) existe el operador [F ′(x0)]−1 ∈ L(X, Y ), para algún x0 ∈ Ω, y es tal que

‖[F ′(x0)]−1‖ ≤ θ,(A3) ‖F ′(x)− F ′(y)‖ ≤ C‖x− y‖, C ≥ 0, x, y ∈ Ω.

En segundo lugar, definimos el polinomio cuadrático

p(t) = C

2 t2 − t

θ+ δ, t ∈ [0, t′],

tal que t∗ ≤ t∗∗ < t′, donde t∗ = 1−√

1−2Cδθ2

Cθes la raíz positiva más pequeña del polinomio p

y t∗∗ = 1+√

1−2Cδθ2

Cθes la raíz positiva más grande, y la sucesión escalar tn dada por

t0 = 0,

tn+1 = tn −p(tn)p′(tn) , n ≥ 0.

Observemos que la sucesión tn converge de forma creciente a t∗, sin más que tener encuenta que es una sucesión monótona no decreciente y está acotada superiormente por t∗.

Teorema 1.53. (Teorema de Newton-Kantorovich) Sea F : Ω ⊂ X → Y un operador unavez continuamente diferenciable Fréchet, definido en un dominio abierto convexo no vacíoΩ de un espacio de Banach X y con valores en un espacio de Banach Y . Supongamos quese verifican las condiciones (A1)–(A3), Cδθ2 ≤ 1

2 y B(x0, t∗) ⊂ Ω, donde t∗ = 1−

√1−2Cδθ2

Cθ.

Entonces, la ecuación F (x) = 0 tiene una solución x∗ y el método de Newton converge a x∗empezando en x0. Además, xn, x∗ ∈ B(x0, t∗), para todo n ∈ N. Por otra parte, si Cδθ2 < 1

2 ,x∗ es la única solución de F (x) = 0 en B(x0, t

∗∗) ∩ Ω, donde t∗∗ = 1+√

1−2Cδθ2

Cθ.

Demostración. En primer lugar, x1 está bien definido, puesto que, por hipótesis, existe[F ′(x0)]−1. Además,

‖x1 − x0‖ = ‖[F ′(x0)]−1F (x0)‖ ≤ ‖[F ′(x0)]−1‖‖F (x0)‖ ≤ − p(t0)p′(t0) = t1 − t0 < t∗

Page 53: Estrategia metodos iterativos

1.5. MÉTODOS ITERATIVOS EN ESPACIOS DE BANACH 39

y, en consecuencia, x1 ∈ B(x0, t∗).

A continuación, veamos que x2 está bien definido. Para ello, tenemos

‖I − [F ′(x0)]−1F ′(x1)‖ ≤ ‖[F ′(x0)]−1‖‖F ′(x0)− F ′(x1)‖

≤ C‖[F ′(x0)]−1‖‖x1 − x0‖

≤ − C

p′(t0)(t1 − t0)

= − 1p′(t0)(p′(t1)− p′(t0))

= 1− p′(t1)p′(t0)

< 1,

por ser p′(t1) > 0 y p′(t1) > p′(t0). Luego, por el lema de Banach (lema 1.22), existe [F ′(x1)]−1

y‖[F ′(x1)]−1‖ ≤ − 1

p′(t1) .

Por tanto, x2 está bien definido.Por otra parte, como

F (x1) = F (x0) + F ′(x0)(x1 − x0) +∫ x1

x0(F ′(z)− F ′(x0)) dz

=∫ x1

x0(F ′(z)− F ′(x0)) dz

=∫ 1

0(F ′(x0 + τ(x1 − x0))− F ′(x0)) dτ(x1 − x0)

y

‖F (x1)‖ ≤∫ 1

0‖F ′(x0 + τ(x1 − x0))‖ dτ‖x1 − x0‖

≤ C∫ 1

0τ‖x1 − x0‖ dτ‖x1 − x0‖

≤ C∫ 1

0τ(t1 − t0)(t1 − t0) dτ

=∫ 1

0(p′(t0 + τ(t1 − t0))− p′(t0)) (t1 − t0) dτ

=∫ t1

t0(p′(s)− p′(t0)) ds

= p(t1)− p(t0)− p′(t0)(t1 − t0)= p(t1),

entonces

‖x2 − x1‖ = ‖[F ′(x1)]−1F (x1)‖ ≤ ‖[F ′(x1)]−1‖‖F (x1)‖ ≤ − p(t1)p′(t1) = t2 − t1,

Page 54: Estrategia metodos iterativos

40 CAPÍTULO 1. CONCEPTOS GENERALES

‖x2 − x0‖ ≤ ‖x2 − x1‖+ ‖x1 − x0‖ ≤ t2 − t1 + t1 − t0 = t2 − t0 < t∗.

y, en consecuencia, x2 ∈ B(x0, t∗).

Procediendo ahora por inducción sobre n, se prueba fácilmente que la sucesión xn estábien definida, xn ∈ B(x0, t

∗), para todo n ≥ 0, y

‖xn+1 − xn‖ = ‖[F ′(xn)]−1F (xn)‖ ≤ ‖[F ′(xn)]−1‖‖F (xn)‖ ≤ − p(tn)p′(tn) = tn+1 − tn,

‖xn+1 − x0‖ ≤ ‖xn+1 − xn‖+ ‖xn − x0‖ ≤ tn+1 − tn + tn − t0 = tn+1 − t0 < t∗.

Como lımn→∞

tn = t∗, entonces existe x∗ tal que x∗ = lımn→∞

xn. Veamos que x∗ es solución deF (x) = 0. De ‖F ′(xn)−F ′(x0)‖ ≤ C‖xn−x0‖ ≤ Ct∗, se sigue ‖F ′(xn)‖ ≤ F ′(x0)+Ct∗, paratodo n ≥ 0. Entonces, como F (xn) = F ′(xn)(xn+1 − xn), pasando al límite cuando n → ∞y teniendo en cuenta que la sucesión ‖F ′(xn)‖ está acotada, obtenemos F (x∗) = 0 por lacontinuidad de F .

Finalmente, probamos la unicidad de solución. Suponemos que existe otra solución y∗ ∈B(x0, t

∗∗) ∩ Ω de la ecuación F (x) = 0 distinta de x∗. Consideramos

F (y∗)− F (x∗) =∫ y∗

x∗F ′(x) dx =

∫ 1

0F ′(x∗ + t(y∗ − x∗))(y∗ − x∗) dt = 0 (1.39)

y el operador J =∫ 1

0F ′(x∗ + t(z∗ − x∗)) dt. Como

‖I − [F ′(x0)]−1J‖ ≤ ‖[F ′(x0)]−1‖‖F ′(x0)− J‖

≤ ‖[F ′(x0)]−1‖‖∫ 1

0‖F ′(x∗ + t(y∗ − x∗))− F ′(x0)‖ dt

≤ Cθ∫ 1

0((1− t)‖x∗ − x0‖+ t(‖y∗ − x0‖)) dt

<Cθ

2 (t∗ + t∗∗)= 1,

el operador J es inversible, por el lema de Banach (lema 1.22), y, por tanto, x∗ = y∗.

Técnicas alternativas al principio de la mayorante para demostrar la convergencia semilo-cal de los métodos iterativos en espacios de Banach están basadas en relaciones de recurrencia.Desde que Kantorovich generalizó, a mediados del siglo XX, el método de Newton a espaciosde Banach, varios autores han demostrado la convergencia semilocal del método de Newtonmediante este tipo de técnicas, incluido el propio Kantorovich, cuyas primeras demostracio-nes están basadas en relaciones de recurrencia. Nosotros presentamos, a continuación, unatécnica de este tipo, desarrollada por los autores del texto [20], que da muy buenos resultadosy que es muy sencilla de utilizar.

En primer lugar, definimos la sucesión de números reales

a0 = Cδθ2, an = a2n−12 f(an−1)2, n ∈ N, donde f(t) = 1

1− t .

Notemos que consideraremos a0 > 0, puesto que si a0 = 0, queda un problema trivial porser x0 la solución de una ecuación F (x) = 0.

Page 55: Estrategia metodos iterativos

1.5. MÉTODOS ITERATIVOS EN ESPACIOS DE BANACH 41

A continuación, mediante inducción matemática sobre n, se prueban, para n ≥ 1, lassiguientes dos relaciones de recurrencia entre la sucesión escalar an y la dada por el métodode Newton, xn, en el espacio de Banach X:

(in) El operador [F ′(xn)]−1 existe y es tal que ‖[F ′(xn)]−1‖ ≤ f(an−1)‖[F ′(xn−1)]−1‖,

(iin) ‖xn+1 − xn‖ ≤an−1

2 f(an−1)‖xn − xn−1‖.

Veamos que las dos relaciones de recurrencia anteriores se cumplen para n = 1. Supo-niendo que a0 < 1 y x1 ∈ Ω, se sigue

‖I − [F ′(x0)]−1F ′(x1)‖ ≤ ‖[F ′(x0)]−1‖‖F ′(x0)− F ′(x1)‖ ≤ Cθ‖x1 − x0‖ ≤ Cδθ2 = a0 < 1.

Entonces, por el lema de Banach (lema 1.22), el operador [F ′(x1)]−1 existe y es tal que

‖[F ′(x1)]−1‖ ≤ ‖[F ′(x0)]−1‖1− ‖I − [F ′(x0)]−1F ′(x1)‖ ≤ f(a0)‖[F ′(x0)]−1‖.

Por tanto, tenemos (i1).Ahora, utilizando la fórmula de Taylor (teorema 1.38)

F (x1) =∫ 1

0(F ′(x0 + τ(x1 − x0))− F ′(x0)) dτ(x1 − x0)

y (A3), obtenemos‖F (x1)‖ ≤ C

2 ‖x1 − x0‖2 ≤ Cδθ

2 ‖x1 − x0‖.

Además,

‖x2 − x1‖ = ‖[F ′(x1)]−1F (x1)‖ ≤ ‖[F ′(x1)]−1‖‖F (x1)‖ ≤ a0

2 f(a0)‖x1 − x0‖.

Por tanto, tenemos (ii1).Si suponemos ahora que an < 1 y xn ∈ Ω, para todo n ∈ N, y que las relaciones (ik)–

(iik) se verifican para k = 1, 2, . . . , n, las relaciones (in+1)–(iin+1) se demuestran de formatotalmente análoga a las relaciones (i1)–(ii1) y se completa la inducción.

En segundo lugar, para probar la convergencia de la sucesión xn definida por el métodode Newton en el espacio de Banach X, debemos probar que xn es una sucesión de Cauchycontenida en Ω y que an < 1, para todo n ≥ 0. Para ello, comenzamos dando algunaspropiedades de la sucesión escalar an en el siguiente lema.

Lema 1.54. Si a0 <12 , entonces

(i) ∆ = a0

2 f(a0)2 < 1,

(ii) la sucesión an es estrictamente decreciente,

(iii) an < 1, para todo n ≥ 0.

Si a0 = 12 , entonces an = a0 < 1, para todo n ∈ N.

Page 56: Estrategia metodos iterativos

42 CAPÍTULO 1. CONCEPTOS GENERALES

Demostración. En primer lugar, consideramos el caso a0 <12 . El apartado (i) es in-

mediato. En cuanto a (ii), lo demostramos por inducción matemática sobre n. Como ∆ < 1,entonces a1 < a0. Suponemos ahora que ak < ak−1 para k = 1, 2, . . . , n. Luego,

an+1 = a2n

2 f(an)2 < ∆ an < an,

por ser f creciente. Por tanto, la sucesión an es estrictamente decreciente.Para ver (iii), tenemos que an < a0 < 1, para todo n ≥ 0, por ser an una sucesión

estrictamente decreciente y a0 <12 .

Si, por otra parte, a0 = 12 , entonces ∆ = a0

2 f(a0)2 = 1 y, en consecuencia, tenemosan = a0 = 1

2 < 1, para todo n ≥ 0.

A continuación, probamos el teorema de convergencia semilocal.

Teorema 1.55. Sea F : Ω ⊂ X → Y un operador una vez continuamente diferenciableFréchet, definido en un dominio abierto convexo no vacío Ω de un espacio de Banach X ycon valores en un espacio de Banach Y . Supongamos que se verifican las condiciones (A1)–(A3), a0 = Cδθ2 ≤ 1

2 y B(x0, ρ) ⊂ Ω, donde ρ = 2(1−a0)2−3a0

δθ. Entonces, la ecuación F (x) = 0tiene una solución x∗ y el método de Newton converge a x∗ empezando en x0. Además,xn, x

∗ ∈ B(x0, ρ), para todo n ∈ N, y la solución x∗ es única en la región B(x0,

1Cθ

)∩ Ω.

Demostración. Sabemos por el lema anterior que an < 1 para todo n ≥ 0. Veamos quexn es una sucesión de Cauchy y que xn ∈ B(x0, ρ), para todo n ≥ 1. Así, para m ≥ 1 yn ≥ 1, vemos

‖xn+m − xn‖ ≤ ‖xn+m − xn+m−1‖+ ‖xn+m−1 − xn+m−2‖+ · · ·+ ‖xn+1 − xn‖

1 +n+m−2∑i=n

i∏j=n

aj2 f(aj)

‖xn+1 − xn‖. (1.40)

Como aj es estrictamente decreciente y f es creciente, por el lema anterior y (1.40), paran ≥ 1, tenemos

‖xn+m − xn‖ <n+m−2∑i=n−1

i∏j=0

a0

2 f(a0) ‖x1 − x0‖

=n+m−2∑i=n−1

(a0

2 f(a0))i+1‖x1 − x0‖

=m−1∑i=0

(a0

2 f(a0))i+n

‖x1 − x0‖

= ∆n 1−∆m

1−∆ ‖x1 − x0‖.

Luego, la sucesión xn es de Cauchy por ser ∆ = a0

2 f(a0)2 < 1.Si ahora hacemos n = 0 en (1.40), entonces

‖xm − x0‖ <1−∆m

1−∆ ‖x1 − x0‖ <δθ

1−∆ = ρ.

Page 57: Estrategia metodos iterativos

1.5. MÉTODOS ITERATIVOS EN ESPACIOS DE BANACH 43

Por lo tanto, xn ∈ B(x0, ρ), para todo n ∈ N, la sucesión xn está bien definida y esuna sucesión de Cauchy. Luego, lım

n→∞xn = x∗ ∈ B(x0, ρ). Veamos que x∗ es una solución de

F (x) = 0. Como ‖[F ′(xn)]−1F (xn)‖ = ‖xn+1 − xn‖ → 0 cuando n→∞, teniendo en cuenta

‖F (xn)‖ ≤ ‖F ′(xn)‖‖[F ′(xn)]−1F (xn)‖

y que la sucesión ‖F ′(xn)‖ está acotada, puesto que

‖F ′(xn)‖(A3)≤ ‖F ′(x0)‖+ C‖xn − x0‖ < ‖F ′(x0)‖+ Cρ,

se sigue ‖F (xn)‖ → 0 cuando n → ∞. En consecuencia, obtenemos F (x∗) = 0 por lacontinuidad de F en B(x0, ρ).

Para probar la unicidad, suponemos que y∗ es otra solución de F (x) = 0, distinta de x∗,en la región B

(x0,

1Cθ

)∩Ω. Entonces, a partir de la aproximación (1.39), tenemos que probar

que el operador J =∫ 1

0F ′(x∗ + t(y∗ − x∗)) dt es inversible. En efecto, como

‖I − [F ′(x0)]−1J‖ ≤ ‖[F ′(x0)]−1‖‖F ′(x0)− J‖

≤ ‖[F ′(x0)]−1‖‖∫ 1

0‖F ′(x∗ + t(y∗ − x∗))− F ′(x0)‖ dt

≤ Cθ∫ 1

0((1− t)‖x∗ − x0‖+ t(‖y∗ − x0‖)) dt

<Cθ

2(ρ+ 1

)= 1,

por el lema de Banach (lema 1.22), el operador J es inversible.

Terminamos esta sección recordando que, utilizando la definición 1.52 de R-orden deconvergencia, es conocido que el método de Newton tiene R-orden de convergencia al menosdos [27].

1.5.2. Accesibilidad del método de NewtonTal y como hemos indicado anteriormente, podemos observar la accesibilidad de un mé-

todo iterativo desde tres puntos de vista, dos de los cuales, la cuenca de atracción y la regiónde accesibilidad, son experimentales, y el otro, el dominio de parámetros, es teórico. Tantola cuenca de atracción como la región de accesibilidad están asociadas a la ecuación a resol-ver, mientras que el dominio de parámetros no, ya que éste está asociado a un resultado deconvergencia semilocal.

Para un sencillo entendimiento de estas tres formas de observar la accesibilidad de unmétodo iterativo cuando se aplica a la resolución de una ecuación, vamos a utilizar el métodode Newton y la ecuación compleja académica F (z) = z3 − 1 = 0, donde F : C → C.Notemos que la ecuación anterior tiene tres raíces complejas: z∗ = 1, z∗∗ = exp

(2πi3

)y

z∗∗∗ = exp(−2πi

3

).

Page 58: Estrategia metodos iterativos

44 CAPÍTULO 1. CONCEPTOS GENERALES

Cuenca de atracción

Recordamos que la cuenca de atracción es el conjunto de todos los puntos de salida apartir de los cuales un método iterativo converge a una solución una vez fijada una toleranciao un número máximo de iteraciones. En la figura 1.3 mostramos las cuencas de atracciónasociadas a las tres raíces de la ecuación anterior cuando aplicamos el método de Newton parasu aproximación. Para representar las cuencas de atracción hemos considerado un rectánguloD en el plano complejo C y asignado un color para cada raíz a la cual el método de Newtonconverge.

-2 -1 0 1 2

-2

-1

0

1

2

Figura 1.3: Cuencas de atracción de las tres raíces de z3 − 1 = 0 cuando se aproximanmediante el método de Newton.

En la práctica, consideramos una malla de 512×512 puntos en D y elegimos estos puntoscomo x0. Utilizamos el rectángulo [−2.5, 2.5] × [−2.5, 2.5] que contiene a las tres raíces. Elmétodo de Newton, empezando en un punto x0 ∈ D, puede converger a cualquiera de lastres raíces o, eventualmente, diverger. En todos los casos, utilizamos la tolerancia 10−3 yun máximo de 50 iteraciones. Si no obtenemos la tolerancia deseada con 50 iteraciones, nose continúa y decidimos que el método iterativo no converge a ninguna raíz comenzandoen z0. En particular, hemos utilizado respectivamente los colores cyan, magenta y amarillopara las cuencas de atracción de las raíces z∗, z∗∗ y z∗∗∗, respectivamente. El color se hacemás claro o más oscuro según sea el número de iteraciones utilizadas para alcanzar unaraíz con la precisión fijada. No hemos pintado los puntos del rectángulo correspondientes alas aproximaciones iniciales a partir de las cuales no se alcanza ninguna de las raíces contolerancia 10−3 en un máximo de 50 iteraciones. Para otras estrategias se puede consultar[47] y las referencias allí dadas. Los gráficos se han generado con Mathematica 5.1 [49].

Región de accesibilidad

Sabemos que los puntos de salida del método de Newton tienen asociados los parámetrosδ, θ y C dados en las condiciones iniciales (A1)–(A3). Para representar las regiones de acce-

Page 59: Estrategia metodos iterativos

1.5. MÉTODOS ITERATIVOS EN ESPACIOS DE BANACH 45

sibilidad del método de Newton, coloreamos los puntos cuyos parámetros asociados verificanlas condiciones de convergencia y, en otro caso, no los coloreamos. La región de accesibilidadasociada a una solución de una ecuación nos indica entonces el dominio de puntos de salidaa partir de los cuales tenemos asegurada la convergencia del método de Newton (es decir, elconjunto de puntos de salida que satisfacen las condiciones de convergencia para el métodode Newton).

A continuación, en la figura 1.4, vemos cuáles son las regiones de accesibilidad asociadasa las raíces de la ecuación z3 − 1 = 0 cuando se aproximan mediante el método de Newton.Representamos la regiones de accesibilidad coloreando los puntos x0 que verifican la condiciónCδθ2 ≤ 1

2 del teorema 1.53.Hemos utilizado los colores cyan, magenta y amarillo para regiones de accesibilidad de las

raíces z∗, z∗∗ y z∗∗∗, respectivamente. Y, al igual que para las cuencas de atracción, el colorse hace más claro o más oscuro según sea el número de iteraciones utilizadas para alcanzaruna solución con la precisión fijada. Los gráficos se han generado de nuevo con Mathematica5.1 [49].

-1 -0.5 0 0.5 1 1.5

-1.5

-1

-0.5

0

0.5

1

1.5

Figura 1.4: Regiones de accesibilidad de las tres raíces de la ecuación z3 − 1 = 0 para elmétodo de Newton según el teorema de Newton-Kantorovich (teorema 1.53).

Dominio de parámetros

Aparte de la observación empírica de la accesibilidad del método de Newton dado porlas cuencas de atracción y las regiones de accesibilidad, podemos realizar un estudio de laaccesibilidad de dicho método a partir de las condiciones de convergencia impuestas en elteorema de convergencia semilocal 1.53.

Observamos que las condiciones de convergencia impuestas en el teorema 1.53 tienen dospartes diferenciadas. Por una parte, las condiciones iniciales (A1)–(A2) exigidas al punto desalida x0; y por otra, la condición (A3) exigida al operador F . Para estudiar las restriccionesque se imponen con las condiciones iniciales, utilizamos el dominio de parámetros, que esta-

Page 60: Estrategia metodos iterativos

46 CAPÍTULO 1. CONCEPTOS GENERALES

blece gráficamente en un plano real la relación entre los parámetros que se definen a partirde las condiciones iniciales.

A partir del teorema 1.53, si queremos estudiar teóricamente la accesibilidad del métodode Newton, basta con tener en cuenta que, dado x0 ∈ Ω, el método tiene asociados losparámetros δ y θ que aparecen en (A1) y (A2). Así, a partir de la condición de convergenciaCδθ2 ≤ 1

2 del teorema 1.53, podemos definir el dominio de parámetros asociado a dichoteorema como el conjunto del plano real dado por (δ, θ) ∈ R2 : Cδθ2 ≤ 1

2. Por un lado,observamos que el parámetro δ mide la aproximación de x0 a la solución x∗. Notemos entoncesque δ = 0 si x0 = x∗. Por otro lado, observamos que el parámetro C, que se define a partirde la condición (A3) que se exige al operador F , es siempre una cantidad fija, de manera queno va a influir en el dominio de parámetros.

En la figura 1.5 mostramos el dominio de parámetros del método de Newton asociado alteorema 1.53. Para representarlo gráficamente, hemos considerado el plano xy con x = θ (ejede abscisas) e y = Cδ (eje de ordenadas) y coloreado en rojo los valores de los parámetrosque verifican la condición x2y ≤ 1

2 .

0.00 0.05 0.10 0.15

0

20

40

60

80

100

Figura 1.5: Dominio de parámetros del método de Newton asociado al teorema de Newton-Kantorovich (teorema 1.53).

1.6. Algunas ecuaciones no lineales en espacios de Ba-nach

La resolución de sistemas de ecuaciones no lineales de la forma F (x) = 0, donde F :D ⊂ Rm → Rm es una función definida en un dominio abierto convexo no vacío D, es unproblema habitual de las ciencias y la ingeniería. Es importante entonces destacar que losconocidos esquemas en diferencias finitas permiten transformar problemas continuos, comoecuaciones integrales y ecuaciones diferenciales, en sistemas de ecuaciones, tal como vemos

Page 61: Estrategia metodos iterativos

1.6. ALGUNAS ECUACIONES NO LINEALES EN ESPACIOS DE BANACH 47

a continuación, puesto que uno de los objetivos de este texto se centra en la resolución desistemas de ecuaciones no lineales en Rm.

1.6.1. Ecuaciones integrales de HammersteinLas ecuaciones de Hammerstein tienen un origen físico importante y surgen de la dinámica

de fluidos electromagnéticos [39]. En particular, las ecuaciones integrales no lineales de tipoHammerstein mixto son de la forma:

x(s) = f(s) +∫ b

aG(s, t)H(t, x(t)) dt, s ∈ [a, b], (1.41)

donde −∞ < a < b < +∞, f(s) es una función continua dada en [a, b] y el núcleo G y lafunción H son conocidos. Estas ecuaciones aparecieron a principios de los años 30 del sigloXX como modelos generales del estudio de problemas de valores en la frontera semilineales,donde el núcleo G(s, t) se presenta típicamente como la función de Green de un operadordiferencial [21]. Así, la ecuación (1.41) se puede reformular como un problema de valoresen la frontera de dos puntos con una cierta condición de contorno no lineal [6]. Tambiénaparecen análogos multidimensionales de la ecuación (1.41) como reformulaciones de unaEDP elíptica con condiciones de contorno no lineales [33]. Ecuaciones integrales como (1.41)aparecen frecuentemente en numerosas aplicaciones del mundo real [9]. Por ejemplo, algu-nos problemas considerados en la teoría vehicular, la biología y la teoría de colas llevan aecuaciones integrales de este tipo [17]. Estas ecuaciones también se aplican en la teoría de latransferencia radiactiva, en la teoría del transporte de neutrones y en la teoría cinética degases [25]. Destacamos además el papel significativo que juegan en varias aplicaciones [14],como por ejemplo los modelos dinámicos de reactores químicos [12], que están gobernadospor ecuaciones de control, justificando así su estudio y resolución [22].

La resolución de la ecuación integral (1.41) es equivalente a resolver la ecuación F(x) = 0,donde F : Ω ⊂ C([a, b])→ C([a, b]) y

[F(x)](s) = x(s)− f(s)−∫ b

aG(s, t)H(t, x(t)) dt, s ∈ [a, b]. (1.42)

Notemos que, como ya hemos visto, C([a, b]) es un espacio de Banach con la norma ‖ · ‖∞ y,por tanto, el operador (1.42) está definido entre dos espacios de Banach.

Cuando queremos aproximar una solución de la ecuación F (x) = 0, donde el operador Festá definido por F : D ⊆ Rm → Rm en un dominio abierto convexo no vacío D, mediante elmétodo de Newton x0 ∈ D,

xn+1 = xn − [F ′(xn)]−1F (xn), n ≥ 0,

lo que hacemos es resolver el sistema de ecuaciones lineales en cada paso dado por

F ′(xn)(xn+1 − xn) = −F (xn). (1.43)

En cambio, si el operador es de la forma F : C([a, b])→ C([a, b]), no podemos utilizar la ideaanterior porque no sabemos resolver la ecuación integral que corresponde a la ecuación (1.43)a partir de (1.42). Tampoco podemos aplicar directamente el método de Newton ya que noconocemos el operador [F ′(x)]−1.

Page 62: Estrategia metodos iterativos

48 CAPÍTULO 1. CONCEPTOS GENERALES

Así, como primer paso, discretizamos la ecuación (1.41) para transformarla en un problemade dimensión finita. Consideramos entonces (1.41) siendo el núcleo G la función de Green en[a, b]× [a, b] y aproximamos la integral que aparece en (1.41) usando la siguiente fórmula decuadratura numérica de Gauss-Legendre con m nodos [28]

∫ b

aq(t) dt '

m∑i=1

wiq(ti),

donde los nodos ti y los pesos wi son conocidos.Si denotamos la aproximación de x(ti) por xi y la de f(ti) por fi (i = 1, 2, . . . ,m), entonces

la ecuación (1.41) se transforma en el siguiente sistema de ecuaciones no lineales

xi = fi +m∑j=1

aijH(tj, xj) , j = 1, 2, . . . ,m, (1.44)

donde

aij = wj G(ti, tj) =

wj(b−ti)(tj−a)

b−a si j ≤ i,

wj(b−tj)(ti−a)

b−a si j > i.

Ahora, el sistema (1.44) se puede escribir como

F (x) ≡ x− f− Ay = 0, F : Rm −→ Rm, (1.45)

dondex = (x1, x2, . . . , xm)T , f = (f1, f2, . . . , fm)T , A = (aij)mi,j=1,

y = (H(t1, x1), H(t2, x2), . . . , H(tm, xm))T .Por otra parte, como los métodos iterativos que estudiamos en este texto utilizan dife-

rencias divididas de primer orden en su algoritmo y en Rm podemos considerar diferenciasdivididas de primer orden que no necesitan que la función sea diferenciable [37], considerare-mos la diferencia dividida de primer orden dada por [u,v;F ] = ([u,v;F ]ij)mi,j=1 ∈ L(Rm,Rm),con

[u,v;F ]ij = 1uj − vj

(Fi(u1, . . . , uj, vj+1, . . . , vm)− Fi(u1, . . . , uj−1, vj, . . . , vm)) , (1.46)

u = (u1, u2, . . . , um)T y v = (v1, v2, . . . , vm)T . Así, para la función F definida en (1.45),

tenemos [u,v;F ] = I − A diagz, donde z = (z1, z2, . . . , zm)T y zi = H(ti, ui)−H(ti, vi)ui − vi

,para todo i = 1, 2, . . . ,m.

1.6.2. Problemas conservativosEs bien conocido que la energía se disipa en la acción de cualquier sistema dinámico

real, generalmente a través de algún tipo de fricción. Sin embargo, en ciertas situaciones estadisipación es tan lenta que se puede despreciar en periodos de tiempo relativamente cortos.En tales casos se supone la ley de conservación de la energía, es decir, que la suma de laenergía cinética y la energía potencial sea constante. Un sistema de este tipo se dice que esconservativo.

Page 63: Estrategia metodos iterativos

1.6. ALGUNAS ECUACIONES NO LINEALES EN ESPACIOS DE BANACH 49

Si ϕ y ψ son funciones arbitrarias con la propiedad de que ϕ(0) = 0 y ψ(0) = 0, laecuación general

µd2x(t)dt2

+ ψ

(dx(t)dt

)+ ϕ(x(t)) = 0 (1.47)

se puede interpretar como la ecuación del movimiento de una masa µ bajo la acción de una

fuerza restauradora −ψ(dx

dt

). En general, estas fuerzas no son lineales y la ecuación (1.47) se

puede considerar como una ecuación básica de mecánica no lineal. Ahora vamos a considerarel caso especial de un sistema no lineal conservativo descrito por la ecuación

µd2x(t)d2t

+ ϕ(x(t)) = 0, (1.48)

en la que la fuerza de amortiguación es nula y, en consecuencia, no hay disipación de energía.Diversos estudios de (1.47), con aplicaciones a un gran número de problemas físicos, se puedenencontrar en las referencias clásicas [3] y [44].

Ahora, consideramos el caso especial de un sistema no lineal conservativo descrito por laecuación

d2x(t)dt2

+ φ(x(t)) = 0 (1.49)

con condiciones de contornox(0) = x(1) = 0. (1.50)

La resolución de la ecuación diferencial (1.49) es equivalente a resolver la ecuación F(x) = 0,donde F : C2([0, 1])→ C([0, 1]) y

[F(x)](t) = d2x(t)dt2

+ φ(x(t)).

Notemos que, como ya hemos visto, C2([0, 1]) es un espacio de Banach con la norma ‖x‖∞ =max‖x‖∞, ‖x′‖∞ teniendo en cuenta que C([0, 1]) es un espacio de Banach con la norma‖ · ‖∞, de manera que el operador anterior F está definido entre dos espacios de Banach.

Tal y como hemos indicado anteriormente, estamos interesados en aproximar una soluciónde una ecuación no lineal F (x) = 0, donde F es un operador definido en un dominio abiertoconvexo no vacío D de Rm y tal que F : D ⊂ Rm → Rm. Así, a continuación, utilizamos unproceso de discretización para transformar el problema de contorno de segundo orden en unproblema finito-dimensional. Transformamos así el problema (1.49)–(1.50) en un sistema deecuaciones no lineales. Para ello, aproximamos la segunda derivada por una fórmula numéricaestándar.

En primer lugar, introducimos los puntos tj = jh, j = 0, 1, . . . ,m + 1, donde h = 1m+ 1

y m es un entero apropiado. El esquema es entonces designado por la determinación de losnúmeros xj y se espera aproximar los valores x(tj) de la solución exacta en los puntos tj. Unaaproximación estándar para la segunda derivada en estos puntos es

x′′

j ≈xj−1 − 2xj + xj+1

h2 , j = 1, 2, . . . ,m,

de manera que un procedimiento natural para obtener dicho esquema es exigir que los xj sa-tisfagan en cada punto tj del interior de la malla la ecuación diferencial y, por la aproximaciónindicada, tenemos

xj−1 − 2xj + xj+1 + h2φ(xj) = 0, (1.51)

Page 64: Estrategia metodos iterativos

50 CAPÍTULO 1. CONCEPTOS GENERALES

y como x0 y xm+1 están determinados por las condiciones de contorno, las incógnitas sonx1, x2, . . . , xm.

Adicionalmente, simplificamos mediante el uso de notación vectorial y matricial. Introdu-cimos entonces los vectores

x =

x1

x2

...xm

, vx =

φ(x1)φ(x2)

...φ(xm)

y la matriz

A =

−2 1 0 · · · 01 −2 1 · · · 00 1 −2 · · · 0... ... ... . . . ...0 0 0 · · · −2

,

de manera que el sistema de ecuaciones, que surge de imponer que (1.51) se verifique paraj = 1, 2, . . . ,m, se puede escribir como

F (x) ≡ Ax + h2vx = 0, (1.52)

donde F es una función de Rm en Rm.Por otra parte, tal y como hemos dicho antes, al estudiar en este texto métodos itera-

tivos que utilizan diferencias divididas de primer orden en su algoritmo, consideraremos ladiferencia dividida de primer orden dada por [u,v;F ] = ([u,v;F ]ij)mi,j=1 ∈ L(Rm,Rm), con[u,v;F ]ij definida en (1.46), de manera que en este caso

[u,v;F ] = A+ h2diagz,

donde z = (z1, z2, . . . , zm)T y zi = φ(ui)− φ(vi)ui − vi

, para todo i = 1, 2, . . . ,m.

Terminamos diciendo que, a lo largo de todo el texto, por una parte, denotamos

B(x, %) = y ∈ X; ‖y − x‖ ≤ % y B(x, %) = y ∈ X; ‖y − x‖ < %,

y, por otra parte, suponemos que existen todas las diferencias divididas de primer orden paracada par de puntos distintos del espacio de Banach X.

Page 65: Estrategia metodos iterativos

Parte II

MÉTODOS TIPO SECANTE

51

Page 66: Estrategia metodos iterativos
Page 67: Estrategia metodos iterativos

53

Como ya se ha indicado en la introducción de este texto, uno de nuestros objetivos princi-pales es el estudio de métodos iterativos que no utilizan derivadas en su algoritmo. En general,estos métodos iterativos tienen el inconveniente de que no es sencillo localizar puntos de salidaa partir de los cuales se asegure la convergencia de los mismos.

En esta segunda parte del texto, centramos nuestra atención en una familia de métodositerativos con memoria, la de los tipo secante que, en el caso escalar, viene dada por elalgoritmo

dados t−1 y t0,sn = λtn + (1− λ)tn−1, λ ∈ [0, 1],

tn+1 = tn −sn − tn

f(sn)− f(tn)f(tn), n ≥ 0,

cuando se aplica a la ecuación escalar f(t) = 0. Esta familia surge a partir de las interpre-taciones geométricas del método de la secante y el método de Newton. Una característicaimportante de esta familia es que no utiliza derivadas en su algoritmo. Además, tiene R-ordende convergencia al menos superlineal, 1+

√5

2 , y a medida que vamos considerando mayores va-lores de λ, próximos a uno, la velocidad de convergencia aumenta. Notemos que para λ→ 1se obtiene el método de Newton, cuyo R-orden de convergencia es al menos cuadrático.

Tal y como hemos dicho anteriormente, son muchos los problemas de las ciencias y laingeniería cuya resolución pasa por considerar el problema de aproximar una raíz x∗ de unaecuación

F (x) = 0.

Para contemplar una mayor generalidad de la ecuación anterior, vamos a considerar que F esun operador definido en un subconjunto abierto convexo no vacío Ω de un espacio de BanachX y con valores en un espacio de Banach Y . En estas condiciones tan generales, la ecuaciónF (x) = 0 puede representar una ecuación escalar, un sistema de ecuaciones, una ecuacióndiferencial, una ecuación integral, etc.

Comenzamos extendiendo la familia de métodos iterativos tipo secante anterior a espaciosde Banach con el objetivo de aproximar una solución x∗ de la ecuación F (x) = 0, que quedade la siguiente forma:

dados x−1, x0 en Ω,yn = λxn + (1− λ)xn−1, λ ∈ [0, 1),xn+1 = xn − [yn, xn;F ]−1F (xn), n ≥ 0,

donde [x, y;F ] es un operador diferencia dividida de primer orden de F en los puntos x e y.Por una parte, tenemos que para λ = 0, obtenemos el método de la secante:

dados x−1, x0 en Ω,xn+1 = xn − [xn−1, xn;F ]−1F (xn), n ≥ 0,

cuyo R-orden de convergencia es al menos superlineal, 1+√

52 . Por otra parte, si λ = 1 y el

operador F es diferenciable, entonces yn = xn, [yn, xn;F ] = F ′(xn) y obtenemos el métodode Newton:

dado x0 en Ω,xn+1 = xn − [F ′(xn)]−1F (xn), n ≥ 0.

Page 68: Estrategia metodos iterativos

54

Aunque el método de la secante es menos utilizado que el método de Newton, su utilizacióntiene gran interés puesto que no requiere la evaluación del operador derivada primera de F .

En esta segunda parte del texto mostramos el principal problema que tiene el resultado deconvergencia semilocal dado para la familia de métodos iterativos tipo secante que se obtienemediante una técnica basada en relaciones de recurrencia [24]. Es conocido que las hipótesisiniciales de todo resultado de convergencia semilocal para métodos iterativos tienen dos partesdiferenciadas. Por una parte, las condiciones iniciales exigidas a los puntos de salida; y porotra, las condiciones exigidas al operador F . Pues bien, aquí nos ocuparemos de analizar lascondiciones iniciales para mejorar un resultado de convergencia semilocal dado a partir derelaciones de recurrencia. Para estudiar las restricciones que imponen las condiciones inicialesutilizaremos la región de accesibilidad y el dominio de parámetros. El problema principal quepresenta el resultado de convergencia semilocal dado a partir de relaciones de recurrenciacorresponde con la situación que se plantea habitualmente cuando aplicamos los métodostipo secante para aproximar una solución de F (x) = 0: no es sencillo localizar puntos desalida a partir de los cuales se asegure la convergencia de los métodos tipo secante.

Resolvemos el problema anterior mediante dos procedimientos. En el capítulo 2, para unoperador diferenciable F , utilizamos un método iterativo híbrido de tipo predictor-corrector,que es un esquema iterativo que facilita la aplicación de un método iterativo, llamado co-rrector, a partir de la aplicación de otro método iterativo, llamado predictor, que permitelocalizar puntos de salida a partir de los cuales la convergencia del método corrector está ase-gurada. La idea básica es aplicar, hasta una cierta aproximación N0, un método iterativo conR-orden de convergencia bajo, pero con buen dominio de puntos de salida, y utilizar despuésesta iteración como punto inicial para un método iterativo con mayor R-orden de convergen-cia. La clave está en el valor N0, que juega un papel fundamental en la construcción de estosmétodos iterativos híbridos. En concreto, en el capítulo 2, utilizamos un método iterativohíbrido (predictor-corrector) que facilita la aplicabilidad de los métodos tipo secante a partirdel método simplificado de la secante (convergencia lineal), permitiendo así localizar puntosde salida, a partir de los cuales esté asegurada la convergencia de los métodos iterativos tiposecante, y aprovechar entonces su convergencia superlineal. En el capítulo 3, obraremos deforma diferente y utilizaremos una modificación de la técnica basada en relaciones de re-currencia para obtener un resultado de convergencia semilocal para la familia de métodostipo secante, que es menos exigente a la hora de obtener puntos de salida adecuados paraestos métodos. Además, el nuevo resultado de convergencia semilocal que se obtiene tiene laventaja de que se puede aplicar a la resolución de ecuaciones en las que el operador implicadoF es tanto diferenciable como no diferenciable.

Page 69: Estrategia metodos iterativos

Capítulo 2

Situación diferenciable

En este capítulo, como ya hemos indicado, teniendo en cuenta la deficiente accesibilidadque presentan los métodos iterativos que no utilizan derivadas y, en particular, los métodos ti-po secante, nos planteamos mejorar su accesibilidad. Para conseguir este objetivo, planteamosla construcción de un método iterativo híbrido (predictor-corrector).

En la sección 2.1.1 presentamos un conocido resultado de convergencia semilocal paralos métodos tipo secante, lo analizamos mediante regiones de accesibilidad y el dominio deparámetros asociado y vemos cuáles son las deficiencias que presenta. En la sección 2.2.1,una vez detectado correctamente el problema de la deficiente accesibilidad de los métodostipo secante, a partir del resultado de convergencia semilocal presentado, consideramos, pararesolverlo, el método simplificado de la secante en espacios de Banach,

dados z−1, z0 en Ω,zn+1 = zn − [z−1, z0;F ]−1F (zn), n ≥ 0,

(2.1)

cuyo R-orden de convergencia es al menos lineal, con el objetivo principal de construir unmétodo iterativo híbrido (predictor-corrector) que utilice el método simplificado de la se-cante (2.1) como predictor y la familia de métodos tipo secante como corrector. Para ello,analizamos la convergencia semilocal del método simplificado de la secante (2.1) y, como lascondiciones de convergencia impuestas a este método son menos restrictivas que las impues-tas previamente a los métodos tipo secante, vemos que se pueden mejorar las regiones deaccesibilidad y los dominios de parámetros de los métodos tipo secante a partir del métodosimplificado de la secante (2.1). Así, en la sección 2.3, mediante el método iterativo híbrido(predictor-corrector) construído, garantizamos la convergencia de los métodos tipo secantesaliendo desde los mismos puntos de salida a partir de los cuales está garantizada la conver-gencia del método simplificado de la secante (2.1). Finalmente, en la sección 2.4, ilustramostodo lo anterior con la resolución de un sistema de ecuaciones no lineales.

2.1. Método corrector: los métodos tipo secante

2.1.1. Convergencia semilocalEn esta sección presentamos un resultado de convergencia semilocal para los métodos tipo

secante y en el que la técnica de demostración está basada en relaciones de recurrencia. Paraello, suponemos que se cumplen las siguientes condiciones iniciales:

55

Page 70: Estrategia metodos iterativos

56 CAPÍTULO 2. SITUACIÓN DIFERENCIABLE

(C1) ‖x0 − x−1‖ = α 6= 0 con x−1, x0 ∈ Ω,(C2) fijado λ ∈ [0, 1), existe A−1

0 = [y0, x0;F ]−1 ∈ L(Y,X), para x0, y0 ∈ Ω, y estal que que ‖A−1

0 ‖ ≤ β,(C3) ‖A−1

0 F (x0)‖ ≤ η,(C4) ‖[x, y;F ]− [u, v;F ]‖ ≤ K(‖x− u‖ + ‖y − v‖); K ≥ 0; x, y, u, v ∈ Ω; x 6= y,

u 6= v.

En primer lugar, se definen las siguientes sucesiones de números reales positivos:

an = f(an−1)g(an−1)bn−1, bn = f(an−1)2an−1bn−1, n ≥ 0, (2.2)

dondea−1 = η

α + η, a0 = f(a−1)g(a−1)b−1, b−1 = Kβα2

α + η, (2.3)

f(t) = 11− t , g(t) = (1− λ) + (1 + λ)f(t)t, λ ∈ [0, 1).

Notemos que tanto f(t) como g(t) son funciones crecientes en R − 1 y, además, f(t) > 1en (0, 1).

A partir de las condiciones iniciales (C1)–(C4), si x1 está bien definido, se deduce queexiste A−1

0 = [y0, x0;F ]−1 y

‖x1 − x0‖ = ‖A−10 F (x0)‖ ≤ η = f(a−1)a−1‖x0 − x−1‖,

K‖x1 − x0‖ ‖x0 − x−1‖ ≤ Kβα = f(a−1)b−1.(2.4)

A continuación, se prueban, mediante inducción matemática sobre n, las siguientes tresrelaciones de recurrencia para n ≥ 1:

(in) Existe A−1n = [yn − xn;F ]−1 y es tal que ‖A−1

n ‖ ≤ f(an−1)‖A−1n−1‖,

(iin) ‖xn+1 − xn‖ ≤ f(an−1)an−1‖xn − xn−1‖,

(iiin) K‖A−1n ‖‖xn − xn−1‖ ≤ f(an−1)bn−1.

Veámoslo para n = 1. Suponiendo que a0 < 1 y x1 ∈ Ω, de (2.3) y (2.4), se sigue:

‖I − A−10 A1‖ ≤ ‖A−1

0 ‖‖A0 − A1‖≤ ‖A−1

0 ‖ (‖y1 − y0‖+ ‖x1 − x0‖)≤ K‖A−1

0 ‖ [(1− λ) + (1 + λ)f(a−1)a−1] ‖x0 − x−1‖≤ a0

< 1.

Entonces, por el lema de Banach (lema 1.22), existe A−11 y es tal que

‖A−11 ‖ ≤ f(a0)‖A−1

0 ‖.

Por tanto, se cumple (i1).

Page 71: Estrategia metodos iterativos

2.1. MÉTODO CORRECTOR: LOS MÉTODOS TIPO SECANTE 57

Ahora, usando la fórmula de Taylor (teorema 1.38)

F (x1) = (F ′(x0)− A0) (x1 − x0) +∫ 1

0(F ′(x0 + t(x1 − x0))− F ′(x0)) (x1 − x0)dt,

y teniendo en cuenta que F es diferenciable por cumplirse (C4), lema 1.43, etonces [x, x;F ] =F ′(x) y

‖F (x1)‖ ≤ K ((1− λ)‖x0 − x−1‖+ ‖x1 − x0‖) ‖x1 − x0‖≤ Kg(a−1)‖x0 − x−1‖‖x1 − x0‖.

Como A−11 existe, si x2 está bien definido, se sigue

‖x2 − x1‖ ≤ f(a0)‖A−10 ‖‖F (x1)‖ ≤ f(a0)a0‖x1 − x0‖

y tenemos (ii2).Notemos que, como consecuencia de (2.4) y (i1), se sigue (iii1), puesto que

K‖A−11 ‖‖x1 − x0‖ ≤ Kf(a0)‖A−1

0 ‖‖x1 − x0‖ ≤ f(a0)b0.

Finalmente, suponiendo an < 1 y xn ∈ Ω, para todo n ≥ 1, el paso inductivo (in+1)–(iiin+1) se demuestra de forma totalmente análoga y se completa la inducción.

En segundo lugar, para probar la convergencia de la sucesión xn que definen los métodostipo secante, se estudian las sucesiones reales definidas en (2.2). Debemos probar que xnes una sucesión de Cauchy contenida en Ω y que an < 1, para todo n ≥ 0.

Se empieza denotando la sucesión de Fibonacci por δn, que se define como sigue

δ1 = δ2 = 1 y δn+2 = δn+1 + δn, n ≥ 1,

sn = δ1 + δ2 + · · ·+ δn, n ≥ 1,y se demuestran por inducción las siguientes dos propiedades:

· δn = 1√5

[(1 +√

52

)n−(

1−√

52

)n]>

1√5

(1 +√

52

)n−1

, n ≥ 1.

· sn = δn+2 − 1 y µn = s1 + s2 + · · ·+ sn = δn+4 − (n+ 3) n ≥ 1.

Para mayor detalle, consúltese [24].A continuación, presentamos algunas propiedades de las sucesiones an y bn, dadas en

(2.2), en el siguiente lema.

Lema 2.1. Sean las sucesiones an y bn definidas en (2.2) y λ ∈ [0, 1) fijo. Si

a−1 = η

α + η<

3−√

52 y b−1 = Kβα2

α + η<

a−1(1− a−1)2

1 + λ(2a−1 − 1) , (2.5)

entonces

(i) an y bn son sucesiones decrecientes,

(ii) ϕ = b0

b−1∈ (0, 1) y a0

1− a0< ϕ,

Page 72: Estrategia metodos iterativos

58 CAPÍTULO 2. SITUACIÓN DIFERENCIABLE

(iii) an < ϕδnan−1 y bn < ϕδn+1bn−1, para todo n ≥ 1,

(iv) an < ϕsna0, para todo n ≥ 1.

Demostración. Para probar (i), procedemos por inducción. De las hipótesis se tieneque a0 < a−1 y b0 < b−1. Si se verifican aj−1 > aj y bj−1 > bj, para j = 0, 1, . . . , n, entonces

an+1 < f(an−1)g(an−1)bn−1 = an y bn+1 < f(an−1)2an−1bn−1 = bn.

Luego an y bn son decrecientes.El apartado (ii) es inmediato por hipótesis.Para probar (iii), aplicamos inducción. De a0 < a−1 y b0 < ϕb−1 se deduce que

a1 < f(an−1)g(an−1)ϕb−1 = ϕa0 y b1 < f(an−1)2g(a−1)ϕb−1 = ϕb0.

Si suponemos bj < ϕδj+1bj−1, para j = 1, 2. . . . , n, entonces

an+1 < f(an−1)g(an−1)ϕδn+1bn−1 = ϕδn+2an,

bn+1 < f(an−1)2(ϕng(an−1))ϕδn+1bn−1 < ϕδn+1+δnbn = ϕδn+2an.

Finalmente, (iv) es consecuencia de (iii).

A continuación, probamos el teorema de convergencia semilocal.

Teorema 2.2. Sean X e Y dos espacios de Banach, F : Ω ⊂ X → Y un operador definidoen un conjunto abierto convexo no vacío Ω y λ ∈ [0, 1). Suponemos que se cumplen lascondiciones (C1)–(C4) y (2.5). Si B(x0, r0) ⊂ Ω, donde r0 = 1− a0

1− 2a0η, entonces los métodos

tipo secante convergen a una solución x∗ de F (x) = 0. Además, xn, x∗ ∈ B(x0, r0) y x∗ esúnica en B(x0, τ) ∩ Ω, donde τ = 1

Kβ− r0 − (1− λ)α.

Demostración. Tenemos que a0 < 1 y an < 1 para todo n ≥ 1. Veamos que xn esuna sucesión de Cauchy y que xn ∈ B(x0, r0), para todo n ≥ 0. Ahora, para m ≥ 1, vemosque

‖xn+m − xn‖ ≤ ‖xn+m − xn+m−1‖+ ‖xn+m−1 − xn+m−2‖+ · · ·+ ‖xn+1 − xn‖

≤ f(an+m−2)an+m−2 · · · f(an+1)an+1f(an)an‖xn+1 − xn‖

+f(an+m−3)an+m−3 · · · f(an+1)an+1f(an)an‖xn+1 − xn‖

+ · · ·+ f(an)an‖xn+1 − xn‖+ ‖xn+1 − xn‖

=1 +

n+m−2∑i=n

i∏j=n

f(aj)aj

‖xn+1 − xn‖. (2.6)

Como aj es decreciente y f es creciente, por el lema 2.1 y (2.6), para n ≥ 2, se tiene

‖xn+m − xn‖ =n+m−2∏j=n

ϕsj ∆n[∆m−1 + ∆m−2 + · · ·+ 1

]‖x1 − x0‖,

Page 73: Estrategia metodos iterativos

2.1. MÉTODO CORRECTOR: LOS MÉTODOS TIPO SECANTE 59

donde ∆ = a01−a0

< 1 y, por tanto, a0 <12 . Entonces,

‖xn+m − xn‖ =(ϕs1+s2+···+sn−1

) ∆n(1−∆m)1−∆ ‖x1 − x0‖. (2.7)

En (2.6), si n = 1, se tiene

‖xm+1 − x1‖ <∆(1−∆m)

1−∆ ‖x1 − x0‖, (2.8)

y, si n = 0,‖xm − x0‖ <

1−∆m

1−∆ <η

1−∆ = r0. (2.9)

Por tanto, xn ∈ B(x0, r0), para todo n ≥ 1, la sucesión xn está bien definida y es unasucesión de Cauchy. Luego, lım

n→∞xn = x∗ ∈ B(x0, r0).

Además, por (C4), existe F ′ y cumple ‖F ′(x)−F ′(y)‖ = ‖[x, x;F ]−[y, y;F ]‖ ≤ 2K‖x−y‖,de manera que

F (xn) = (F ′(xn−1)− An−1) (xn−xn−1)+∫ 1

0(F ′(xn−1 +t(xn−xn−1))−F ′(xn−1)(xn−xn−1) dt,

‖F (xn)‖ ≤ K ((1− λ)‖xn−1 − xn−2‖+ ‖xn − xn−1‖) ‖xn − xn−1‖,lımn→∞

‖F (xn)‖ = 0 y, por la continuidad de F , vemos que x∗ es solución de F (x) = 0, puestoque lım

n→∞‖F (xn)‖ = ‖F (x∗)‖ = 0.

A continuación, probamos la unicidad de x∗. Sea z∗ otra solución distinta de F (x) = 0 enB(x0, τ) ∩ Ω, donde τ = 1

Kβ− r0 − (1− λ)α. Si consideramos

F (z∗)− F (x∗) =∫ z∗

x∗F ′(x)dx =

∫ 1

0F ′ (x∗ + t(z∗ − x∗)) (z∗ − x∗)dt = 0,

y el operador J =∫ 1

0F ′ (x∗ + t(z∗ − x∗)) dt, entonces

‖I − A−10 J‖ ≤ ‖A−1

0 ‖ ‖A0 − J‖

≤ ‖A−10 ‖

∫ 1

0‖F ′ (x∗ + t(z∗ − x∗))− A0‖ dt

= ‖A−10 ‖

∫ 1

0‖F ′ (x∗ + t(z∗ − x∗))− F ′(x0) + F ′(x0)− A0‖ dt

≤ β(∫ 1

02K‖x∗ + t(z∗ − x∗)− x0‖ dt+ ‖F ′(x0)− A0‖

)≤ β

(∫ 1

02K((1− t)‖x∗ − x0‖+ t ‖z∗ − x0‖) dt+K(1− λ)α

)= Kβ ((1− λ)α + ‖x∗ − x0‖+ ‖z∗ − x0‖)

< Kβ ((1− λ)α + r0 + τ)= 1,

de manera que J es inversible y, por tanto, z∗ = x∗.

Page 74: Estrategia metodos iterativos

60 CAPÍTULO 2. SITUACIÓN DIFERENCIABLE

2.1.2. AccesibilidadSabemos que los puntos de salida de un método iterativo tienen asociados los parámetros

dados en las condiciones iniciales. Para representar la región de accesibilidad del métodoiterativo, coloreamos los puntos cuyos parámetros asociados verifican las condiciones de con-vergencia y, en otro caso, no los coloreamos. La región de accesibilidad asociada a una soluciónde F (x) = 0 nos indica entonces el dominio de puntos de salida a partir de los cuales tenemosasegurada la convergencia del método iterativo que se aplica; es decir, el conjunto de puntosde salida que satisfacen las condiciones de convergencia impuestas al método iterativo.

A continuación, vemos cuál es la región de accesibilidad asociada a la raíz z = 1 de laecuación compleja F (z) = z3 − 1 = 0 cuando se aproxima mediante los métodos tipo secan-te. Considerando el cuadrado [0.9, 1.3]× [−0.2, 0.2] como dominio complejo, que únicamentecontiene la raíz z = 1, obtenemos K = 6|1.3 + 0.2i| = 3.9458 . . . Tomando z−1 = z0 − d,representamos la región de accesibilidad coloreando los puntos z0 que verifiquen las condi-ciones de convergencia dadas en (2.5). Así, fijado α = |z0 − z−1| = |d|, en las figuras 2.1–2.4se muestran las regiones de accesibilidad para cuatro métodos tipo secante: λ = 0 (regiónverde), λ = 1

4 (región rosa), λ = 12 (región amarilla) y λ = 3

4 (región morada).Se observa entonces que las regiones de accesibilidad de los métodos tipo secante que se han

representado gráficamente tienen el problema de que no se puede garantizar la convergenciapara ciertos valores de λ, aún estando cerca de la raíz o en la misma raíz. Vemos que apareceuna zona hueca en la región de accesibilidad que contiene a la propia raíz. Evidentemente, estarestricción es consecuencia de que la distancia entre los puntos de salida (o, equivalentemente,del valor de α) no es suficientemente pequeña como para poder garantizar la convergencia enestas situaciones concretas.

Por otra parte, si se consideran valores de α más pequeños, se puede ver en las figuras 2.5–2.8 que, aunque se va reduciendo la zona hueca, también se reduce la región de accesibilidad.De hecho, se puede comprobar que para α = 1/64 ya no existe región de accesibilidad, comoconsecuencia de que las condiciones (2.10) no se cumplen.

A continuación, estudiando el dominio de parámetros asociado al teorema 2.2, vamos adetallar cuáles son los problemas de accesibilidad de los métodos tipo secante. Para represen-tarlo gráficamente, se colorean en un plano xy los valores de los parámetros correspondientesa los puntos de salida que verifican las condiciones que se imponen en el teorema 2.2. Observa-mos que las condiciones exigidas a los puntos de salida, (C1)–(C3), introducen los parámetrosα, β y η, y la condición exigida al operador F , (C4), introduce el parámetro fijo K. En primerlugar, expresamos las dos condiciones dadas en (2.5) de forma explícita a partir de los valo-res que consideramos para construir el dominio de parámetros: Kβη y Kβα. Así, podemosescribir (2.5) de la siguiente forma:

Kβη

Kβα+Kβη<

3−√

52 y 1 < Kβη

(Kβα+Kβη)(Kβα+Kβη + λ(Kβη −Kβα) . (2.10)

Ahora, considerando que representamos en el eje x de abscisas los valores Kβη y en ely de ordenadas los valores Kβα, dibujamos en la figura 2.9 los dominios de parámetros queestán sujetos a las condiciones dadas en (2.10) para cuatro métodos tipo secante: λ = 0(región verde), λ = 0.25 (región rosa), λ = 0.5 (región amarilla) y λ = 0.75 (región morada).Notamos que las regiones están superpuestas.

A partir de la figura 2.9 observamos dos situaciones que destacamos a continuación. Enprimer lugar, la elección de adecuados puntos de salida x−1 y x0 para los métodos tipo secante

Page 75: Estrategia metodos iterativos

2.2. MÉTODO PREDICTOR: EL MÉTODO SIMPLIFICADO DE LA SECANTE 61

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.1: Región de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método tipo secante correspondientea λ = 0 y tomando α = 1

10 .

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.2: Región de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método tipo secante correspondientea λ = 1

4 y tomando α = 110 .

es muy restrictiva, puesto que el dominio de parámetros es muy reducido. En segundo lugar,si consideramos un valor fijo de Kβα perteneciente al dominio de parámetros, observamosque los posibles valores que se pueden considerar de Kβη, para que los puntos de salidapertenezcan al dominio de parámetros, tienen una cota superior y una cota inferior para lacantidad Kβη. Esto hace que, incluso tomando la propia raíz como punto de salida (Kβη =0), no obtengamos puntos iniciales que verifiquen las condiciones del teorema 2.2, lo queresulta evidente a partir de la segunda condición de (2.10), puesto que obviamente nunca severifica la desigualdad para α > 0 y η = 0 (es decir, x0 = x∗).

2.2. Método predictor: el método simplificado de la se-cante

Una vez descritos los problemas de accesibilidad que se deducen del teorema 2.2 para losmétodos tipo secante, introducimos ahora el método simplificado de la secante (2.1) y analiza-mos su convergencia semilocal. A partir de este estudio, veremos que este método tiene mejoraccesibilidad que los método tipo secante, lo que posteriormente utilizamos para considerarlocomo método predictor del método híbrido (predictor-corrector) que construimos.

2.2.1. Convergencia semilocalPara probar la convergencia semilocal del método simplificado de la secante (2.1), supo-

nemos que se cumplen las siguientes condiciones iniciales:

(H1) ‖z0 − z−1‖ = α0 6= 0, con z−1, z0 ∈ Ω,

Page 76: Estrategia metodos iterativos

62 CAPÍTULO 2. SITUACIÓN DIFERENCIABLE

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.3: Región de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método tipo secante correspondientea λ = 1

2 y tomando α = 110 .

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.4: Región de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método tipo secante correspondientea λ = 3

4 y tomando α = 110 .

(H2) existe L−10 = [z−1, z0;F ]−1 ∈ L(Y,X), para z−1, z0 ∈ Ω, y es tal que

‖L−10 ‖ ≤ γ,

(H3) ‖L−10 F (z0)‖ ≤ ε,

(H4) ‖[z, y;F ]− [u, v;F ]‖ ≤ K(‖z− u‖+ ‖y− v‖), K ≥ 0, z, y, u, v ∈ Ω, z 6= y,u 6= v.

Antes de probar la convergencia semilocal del método simplificado de la secante (2.1) bajolas condiciones (H1)–(H4), probamos el siguiente lema técnico.

Lema 2.3. A partir de (H1)–(H4), si

Kγα0 < 1 y Kγε <

√2(1 + (Kγα0)2)− (1 +Kγα0)

2 , (2.11)

entonces la ecuación

2Kγt2 − (1−Kγα0 + 2Kγε)t+ (1 +Kγε)ε = 0 (2.12)

tiene dos raíces reales positivas. Si denotamos por R la menor de ellas, se tiene que Kγ(2R+α0) < 1 y R > ε.

Demostración. Como el discriminante de la ecuación (2.12) está dado por

∆ = (1−Kγα0 + 2Kγε)2 − 8Kγε(1 +Kγε)

=((1−Kγα0 + 2Kγε) +

√8Kγε(1 +Kγε)

)×((1−Kγα0 + 2Kγε)−

√8Kγε(1 +Kγε)

),

Page 77: Estrategia metodos iterativos

2.2. MÉTODO PREDICTOR: EL MÉTODO SIMPLIFICADO DE LA SECANTE 63

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.5: Región de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método tipo secante correspondientea λ = 0 y tomando α = 1

16 .

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.6: Región de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método tipo secante correspondientea λ = 1

4 y tomando α = 120 .

la ecuación (2.12) tiene dos raíces reales si y solo si ∆ > 0. Analizamos ahora los dos factoresde ∆. Por hipótesis, tenemos que Kγα0 < 1, de manera que ∆ > 0 si

1−Kγα0 + 2Kγε >√

8Kγε(1 +Kγε),

y operando llegamos a

(1−Kγα0)2 − 4(1 +Kγα0)Kγε− 4(Kγε)2 > 0,

que conduce a la segunda condición de (2.11).Notemos que

1−Kγα0 + 2Kγε >√

8Kγε(1 +Kγε) > 0,

de manera que la menor raíz real positiva de (2.12) es:

R =1−Kγα0 + 2Kγε−

√(1−Kγα0)2 − 4(1 +Kγα0)Kγε− 4(Kγε)2

4Kγ . (2.13)

Probamos a continuación queKγ(2R+α0) < 1. Para ello, probamos previamente queKγ(2ε+α0) < 1. A partir de la segunda condición de (2.11), tenemos

Kγα0 + 2Kγε <√

2(1 + (Kγα0)2)− 1.

Además, como √2(1 + (Kγα0)2)− 1 < 1,

Page 78: Estrategia metodos iterativos

64 CAPÍTULO 2. SITUACIÓN DIFERENCIABLE

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.7: Región de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método tipo secante correspondientea λ = 3

4 y tomando α = 132 .

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.8: Región de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método tipo secante correspondientea λ = 1

2 y tomando α = 140 .

ya que 2(1+(Kγα0)2) < 4, por verificarseKγα0 < 1, tenemosKγα0+2Kγε = Kγ(α0+2ε) <1. Ahora, observamos que la condición Kγ(2R + α0) < 1 es equivalente a la condición

1 +Kγα0 + 2Kγε−√

(1−Kγα0 + 2Kγε)2 − 8Kγε(1 +Kγε) < 2,

que se satisface trivialmente porque Kγ(α0 + 2ε) < 1. La desigualdad R > ε resulta fácil deprobar a partir de (2.13).

Observemos que en el resultado anterior también podemos considerar la existencia de unaraíz doble. Para ello, basta considerar las desigualdades no estrictas.

A continuación, damos un lema técnico para la sucesión zn dada por el método simpli-ficado de la secante (2.1).

Lema 2.4. Sea zn la sucesión dada por el método simplificado de la secante (2.1). Supon-gamos (H1)–(H4). Si zn−1 6= zn con zn−1, zn ∈ Ω, entonces

(i) F (zn) = (Ln − L0)(zn − zn−1), donde L0 = [z−1, z0;F ] y Ln = [zn−1, zn;F ],

(ii) ‖zn+1 − zn‖ ≤ Kγ(‖zn − z0‖+ ‖zn−1 − z0‖+ ‖z0 − z−1‖)‖zn − zn−1‖.

Demostración. A partir del algoritmo del método simplificado de la secante (2.1),tenemos F (zn−1) + L0(zn − zn−1) = 0, de manera que

F (zn) = F (zn)− F (zn−1)− L0(zn − zn−1) = (Ln − L0)(zn − zn−1).

Page 79: Estrategia metodos iterativos

2.2. MÉTODO PREDICTOR: EL MÉTODO SIMPLIFICADO DE LA SECANTE 65

0.00 0.05 0.10 0.15 0.200.0

0.1

0.2

0.3

0.4

0.5

Figura 2.9: Dominios de parámetros de los métodos tipo secante asociados al teorema 2.2cuando λ = 0, 1

4 ,12 ,

34 (regiones verde, rosa, amarilla y morada, respectivamente).

Por otra parte,

‖zn+1 − zn‖ ≤ ‖L−10 ‖‖F (zn)‖

≤ ‖L−10 ‖‖Ln − L0‖‖zn − zn−1‖

≤ Kγ(‖zn − z0‖+ ‖zn−1 − z−1‖)‖zn − zn−1‖≤ Kγ(‖zn − z0‖+ ‖zn−1 − z0‖+ ‖z0 − z−1‖)‖zn − zn−1‖.

A continuación, presentamos el siguiente resultado de convergencia semilocal para el mé-todo simplificado de la secante (2.1).

Teorema 2.5. Sean X e Y dos espacios de Banach y F : Ω ⊂ X → Y un operador definidoen un conjunto abierto convexo no vacío Ω. Suponemos que se cumplen las condiciones (H1)–(H4) y (2.11). Si B(z0, R) ⊂ Ω, con R dado en (2.13), entonces la sucesión zn dada porel método simplificado de la secante (2.1) está bien definida y converge a una solución z∗

de la ecuación F (x) = 0. Además zn, z∗ ∈ B(z0, R) y z∗ es única en B(z0, r) ∩ Ω, donder = 1

Kγ−R− α0.

Demostración. Comenzamos probando que la sucesión zn está bien definida; es decir,zn ∈ B(z0, R) ⊂ Ω, para todo n ∈ N. Lo haremos por inducción matemática sobre n. Enprimer lugar, consideramos z1 = z0 − L−1

0 F (z0), donde L0 = [z−1, z0;F ]. En este caso, por ellema 2.3, tenemos

‖z1 − z0‖ = ‖L−10 F (z0)‖ ≤ ε < R.

Luego, z1 ∈ B(z0, R) ⊂ Ω y podemos definir z2 = z1 − L−10 F (z1).

A continuación, por el lema 2.4, tenemos

‖z2 − z1‖ ≤ Kγ(‖z1 − z0‖+ ‖z0 − z−1‖)‖z1 − z0‖ ≤ Kγ(ε+ α0)ε.

Page 80: Estrategia metodos iterativos

66 CAPÍTULO 2. SITUACIÓN DIFERENCIABLE

Por tanto, de (2.12), (2.13) y Kγ(2R + α0) < 1, se sigue

‖z2 − z0‖ ≤ ‖z2 − z1‖+ ‖z1 − z0‖≤ (1 +Kγ(ε+ α0))ε

≤(

1 + Kγ(ε+ α0)1−Kγ(2R + α0)

= R.

Luego, z2 ∈ B(z0, R) ⊂ Ω y podemos definir z3 = z2 − L−10 F (z2).

Utilizando inducción matemática sobre n, suponemos que zj ∈ B(z0, R) ⊂ Ω, para j =2, 3, . . . , n,

‖zn − zn−1‖ < Kγ(2R + α0)‖zn−1 − zn−2‖,

‖zn − z0‖ ≤(

1 +Kγ(ε+ α0)n−2∑i=0

(Kγ(2R + α0))i)ε < R.

Entonces, zn+1 = zn − L−10 F (zn) está bien definido. Además,

‖zn+1−zn‖ ≤ Kγ(‖zn−z0‖+‖zn−1−z0‖+‖z0−z−1‖)‖zn−zn−1‖ < Kγ(2R+α0)‖zn−zn−1‖

‖zn+1 − z0‖ ≤ ‖zn+1 − zn‖+ ‖zn − z0‖≤ Kγ(2R + α0)‖zn − zn−1‖+ ‖zn − z0‖≤ (Kγ(2R + α0))n−1‖z2 − z1‖+ ‖zn − z0‖

Kγ(ε+ α0)(Kγ(2R + α0))n−1 +Kγ(ε+ α0)n−2∑j=0

(Kγ(2R + α0))j + 1 ε

<

(1 + Kγ(ε+ α0)

1−Kγ(2R + α0)

= R

y la sucesión zn está entonces bien definida.Por otra parte, resulta evidente que

‖zn+1 − zn‖ ≤ Kγ(ε+ α0)(Kγ(2R + α0))n−1,

y, como Kγ(2R + α0) < 1, se sigue que zn es una sucesión de Cauchy, y por tanto con-vergente a un punto z∗ ∈ B(z0, R). Veamos que z∗ es solución de la ecuación F (x) = 0.Como

‖F (zn)‖ ≤ ‖L0 − Ln‖‖zn − zn−1‖≤ K (‖zn − z0‖+ ‖zn−1 − z−1‖) ‖zn − zn−1‖< K(2R + α0)‖zn − zn−1‖,

por la continuidad del operador F , es fácil ver que F (z∗) = 0, puesto que lımn→∞

‖F (zn)‖ = ‖F (x∗)‖ = 0.Finalmente, probamos la unicidad de la solución z∗ en B(z0, r)∩Ω, donde r = 1

Kγ−R−α0.

Suponemos entonces que tenemos otra solución distinta y∗ ∈ B(z0, r) ∩ Ω de F (x) = 0.Consideramos

F (y∗)− F (z∗) =∫ y∗

z∗F ′(u) du =

∫ 1

0F ′(z∗ + t(y∗ − z∗))(y∗ − z∗) dt = 0,

Page 81: Estrategia metodos iterativos

2.2. MÉTODO PREDICTOR: EL MÉTODO SIMPLIFICADO DE LA SECANTE 67

y el operador J =∫ 1

0F ′(z∗ + t(y∗ − z∗)) dt. Teniendo en cuenta

‖I − L−10 J‖ ≤ ‖L−1

0 ‖‖L0 − J‖

≤ ‖L−10 ‖

∫ 1

0‖F ′(z∗ + t(y∗ − z∗))− L0‖ dt

≤ ‖L−10 ‖

∫ 1

0(‖F ′(z∗ + t(y∗ − z∗))− F ′(z0)‖+ ‖F ′(z0)− L0‖) dt

≤ γ∫ 1

02K‖z∗ + t(y∗ − z∗)− z0‖ dt+ γ‖F ′(z0)− L0‖

≤ γ∫ 1

02K ((1− t)‖z∗ − z0‖+ t‖y∗ − z0‖) dt+Kγ‖z0 − z−1‖

< Kγ(R + r + α0)= 1

y el lema de Banach (lema 1.22), se sigue que J es inversible y, por tanto, y∗ = z∗. Notemosque r > R > 0, puesto que Kγ(2R + α0) < 1, por cumplirse (2.11) (véase el lema 2.3).

2.2.2. AccesibilidadSi consideramos de nuevo la ecuación compleja F (z) = z3 − 1 = 0 y observamos las

regiones de accesibilidad asociadas a la raíz z = 1 para el método simplificado de la secante(2.1) (región roja) y los métodos tipo secante para distintos valores de λ (λ = 0 (regiónverde), λ = 1

4 (región rosa), λ = 12 (región amarilla) y λ = 3

4 (región morada)) en lascondiciones indicadas anteriormente, vemos claramente la mejora que se consigue tomandodistintos valores del parámetro α0 en las figuras 2.10–2.17. Notamos que las regiones estánsuperpuestas.

Nuestro siguiente objetivo es comparar con mayor exactitud los dominios de parámetrosde los métodos tipo secante con el del simplificado de la secante (2.1). Para ello, tenemos querepresentar los mismos valores en los ejes de los planos donde representamos gráficamentelos dominios de los parámetros. Para ello, tenemos que escribir β en función de γ, de maneraque podemos representar los valores de los inversos de las mismas diferencias divididas. Así,si L−1

0 existe y ‖L−10 ‖ ≤ ε, tenemos

‖I − L−10 A0‖ ≤ ‖L−1

0 ‖ ‖L0 − A0‖ ≤ γK‖y0 − x−1‖ ≤ γKλα

y, siempre que γKλα < 1,‖A−1

0 ‖ ≤γ

1− γKλα = β.

Como se puede observar en la figura 2.18, el dominio de parámetros del método simpli-ficado de la secante (2.1) resuelve el problema que tenían los métodos tipo secante cuandolos valores de α0 o ε son pequeños. Fijado un valor de Kγα0 perteneciente al dominio deparámetros, observamos que el valor de Kγε solo está acotado superiormente (no inferior-mente). Por ello, en las regiones de accesibilidad del método simplificado de la secante (2.1)no aparecen zonas huecas conteniendo a la raíz, tal y como ocurre para los métodos tiposecante. Notamos que las regiones están superpuestas.

Page 82: Estrategia metodos iterativos

68 CAPÍTULO 2. SITUACIÓN DIFERENCIABLE

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.10: Regiones de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método simplificado de la secante(región roja) y el método tipo secante co-rrespondiente a λ = 0 (región verde) y to-mando α = 1

8 .

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.11: Regiones de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método simplificado de la secante(región roja) y el método tipo secante co-rrespondiente a λ = 3

4 (región morada) ytomando α = 1

8 .

2.3. Método iterativo híbrido (predictor-corrector)

A partir de lo visto anteriormente, el objetivo principal es ahora construir, apoyándonosen el método simplificado de la secante (2.1), una modificación de los métodos tipo secanteque mejore su dominio de parámetros y su región de accesibilidad.

2.3.1. Construcción del método

Como se observa en la figura 2.18, el dominio de parámetros del método simplificado dela secante (2.1) no tiene los problemas de accesibilidad de los dominios de parámetros de losmétodos tipo secante. Trataremos entonces de asegurar que, para una terna inicial (α0, γ, ε)que satisfaga las condiciones dadas en (2.11) y estar así en el dominio de parámetros delmétodo simplificado de la secante (2.1), podamos obtener una terna (α, β, η) que satisfagalas condiciones dadas en (2.5) después de realizar un cierto número de iteraciones N0 conel método simplificado de la secante (2.1), de manera que estemos en condiciones de podergarantizar la convergencia de la familia de métodos tipo secante. Cuando esto ocurra, podre-mos considerar la terna (αN0 , βN0 , ηN0) como terna inicial (α, β, η) de la familia de métodostipo secante.

Nuestro objetivo inmediato es entonces construir una sencilla modificación de la familiade métodos tipo secante que sea convergente al empezar en los mismos puntos de salida quegarantizan la convergencia del método simplificado de la secante (2.1). Así, consideramos el

Page 83: Estrategia metodos iterativos

2.3. MÉTODO ITERATIVO HÍBRIDO (PREDICTOR-CORRECTOR) 69

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.12: Regiones de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método simplificado de la secante(región roja) y el método tipo secante co-rrespondiente a λ = 0 (región verde) y to-mando α = 1

10 .

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.13: Regiones de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método simplificado de la secante(región roja) y el método tipo secante co-rrespondiente a λ = 3

4 (región morada) ytomando α = 1

10 .

método iterativo híbrido (predictor-corrector) dado por

dados z−1, z0 en Ω,zi+1 = zi − [z0, z−1;F ]−1F (zi), i = 0, 1, . . . , N0 − 1,x−1 = zN0−1, x0 = zN0 ,

xn+1 = xn − [λxn + (1− λ)xn−1, xn;F ]−1F (xn), λ ∈ [0, 1), n ≥ 0,

(2.14)

donde z−1 y z0 satisfacen (2.11), mientras que x−1 = zN0−1 y x0 = zN0 satisfacen (2.5). Paraque el método híbrido (2.14) sea convergente, nos planteamos dos cuestiones:

1. Localizar z−1 y z0 de manera que el método predictor, el método simplificado de lasecante (2.1), sea convergente.

2. Utilizando la convergencia del método predictor, calcular un valor N0 tal que zN0−1 yzN0 sean considerados puntos iniciales a partir de los cuales la convergencia del métodocorrector, la familia de métodos tipo secante para un valor fijo de λ, esté garantizada.

Así, utilizamos el método simplificado de la secante (2.1) durante un número finito depasos N0 hasta que zN0−1 = x−1 y zN0 = x0 cumplan las condiciones dadas en (2.5) y, después,aplicaremos un método de la familia de métodos tipo secante en vez del método simplificadode la secante (2.1). La clave del problema está entonces en garantizar la existencia de N0.

Page 84: Estrategia metodos iterativos

70 CAPÍTULO 2. SITUACIÓN DIFERENCIABLE

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.14: Regiones de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método simplificado de la secante(región roja) y el método tipo secante co-rrespondiente a λ = 0 (región verde) y to-mando α = 1

20 .

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.15: Regiones de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método simplificado de la secante(región roja) y el método tipo secante co-rrespondiente a λ = 1

4 (región rosa) y to-mando α = 1

20 .

2.3.2. Convergencia semilocal del método

A continuación, vamos a estudiar la convergencia semilocal del método (2.14). A partirdel método predictor, consideramos la siguiente situación. Dadas las aproximaciones inicialesz−1 y z0, consideramos la sucesión zn definida por el método simplificado de la secante(2.1) y denotamos M = Kγ(2R + α0). Para que el método simplificado de la secante (2.1)sea convergente, sabemos que la terna inicial (α0, γ, ε) debe verificar las condiciones dadas en(2.11). Nos planteamos ahora cómo encontrar N0 de manera que, a partir de la iteración N0del método simplificado de la secante (2.1), podamos considerar la familia de métodos tiposecante con x−1 = zN0−1 y x0 = zN0 cumpliendo (2.5).

En primer lugar, observamos que la definición de la terna inicial (α0, β0, η0) para la familiade métodos tipo secante es inmediata sin más que tener en cuenta β0 = γ

1−M y η0 = ε,puesto que

‖I − L−10 A0‖ ≤ ‖L−1

0 ‖ ‖L0 − A0‖ ≤ γKλα0 < γKα0 < M < 1.

A continuación, vamos iterando para definir las ternas (αn, βn, ηn) asociadas a cada zn. Paraello, procedemos de la siguiente forma.

Primer paso del método predictor: definición de la terna (α1, β1, η1).Como

‖z1 − z0‖ = ‖L−10 F (z0)‖ ≤ ε = η0 = α1,

Page 85: Estrategia metodos iterativos

2.3. MÉTODO ITERATIVO HÍBRIDO (PREDICTOR-CORRECTOR) 71

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.16: Regiones de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método simplificado de la secante(región roja) y el método tipo secante co-rrespondiente a λ = 0 (región verde) y to-mando α = 1

40 .

0.9 1.0 1.1 1.2 1.3-0.2

-0.1

0.0

0.1

0.2

Figura 2.17: Regiones de accesibilidad de laraíz z = 1 de la ecuación F (z) = z3− 1 = 0para el método simplificado de la secante(región roja) y el método tipo secante co-rrespondiente a λ = 0 y tomando α = 1

64 .

‖I − L−10 A1‖ ≤ ‖L−1

0 ‖ ‖L0 − A1‖≤ γK (‖λz1 + (1− λ)z0 − z−1‖+ ‖z1 − z0‖)≤ γK ((1 + λ) ‖z1 − z0‖+ ‖z0 − z−1‖)≤ γK ((1 + λ)R + α0)< M,

‖A−11 ‖ = ‖[λz1 + (1− λ)z0, z1;F ]−1‖ ≤ γ

1−M = β1,

‖F (z1)‖ ≤ ‖L1 − L0‖ ‖z1 − z0‖≤ K (‖z0 − z−1‖+ ‖z1 − z0‖) ‖z1 − z0‖≤ K(α0 + ε) ‖z1 − z0‖,

‖z2 − z1‖ ≤ ‖L−10 ‖ ‖F (z1)‖ ≤ γK(α0 + ε)η0 ≤ γK(2R + α0)η0 = Mη0 = η1,

siempre que M < 1. Además, η1 = Mη0 < η0 si M < 1.

Segundo paso del método predictor: definición de la terna (α2, β2, η2).Como

‖z2 − z1‖ = ‖L−10 F (z1)‖ ≤ ‖L−1

0 ‖ ‖F (z1)‖ ≤ γK(α0 + ε)η0 ≤ η1 = α2,

Page 86: Estrategia metodos iterativos

72 CAPÍTULO 2. SITUACIÓN DIFERENCIABLE

0.00 0.05 0.10 0.15 0.200.0

0.2

0.4

0.6

0.8

1.0

Figura 2.18: Dominios de parámetros del método simplificado de la secante (2.1) asociadoal teorema 2.5 (región roja) y de los métodos tipo secante asociados al teorema 2.2 cuandoλ = 0, 1

4 ,12 ,

34 (regiones verde, rosa, amarilla y morada, respectivamente).

‖I − L−10 A2‖ ≤ ‖L−1

0 ‖ ‖L0 − A2‖≤ γK (‖λz2 + (1− λ)z1 − z−1‖+ ‖z2 − z0‖)≤ γK ((1 + λ)‖z2 − z0‖+ (1− λ)‖z1 − z0‖+ ‖z0 − z−1‖)≤ γK(2R + α0)= M,

‖A−12 ‖ =

∥∥∥[λz2 + (1− λ)z1, z1;F ]−1∥∥∥ ≤ γ

1−M = β2,

‖F (z2)‖ ≤ ‖L2 − L0‖ ‖z2 − z1‖≤ K (‖z1 − z−1‖+ ‖z2 − z0‖) ‖z2 − z1‖≤ K(2R + α0) ‖z2 − z1‖,

‖z3 − z2‖ ≤ ‖L−10 ‖ ‖F (z2)‖ ≤ γK(2R + α0)‖z2 − z1‖ ≤Mη1 = η2,

siempre que M < 1. Además, α2 = η1 = Mη0 = Mα1 < α1 y η2 = Mη1 = M2η0 < η0 siM < 1.

n-ésimo paso del método predictor: definición de la terna (αn, βn, ηn).Como

‖zn − zn−1‖ = ‖L−10 F (zn−1)‖ ≤ ‖L−1

0 ‖ ‖F (zn−1)‖≤ γK(2R + α0)‖zn−1 − zn−2‖≤ γK(2R + α0)ηn−2

= Mηn−2 = ηn−1 = αn,

Page 87: Estrategia metodos iterativos

2.3. MÉTODO ITERATIVO HÍBRIDO (PREDICTOR-CORRECTOR) 73

‖I − L−10 An‖ ≤ ‖L−1

0 ‖ ‖L0 − An‖≤ γK (‖λzn + (1− λ)zn−1 − z−1‖+ ‖zn − z0‖)≤ γK ((1 + λ)‖zn − z0‖+ (1− λ)‖zn−1 − z0‖+ ‖z0 − z−1‖)≤ γK(2R + α0)= M,

‖A−1n ‖ =

∥∥∥[λzn + (1− λ)zn−1, zn;F ]−1∥∥∥ ≤ γ

1−M = βn,

‖F (zn)‖ ≤ ‖Ln − L0‖ ‖zn − zn−1‖≤ K (‖zn−1 − z−1‖+ ‖zn − z0‖) ‖zn − zn−1‖≤ K(2R + α0) ‖zn − zn−1‖,

‖zn+1 − zn‖ ≤ ‖L−10 ‖ ‖F (zn)‖ ≤ γK(2R + α0)‖zn − zn−1‖ ≤Mηn−1 = ηn,

siempre que M < 1. Además, αn = ηn−1 = Mn−1η0 = Mn−1α1 < α1 y ηn = Mηn−1 =Mnη0 < η0 si M < 1.

Una vez construida la terna (αn, βn, ηn), formada a partir de las sucesiones reales αn,βn y ηn, buscamos un valor N0 ∈ N, de manera que la terna (αN0 , βN0 , ηN0) verifique lascondiciones de convergencia dadas en (2.5) para la familia de métodos tipo secante.

En primer lugar, consideramos la correspondiente primera condición de (2.5):

ηN0

αN0 + ηN0

<3−√

52 .

Como ηn = Mηn−1 y αn = ηn−1, la condición anterior se transforma en

M

1 +M<

3−√

52 ⇔ M <

√5− 12 .

Debido al tipo de sucesiones que hemos definido y las cotas que hemos utilizado, observamosque el cálculo de nuevas iteraciones con el método predictor no permite verificar la condicióna partir de un n, luego esta condición tendremos que imponerla inicialmente. Notemos queesta condición no representa una restricción excesiva.

En segundo lugar, la correspondiente segunda condición de (2.5) se transforma en

KβN0 <ηN0

(αN0 + ηN0)(αN0 + ηN0 − λ(αN0 − ηN0)) .

Luego,

1−M <MηN0−1

(1 +M)ηN0−1(1 +M − λ(1−M))ηN0−1= M

(1 +M)(1 +M − λ(1−M))ηN0−1,

de manera queKγηN0−1 <

M(1−M)(1 +M)(1 +M − λ(1−M)) .

Page 88: Estrategia metodos iterativos

74 CAPÍTULO 2. SITUACIÓN DIFERENCIABLE

AsíMN0−1Kγη0 <

M(1−M)(1 +M)(1 +M − λ(1−M))

y teniendo en cuenta M < 1 y η0 = ε, escribimos

N0 > 1 +log

(M(1−M)

(1+M)(1+M−λ(1−M))

)− log (Kγε)

logM .

En consecuencia, una vez fijado λ ∈ [0, 1) y denotado la parte entera del número real t por[t], tomamos

N0 = 1 +1 +

log(

M(1−M)(1+M)(1+M−λ(1−M))

)− log (Kγε)

logM

(2.15)

y ya podemos asegurar que los métodos tipo secante convergen cuando parten de los puntosx−1 = zN0−1 y x0 = zN0 , donde N0 está definido en (2.15).

Finalmente, una vez estimado a priori el valor de N0, resumimos todo lo anterior en elsiguiente resultado.

Teorema 2.6. Sean X e Y dos espacios de Banach y F : Ω ⊂ X → Y un operador definidoen un conjunto abierto convexo no vacío Ω. Supongamos que se cumplen las condiciones(H1)–(H4) y (2.11). Si B(z0, R) ⊂ Ω, con R dado en (2.13), y M = Kγ(2R + α0) <

√5−12 ,

entonces la sucesión dada por el método híbrido (2.14) está bien definida y converge a unasolución de la ecuación F (x) = 0, donde N0 está definido en (2.15).

2.4. AplicaciónHemos justificado anteriormente que la aplicación de los métodos tipo secante es más

restrictiva que la del método simplificado de la secante (2.1). Ilustrémoslo con un ejemplo.Consideramos la siguiente ecuación integral no lineal de tipo Hammerstein

x(s) = 1 + 12

∫ 1

0G(s, t)x(t)2 dt, s ∈ [0, 1], (2.16)

donde x ∈ C[0, 1], t ∈ [0, 1] y G es la función de Green en [0, 1]× [0, 1].A continuación, transformamos la ecuación integral (2.16) en un problema de dimensión

finita, tal y como se hizo en la sección 1.6.1 del capítulo 1, de manera que obtenemos elsiguiente sistema de ecuaciones no lineales:

F (x) ≡ x− 1− 12A x = 0, F : R8 −→ R8, (2.17)

donde

x = (x1, x2, . . . , x8)T , 1 = (1, 1, . . . , 1)T , A = (aij)8i,j=1, x = (x2

1, x22, . . . , x

28)T .

Además,[u,v;F ] = I − 1

2A diagz,

donde z = (z1, z2, . . . , z8)T y zi = ui + vi, para todo i = 1, 2, . . . , 8.

Page 89: Estrategia metodos iterativos

2.4. APLICACIÓN 75

Eligiendo z−1 = (9/10, 9/10, . . . , 9/10)T y z0 = (1, 1, . . . , 1)T como puntos de salida yla norma del máximo, obtenemos α0 = 0.1, γ = 1.1305 . . ., ε = 0.0687 . . ., K = 0.0617 . . .,Kγα0 = 0.0069 . . . y Kγε = 0.0047 . . . Por tanto, se puede ver que se verifican las doscondiciones de (2.11) y podemos aplicar entonces el método simplificado de la secante (2.1)para aproximar una solución del sistema (2.17). Por contra, no podemos utilizar los métodostipo secante, ya que la primera condición de (2.5) no se satisface, puesto que

η

α + η= 0.4072 . . . > 3−

√5

2 = 0.3819 . . . ,

donde α = α0 y η = ε.Por el teorema 2.5, el método simplificado de la secante (2.1) es convergente y, después de

ocho iteraciones y usando el criterio de parada ‖zn− zn−1‖ < 10−16, obtenemos la aproxima-ción numérica x∗ = (x∗1, x∗2, . . . , x∗8)T de la solución de (2.17) que vemos en la tabla 2.1. Enla tabla 2.2 mostramos los errores ‖zn − x∗‖ obtenidos usando el mismo criterio de parada.Notemos que el vector dado en la tabla 2.1 es una buena aproximación de la solución delsistema (2.17), puesto que ‖F (x∗)‖ ≤ constante × 10−16. Mostramos la sucesión ‖F (zn)‖en la tabla 2.2.

i x∗i i x∗i i x∗i i x∗i1 1.005450 . . . 3 1.051629 . . . 5 1.069365 . . . 7 1.025815 . . .2 1.025815 . . . 4 1.069365 . . . 6 1.051629 . . . 8 1.005450 . . .

Tabla 2.1: Aproximación de la solución x∗ de (2.17)

n ‖zn − x∗‖ ‖F (zn)‖−1 1.6936 . . .× 10−1 1.5004 . . .× 10−1

0 6.9365 . . .× 10−2 6.1779 . . .× 10−2

1 6.6461 . . .× 10−4 5.9142 . . .× 10−4

2 8.6314 . . .× 10−6 7.6848 . . .× 10−6

3 1.1194 . . .× 10−7 9.9676 . . .× 10−8

4 1.4513 . . .× 10−9 1.2922 . . .× 10−9

5 1.8814 . . .× 10−11 1.6752 . . .× 10−11

6 2.4390 . . .× 10−13 2.1717 . . .× 10−13

7 3.1619 . . .× 10−15 2.8154 . . .× 10−15

Tabla 2.2: Errores absolutos obtenidos con el método simplificado de la secante y ‖F (zn)‖

Además, por el teorema 2.5, la existencia de la solución está garantizada enB(z0, 1.1683 . . .)y es única en B(z0, 13.0286 . . .).

Ahora, vamos a aplicar el método híbrido (2.14) con λ = 12 para aproximar la solución

de (2.17) dada en la tabla 2.1. Para esto, teniendo en cuenta que M = Kγ(2R + α0) =0.0166 . . . < 0.6180 . . . =

√5−12 , calculamos el valor N0 determinado por el teorema 2.6. De

acuerdo con la fórmula (2.15), N0 = 1 para λ = 12 ; por tanto, después de una iteración del

Page 90: Estrategia metodos iterativos

76 CAPÍTULO 2. SITUACIÓN DIFERENCIABLE

método simplificado de la secante (2.1), aplicamos el método tipo secante correspondiente aλ = 1

2 y obtenemos la solución aproximada dada en la tabla 2.1 después de tres iteracionesmás. En la tabla 2.3 se pueden ver los errores ‖xn−x∗‖ con el criterio de parada ‖xn−xn−1‖ <10−16, así como la sucesión ‖F (xn)‖.

n ‖xn − x∗‖ ‖F (xn)‖−1 1.6936 . . .× 10−1 1.5004 . . .× 10−1

0 6.9365 . . .× 10−2 6.1779 . . .× 10−2

1 6.6461 . . .× 10−4 5.9142 . . .× 10−4

2 1.5148 . . .× 10−10 1.3499 . . .× 10−10

3 2.6106 . . .× 10−15 2.3266 . . .× 10−15

Tabla 2.3: Errores absolutos obtenidos con el método híbrido (2.14) correspondiente a λ = 12

y ‖F (xn)‖

Page 91: Estrategia metodos iterativos

Capítulo 3

Situación (no)-diferenciable

En este capítulo, vamos a estudiar la convergencia semilocal de los métodos tipo secantepersiguiendo dos objetivos. En primer lugar, a partir de una modificación de la técnica dedemostración dada por las relaciones de recurrencia en el teorema 2.2 del capítulo anterior,obtenemos un resultado de convergencia semilocal para la familia de métodos tipo secante quemejora notablemente el dominio de parámetros asociado al teorema 2.2. Además, el resultadoasí obtenido proporciona un resultado nuevo de convergencia semilocal cuando el operadorimplicado F es no diferenciable, situación habitualmente no contemplada y que se deducegracias a la novedosa condición que se exige a la diferencia dividida de primer orden de F .

En la sección 3.1 recordamos el principal problema que presenta el estudio de la conver-gencia semilocal dado para la familia de métodos tipo secante en el capítulo anterior, que,tal y como hemos visto, es que limita mucho la aplicación de estos métodos para resolverF (x) = 0. Además, presentamos la novedosa condición que exigiremos a la diferencia divididade primer orden de F . En la sección 3.2 vemos que el dominio de parámetros de la familia demétodos tipo secante se puede mejorar utilizando una modificación de la técnica de demos-tración de la convergencia semilocal presentada, que, además, como hemos dicho antes, va apermitir contemplar situaciones en las que el operador F es no diferenciable. Finalmente, enla sección 3.3, ilustramos lo anterior con dos sistemas no lineales, uno diferenciable y otro nodiferenciable.

3.1. Planteamiento del problemaHemos visto en el capítulo anterior, teorema 2.2, un resultado de convergencia semilocal

bajo la exigencia de que exista la diferencia dividida de primer orden del operador F paracada par de puntos distintos en Ω y de que se cumplan las siguientes condiciones iniciales:

(C1) ‖x0 − x−1‖ = α 6= 0 con x−1, x0 ∈ Ω,(C2) fijado λ ∈ [0, 1), existe A−1

0 = [y0, x0;F ]−1 ∈ L(Y,X), para x0, y0 ∈ Ω, y estal que ‖A−1

0 ‖ ≤ β,(C3) ‖[y0, x0;F ]−1F (x0)‖ ≤ η,(C4) ‖[x, y;F ]− [u, v;F ]‖ ≤ K(‖x−u‖+‖y− v‖), K ≥ 0, x, y, u, v ∈ Ω, x 6= y,

u 6= v.Se obtienen entonces condiciones suficientes para que se dé la convergencia semilocal dela familia de métodos tipo secante, tal y como hemos visto en el teorema 2.2 del capítulo

77

Page 92: Estrategia metodos iterativos

78 CAPÍTULO 3. SITUACIÓN (NO)-DIFERENCIABLE

anterior. Este resultado requiere que el operador F sea diferenciable, además de tener asociadoun dominio de parámetros reducido y, junto con los inconvenientes descritos en el capítuloanterior, implica una deficiente aplicabilidad de los métodos tipo secante.

Si consideramos ecuaciones integrales no lineales de tipo Hammerstein de la forma (1.41),presentadas en la sección 1.6.1, donde

H(t, x(t)) = δx(t)2 + µ|x(t)|, δ, µ ∈ R,

y las trasformamos, mediante un proceso de discretización, en sistemas de ecuaciones nolineales de la forma

Ψ(x) ≡ x− f− A (δ x + µ x) = 0, Ψ : Rm −→ Rm, (3.1)

donde x = (x21, x

22, . . . , x

2m)T , x = (|x1|, |x2|, . . . , |xm|)T y δ, µ ∈ R, es obvio que la función Ψ

definida en (3.1) es no lineal y además no diferenciable si µ 6= 0. Teniendo en cuenta (1.46),consideramos

[u,v; Ψ] = I − A (δdiagz+ µdiagw),donde z = (z1, z2, . . . , zm)T con zi = ui+vi, para todo i = 1, 2, . . . ,m, y w = (w1, w2, . . . , wm)Tcon wi = |ui|−|vi|

ui−vi, para todo i = 1, 2, . . . ,m, de manera que

‖[x,y; Ψ]− [u,v; Ψ]‖ ≤ L+K(‖x− u‖+ ‖y− v‖) con L = 2|µ| ‖A‖ y K = |δ| ‖A‖. (3.2)

Por tanto, si en vez de exigir la condición (C4) para la diferencia dividida de primer ordendel operador F , exigimos que F cumpla una condición del tipo (3.2) en el espacio de BanachX, la dada por

‖[x, y;F ]− [u, v;F ]‖ ≤ L+K(‖x−u‖+‖y−v‖);L,K ≥ 0;x, y, u, v ∈ Ω;x 6= y;u 6= v, (3.3)

podremos considerar situaciones en las que el operador F sea no diferenciable (L 6= 0), comopor ejemplo la indicada anteriormente para la función Ψ definida en (3.1) con µ 6= 0. Por elcontrario, para L = 0, podemos seguir considerando situaciones en las que el operador F seadiferenciable, lo que se contempla en (3.3) si µ = 0.

Así, para el caso anterior, vamos a obtener un nuevo resultado de convergencia semilocalexigiendo la condición (3.3) al operador F , resultado que para L = 0 permitirá mejorar losdominios de parámetros asociados al teorema 2.2 para los métodos tipo secante cuando eloperador F sea diferenciable, mientras que para L 6= 0 permitirá obtener un resultado deconvergencia semilocal en situaciones en las que el operador F sea no diferenciable.

3.2. Mejora de la accesibilidadNuestro primer objetivo es entonces ampliar el dominio de parámetros de los métodos tipo

secante. Para ello desarrollamos una nueva técnica para analizar la convergencia semilocal deestos métodos, que además, como segundo objetivo, va a permitir utilizar los métodos tiposecante para resolver ecuaciones en situaciones en las que el operador F sea no diferenciable.Como en el teorema 2.2, exigiremos que exista una diferencia dividida de primer orden deloperador F para cada par de puntos distintos de Ω.

Por otra parte, si la sucesión xn está generada por los métodos tipo secante, resultaevidente en el estudio de su convergencia que existirán todas las diferencias divididas de

Page 93: Estrategia metodos iterativos

3.2. MEJORA DE LA ACCESIBILIDAD 79

primer orden [yk, xk;F ], salvo que xk = yk = λxk +(1−λ)xk−1, en cuyo caso resulta evidenteque xk = xk−1 y, por tanto, xk−1 = xk = x∗ es una solución de la ecuación F (x) = 0 yxn = x∗, para todo n ≥ k − 1, de manera que la sucesión xn es convergente a la soluciónx∗ de F (x) = 0.

Teniendo en cuenta estas ideas, comenzamos dando un lema técnico que utilizamos pos-teriormente.Lema 3.1. Sea xn la sucesión dada por los métodos tipo secante. Si xm−1 6= xm conxm−1, xm ∈ Ω, entonces

F (xm) = ([xm, xm−1;F ]− Am−1) (xm − xm−1), donde Am−1 = [ym−1, xm−1;F ].

Demostración. A partir de la definición de la sucesión xn se sigue

F (xm) + [ym−1, xm−1;F ](xm − xm−1) = 0,

de manera queF (xm) = F (xm)− F (xm−1)− [ym−1, xm−1;F ](xm − xm−1)

= [xm, xm−1;F ](xm − xm−1)− [ym−1, xm−1;F ](xm − xm−1)= ([xm, xm−1;F ]− Am−1) (xm − xm−1).

A continuación, presentamos el nuevo resultado de convergencia semilocal para los méto-dos tipo secante.Teorema 3.2. Sean X e Y dos espacios de Banach y F : Ω ⊂ X → Y un operador nolineal definido en un dominio abierto convexo no vacío Ω. Supongamos que se cumplen lascondiciones (C1)–(C3) y (3.3). Fijado λ ∈ [0, 1), si la ecuación

h(t) = t

(1− m

1− β (L+K(2t+ (1− λ)α))

)− η = 0, (3.4)

donde m = max β(L+K((1− λ)α + η)), β(L+ (2− λ)Kη) , tiene al menos una raíz po-sitiva, y denotamos por R la raíz positiva más pequeña de (3.4),

β(L+K(2R + (1− λ)α)) < 1 (3.5)

y B(x0, R) ⊂ Ω, entonces la sucesión xn dada por los métodos tipo secante, empezando enx−1 y x0, está bien definida y converge a una solución x∗ de F (x) = 0. Además, la soluciónx∗ y las iteraciones xn pertenecen a B(x0, R) y x∗ es única en B(x0, R) ∩ Ω.

Demostración. Comenzamos probando que la sucesión xn está bien definida, es decir,xn ∈ B(x0, R) ⊂ Ω, para todo n ∈ N. A partir de (C3) se sigue que x1 está bien definido y‖x1 − x0‖ = ‖A−1

0 F (x0)‖ ≤ η < R, por ser R solución de (3.4). Luego, x1 ∈ B(x0, R).A continuación, utilizando (3.3), vemos que

‖I − A−10 A1‖ ≤ ‖A−1

0 ‖‖A0 − A1‖≤ β(L+K(‖y1 − y0‖+ ‖x1 − x0‖))≤ β(L+K((1 + λ)‖x1 − x0‖+ (1− λ)‖x0 − x−1‖))≤ β(L+K((1 + λ)R + (1− λ)α))≤ β(L+K(2R + (1− λ)α))< 1,

Page 94: Estrategia metodos iterativos

80 CAPÍTULO 3. SITUACIÓN (NO)-DIFERENCIABLE

y por el lema de Banach (lema 1.22), tenemos que existe A−11 y es tal que

‖A−11 ‖ ≤

β

1− β(L+K(2R + (1− λ)α)) .

Además, por el lema 3.1, se sigue F (x1) = ([x1, x0;F ]− A0) (x1 − x0), de manera que

‖F (x1)‖ ≤ ‖[x1, x0;F ]− A0‖ ‖x1 − x0‖≤ (L+K‖y0 − x1‖)‖x1 − x0‖≤ (L+K(‖y0 − x0‖+ ‖x1 − x0‖))‖x1 − x0‖≤ (L+K((1− λ)α + η))‖x1 − x0‖.

En consecuencia,

‖x2 − x1‖ ≤ ‖A−11 ‖ ‖F (x1)‖

≤ β(L+K((1− λ)α + η))1− β(L+K(2R + (1− λ)α)) ‖x1 − x0‖

≤ P‖x1 − x0‖< η,

donde P = m

1− β(L+K(2R + (1− λ)α)) < 1, y

‖x2 − x0‖ ≤ ‖x2 − x1‖+ ‖x1 − x0‖ ≤ (1 + P )‖x1 − x0‖ = 1− P 2

1− P ‖x1 − x0‖ <η

1− P = R.

Por lo tanto, x2 ∈ B(x0, R).Ahora, podemos demostrar por inducción matemática sobre n que se cumplen los siguien-

tes tres ítems para n ∈ N:

· El operador A−1n−1 existe y es tal que ‖A−1

n−1‖ ≤β

1− β(L+K(2R + (1− λ)α)) ,

· ‖xn − xn−1‖ ≤ P ‖xn−1 − xn−2‖ ≤ P n−1 ‖x1 − x0‖ < η,

· ‖xn+1 − x0‖ ≤1− P n+1

1− P ‖x1 − x0‖ <η

1− P = R,

siempre que Ai = [yi, xi;F ] sea inversible y xi+1 ∈ B(x0, R), ∀i = 1, 2, . . . , n− 2.En primer lugar, por hipótesis, vemos que

‖I − A−10 An‖ ≤ ‖A−1

0 ‖‖A0 − An‖≤ β(L+K(‖yn − y0‖+ ‖xn − x0‖))≤ β(L+K(λ‖xn − x0‖+ (1− λ)‖xn−1 − x−1‖+ ‖xn − x0‖))≤ β(L+K((1 + λ)‖xn − x0‖+ (1− λ)‖xn−1 − x−1‖))≤ β(L+K((1 + λ)‖xn − x0‖+ (1− λ)‖xn−1 − x0‖+ (1− λ)‖x0 − x−1‖))< β(L+K(2R + (1− λ)α))< 1.

Page 95: Estrategia metodos iterativos

3.2. MEJORA DE LA ACCESIBILIDAD 81

Además,‖A−1

n ‖ ≤β

1− β(L+K(2R + (1− λ)α)) .

En segundo lugar, por el lema 3.1, tenemos F (xn) = ([xn, xn−1;F ]− An−1) (xn − xn−1),de manera que

‖F (xn)‖ ≤ ‖[xn, xn−1;F ]− An−1‖ ‖xn − xn−1‖≤ (L+K‖yn−1 − xn−1‖) ‖xn − xn−1‖≤ (L+K(‖yn−1 − xn−1‖+ ‖xn − xn−1‖)) ‖xn − xn−1‖≤ (L+K((1− λ)‖xn−1 − xn−2‖+ ‖xn − xn−1‖)) ‖xn − xn−1‖≤ (L+ (2− λ)Kη) ‖xn − xn−1‖.

Por lo tanto,

‖xn+1 − xn‖ ≤ ‖A−1n ‖ ‖F (xn)‖

≤ β(L+ (2− λ)Kη)1− β(L+K(2R + (1− λ)α)) ‖xn − xn−1‖

≤ m

1− β(L+K(2R + (1− λ)α)) ‖xn − xn−1‖

= P ‖xn − xn−1‖≤ P n ‖x1 − x0‖< η,

y, en consecuencia,

‖xn+1 − x0‖ ≤n+1∑i=0‖xi − xi−1‖ ≤ (P n + P n−1 + · · ·+ P + 1)‖x1 − x0‖

≤ 1− P n+1

1− P ‖x1 − x0‖

1− P= R,

por ser P < 1. Luego xn+1 ∈ B(x0, R), para todo n ∈ N.Una vez probado que la sucesión xn está bien definida, vemos que es una sucesión de

Cauchy. En efecto, como

‖xn+j − xn‖ ≤ ‖xn+j − xn+j−1‖+ ‖xn+j−1 − xn+j−2‖+ · · ·+ ‖xn+1 − xn‖≤ (P j−1 + P j−2 + · · ·+ P + 1)‖xn+1 − xn‖

= 1− P j

1− P ‖xn+1 − xn‖

<P n

1− P ‖x1 − x0‖,

para j ≥ 1, y P < 1, es claro que xn es una sucesión de Cauchy. Por tanto, la sucesiónxn es convergente.

Page 96: Estrategia metodos iterativos

82 CAPÍTULO 3. SITUACIÓN (NO)-DIFERENCIABLE

Ahora, si lımn→∞

xn = x∗, vemos que x∗ es una solución de F (x) = 0. Como

‖F (xn)‖ ≤ (L+ (2− λ)Kη)‖xn − xn−1‖

y ‖xn − xn−1‖ → 0 cuando n → ∞, por la continuidad del operador F , se sigue fácilmenteque F (x∗) = 0.

Finalmente, probamos la unicidad de la solución x∗ en B(x0, R). Suponemos que tenemosotra solución distinta y∗ ∈ B(x0, R) de la ecuación F (x) = 0. Sea J = [y∗, x∗;F ]. Si J esinversible, tenemos que x∗ = y∗, puesto que J(y∗ − x∗) = F (y∗)− F (x∗). Para ver que J esinversible, por el lema de Banach (lema 1.22), basta con ver que ‖I −A−1

0 J‖ < 1. En efecto,

‖I − A−10 J‖ ≤ ‖A−1

0 ‖ ‖A0 − J‖≤ ‖A−1

0 ‖ ‖[y0, x0;F ]− [y∗, x∗;F ]‖≤ β(L+K(‖y∗ − y0‖+ ‖x∗ − x0‖))≤ β(L+K(‖y∗ − x0‖+ ‖x0 − y0‖+ ‖x∗ − x0‖))≤ β(L+K(R + (1− λ)α +R))= β(L+K(2R + (1− λ)α))< 1.

Luego, el operador J−1 existe. Notemos que existen las diferencias divididas utilizadas [xj, xj−1;F ] y [yj−1, xj−1;F ], ya

que si existe j ∈ N tal que xj = xj−1, entonces xj−1 = x∗ (la solución buscada). Además,si xj−1 = yj−1 = λxj−1 + (1 − λ)xj−2, entonces xj−1 = xj−2, de manera que xj−2 = x∗. Enambos casos, la sucesión xn es convergente trivialmente.

Una vez probada la convergencia semilocal de la familia de métodos tipo secante, nues-tro siguiente objetivo es ver cuál es el dominio de parámetros de esta familia. Para ello,trasformamos la ecuación (3.4) en la siguiente ecuación cuadrática equivalente:

2Kβt2 + (β(L+K((1− λ)α− 2η) +m− 1) t+ η (1− β(L+ (1− λ)Kα)) = 0, (3.6)

y vemos cuándo tiene raíces reales positivas. La ecuación anterior tendrá dos raíces realespositivas si

β(L+K((1− λ)α− 2η) +m− 1 < 0, (3.7)1− β(L+ (1− λ)Kα) > 0, (3.8)

∆ = (β(L+K((1− λ)α− 2η)) +m− 1)2 − 8Kβη (1− β(L+ (1− λ)Kα))

=(β(L+K((1− λ)α− 2η)) +m− 1 +

√8Kβη (1− β(L+ (1− λ)Kα))

)×(β(L+K((1− λ)α− 2η)) +m− 1−

√8Kβη (1− β(L+ (1− λ)Kα))

)> 0.

Observamos que los dos factores de ∆ son < 0 si

β(L+K((1− λ)α− 2η)) +m+√

8Kβη (1− β(L+ (1− λ)Kα)) < 1. (3.9)

Además, se cumple (3.7) si se satisface (3.9). Por lo tanto, la ecuación (3.6) tendrá dos raícesreales positivas si se cumplen (3.8) y (3.9). Si la ecuación (3.6) tiene dos raíces reales positivas,

Page 97: Estrategia metodos iterativos

3.2. MEJORA DE LA ACCESIBILIDAD 83

entonces la raíz positiva más pequeña es:

R = 14Kβ (1−m− β(L+K((1− λ)α− 2η))

−√

(β(L+K((1− λ)α− 2η) +m− 1)2 − 8Kβη (1− β(L+ (1− λ)Kα))).

(3.10)Notemos que también podemos considerar que la ecuación (3.6) tenga una raíz doble sin

más que tener en cuenta la desigualdad no estricta en (3.9).A continuación, vemos cuándo se cumple la condición (3.5) que aparece en el teorema 3.2.

Para ello, distinguimos dos casos:

α ≥ η ⇒ m = β(L+K((1− λ)α + η)),

α ≤ η ⇒ m = β(L+ (2− λ)Kη).

Si α ≥ η, entonces

R = 14Kβ (1− β(2L+K(2(1− λ)α− η))

−√

(β(2L+K(2(1− λ)α− η))− 1)2 − 8Kβη (1− β(L+ (1− λ)Kα)))

y, de (3.5), se sigue

12

(1 +Kβη −

√(β(2L+K(2(1− λ)α− η))− 1)2 − 8Kβη (1− β(L+ (1− λ)Kα))

)< 1,

√(β(2L+K(2(1− λ)α− η))− 1)2 − 8Kβη (1− β(L+ (1− λ)Kα)) > Kβη − 1.

Para que se cumpla la última desigualdad, basta con que se cumpla Kβη − 1 < 0; es decir,

Kβη < 1. (3.11)

Por lo tanto, la condición (3.5) del teorema 3.2 se cumple si se verifica (3.11) cuando α ≥ η.Por otra parte, si α ≤ η, entonces

R = 14Kβ (1− β(2L+K((1− λ)α− λη))

−√

(β(2L+K((1− λ)α− λη))− 1)2 − 8Kβη (1− β(L+ (1− λ)Kα)))

y, de (3.5), se sigue

12 (1 +Kβ((1− λ)α + η)

−√

(β(2L+K((1− λ)α− η))− 1)2 − 8Kβη (1− β(L+ (1− λ)Kα)))< 1,

√(β(2L+K((1− λ)α− η))− 1)2 − 8Kβη (1− β(L+ (1− λ)Kα)) > Kβ((1−λ)α+ η)− 1.

Para que se cumpla la desigualdad anterior basta con que se cumpla Kβ((1−λ)α+η)−1 < 0;es decir,

Kβ((1− λ)α + η) < 1. (3.12)

Page 98: Estrategia metodos iterativos

84 CAPÍTULO 3. SITUACIÓN (NO)-DIFERENCIABLE

Por lo tanto, la condición (3.5) del teorema 3.2 se cumple si se verifica (3.12) cuando α ≤ η.Destacamos que no consideramos la posibilidad de que la ecuación cuadrática (3.4) tenga

una raíz real positiva y otra negativa porque, en este caso, la raíz real positiva nunca cumplela condición (3.5).

En consecuencia, las condiciones de convergencia que se imponen a los parámetros α, β,η, L y K, como son que la ecuación (3.4) tenga al menos una raíz real positiva y que la raízpositiva más pequeña de (3.4), denotada por R, cumpla (3.5), se van a cumplir siempre quese verifiquen (3.8), (3.9) y (3.11) cuando α ≥ η o (3.8), (3.9) y (3.12) cuando α ≤ η. Así,enunciamos entonces el siguiente resultado, cuya demostración se sigue fácilmente sin másque satisfacer las hipótesis del teorema 3.2.

Corolario 3.3. Sean X e Y dos espacios de Banach y F : Ω ⊂ X → Y un operador no linealdefinido en un dominio abierto convexo no vacío Ω. Una vez fijado λ ∈ [0, 1), suponemos quese cumplen las condiciones (C1)–(C3), (3.3), (3.8) y (3.9). Además, si se cumplen (3.11)cuando α ≥ η o (3.12) cuando α ≤ η y B(x0, R) ⊂ Ω, donde R está definido en (3.10) conm = maxβ(L+K((1−λ)α+η)), β(L+(2−λ)Kη), entonces la sucesión xn dada por losmétodos tipo secante, empezando en x−1 y x0, está bien definida y converge a una soluciónx∗ de F (x) = 0. Además, la solución x∗ y las iteraciones xn pertenecen a B(x0, R) y x∗ esúnica en B(x0, R) ∩ Ω.

Ahora, representamos gráficamente el dominio de parámetros asociado al corolario ante-rior. Para representarlo gráficamente, se colorean en un plano xy, con x = Kβη e y = Kβα,los valores de los parámetros que verifican las condiciones (3.8), (3.9) y (3.11), si α ≥ η, o(3.12), si α ≤ η, que se imponen en el corolario anterior. Observamos que las condicionesexigidas a los puntos de salida, (C1)–(C3), introducen los parámetros α, β y η, y la con-dición exigida al operador F , (3.3), introduce los parámetros fijos L y K. A continuación,distinguimos dos casos: el caso diferenciable, L = 0, y el no diferenciable, L 6= 0.

Comenzamos con el caso diferenciable. Como se puede ver en las figuras 3.1 y 3.2, el nuevodominio de parámetros (figura 3.1) resuelve el problema que tienen los métodos tipo secanteen el dominio de parámetros asociado al teorema 2.2 (figura 3.3) cuando los valores de η sonpequeños para un valor fijo de α. Fijado un valor de Kβα perteneciente al dominio de pará-metros, observamos que el valor de Kβη sólo está acotado superiormente y no inferiormente.Notamos que las regiones están superpuestas.

En segundo lugar, representamos el dominio de parámetros asociado al teorema 3.2 cuan-do F es no diferenciable, L 6= 0. En este caso, el dominio de parámetros depende de lacantidad Lβ, que tiene que cumplir que Lβ < 1

2 , sin más que observar la condición (3.9). Así,representamos gráficamente los casos Lβ = 1

10 y Lβ = 15 en las figuras 3.4 y 3.5, respectiva-

mente. Observamos que el dominio de parámetros se reduce al aumentar el valor de Lβ, perosigue teniendo buenas características locales. Notamos que las regiones están superpuestas.

3.3. AplicaciónA continuación ilustramos todo lo visto en la sección anterior con dos sistemas de ecua-

ciones no lineales. En primer lugar, consideramos un sistema de ecuaciones no lineales dife-renciable y vemos que no podemos garantizar la convergencia semilocal de los métodos tiposecante mediante el teorema 2.2, pero si que lo podemos hacer mediante el teorema 3.2. En

Page 99: Estrategia metodos iterativos

3.3. APLICACIÓN 85

0.00 0.05 0.10 0.15 0.20

0.0

0.5

1.0

1.5

2.0

Figura 3.1: Dominios de parámetros de losmétodos tipo secante asociados al corolario3.3 cuando L = 0 y λ = 0, 1

4 ,12 ,

34 (verde,

rosa, amarillo y morado, respectivamente).

0.00 0.05 0.10 0.15 0.20

0.0

0.5

1.0

1.5

2.0

Figura 3.2: Dominios de parámetros de losmétodos tipo secante asociados al teore-ma 2.2 y al corolario 3.3 cuando L = 0 yλ = 0, 1

4 ,12 ,

34 (verde, rosa, amarillo y mora-

do, respectivamente).

segundo lugar, consideramos un sistema de ecuaciones no lineales no diferenciable y vemosque el teorema 3.2 garantiza la convergencia semilocal de los métodos tipo secante.

3.3.1. Sistema de ecuaciones no lineales diferenciableSea la siguiente ecuación integral no lineal de tipo Hammerstein

x(s) = 1 +∫ 1

0G(s, t)x(t)2 dt, s ∈ [0, 1], (3.13)

donde x ∈ C[0, 1] y G es la función de Green en [0, 1]× [0, 1].A continuación, mediante un proceso de discretización, transformamos (3.13) en un pro-

blema de dimensión finita, tal y como se hizo en la sección 1.6.1 del capítulo 1, de maneraque obtenemos el siguiente sistema de ecuaciones no lineales:

F (x) ≡ x− 1− Ax = 0, F : R8 −→ R8, (3.14)

donde

x = (x1, x2, . . . , x8)T , 1 = (1, 1, . . . , 1)T , A = (aij)8i,j=1, x = (x2

1, x22, . . . , x

28)T .

En este caso, el operador diferencia dividida considerado es

[u,v;F ] = I − 12A diagz,

donde z = (z1, z2, . . . , z8)T y zi = ui + vi, para todo i = 1, 2, . . . , 8.

Page 100: Estrategia metodos iterativos

86 CAPÍTULO 3. SITUACIÓN (NO)-DIFERENCIABLE

0.00 0.05 0.10 0.15 0.200.0

0.1

0.2

0.3

0.4

0.5

Figura 3.3: Dominios de parámetros de los métodos tipo secante asociados al teorema 2.2cuando λ = 0, 1

4 ,12 ,

34 (regiones verde, rosa, amarilla y morada, respectivamente).

Eligiendo x−1 =(

910 ,

910 , . . . ,

910

)Ty x0 = (1, 1, . . . , 1)T como puntos de salida, λ = 1

2 yla norma del máximo, obtenemos α = 0.1, β = 1.3035 . . ., η = 0.1556 . . . y K = 0.1235 . . .Vemos entonces que la primera condición de (2.5) del teorema 2.2 no se cumple puesto que

η

α + η= 0.6088 . . . > 3−

√5

2 = 0.3819 . . .

En consecuencia, no podemos garantizar la convergencia del método tipo secante con λ = 12

mediante el teorema 2.2 del capítulo anterior. Sin embargo, si que la podemos garantizarmediante el teorema 3.2, puesto que la correspondiente ecuación (3.4) es

t

(1− (0.0376 . . .)

1− (0.1610 . . .)(2t+ 0.05)

)− (0.1556 . . .) = 0,

que tiene dos raíces reales positivas y la más pequeña, denotada por R = 0.1621 . . ., cumplela condición (3.5):

βK(2R + (1− λ)α) = 0.0602 . . . < 1.

En este caso, utilizando el método tipo secante correspondiente a λ = 12 , después de cinco

iteraciones y usando el criterio de parada ‖xn − xn−1‖ < 10−16, obtenemos la aproximaciónnumérica x∗ = (x∗1, x∗2, . . . , x∗8)T de una solución de (3.14) que vemos en la tabla 3.1. En latabla 3.2 mostramos los errores ‖xn − x∗‖ obtenidos usando el mismo criterio de parada.Notemos que el vector dado en la tabla 3.1 es una buena aproximación de la solución delsistema (3.14), puesto que ‖F (x∗)‖ ≤ constante × 10−16. Mostramos la sucesión ‖F (xn)‖en la tabla 3.2.

Además, por el teorema 3.2, la existencia y unicidad de la solución está garantizada en labola B(x0, 0.1621 . . .).

Page 101: Estrategia metodos iterativos

3.3. APLICACIÓN 87

0.00 0.05 0.10 0.15

0.0

0.5

1.0

1.5

Figura 3.4: Dominios de parámetros de losmétodos tipo secante asociados al corolario3.3 cuando Lβ = 1

10 y λ = 0, 14 ,

12 ,

34 (verde,

rosa, amarillo y morado, respectivamente).

0.00 0.02 0.04 0.06 0.08 0.10 0.12

0.0

0.2

0.4

0.6

0.8

1.0

1.2

Figura 3.5: Dominios de parámetros de losmétodos tipo secante asociados al corolario3.3 cuando Lβ = 1

5 y λ = 0, 14 ,

12 ,

34 (verde,

rosa, amarillo y morado, respectivamente).

i x∗i i x∗i i x∗i i x∗i1 1.012239 . . . 3 1.118079 . . . 5 1.159804 . . . 7 1.058428 . . .2 1.058428 . . . 4 1.159804 . . . 6 1.118079 . . . 8 1.012239 . . .

Tabla 3.1: Aproximación de la solución x∗ de (3.14)

3.3.2. Sistema de ecuaciones no lineales no diferenciableConsideramos ahora la siguiente ecuación integral no lineal de tipo Hammerstein

x(s) = 12 + 3

4

∫ 1

0G(s, t)

(x(t)2 + |x(t)|

)dt, s ∈ [0, 1], (3.15)

donde x ∈ C[0, 1] y G es la función de Green en [0, 1]× [0, 1].A continuación, de nuevo tal y como se hizo en la sección 1.6.1, transformamos (3.15) en

el siguiente sistema de ecuaciones no lineales:

F (x) ≡ x− 12− 3

4A(x + x) = 0, F : R8 −→ R8, (3.16)

dondex = (x1, x2, . . . , x8)T , 1

2=(1

2 ,12 , . . . ,

12

)T, A = (aij)8

i,j=1,

x = (x21, x

22, . . . , x

28)T , x = (|x1|, |x2|, . . . , |x8|)T .

En este caso, el operador diferencia dividida considerado es

[u,v;F ] = I − 34A (diagz+ diagw),

Page 102: Estrategia metodos iterativos

88 CAPÍTULO 3. SITUACIÓN (NO)-DIFERENCIABLE

n ‖xn − x∗‖ ‖F (xn)‖−1 2.5980 . . .× 10−1 2.0008 . . .× 10−1

0 1.5980 . . .× 10−1 1.2355 . . .× 10−1

1 4.1222 . . .× 10−3 3.1494 . . .× 10−3

2 4.1117 . . .× 10−5 3.1489 . . .× 10−5

3 1.0346 . . .× 10−8 9.9173 . . .× 10−9

4 2.5597 . . .× 10−14 1.9590 . . .× 10−14

Tabla 3.2: Errores absolutos obtenidos con el método tipo secante correspondiente a λ = 12 y

‖F (xn)‖

donde z = (z1, z2, . . . , z8)T con zi = ui + vi, para todo i = 1, 2, . . . , 8, y w = (w1, w2, . . . , w8)Tcon wi = |ui|−|vi|

ui−vi, para todo i = 1, 2, . . . , 8.

Eligiendo x−1 =(

25 ,

25 , . . . ,

25

)Ty x0 =

(12 ,

12 , . . . ,

12

)Tcomo puntos de salida, λ = 3

4 yla norma del máximo, obtenemos α = 0.1, β = 1.2170 . . ., η = 0.0824 . . ., L = 0.1853 . . . yK = 0.0926 . . . La ecuación (3.4) se reduce a

t

(1− (0.2376 . . .)

1− (1.2170 . . .)((0.1863 . . .) + (0.0926 . . .)(2t+ 0.0250 . . .)

)− (0.0824 . . .) = 0,

que tiene dos raíces reales positivas y la más pequeña, denotada por R = 0.1211 . . ., cumplela condición (3.5):

β(L+K(2R + (1− λ)α)) = 0.2557 . . . < 1.

Así, mediante el teorema 3.2, podemos garantizar la convergencia semilocal del método tiposecante correspondiente a λ = 3

4 a una solución del sistema (3.16). Es más, por el teorema 3.2,la existencia y unicidad de solución está garantizada en la bola B(x0, 0.1211 . . .).

Después de cuatro iteraciones y usando el criterio de parada ‖xn − xn−1‖ < 10−16, ob-tenemos la aproximación numérica x∗ = (x∗1, x∗2, . . . , x∗8)T de una solución (3.16) que vemosen la tabla 3.3. En la tabla 3.4 mostramos los errores ‖xn − x∗‖ obtenidos usando el mismocriterio de parada. Notemos que el vector dado en la tabla 3.3 es una buena aproximaciónde la solución del sistema (3.16), puesto que ‖F (x∗)‖ ≤ constante × 10−16. Mostramos lasucesión ‖F (xn)‖ en la tabla 3.4.

i x∗i i x∗i i x∗i i x∗i1 0.506462 . . . 3 0.561738 . . . 5 0.583219 . . . 7 0.530722 . . .2 0.530722 . . . 4 0.583219 . . . 6 0.561738 . . . 8 0.506462 . . .

Tabla 3.3: Aproximación de la solución x∗ de (3.16)

Page 103: Estrategia metodos iterativos

3.3. APLICACIÓN 89

n llxn- x*ll IIF(xn)ll - 1 1.8321. .. X 10 1 L5189 ... x 10 1

o 8.3221 ... X 10-2 6.9501 ... x 1 o-2

1 7.8399 ... X 10-4 6.5351 ... X 10- 4

2 1.4181 . .. X 10- 6 1.1832 ... X 1Q-6 3 2.3181 ... X 10- 11 1.9352 ... X 10- 11

Tabla 3.4: Errores a bsolutos obtenidos con el mét odo tipo secante correspondiente a,\ = ~y IIF(xn) 11

Page 104: Estrategia metodos iterativos
Page 105: Estrategia metodos iterativos

Parte III

EL MÉTODO DE STEFFENSEN

91

Page 106: Estrategia metodos iterativos
Page 107: Estrategia metodos iterativos

93

En esta parte del texto consideraremos un operador F : Ω ⊂ X → X, donde Ω es undominio abierto convexo no vacío contenido en un espacio de Banach X, y nos planteamosla aproximación de una solución de la ecuación

F (x) = 0

mediante un método iterativo punto a punto que no evalúe derivadas del operador F encada paso. Este tipo de métodos iterativos tienen gran interés debido a que la derivada deloperador F puede ser costosa de evaluar o porque incluso puede no existir, situaciones que sondesfavorables para la aplicación del método de Newton, cuyo algoritmo, como bien sabemos,está dado por

dado x0 en Ω,xn+1 = xn − [F ′(xn)]−1F (xn), n ≥ 0.

Usualmente la no utilización de derivadas pasa por la aproximación de éstas. Así, comobien sabemos, en el caso de espacios de Banach, podemos considerar el concepto de diferenciadividida. Es conocido que, dado x ∈ X, si consideramos un punto y ∈ X distinto de x,próximo a x, el operador [x, y;F ] representa una aproximación de F ′(x). Utilizando estehecho, es habitual construir métodos iterativos que utilizan diferencias divididas en vez dederivadas.

Como en la parte anterior de este texto, nuestro punto de partida es el método de Newton.Para eliminar de su algoritmo la evaluación de las derivadas del operador F , utilizamos unaaproximación de F ′(x) a partir de determinada diferencia dividida. Como el objetivo singularde esta parte del texto es la construcción de un método iterativo punto a punto, teniendoen cuenta las características del operador considerado y tomando como nodos x y x+ F (x),podemos utilizar éstos para considerar la aproximación F ′(x) ≈ [x, x + F (x);F ]. A partirde esta aproximación, definimos el método de Steffensen, que está dado por el siguientealgoritmo:

dado x0 en Ω,xn+1 = xn − [xn, xn + F (xn);F ]−1F (xn), n ≥ 0.

Evidentemente, el método de Steffensen es un método iterativo punto a punto. Además,por la aproximación de la derivada del operador F considerada en este caso, es conocidoque el método de Steffensen tiene convergencia cuadrática [5]. Por otra parte, como resultaevidente, este método iterativo tiene el mismo coste computacional que el método de Newton.Por tanto, la eficiencia computacional ([35], [45]) del método de Steffensen es la misma que ladel método de Newton. Pese a las buenas características que tiene el método de Steffensen,misma eficiencia computacional que el método de Newton y la no evaluación de derivadas, esmucho menos utilizado que el método de Newton para aproximar soluciones de la ecuaciónF (x) = 0. Nuestro objetivo principal se va a centrar entonces en mejorar la aplicabilidad delmétodo de Steffensen.

Como hemos dicho en la sección 1.5 del capítulo 1, el aspecto central a la hora de estudiarla aplicabilidad de un método iterativo es su accesibilidad. Experimentalmente, podemos verlamediante las cuencas de atracción, que recordamos que son el conjunto de todos los puntosde salida a partir de los cuales el método iterativo converge a una solución de F (x) = 0,fijada una tolerancia o un número máximo de iteraciones.

A continuación, en las figuras 3.6 y 3.7 mostramos las cuencas de atracción asociadas alas tres raíces z∗ = 1, z∗∗ = exp

(2πi3

)y z∗∗∗ = exp

(−2πi

3

)de la ecuación F (z) = z3 − 1 = 0,

Page 108: Estrategia metodos iterativos

94

donde F : C→ C, cuando aplicamos respectivamente los métodos de Newton y de Steffensen.Para representar las cuencas de atracción de las tres raíces de la ecuación anterior, hemosseguido la misma estrategia que la descrita en la sección 1.5.2 para el método de Newton.

-2 -1 0 1 2

-2

-1

0

1

2

Figura 3.6: Cuencas de atracción asociadasa las tres raíces de F (z) = z3 − 1 = 0 parael método de Newton.

-2 -1 0 1 2

-2

-1

0

1

2

Figura 3.7: Cuencas de atracción asociadasa las tres raíces de F (z) = z3 − 1 = 0 parael método de Steffensen.

Vemos que las cuencas de atracción, cuando aplicamos el método de Steffensen, se reducenconsiderablemente con respecto a las del método de Newton, lo que justifica claramente sumenor uso con respecto al de Newton a la hora de resolver ecuaciones no lineales.

También hemos indicado en la sección 1.5 del capítulo 1 que, aparte del estudio empíricode la accesibilidad de un método iterativo dado por las cuencas de atracción, podemos realizarun estudio de la accesibilidad del método iterativo a partir de las condiciones de convergenciaimpuestas al método iterativo, mediante la región de accesibilidad y el dominio de parámetros.

En el capítulo 4 de esta parte del texto realizamos un estudio de la convergencia semilocaldel método de Steffensen mediante el principio de la mayorante de Kantorovich, de maneraque podamos comparar su accesibilidad con la del método de Newton bajo condiciones de tipoKantorovich. Así, vemos que el dominio de parámetros asociado al resultado de convergenciasemilocal del método de Steffensen es más pequeño que el del método de Newton. Parasolventar esta situación, construimos un método iterativo híbrido (predictor-corrector) queno evalúe derivadas en cada paso y con la misma accesibilidad que el método de Newton.

La utilización de la teoría de Kantorovich en el capítulo 4 para estudiar la convergenciasemilocal de los métodos iterativos nos obliga a considerar ecuaciones con operadores diferen-ciables. Así, en el capítulo 5, modificamos las condiciones de convergencia consideradas en elcapítulo 4 y desarrollamos una teoría, basada en relaciones de recurrencia, que proporcionaresultados de convergencia semilocal y permite aproximar soluciones de ecuaciones definidasmediante operadores cualesquiera, tanto diferenciables como no diferenciables. Después, apartir del estudio de los dominios de parámetros asociados a los nuevos resultados, construi-mos un método iterativo híbrido (predictor-corrector) aplicable a ecuaciones con operadorescualesquiera y con una buena accesibilidad de soluciones.

Page 109: Estrategia metodos iterativos

Capítulo 4

Situación diferenciable

Comenzamos este capítulo realizando un estudio de la convergencia semilocal del métodode Steffensen mediante el principio de la mayorante de Kantorovich. Hemos visto antes quepara establecer un resultado de convergencia semilocal se exigen dos tipos de condiciones:condiciones sobre los puntos de salida y condiciones sobre el operador implicado. Comonuestro primer interés se centra en el estudio comparativo de la accesibilidad de los métodosde Newton y de Steffensen a partir de la teoría de Kantorovich, exigimos la misma condiciónal operador F :

‖F ′(x)− F ′(y)‖ ≤ C ‖x− y‖, C ≥ 0, ∀x, y ∈ Ω;es decir, que F ′ sea Lipschitz continua en Ω. Notemos en primer lugar que, a partir de lacondición anterior, siempre existe la diferencia dividida

[x, y;F ] =∫ 1

0F ′ (x+ τ(x− y)) dτ,

para cualesquiera que sean los puntos x, y ∈ Ω. Si x = y, entonces [x, x;F ] = F ′(x), [37].Luego el método de Steffensen está bien definido en cada paso.

A partir del estudio de la convergencia semilocal del método de Steffensen, que realizare-mos mediante la teoría de Kantorovich, probamos que la accesibilidad del método de Newtones mucho mejor que la que se obtiene para el método de Steffensen en las mismas condiciones.

En la sección 4.1 obtenemos un teorema de convergencia semilocal para el método de Stef-fensen mediante la teoría de Kantorovich. Luego, comparamos la accesibilidad de los métodosde Newton y de Steffensen. Adelantamos que las diferencias que se observan experimental-mente con las cuencas de atracción de las tres raíces de la ecuación F (z) = z3 − 1 = 0 seconfirman en el estudio teórico.

A continuación, en la sección 4.2, consideramos el método simplificado de Newton, cuyoalgoritmo es

dado z0 en Ω,zn+1 = zn − [F ′(z0)]−1F (zn), n ≥ 0,

(4.1)

observamos que no se evalúa F ′ en un nuevo punto en cada paso, sino que basta considerarun punto z0 de Ω donde se evalúe F ′ y vemos que este método tiene la misma accesibilidadque el método de Newton.

Teniendo en cuenta lo anterior en la sección 4.3, construimos un método iterativo híbrido(predictor-corrector) considerando el método simplificado de Newton (predictor) en unosprimeros pasos para localizar un punto de salida favorable para el método de Steffensen

95

Page 110: Estrategia metodos iterativos

96 CAPÍTULO 4. SITUACIÓN DIFERENCIABLE

(método corrector). Este método híbrido tiene la misma accesibilidad que el método deNewton, pero no evalúa derivadas en cada paso. En particular, saliendo desde los mismospuntos de salida que el método simplificado de Newton, garantizamos la convergencia delmétodo híbrido. Finalmente, en la sección 4.4, veremos una aplicación en la que consideramosun sistema de ecuaciones no lineales que ilustra todo lo anterior.

4.1. Método corrector: el método de Steffensen

4.1.1. Convergencia semilocalA continuación, suponemos que se satisfacen las siguientes condiciones:(A1) ‖F (x0)‖ ≤ δ,(A2) existe Γ0 = [F ′(x0)]−1 ∈ L(X,X), para x0 ∈ Ω, y es tal que ‖Γ0‖ ≤ θ,(A3) ‖F ′(x)− F ′(y)‖ ≤ C‖x− y‖, C ≥ 0, x, y ∈ Ω.

En primer lugar, establecemos la convergencia semilocal del método de Steffensen, bajo lascondiciones (A1)–(A3), de manera similar a la dada para el método de Newton en el teoremade Newton-Kantorovich (teorema 1.53 del capítulo 1), utilizando entonces el principio de lamayorante de Kantorovich.

Lo primero que vamos a hacer es probar la existencia del operador [x0, y0;F ]−1 ∈ L(X,X)para x0, y0 ∈ Ω. Así,

‖I − Γ0[x0, y0;F ]‖ ≤ ‖Γ0‖‖F ′(x0)− [x0, y0;F ]‖

= ‖Γ0‖∥∥∥∥F ′(x0)−

∫ 1

0F ′(x0 + τ(y0 − x0)) dτ

∥∥∥∥≤ ‖Γ0‖

∫ 1

0‖F ′(x0 + τ(y0 − x0))− F ′(x0)‖ dτ

≤ 12Cδθ,

de modo que, si Cδθ < 2, existe [x0, y0;F ]−1 ∈ L(X,X), para x0, y0 ∈ Ω, y es tal que∥∥∥[x0, y0;F ]−1∥∥∥ ≤ 2θ

2− Cδθ = b.

A continuación, definimos el polinomio cuadrático

q(s) = `

2s2 − s

b+ δ, ` = C

(1 + 1

b

), s ∈ [0, s′], (4.2)

tal que s∗ ≤ s∗∗ < s′, donde denotamos la raíz positiva más pequeña del polinomio q por

s∗ = 1−√

1− 2`δb2

`by la mayor por s∗∗ = 1 +

√1− 2`δb2

`b, y la sucesión sn definida por

s0 = 0,

sn+1 = sn −q(sn)q′(sn) , n ≥ 0.

(4.3)

Observemos que la sucesión sn converge de forma creciente a s∗, sin más que tener encuenta que sn es una sucesión monótona no decreciente y está acotada superiormente pors∗.

Page 111: Estrategia metodos iterativos

4.1. MÉTODO CORRECTOR: EL MÉTODO DE STEFFENSEN 97

Teorema 4.1. Sean X un espacio de Banach y F : Ω ⊂ X → X un operador una vezcontinuamente diferenciable Fréchet definido en un dominio abierto convexo no vacío Ω. Sise cumplen las condiciones (A1)–(A3), se satisfacen las condiciones

Cδθ ≤ 2, `δb2 ≤ 12 (4.4)

y B(x0, s∗+δ) ⊂ Ω, entonces el método de Steffensen converge, a partir de x0, a una solución

x∗ de F (x) = 0. Además, la solución x∗ y las iteraciones xn pertenecen a B(x0, s∗ + δ) y x∗es única en B(x0, s

∗∗ + δ) ∩ Ω, donde s∗∗ = 1+√

1−2`δb2

`b.

Demostración. Probamos la convergencia semilocal del método de Steffensen utilizandoun proceso inductivo.

Notemos que

‖x1 − x0‖ =∥∥∥[x0, y0;F ]−1F (x0)

∥∥∥ ≤ bδ = s1 − s0 < s∗ + δ,

de manera que x1 ∈ B(x0, s∗ + δ) ⊂ Ω y podamos definir x2. A continuación, como

F (x1) = F (x1)− F (x0)− [x0, y0;F ](x1 − x0)

=∫ x1

x0(F ′(z)− F ′(x0)) dz + (F ′(x0)− [x0, y0;F ]) (x1 − x0)

=∫ 1

0(F ′(x0 + τ(x1 − x0))− F ′(x0)) dτ(x1 − x0) + (F ′(x0)− [x0, y0;F ]) (x1 − x0),

vemos que

‖F (x1)‖ ≤ C

2 ‖x1 − x0‖2 + C

2 ‖F (x0)‖‖x1 − x0‖

≤ C

2 (s1 − s0)2 + C

2 q(s0)(s1 − s0)

= C

2 (1− q′(s0)) (s1 − s0)2

= `

2(s1 − s0)2

= q(s1).

Ahora, puesto que la sucesión sn, dada en (4.3), es creciente y el polinomio (4.2) es decre-ciente en [0, s∗], se tiene

‖y1 − x0‖ ≤ ‖x1 − x0‖+ ‖F (x1)‖ ≤ s1 − s0 + q(s1) < s∗ + q(s0) = s∗ + δ.

Notemos que, para poder definir x2, necesitamos la existencia del operador [x1, y1;F ]−1.Teniendo de nuevo en cuenta nuevamente que la sucesión (4.3) es creciente y el polinomio

Page 112: Estrategia metodos iterativos

98 CAPÍTULO 4. SITUACIÓN DIFERENCIABLE

(4.2) es decreciente en [0, s∗], se tiene

‖I − Γ0[x1, y1;F ]‖ ≤ ‖Γ0‖ ‖F ′(x0)− [x1, y1;F ]‖

= ‖Γ0‖ (‖F ′(x0)− F ′(x1)‖+ ‖F ′(x1)− [x1, y1;F ]‖)

≤ ‖Γ0‖(C ‖x1 − x0‖+

∫ 1

0‖F ′(x1 + τ(y1 − x1))− F ′(x1)‖ dτ

)≤ ‖Γ0‖

(C ‖x1 − x0‖+ C

2 ‖F (x1)‖)

≤ ‖Γ0‖(C (s1 − s0) + C

2 q(s1))

≤ ‖Γ0‖(Cs1 + C

2 q(s0))

≤ ‖Γ0‖C(

1− q′(s0)2

)s1

≤ θ(q′(s1) + 1

b

)≤ θ

(q′(s1) + 1

θ

)< 1,

de modo que el operador [x1, y1;F ]−1 existe y es tal que

‖[x1, y1;F ]−1‖ ≤ θ

1− ‖I − Γ0[x1, y1;F ]‖ ≤ −1

q′(s1) .

Entonces,

‖x2 − x1‖ ≤ −q(s1)q′(s1) ≤ s2 − s1,

‖x2 − x0‖ ≤ ‖x2 − x1‖+ ‖x1 − x0‖ ≤ s2 − s0 < s∗ < s∗ + δ

y x2 ∈ B(x0, s∗ + δ) ⊂ Ω, lo que permite definir y2.

Ahora, a partir de

F (xn) = F (xn)− F (xn−1)− [xn−1, yn−1;F ](xn − xn−1)

=∫ xn

xn−1(F ′(z)− F ′(xn−1)) dz + (F ′(xn−1)− [xn−1, yn−1;F ]) (xn − xn−1)

=∫ 1

0(F ′(xn−1 + τ(xn − xn−1))− F ′(xn−1)) dτ(xn − xn−1)

+ (F ′(xn−1)− [xn−1, yn−1;F ]) (xn − xn−1)

=∫ 1

0(F ′(xn−1 + τ(xn − xn−1))− F ′(xn−1)) dτ(xn − xn−1)

+∫ 1

0(F ′(xn−1)− F ′(xn−1 + τ(yn−1 − xn−1) dτ) (xn − xn−1)

Page 113: Estrategia metodos iterativos

4.1. MÉTODO CORRECTOR: EL MÉTODO DE STEFFENSEN 99

yq(sn) = q(sn)− q(sn−1)− q′(sn−1)(sn − sn−1)

=∫ 1

0(q′(sn−1 + τ(sn − sn−1))− q′(sn−1)) dτ(sn − sn−1)

= `∫ 1

0τ(sn − sn−1)2 dτ

= `

2(sn − sn−1)2,

se tiene‖F (xn)‖ ≤ q(sn), ∀n ∈ N,

puesto que

‖F (xn)‖ ≤∫ 1

0Cτ‖xn − xn−1‖2 dτ +

∫ 1

0Cτ‖F (xn−1)‖‖xn − xn−1‖ dτ

≤ C

2 (sn − sn−1)2 + C

2 q(sn−1)(sn − sn−1)

= C

2 (1− q′(sn−1)) (sn − sn−1)2

≤ `

2(sn − sn−1)2

= q(sn).Entonces, como el polinomio q es decreciente en [0, s∗], se sigue

‖yn − x0‖ ≤ ‖xn − x0‖+ ‖F (xn)‖ ≤ sn + q(sn) < s∗ + q(s0) < s∗ + δ

y, por tanto, yn ∈ B(x0, s∗ + δ) ⊂ Ω.

A continuación, probamos la existencia del operador [xn, yn;F ]−1. Como‖I − Γ0[xn, yn;F ]‖ ≤ ‖Γ0‖‖F ′(x0)− [xn, yn;F ]‖

= ‖Γ0‖ (‖F ′(x0)− F ′(xn)‖+ ‖F ′(xn)− [xn, yn;F ]‖)

≤ ‖Γ0‖(C‖xn − x0‖+

∫ 1

0‖F ′(xn + τ(yn − xn))− F ′(xn)‖ dτ

)≤ ‖Γ0‖

(C‖xn − x0‖+ C

2 ‖F (xn)‖)

≤ ‖Γ0‖(C(sn − s0) + C

2 q(sn))

≤ ‖Γ0‖(Csn −

C

2 q′(sn)(sn − sn−1)

)

≤ ‖Γ0‖C(

1− q′(s0)2

)sn

≤ θ(q′(sn) + 1

b

)≤ θ

(q′(sn) + 1

θ

)< 1,

Page 114: Estrategia metodos iterativos

100 CAPÍTULO 4. SITUACIÓN DIFERENCIABLE

tenemos que el operador [xn, yn;F ]−1 existe y es tal que

‖[xn, yn;F ]−1‖ ≤ θ

1− ‖I − Γ0[xn, yn;F ]‖ ≤ −1

q′(sn) .

Por tanto,‖xn+1 − xn‖ ≤ ‖[xn, yn;F ]−1‖‖F (xn)‖ ≤ − q(sn)

q′(sn) = sn+1 − sn,

‖xn+1 − x0‖ ≤ ‖xn+1 − xn‖+ ‖xn − x0‖ ≤ sn+1 − s0 < s∗ < s∗ + δ,

y, como sn es una sucesión de Cauchy, se deduce que xn también lo es y, en consecuencia,xn converge a x∗ ∈ B(x0, s∗ + δ). Para ver que x∗ es una solución de la ecuación F (x) = 0,basta tener en cuenta que ‖F (xn)‖ ≤ q(sn) y, por la continuidad de F , tenemos F (x∗) = 0.

A continuación, probamos la unicidad de solución. Suponemos que tenemos otra soluciónz∗ ∈ B(x0, s

∗∗ + δ) ∩ Ω de la ecuación F (x) = 0 distinta de x∗. Consideramos

F (z∗)− F (x∗) =∫ z∗

x∗F ′(x) dx =

∫ 1

0F ′(x∗ + t(z∗ − x∗))(z∗ − x∗) dt = 0

y el operador J =∫ 1

0F ′(x∗ + t(z∗ − x∗)) dt. Teniendo en cuenta que

‖I − Γ0J‖ ≤ ‖Γ0‖‖F ′(x0)− J‖

≤ ‖Γ0‖∫ 1

0‖F ′(x∗ + t(z∗ − x∗))− F ′(x0)‖ dt

≤ θC∫ 1

0((1− t)‖x∗ − x0‖+ t(‖z∗ − x0‖)) dt

<θC

2

( 2`b

+ δ)

< 1,

puesto que Cδθ ≤ 2, el operador J es inversible y, por tanto, x∗ = z∗.

4.1.2. AccesibilidadBuscando cierto paralelismo con las cuencas de atracción vistas en las figuras 3.6 y 3.7,

consideramos ahora la otra forma experimental de estudiar la accesibilidad de un métodoiterativo: las regiones de accesibilidad.

En la figura 4.1, se muestran las regiones de accesibilidad de la solución z = 1 de la ecua-ción compleja F (z) = z3 − 1 = 0, una vez fijado el dominio complejo [0.8, 1.6] × [−0.2, 0.2]que conduce a que C = 6|1.6 + 0.2i|, para los métodos de Newton, según el teorema deNewton-Kantorovich, y de Steffensen, según el teorema 4.1. Notamos que las regiones estánsuperpuestas. Observamos entonces la gran diferencia que existe entre las dos regiones de ac-cesibilidad, tal y como ocurría con las cuencas de atracción, volviéndose a poner de manifiestola reducida accesibilidad del método de Steffensen.

Recordemos, sección 1.5.2 del capítulo 1, que para representar gráficamente la región deaccesibilidad para el método de Newton, coloreamos los puntos x0 que verifican la condiciónCδθ2 ≤ 1

2 del teorema de Newton-Kantorovich. Para representar gráficamente la región de

Page 115: Estrategia metodos iterativos

4.2. MÉTODO PREDICTOR: EL MÉTODO SIMPLIFICADO DE NEWTON 101

0.8 1.0 1.2 1.4 1.6

-0.2

-0.1

0.0

0.1

0.2

Figura 4.1: Regiones de accesibilidad de la solución z = 1 de la ecuación compleja F (z) =z3 − 1 = 0 para los métodos de Newton (región roja) y de Steffensen (región verde), segúnlos teoremas de Newton-Kantorovich y 4.1, respectivamente.

accesibilidad para el método de Steffensen, coloreamos los puntos x0 que verifican las doscondiciones dadas en (4.4) del teorema 4.1.

Por otra parte, si comparamos teóricamente la accesibilidad de ambos métodos mediantelos dominios de parámetros asociados a los teoremas de Newton-Kantorovich y 4.1, vemosclaramente en la figura 4.2 que la accesibilidad del método de Steffensen se reduce con-siderablemente con respecto a la del método de Newton. Notamos que las regiones estánsuperpuestas.

Recordemos, sección 1.5.2 del capítulo 1, que para representar gráficamente el dominio deparámetros del método de Newton asociado al teorema de Newton-Kantorovich, coloreamosen el plano xy el conjunto de puntos (x, y) ∈ R2 : x2y ≤ 1

2, donde x = θ e y = Cδ.Para representar gráficamente el dominio de parámetros del método de Steffensen asociadoal teorema 4.1, coloreamos en el mismo plano xy el conjunto de puntos que cumplen las doscondiciones dadas en (4.4), véase la figura 4.2.

4.2. Método predictor: el método simplificado de New-ton

Con el objetivo de aumentar la aplicabilidad del método de Steffensen, vamos a construir,como se ha indicado en la introducción, un método iterativo híbrido (predictor-corrector) quenos permita localizar puntos de salida para el método de Steffensen y que, a partir de ellos,esté garantizada la convergencia del método. Para ello, tenemos que considerar un métodopredictor apropiado. Así, consideramos como método predictor el método simplificado deNewton (4.1), que tiene la misma accesibilidad que el método de Newton, pero sin la necesidadde tener que evaluar derivadas en cada paso de iteración. Como el operador F es derivable,

Page 116: Estrategia metodos iterativos

102 CAPÍTULO 4. SITUACIÓN DIFERENCIABLE

0.00 0.05 0.10 0.15

0

20

40

60

80

100

Figura 4.2: Dominios de parámetros de los métodos de Newton (región roja) y de Steffensen(región verde) asociados a los teoremas de Newton-Kantorovich y 4.1, respectivamente.

dado el punto de salida x0, existirá el operador F ′(x0), que es la única derivada que se evalúaa la hora de aplicar el método simplificado de Newton (4.1).

4.2.1. Convergencia semilocalAcabamos de ver que la accesibilidad del método de Steffensen es peor que la del mé-

todo de Newton. Sin embargo, como veremos a continuación, la accesibilidad del métodosimplificado de Newton (4.1) es la misma que la del método de Newton, si bien tiene menorvelocidad de convergencia, puesto que su R-orden de convergencia es al menos lineal. Esto noslleva a considerar un método iterativo híbrido (predictor-corrector) formado por los métodossimplificado de Newton (4.1) y de Steffensen. Así, mediante un método predictor con buenaaccesibilidad y un método corrector con buena velocidad de convergencia, obtendremos unmétodo híbrido con características similares a las del método de Newton.

Comenzamos viendo que el método simplificado de Newton (4.1) tiene la misma accesibi-lidad que el método de Newton. Establecemos entonces bajo qué condiciones para el puntode salida z0 y el operador F podemos garantizar la convergencia del método simplificado deNewton (4.1) a una solución de la ecuación F (x) = 0. Para ello, suponemos que se cumplenlas siguientes condiciones:

(H1) ‖F (z0)‖ ≤ δ0,(H2) existe Γ0 = [F ′(z0)]−1 ∈ L(X,X), para z0 ∈ Ω, y es tal que ‖Γ0‖ ≤ θ0,(H3) ‖F ′(x)− F ′(y)‖ ≤ C‖x− y‖, C ≥ 0, x, y ∈ Ω.

A partir de (H1)–(H3) definimos el polinomio cuadrático

p(t) = C

2 t2 − t

θ0+ δ0, t ∈ [t0, t′], (4.5)

Page 117: Estrategia metodos iterativos

4.2. MÉTODO PREDICTOR: EL MÉTODO SIMPLIFICADO DE NEWTON 103

donde t∗ ≤ t∗∗ ≤ t′, y denotamos por t∗ y t∗∗ sus dos raíces positivas. Definimos también lafunción

h(t) = t+ θ0p(t) (4.6)

y consideramos la sucesión tn dada por t0 = 0,tn+1 = h(tn) = tn + θ0p(tn), n ≥ 0.

(4.7)

Lema 4.2. La sucesión (4.7) converge de forma creciente a t∗.

Demostración. De (4.7), se sigue

t1 − t0 = θ0p(t0) > 0,

t1 − t∗ = h(t0)− h(t∗) = h′(θ0)(t0 − t∗) < 0,

de modo que t1 > t0 y t1 < t∗. Supongamos que tk ≥ tk−1 y tk < t∗, para k = 1, 2 . . . , n− 1.Entonces, como tn−1 < t∗, se tiene p(tn−1) ≥ 0 y

tn − tn−1 = θ0p(tn−1) ≥ 0.

Además,tn − t∗ = h(tn−1)− h(t∗) = h′(θn−1)(tn−1 − t∗) < 0.

Por tanto, la sucesión tn es creciente y tn < t∗, para todo n ∈ N. Luego, existe t = lımntn.

Ahora bien, comot = lım

ntn+1 = lım

n(tn + θ0p(tn)) ,

tenemos θ0p(t) = 0, de donde se sigue t = t∗.

Teorema 4.3. Sean X un espacio de Banach y F : Ω ⊂ X → X un operador una vezcontinuamente diferenciable Fréchet definido en un dominio abierto convexo no vacío Ω.Supongamos que se verifican las condiciones (H1)–(H3) y que se satisfacen

Cδ0θ20 ≤

12 (4.8)

y B(z0, t∗) ⊂ Ω, donde t∗ = 1−

√1−2Cδ0θ2

0Cθ0

. Entonces, la ecuación F (x) = 0 tiene una soluciónz∗ y el método simplificado de Newton (4.1) converge a z∗ empezando en z0. Además, zn, z∗ ∈B(z0, t∗), para todo n ∈ N. Por otra parte, si Cδ0θ

20 <

12 , z

∗ es la única solución de F (x) = 0

en B(x0, t∗∗) ∩ Ω, donde t∗∗ = 1+

√1−2Cδ0θ2

0Cθ0

.

Demostración. En primer lugar, consideramos z1 = z0 − Γ0F (z0). En este caso,

‖z1 − z0‖ = ‖Γ0F (z0)‖ ≤ θ0δ0 < t1 − t0 < t∗.

Luego, z1 ∈ B(z0, t∗) ⊂ Ω y podemos definir z2 = z1 − Γ0F (z1).

Page 118: Estrategia metodos iterativos

104 CAPÍTULO 4. SITUACIÓN DIFERENCIABLE

Ahora,F (z1) = F (z1)− F (z0)− F ′(z0)(z1 − z0)

=∫ z1

z0(F ′(u)− F ′(z0)) du

=∫ 1

0(F ′(z0 + τ(z1 − z0))− F ′(z0)) dτ(z1 − z0)

y‖F (z1)‖ ≤ C

2 ‖z1 − z0‖2 ≤ C

2 (t1 − t0)2,

de forma que‖z2 − z1‖ ≤

θ0C

2 t21.

Teniendo en cuenta que t2 − t1 = θ0p(t1) = θ0Ct21

2 , se sigue

‖z2 − z1‖ ≤ t2 − t1,

‖z2 − z0‖ ≤ ‖z2 − z1‖+ ‖z1 − z0‖ ≤ t2 − t0 < t∗.

Luego, z2 ∈ B(z0, t∗) ⊂ Ω y podemos definir z3.

Ahora, a partir de

F (zn) = F (zn)− F (zn−1)− F ′(z0)(zn − zn−1)

=∫ zn

zn−1(F ′(u)− F ′(z0)) du

=∫ 1

0(F ′(zn−1 + τ(zn − zn−1))− F ′(z0)) dτ(zn − zn−1),

yp(tn) = p(tn)− p(tn−1) + 1

θ0(tn − tn−1)

=∫ tn

tn−1(p′(u)− p′(t0)) du

=∫ 1

0(p′(tn−1 + τ(tn − tn−1))− p′(t0)) dτ(tn − tn−1)

= C(

(tn−1 − t0) + 12(tn − tn−1)

)(tn − tn−1),

se tiene‖F (zn)‖ ≤ p(tn), ∀n ∈ N,

puesto que

‖F (zn)‖ ≤∫ 1

0C (‖zn−1 − t0‖+ τ‖zn − zn−1‖) dτ‖zn − zn−1‖

≤ C(

(tn−1 − t0) + 12(tn − tn−1)

)(tn − tn−1).

Entonces,‖zn − zn−1‖ ≤ θ0p(tn) = tn − tn−1

Page 119: Estrategia metodos iterativos

4.2. MÉTODO PREDICTOR: EL MÉTODO SIMPLIFICADO DE NEWTON 105

y, por tanto, como la sucesión tn es de Cauchy, se deduce que la sucesión zn tambiénlo es y, en consecuencia, zn converge a z∗ ∈ B(z0, t∗). Veamos que z∗ es solución de laecuación F (x) = 0. Hemos probado que ‖F (zn)‖ ≤ p(tn), de manera que F (z∗) = 0 se siguepor continuidad.

Finalmente, suponemos que existe otra solución y∗ ∈ B(z0, t∗∗)∩Ω de la ecuación F (x) = 0

distinta de z∗. Consideramos

F (y∗)− F (z∗) =∫ y∗

z∗F ′(x) dx =

∫ 1

0F ′(z∗ + t(y∗ − z∗))(y∗ − z∗) dt = 0

y el operador J =∫ 1

0F ′(z∗ + t(y∗ − z∗)) dt. Teniendo en cuenta que

‖I − Γ0J‖ ≤ ‖Γ0‖‖F ′(z0)− J‖

≤ ‖Γ0‖∫ 1

0‖F ′(z∗ + t(y∗ − z∗))− F ′(z0)‖ dt

≤ θ0C∫ 1

0((1− t)‖z∗ − z0‖+ t‖y∗ − z0‖) dt

<Cθ0

2 (t∗∗ + t∗)

= 1,

vemos, por el lema de Banach (lema 1.22), que el operador J es inversible y, por tanto,x∗ = z∗.

4.2.2. AccesibilidadEn la figura 4.3 se muestran las regiones de accesibilidad de la raíz z = 1 de la ecuación

compleja F (z) = z3 − 1 = 0, una vez fijado el dominio complejo [0.8, 1.6] × [−0.2, 0.2] queconduce a que C = 6|1.6 + 0.2i|, para los métodos simplificado de Newton (4.1), según elteorema 4.3, y de Steffensen, según el teorema 4.1. Notamos que las regiones están super-puestas. Observamos entonces que ocurre lo mismo que cuando comparábamos las regionesde accesibilidad de los métodos de Newton y de Steffensen: la gran diferencia entre ambasregiones. De hecho, las regiones de accesibilidad para los métodos de Newton y simplificadode Newton (4.1) son las mismas. Esto nos indica que el dominio de puntos de salida paraobtener una aproximación de la raíz z = 1 de la ecuación compleja F (z) = z3 − 1 = 0 esmucho mayor para el método simplificado de Newton (4.1) que para el de Steffensen.

Por otra parte, si representamos gráficamente el dominio de parámetros del método sim-plificado de Newton (4.1) asociado al teorema 4.3, figura 4.4, vemos, como es obvio, que esel mismo que el del método de Newton asociado al teorema de Newton-Kantorovich, puestoque las condiciones de convergencia impuestas en ambos teoremas son las mismas. Notamosque las regiones están superpuestas. Por lo tanto, si comparamos la accesibilidad de los mé-todos simplificado de Newton (4.1) y de Steffensen, desde el punto de vista teórico de losdominios de parámetros asociados a los teoremas 4.3 y 4.1, concluimos lo mismo que antes:la accesibilidad del método de Steffensen se reduce considerablemente con respecto a la delmétodo simplificado de Newton (4.1).

Page 120: Estrategia metodos iterativos

106 CAPÍTULO 4. SITUACIÓN DIFERENCIABLE

0.8 1.0 1.2 1.4 1.6

-0.2

-0.1

0.0

0.1

0.2

Figura 4.3: Regiones de accesibilidad de la solución z = 1 de la ecuación compleja F (z) =z3 − 1 = 0 para los métodos simplificado de Newton (región roja) y de Steffensen (regiónverde), según los teoremas 4.3 y 4.1, respectivamente.

Parece entonces claro que podemos aprovechar la accesibilidad del método simplificadode Newton (4.1) para predecir puntos de salida para el método de Steffensen que garanticenla convergencia de éste al empezar en ellos.

4.3. Método iterativo híbrido (predictor-corrector)A partir de lo visto anteriormente, ahora nos planteamos construir una modificación del

método de Steffensen que mejore su accesibilidad, utilizando para esto el método simplificadode Newton (4.1).

4.3.1. Construcción del métodoComo se observa en la figura 4.4, el dominio de parámetros del método de Steffensen está

contenido en el dominio de parámetros del método simplificado de Newton (4.1). Por tanto,las condiciones exigidas al método de Steffensen para garantizar su convergencia semilocalson evidentemente más restrictivas que las exigidas al método simplificado de Newton (4.1).

Tratamos entonces de asegurar que, para un par inicial (δ0, θ0) que satisfaga la condición(4.8), es decir que esté dentro del dominio de parámetros del método simplificado de Newton,obtengamos un par (δ, θ) que satisfaga las dos condiciones dadas en (4.4), después de realizarun cierto número N0 de iteraciones con el método simplificado de Newton, de manera queestemos en condiciones de poder garantizar la convergencia del método de Steffensen alempezar en la iteración N0 que se obtiene mediante el método simplificado de Newton (4.1).De este modo, se puede considerar el par (δN0 , θN0) asociado a la iteración N0 obtenida conel método simplificado de Newton (4.1) como el par (δ, θ) asociado a la iteración inicial x0del método de Steffensen.

Page 121: Estrategia metodos iterativos

4.3. MÉTODO ITERATIVO HÍBRIDO (PREDICTOR-CORRECTOR) 107

0.00 0.05 0.10 0.15

0

20

40

60

80

100

Figura 4.4: Dominios de parámetros de los métodos simplificado de Newton (región roja) yde Steffensen (región verde) asociados a los teoremas 4.3 y 4.1, respectivamente.

Nuestro objetivo principal es entonces construir una sencilla modificación del método deSteffensen de manera que este método converja al empezar en los mismos puntos de salida queel método simplificado de Newton (4.1). Consideramos entonces el método iterativo híbrido(predictor-corrector) dado por el siguiente algoritmo

dado z0 en Ω,zi+1 = zi − [F ′(z0)]−1F (zi), i = 0, 1, . . . , N0 − 1,x0 = zN0 ,

xn+1 = xn − [xn, xn + F (xn);F ]−1F (xn), n ≥ 0,

(4.9)

donde z0 satisface (4.8), mientras que x0 = zN0 satisface (4.4). Para que este algoritmo seaconvergente nos planteamos dos cuestiones:

1. Localizar z0 de manera que el método predictor, el método simplificado de Newton(4.1), sea convergente.

2. Utilizando la convergencia del método predictor, calcular un valor N0 tal que zN0 seaconsiderado como punto de salida del método corrector, el método de Steffensen, demanera que podamos asegurar la convergencia del método de Steffensen saliendo desdex0 = zN0 .

La idea es usar el método simplificado de Newton (4.1) durante un número finito de pasosN0 hasta que zN0 = x0 cumpla las condiciones dadas en (4.4) y aplicar después el métodode Steffensen en vez del método simplificado de Newton (4.1). La clave del problema resideentonces en garantizar la existencia de N0.

Page 122: Estrategia metodos iterativos

108 CAPÍTULO 4. SITUACIÓN DIFERENCIABLE

4.3.2. Convergencia semilocal del métodoA continuación, vamos a estudiar la convergencia semilocal del método híbrido (4.9).

Necesitamos entonces conocer la evolución de los parámetros asociados a las aproximacionesque vamos obteniendo como iteraciones del método simplificado de Newton (4.1), para lo quenos apoyamos en el siguiente resultado.

Teorema 4.4. En las condiciones del teorema 4.3, consideramos el polinomio (4.5) y sean t∗y t∗∗ sus dos raíces reales positivas y tales que t∗ ≤ t∗∗. Entonces, para el método simplificadode Newton (4.1), se obtienen las siguientes cotas de error:

(i) Si t∗ < t∗∗,((t∗∗ − t∗)t∗)n+1

(t∗∗)n+1 − (t∗)n+1 < t∗ − tn <t∗(t∗∗ − t∗)(t∗Cθ0)nt∗∗ − t∗(t∗Cθ0)n .

(ii) Si t∗ = t∗∗, (12

)nt∗ ≤ t∗ − tn ≤ t∗.

Demostración. Demostramos en primer lugar el apartado (i). A partir de (4.5), comot∗ < t∗∗, tenemos

p(t) = C

2 (t∗ − t)(t∗∗ − t).

Si denotamos an = t∗ − tn y bn = t∗∗ − tn, para todo n ≥ 0, entonces p(tn) = C2 anbn,

p′(t0) = − 1θ0

y

an+1 = t∗ − tn+1 = t∗ − tn − θ0p(tn) = an −Cθ0

2 anbn,

bn+1 = t∗∗ − tn+1 = t∗∗ − tn − θ0p(tn) = bn −Cθ0

2 anbn.

Comoan+1

bn+1= an

bn

2− Cθ0(t∗∗ − tn)2− Cθ0(t∗ − tn)

y la función

ψ(t) = 2− Cθ0(t∗∗ − t)2− Cθ0(t∗ − t)

es estrictamente creciente, entonces

t∗

t∗∗= ψ(0) = ψ(t0) ≤ ψ(t) ≤ ψ(t∗) = Cθ0t

∗,

de manera que

an+1

bn+1= anbnψ(tn) ≤ an

bnψ(t∗) ≤ an−1

bn−1ψ(t∗)2 ≤ · · · ≤ a0

b0ψ(t∗)n+1 = t∗

t∗∗(Cθ0t

∗)n+1,

an+1

bn+1= anbnψ(tn) ≥ an

bnψ(t0) ≥ an−1

bn−1ψ(t0)2 ≥ · · · ≥ a0

b0ψ(t0)n+1 =

(t∗

t∗∗

)n+2.

Page 123: Estrategia metodos iterativos

4.3. MÉTODO ITERATIVO HÍBRIDO (PREDICTOR-CORRECTOR) 109

Como bn+1 = (t∗∗ − t∗) + an+1, obtenemos(t∗∗ − t∗)(t∗)n+2

(t∗∗)n+2 − (t∗)n+2 < t∗ − tn+1 <t∗(t∗∗ − t∗)(t∗Cθ0)n+1

t∗∗ − t∗(t∗Cθ0)n+1 .

En segundo lugar vemos (ii). Partiendo de (4.5), si t∗ = t∗∗, entonces an = bn y p(tn) =C

2 a2n, de manera que

an+1

an= 1− Cθ0

2 an.

Ahora, teniendo en cuenta que la función

ϕ(t) = 1− Cθ0

2 (t∗ − t)

es estrictamente creciente, se sigue que 12 = ϕ(t0) ≤ ϕ(t) ≤ ϕ(t∗) = 1 y, como an+1 = ϕ(tn)an,

entoncesan+1 ≤ an ≤ · · · ≤ a0 ≤ t∗ − t0 = t∗,

an+1 ≥12an ≥ · · · ≥

(12

)n+1a0 =

(12

)n+1t∗.

En consecuencia, (12

)n+1t∗ ≤ t∗ − tn+1 ≤ t∗.

Notemos que a partir del resultado anterior resulta evidente que el método simplificado deNewton (4.1) tiene al menos convergencia lineal.

Método predictor: el método simplificado de Newton

Consideramos la situación inicial a partir del método simplificado de Newton (4.1). Dadala aproximación inicial z0, partimos del par (δ0, θ0) definido a partir de (H1) y (H2):

‖Γ0‖ = ‖[F ′(z0)]−1‖ ≤ θ0 y ‖F (z0)‖ ≤ δ0.

Para la convergencia del método debe verificarse la condición (4.8):

Cδ0θ20 ≤

12 .

Iterando, se van definiendo los pares (δn, θn), a partir del cumplimiento de la condiciones(H1) y (H2), de modo que

‖F (zn)‖ ≤ p(tn) = δn ⇔ C

2 anbn = δn ⇔ C2

2 anbn = Cδn,

donde an = t∗ − tn y bn = t∗∗ − tn, siendo t∗ y t∗∗ (t∗ ≤ t∗∗) las dos raíces positivas de (4.5).Por el teorema 4.4, tenemos

Cδn = Cp(tn) <C2

2t∗ t∗∗(t∗∗ − t∗)t∗∗ − t∗(t∗Cθ0)n (t∗Cθ0)n

=Ct∗t∗∗

√1− 2Cδ0θ2

0

θ0 (t∗∗ − t∗(t∗Cθ0)n) (t∗Cθ0)n

= Ct∗t∗∗(t∗Cθ0)nθ0(t∗∗ − t∗(t∗Cθ0)n) (1− t∗Cθ0). (4.10)

Page 124: Estrategia metodos iterativos

110 CAPÍTULO 4. SITUACIÓN DIFERENCIABLE

A continuación, expresando θn en función de θ0 y considerando

‖I − Γ0F′(zn)‖ ≤ ‖Γ0‖‖F ′(z0)− F ′(zn)‖ ≤ Cθ0‖z0 − zn‖ ≤ Cθ0t

∗,

obtenemos‖Γn‖ = ‖ [F ′(zn)]−1 ‖ ≤ θn, donde θn = θ0

1− Cθ0t∗= θ.

Con lo que, tras aplicar este método, obtenemos el par (δn, θn) = (δn, θ) para algún n ∈ N.

Método corrector: el método de Steffensen

El par (δn, θn) = (δn, θ) debe verificar ahora las condiciones de convergencia dadas en(4.4) para el método de Steffensen:

Cδθ ≤ 2 y `δb2 ≤ 12 ,

donde δ = δn, b = 2θ2−Cδθ y ` = C

(1 + 1

b

). Por tanto, sustituyendo los parámetros δ y θ del

método predictor en (4.4), tenemos:

• Si Cδθ ≤ 2, entonces Cδn ≤ 2θ,

• Si `δb2 ≤ 12 , entonces

12 ≥ `δnb

2 = C(1 + 2−Cδnθ

)δn(

2θ2−Cδnθ

)2, que es equivalente a

5θ2(Cδn)2 − 4θ(3 + 2θ)(Cδn) + 4 ≥ 0

y se verifica si

Cδn ≤ P, donde P = 2(3 + 2θ)θ − 4√θ2 + 3θ + 1

5θ2 .

Luego,

Cδn ≤ mın2θ, P

=

P si θ ≤ 2.5303 . . .2θ

si θ ≥ 2.5303 . . .(4.11)

Definición de N0

Ahora vamos a definirN0 de manera que indique cuando se da el salto del método predictoral método corrector. Notemos que la sucesión δn es decreciente, con lo que buscamos elprimer valor de n en (4.10) que verifique (4.11).

Si θ ≤ 2.5303 . . ., entonces

Cδn <Ct∗t∗∗(Cθ0t

∗)nθ0(t∗∗ − t∗(t∗Cθ0)n)(1− Cθ0t

∗) < P.

Tomando logaritmos, encontramos un valor N0 ∈ N, de manera que el par (δN0 , θN0)satisfaga las dos condiciones de convergencia dadas en (4.4) para el método corrector.Así, obtenemos

N0 ≥log

(Pθ0t

∗∗

t∗(Pθ0 + Ct∗∗(1− t∗Cθ0))

)log(t∗Cθ0) .

Page 125: Estrategia metodos iterativos

4.4. APLICACIÓN 111

Luego

N0 = 1 +

log

(Pθ0t

∗∗

t∗(Pθ0 + Ct∗∗(1− Cθ0t∗))

)log(Cθ0t∗)

.

Si θ ≥ 2.5303 . . ., entonces

Cδn <Ct∗t∗∗(t∗Cθ0)n

θ0(t∗∗ − t∗(t∗Cθ0)n)(1− t∗Cθ0) < 2θ.

Tomando de nuevo logaritmos y procediendo como en el caso anterior, encontramosun valor N0 ∈ N, de manera que el par (δN0 , θN0) satisfaga las dos condiciones deconvergencia dadas en (4.4) para el método corrector. Así, obtenemos

N0 = 1 +

log

(2θ0t

∗∗

t∗(2θ0 + Cθt∗∗(1− Cθ0t∗))

)log(Cθ0t∗)

.

Por tanto, podemos asegurar que el método corrector es convergente partiendo del puntox0 = zN0 .

A partir de los comentarios y resultados previos, queda probado el siguiente teorema deconvergencia semilocal para el método iterativo híbrido (predictor-corrector) dado en (4.9).

Teorema 4.5. Sean X un espacio de Banach y F : Ω ⊂ X → X un operador una vezcontinuamente diferenciable Fréchet definido en un conjunto abierto convexo no vacío Ω.Suponemos que se satisfacen las condiciones (H1)–(H3) y que B(z0, t

∗) ⊂ Ω, donde t∗ es lamenor raíz positiva del polinomio (4.5). Si además Cδ0θ

20 ≤ 1

2 , entonces existe N0 ∈ N deforma que el método (4.9) es convergente con

N0 =

1 +

log

(Pθ0t

∗∗

t∗(Pθ0 + Ct∗∗(1− Cθ0t∗))

)log(Cθ0t∗)

si θ ≤ 2.5303 . . . ,

1 +

log

(2θ0t

∗∗

t∗(2θ0 + Cθt∗∗(1− Cθ0t∗))

)log(Cθ0t∗)

si θ ≥ 2.5303 . . . ,

(4.12)

y θ = θ0

1− Cθ0t∗.

4.4. AplicaciónEn principio, la aplicabilidad del método de Steffensen es menor que la del método simpli-

ficado de Newton (4.1). Veamos que esto es así en la siguiente aplicación, donde comprobamos

Page 126: Estrategia metodos iterativos

112 CAPÍTULO 4. SITUACIÓN DIFERENCIABLE

que no podemos aplicar el método de Steffensen para aproximar una solución del problemadiscreto, que surge de discretizar una ecuación integral no lineal de Hammerstein, porque nose cumplen las condiciones de convergencia del teorema 4.1. Sin embargo, apoyándonos en elmétodo híbrido (4.9), vemos que podemos aplicar el método de Steffensen a partir de ciertaiteración.

Consideramos la siguiente ecuación integral no lineal mixta de tipo Hammerstein

x(s) = 1 +∫ 1

0G(s, t)x(t)2 dt, s ∈ [0, 1], (4.13)

donde x ∈ C[0, 1], t ∈ [0, 1] y el núcleo G es la función de Green en [0, 1]× [0, 1].A continuación, usamos un proceso de discretización que transforma (4.13) en un problema

finito dimensional, tal y como se hizo en la sección 1.6.1, de manera que obtenemos el siguientesistema de ecuaciones no lineales:

F (x) ≡ x− 1− A x = 0, F : R8 −→ R8, (4.14)

donde

x = (x1, x2, . . . , x8)T , 1 = (1, 1, . . . , 1)T , A = (aij)8i,j=1, x = (x2

1, x22, . . . , x

28)T .

Además , F ′(x) = I − 2A diagx.Eligiendo como punto de salida z0 = (1.7, 1.7, . . . , 1.7)T y la norma del máximo, obte-

nemos δ0 = 0.6713 . . ., θ0 = 1.6549 . . ., C = 0.2471 . . ., Cδ0θ20 = 0.4543 . . . < 1

2 . Por tanto,podemos aplicar el método simplificado de Newton (4.1) para resolver el sistema (4.14), pues-to que se verifica la condición (4.8) del teorema 4.3. Por contra, no podemos aplicar el métodode Steffensen, ya que no se verifica la segunda condición de (4.4) del teorema 4.1, puesto que

`δb2 = 0.9286 . . . > 12 ,

donde δ = δ0, b = 1.9182 . . . y ` = 0.3759 . . .Como el método simplificado de Newton (4.1) es convergente por el teorema 4.3, lo aplica-

mos para obtener la aproximación numérica x∗ = (x∗1, x∗2, . . . , x∗8)T de la solución del sistema(4.14) y mostrada en la tabla 4.1, después de 20 iteraciones y usando como criterio de parada‖zn−zn−1‖ < 10−16. En la tabla 4.2 se muestran los errores ‖zn−x∗‖ obtenidos con el mismocriterio de parada. Notemos que el vector dado en la tabla 4.1 es una buena aproximaciónde la solución del sistema (4.14), puesto que ‖F (x∗)‖ ≤ constante × 10−16. Mostramos lasucesión ‖F (zn)‖ en la tabla 4.2.

i x∗i i x∗i i x∗i i x∗i1 1.012239 . . . 3 1.118079 . . . 5 1.159804 . . . 7 1.058428 . . .2 1.058428 . . . 4 1.159804 . . . 6 1.118079 . . . 8 1.012239 . . .

Tabla 4.1: Aproximación de la solución x∗ de (4.14)

Por otra parte, si aplicamos el método híbrido (4.9) para aproximar la solución dada enla tabla 4.1 con el mismo punto de salida, sólo necesitamos calcular el valor de N0, mediante

Page 127: Estrategia metodos iterativos

4.4. APLICACIÓN 113

n ‖zn − x∗‖ ‖F (zn)‖0 6.8776 . . .× 10−1 6.7130 . . .× 10−1

1 6.1560 . . .× 10−2 4.6960 . . .× 10−2

2 1.1811 . . .× 10−2 8.9776 . . .× 10−3

3 2.0931 . . .× 10−3 1.5942 . . .× 10−3

4 3.7465 . . .× 10−4 2.8588 . . .× 10−4

5 6.6908 . . .× 10−5 5.0952 . . .× 10−5

... ... ...19 2.2532 . . .× 10−15 1.7180 . . .× 10−15

Tabla 4.2: Errores absolutos obtenidos con el método simplificado de Newton y ‖F (zn)‖

el teorema 4.5, teniendo en cuenta el valor θ = 5.4777 . . . Si nos fijamos en la fórmula (4.12),obtenemos N0 = 1. Por tanto, después de una iteración del método simplificado de Newton(4.1), podemos aplicar el método de Steffensen, obteniendo la aproximación numérica de lasolución dada en la tabla 4.1 tras realizar cuatro iteraciones más con este último método.En la tabla 4.3 se muestran los errores ‖xn − x∗‖ cuando usamos el criterio de parada‖xn − xn−1‖ < 10−16, así como la sucesión ‖F (xn)‖.

n ‖xn − x∗‖ ‖F (xn)‖0 6.8776 . . .× 10−1 6.7130 . . .× 10−1

1 6.1560 . . .× 10−2 4.6960 . . .× 10−2

2 8.2751 . . .× 10−4 6.3230 . . .× 10−4

3 1.4582 . . .× 10−7 1.1158 . . .× 10−7

4 4.4982 . . .× 10−15 3.4428 . . .× 10−15

Tabla 4.3: Errores absolutos obtenidos con el método híbrido (4.9) y ‖F (xn)‖

Page 128: Estrategia metodos iterativos
Page 129: Estrategia metodos iterativos

Capítulo 5

Situación (no)-diferenciable

El estudio realizado en el capítulo anterior se restringe a la resolución de ecuacionesF (x) = 0 en las que el operador F es diferenciable Fréchet. Evidentemente, una característicaque tiene el método de Steffensen es que no necesita que el operador F sea diferenciableFréchet, simplemente necesita que exista una diferencia dividida definida en el dominio Ω.

Habitualmente, para probar la convergencia semilocal del método de Steffensen, se impo-nen las siguientes dos condiciones básicas ([1],[2],[5]):

(I) Dados dos puntos cualesquiera x, y ∈ Ω, distintos, existe la diferencia divi-dida de primer orden [x, y;F ].

(II) La diferencia dividida verifica la condición

‖[x, y;F ]− [u, v;F ]‖ ≤ K(‖x− u‖+ ‖y − v‖), (5.1)

con K ≥ 0, x, y, u, v ∈ Ω, x 6= y y u 6= v.

La condición (5.1) se puede suavizar considerando la condición

‖[x, y;F ]− [u, v;F ]‖ ≤ K(‖x− u‖p + ‖y − v‖p), (5.2)

con K ≥ 0, p ∈ (0, 1], x, y, u, v ∈ Ω, x 6= y y u 6= v. Las condiciones (5.1) y (5.2) dicenque la diferencia dividida de primer orden es, respectivamente, Lipschitz continua en Ω y(K, p)-Hölder continua en Ω.

Si ahora consideramos una diferencia dividida de primer orden para la que existe unafunción ω : R+ × R+ → R+ no decreciente en sus dos argumentos y tal que

‖[x, y;F ]− [u, v;F ]‖ ≤ ω(‖x− u‖, ‖y − v‖), (5.3)

con x, y, u, v ∈ Ω, x 6= y y u 6= v, es claro que obtenemos como casos particulares lascondiciones (5.1) y (5.2) si ω(s, t) = K(s + t) o ω(s, t) = K(sp + tp), respectivamente.En estos casos, como ω(0, 0) = 0, F es diferenciable (véase [37]). Así, los resultados deconvergencia semilocal para el método de Steffensen dados habitualmente exigen veladamenteque el operador F sea diferenciable.

En este capítulo nos planteamos la obtención de un resultado de convergencia semilocalpara el método de Steffensen cuando se aplica a ecuaciones en las que el operador F puedeser no diferenciable. Para ello, consideramos las condiciones (I) y (5.3) teniendo en cuentaque ω(0, 0) 6= 0 si el operador F es no diferenciable.

115

Page 130: Estrategia metodos iterativos

116 CAPÍTULO 5. SITUACIÓN (NO)-DIFERENCIABLE

Por otra parte, dada la generalidad de las condiciones de convergencia que vamos a con-siderar, veremos, a partir del dominio de parámetros asociado al resultado de convergenciasemilocal, que la accesibilidad del método de Steffensen va a ser restrictiva en determina-das condiciones. Para solventar esta dificultad, construiremos un método iterativo híbrido(predictor-corrector).

En la sección 5.1 obtenemos un resultado de convergencia semilocal para el método deSteffensen que permite aplicar este método a la resolución de ecuaciones con determinadosoperadores no diferenciables. Para ello, utilizamos la técnica de demostración de la convergen-cia semilocal ya vista en el capítulo 4, basada en relaciones de recurrencia, que proporcionanovedosos resultados acerca de la convergencia semilocal. Después, analizamos el dominiode parámetros asociado al resultado obtenido, observando que es mejorable en determinadassituaciones. En la sección 5.2, pensando en la construcción de un método iterativo híbrido(predictor-corrector) que mejore la accesibilidad del método de Steffensen y que no utilicederivadas en su algoritmo, obtenemos un nuevo resultado de convergencia semilocal en lasmismas condiciones, (I) y (5.3), para el método simplificado de Steffensen, cuyo algoritmo es

dado z0 en Ω,zn+1 = zn − [z0, z0 + F (z0);F ]−1F (zn), n ≥ 0,

(5.4)

y que utilizamos como método predictor en el método híbrido. Vemos que el dominio deparámetros de este método es menos restrictivo que el del método de Steffensen. Así, en lasección 5.3, construimos un método iterativo híbrido (predictor-corrector) que se beneficiadel buen dominio de parámetros del método simplificado de Steffensen, el método predictor,y de la velocidad de convergencia del método de Steffensen, el método corrector. Terminamoscon la sección 5.4, donde vemos dos aplicaciones en las que se aproximan las soluciones de dossistemas no lineales, uno diferenciable y otro no diferenciable, mediante el método híbridopreviamente construido, pero que no se pueden aproximar mediante el método de Steffensen.

5.1. Método corrector: el método de Steffensen

5.1.1. Convergencia semilocalTal y como hemos dicho en el capítulo anterior, resulta evidente que, en el estudio de la

convergencia de la sucesión xn definida por el método de Steffensen, existirán todas lasdiferencias divididas de primer orden [xk, yk;F ], salvo que xk = yk = xk + F (xk), en cuyocaso resulta evidente que xk es una solución de la ecuación F (x) = 0 y, en este caso, tenemosxn = xk para todo n ≥ k, luego la sucesión xn es convergente a xk ≡ x∗ solución deF (x) = 0.

Comenzamos con un lema técnico que utilizamos posteriormente.

Lema 5.1. Sea xn la sucesión dada por el método de Steffensen. Si xm−1 6= xm conxm−1, xm ∈ Ω, entonces

F (xm) = ([xm, xm−1;F ]− Am−1) (xm − xm−1), donde Am−1 = [xm−1, xm−1 + F (xm−1);F ].

Demostración. A partir de la sucesión dada por el método de Steffensen se sigue

F (xm−1) + [xm−1, xm−1 + F (xm−1);F ](xm − xm−1) = 0,

Page 131: Estrategia metodos iterativos

5.1. MÉTODO CORRECTOR: EL MÉTODO DE STEFFENSEN 117

de manera queF (xm) = F (xm)− F (xm−1)− [xm−1, xm−1 + F (xm−1);F ](xm − xm−1)

= [xm, xm−1;F ](xm − xm−1)− [xm−1, xm−1 + F (xm−1);F ](xm − xm−1)= ([xm, xm−1;F ]− Am−1) (xm − xm−1).

A continuación, presentamos un resultado de convergencia semilocal para el método deSteffensen. Para ello, dados x0, x0 +F (x0) ∈ Ω, notemos que x0 6= x0 +F (x0), ya que en otrocaso x0 es una solución x∗ de F (x) = 0 y xn = x∗, para todo n ∈ N. Suponemos las siguientescondiciones:

(C1) ‖F (x0)‖ ≤ δ,(C2) existe A−1

0 = [x0, x0 + F (x0);F ]−1 ∈ L(X,X), para x0 ∈ Ω, y es tal que‖A−1

0 ‖ ≤ β,(C3) ‖[x, y;F ] − [u, v;F ]‖ ≤ ω(‖x − u‖, ‖y − v‖); x, y, u, v ∈ D; x 6= y;u 6= v,

donde ω : R+ ×R+ → R+ es una función continua no decreciente en los dosargumentos.

Teorema 5.2. Sean X un espacio de Banach y F : Ω ⊂ X → X un operador no lineal defi-nido en un dominio abierto convexo no vacío Ω. Suponemos que se cumplen las condiciones(C1)–(C3). Si la ecuación

t = βδ(1− βω(t, t+ δ))1− βω(t, t+ δ)−M +Mδ, (5.5)

donde M = βω(βδ, δ), tiene al menos una raíz real positiva, y denotamos por R la raízpositiva más pequeña de (5.5),

M + βω(R,R + δ) < 1 (5.6)y B(x0, R) ⊂ Ω, entonces el método de Steffensen, empezando en x0, está bien definidoy converge a una solución x∗ de F (x) = 0. Además, la solución x∗ y las iteraciones xnpertenecen a B(x0, R) y x∗ es única en B(x0, R) ∩ Ω.

Demostración. Comenzamos probando que la sucesión xn está bien definida, es decir,xn ∈ B(x0, R) ⊂ Ω, para todo n ∈ N. Notemos que

R = βδ

1− P +Mδ, (5.7)

donde P = M

1− βω(R,R + δ) < 1.

A partir de (C1)–(C2) se sigue que x1 está bien definida y, por (5.7), tenemos‖x1 − x0‖ ≤ ‖A−1

0 ‖ ‖F (x0)‖ ≤ βδ < R.

Luego, x1 ∈ B(x0, R). Además, por el lema 5.1, F (x1) = ([x1, x0;F ]− A0) (x1 − x0) y, enconsecuencia,

‖F (x1)‖ ≤ ‖[x1, x0;F ]− A0‖‖x1 − x0‖≤ ω(‖x1 − x0‖, ‖F (x0)‖)‖x1 − x0‖≤ ω(βδ, δ)‖x1 − x0‖≤ Mδ

< δ.

Page 132: Estrategia metodos iterativos

118 CAPÍTULO 5. SITUACIÓN (NO)-DIFERENCIABLE

De nuevo, por (5.7), se sigue ‖x1 + F (x1) − x0‖ ≤ ‖x1 − x0‖ + ‖F (x1)‖ ≤ βδ + Mδ < R yx1 + F (x1) ∈ B(x0, R).

A continuación, teniendo en cuenta

‖I − A−10 A1‖ ≤ ‖A−1

0 ‖ ‖A0 − A1‖≤ βω(‖x1 − x0‖, ‖x1 + F (x1)− x0 − F (x0)‖)≤ βω(‖x1 − x0‖, ‖x1 + F (x1)− x0‖+ ‖F (x0)‖)≤ βω(βδ, βδ + δ)≤ βω(R,R + δ)< 1,

vemos, por el lema de Banach (lema 1.22), que existe el operador A−11 y es tal que

‖A−11 ‖ ≤

β

1− βω(R,R + δ) .

En consecuencia, como P < 1, se sigue

‖x2 − x1‖ ≤ ‖A−11 ‖‖F (x1)‖ ≤ P‖x1 − x0‖ < βδ,

‖x2 − x0‖ ≤ ‖x2 − x1‖+ ‖x1 − x0‖ ≤ (1 + P )‖x1 − x0‖ = 1− P 2

1− P ‖x1 − x0‖ <βδ

1− P < R.

Por lo tanto, x2 ∈ B(x0, R). También, como

‖F (x2)‖ ≤ ‖[x2, x1;F ]− A1‖‖x2 − x1‖≤ ω(‖x2 − x1‖, ‖F (x1)‖)‖x2 − x1‖≤ ω(βδ, δ)‖x2 − x1‖≤ Mδ

< δ,

se sigue

‖x2 + F (x2)− x0‖ ≤ ‖x2 − x0‖+ ‖F (x2)‖ < βδ

1− P +Mδ = R

y x2 + F (x2) ∈ B(x0, R).Ahora podemos demostrar por inducción matemática sobre n que se cumplen los siguientes

tres ítems para n ∈ N:

· El operador A−1n existe y es tal que ‖A−1

n ‖ ≤β

1− βω(R,R + δ) ,

· ‖F (xn)‖ ≤ ω(βδ, δ)‖xn − xn−1‖,

· ‖xn+1 − xn‖ ≤ P‖xn − xn−1‖ ≤ P n‖x1 − x0‖ < βδ,

Page 133: Estrategia metodos iterativos

5.1. MÉTODO CORRECTOR: EL MÉTODO DE STEFFENSEN 119

siempre que Ai = [xi, xi + F (xi);F ] sea invertible y xi+1, xi+1 + F (xi+1) ∈ B(x0, R), paratodo i = 1, 2, . . . , n− 1.

En primer lugar, por hipótesis, vemos

‖I − A−10 An‖ ≤ ‖A−1

0 ‖‖A0 − An‖≤ βω(‖xn − x0‖, ‖xn − x0 + F (xn)− F (x0)‖)≤ βω(‖xn − x0‖, ‖xn + F (xn)− x0‖+ ‖F (x0)‖)≤ βω(R,R + δ)< 1

y‖A−1

n ‖ ≤β

1− βω(R,R + δ) .

En segundo lugar, por el lema 5.1, F (xn) = ([xn, xn−1;F ]− An−1)(xn − xn−1) y

‖F (xn)‖ ≤ ‖[xn, xn−1;F ]− An−1‖‖xn − xn−1‖≤ ω(‖xn − xn−1‖, ‖F (xn−1)‖)‖xn − xn−1‖≤ ω(βδ, δ)‖xn − xn−1‖≤ Mδ

< δ.

Como ya hemos indicado anteriormente, existen todas las diferencias divididas de primerorden utilizadas porque, en otro caso, obtendríamos xn = xn−1 o F (xn) = 0, lo que indicaríaque ya habríamos alcanzado una solución de F (x) = 0 y el resultado quedaría probado.

En tercer lugar, vemos que

‖xn − xn−1‖ ≤ ‖A−1n ‖‖F (xn)‖

≤ βω(βδ, δ)1− βω(R,R + δ)‖xn − xn−1‖

= P ‖xn − xn−1‖≤ P n ‖x1 − x0‖< βδ.

En consecuencia,

‖xn+1 − x0‖ ≤n+1∑i=0‖xi − xi−1‖

≤ (P n + P n−1 + · · ·+ P + 1)‖x1 − x0‖

≤ 1− P n+1

1− P ‖x1 − x0‖

<βδ

1− P< R,

Page 134: Estrategia metodos iterativos

120 CAPÍTULO 5. SITUACIÓN (NO)-DIFERENCIABLE

‖xn+1 + F (xn+1)− x0‖ ≤ ‖xn+1 − x0‖+ ‖F (xn+1)‖ < βδ

1− P +Mδ = R,

por (5.7) y ser P < 1. Luego, xn+1, xn+1 + F (xn+1) ∈ B(x0, R), para todo n ∈ N.Una vez probado que la sucesión xn está bien definida, vemos que es una sucesión de

Cauchy. En efecto, como

‖xn+j − xn‖ ≤ ‖xn+j − xn+j−1‖+ ‖xn+j−1 − xn+j−2‖+ · · ·+ ‖xn+1 − xn‖≤ (P j−1 + P j−2 + · · ·+ P + 1)‖xn+1 − xn‖

= 1− P j

1− P ‖xn+1 − xn‖

<P n

1− P ‖x1 − x0‖,

para j ≥ 1, y P < 1, es claro que xn es una sucesión de Cauchy. Por tanto, la sucesiónxn es convergente. Ahora, si lım

nxn = x∗, vemos que x∗ es una solución de F (x) = 0. Como

‖F (xn)‖ ≤ ω(βδ, δ) ‖xn − xn−1‖

y ‖xn − xn−1‖ → 0, cuando n → ∞, se sigue fácilmente, por la continuidad de F , queF (x∗) = 0.

Finalmente, probamos la unicidad de la solución x∗ en B(x0, R). Supongamos entonces quetenemos otra solución y∗ ∈ B(x0, R), y∗ 6= x∗, de la ecuación F (x) = 0. Sea J = [y∗, x∗;F ].Si J es inversible, entonces x∗ = y∗, puesto que J(y∗ − x∗) = F (y∗) − F (x∗). Para ver queJ es invertible, basta, por el lema de Banach (lema 1.22), con ver que ‖I − A−1

0 J‖ < 1. Enefecto, si x0 6= x0 + F (x0), por hipótesis tenemos

‖I − A−10 J‖ ≤ ‖A−1

0 ‖‖A0 − J‖≤ ‖A−1

0 ‖‖[x0, x0 + F (x0);F ]− [y∗, x∗;F ]‖≤ βω(‖y∗ − x0‖, ‖x∗ − x0 − F (x0)‖)≤ βω(‖y∗ − x0‖, ‖x∗ − x0‖+ ‖F (x0)‖)≤ βω(R,R + δ)< 1.

Luego, el operador J−1 existe.

5.1.2. AccesibilidadUna vez probada la convergencia semilocal del método de Steffensen, nuestro siguiente

objetivo es ver cuál es el dominio de parámetros de este método.Es conocido que el operador F es diferenciable si la función ω que aparece en (C3) cumple

ω(0, 0) = 0, [37]. En otro caso, el operador F puede ser no diferenciable. A continuación,vamos a analizar dos casos particulares de la función ω: uno diferenciable y otro no diferen-ciable.

Page 135: Estrategia metodos iterativos

5.1. MÉTODO CORRECTOR: EL MÉTODO DE STEFFENSEN 121

Como hemos visto en la discretización de ecuaciones diferenciales e integrales, es conocidoque la función ω que aparece en (C3) es frecuentemente de la forma

ω(s, t) = L+K(s+ t), L,K ≥ 0. (5.8)

En este caso, la ecuación (5.5) del teorema 5.2 se puede transformar en la siguiente ecuacióncuadrática:

2Kβt2+(M(1−2Kβδ)+β(L+Kδ(1−2β))−1)t−δ(M2+(Lβ+Kβδ−1)(M+β)) = 0, (5.9)

donde M = β(L+Kδ(1 + β)). Y la condición (5.6) se transforma en la condición

M + β(L+K(2R + δ)) < 1, (5.10)

donde R es la raíz positiva más pequeña de (5.9) siempre que exista.Analizamos a continuación la ecuación (5.9) viendo cuándo tiene dos raíces reales positi-

vas. La ecuación anterior tendrá dos raíces reales positivas si

M(1− 2Kδβ) + β(L+Kδ(1− 2β))− 1 < 0, (5.11)

δ(M2 + (Lβ +Kδβ − 1)(M + β)

)< 0, (5.12)

∆ = (M(1− 2Kδβ) + β(L+Kδ(1− 2β))− 1)2 + 8Kδβ (M2 + (Lβ +Kδβ − 1)(M + β))

=(M(1− 2Kδβ) + β(L+Kδ(1− 2β))− 1 +

√−8Kδβ (M2 + (Lβ +Kδβ − 1)(M + β))

)×(M(1− 2Kδβ) + β(L+Kδ(1− 2β))− 1−

√−8Kδβ (M2 + (Lβ +Kδβ − 1)(M + β))

)> 0.

Observamos que los dos factores de ∆ son < 0 si

M(1−2Kβδ)+β(L+Kδ(1−2β))+√−8Kβδ(M2 + (Lβ +Kβδ − 1)(M + β)) < 1. (5.13)

Además, se cumple (5.11) si se satisface (5.13). Por lo tanto, la ecuación (5.9) tendrá dosraíces reales positivas si se cumplen (5.12) y (5.13). Si la ecuación (5.9) tiene dos raíces realespositivas, entonces la raíz positiva más pequeña es:

R = 14Kβ

(1−M(1− 2Kβδ)− β(L+Kδ(1− 2β))−

√∆). (5.14)

Notemos que también podemos considerar que la ecuación (5.9) tenga una raíz doble sinmás que tener en cuenta la desigualdad no estricta en (5.13).

A continuación, sustituimos el valor de R en (5.10) y vemos que (5.10) se cumple si

1− Lβ − (1 + 2Kδβ)M −Kδβ(1 + 2β) +√

∆ > 0. (5.15)

Destacamos que no consideramos la posibilidad de que la ecuación cuadrática (5.9) tengauna raíz real positiva y otra negativa porque, en este caso, la raíz real positiva nunca cumplela condición (5.15).

Teniendo en cuenta lo anterior, enunciamos el siguiente resultado, cuya demostración sesigue fácilmente sin más que cumplir las hipótesis del teorema 5.2 cuando ω(s, t) es la funcióndefinida en (5.8).

Page 136: Estrategia metodos iterativos

122 CAPÍTULO 5. SITUACIÓN (NO)-DIFERENCIABLE

Corolario 5.3. Sean X un espacio de Banach y F : Ω ⊂ X → X un operador no lineal defi-nido en un dominio abierto convexo no vacío Ω. Supongamos que se cumplen las condiciones(C1)–(C3), siendo ω la función que se define en (5.8). Además, si se cumplen (5.12), (5.13),(5.15) y B(x0, R) ⊂ Ω, donde R está definido en (5.14), entonces el método de Steffensen,empezando en x0, está bien definido y converge a una solución x∗ de F (x) = 0. Además, lasolución x∗ y las iteraciones xn pertenecen a B(x0, R) y x∗ es única en B(x0, R) ∩ Ω.

Caso diferenciable

A continuación, analizamos la accesibilidad del método de Steffensen desde el punto devista teórico de los dominios de parámetros asociados al resultado anterior de convergen-cia semilocal. Para ello, distinguimos dos casos: el caso diferenciable, L = 0, y el caso nodiferenciable, L 6= 0.

En la figura 5.1 podemos visualizar el dominio de parámetros asociado al corolario 5.3cuando F es diferenciable (caso L = 0). Así, el dominio de parámetros es la región del planocuyos puntos representan los parámetros correspondientes a los puntos de salida a partir de loscuales está garantizada la convergencia del método de Steffensen, indicando entonces a partirde qué puntos de salida está garantizada la convergencia del método bajo las condiciones (C1)–(C3), donde ω es la función definida en (5.8) con L = 0. Para representarlo gráficamente,consideramos el plano xy, con x = β (eje de abscisas) e y = Kδ (eje de ordenadas), ycoloreamos los valores de los parámetros que verifican las condiciones (5.12), (5.13) y (5.15),cuando L = 0, y que se imponen en el corolario 5.3. Observamos que las condiciones iniciales(C1) y (C2), exigidas al punto de salida x0, definen los parámetros δ y β, mientras que lacondición (C3), exigida al operador F , define el parámetro fijo K.

Por otra parte, consideramos el análisis de la convergencia semilocal del método de Stef-fensen mediante el principio de la mayorante de Kantorovich, sección 4.1.1, y representamosgráficamente el dominio de parámetros asociado al teorema 4.1, de manera que podamoscompararlo con el asociado al corolario 5.3 cuando L = 0 y ver cuál es mayor. Para ello,tenemos que representar los mismos valores en los ejes x e y del plano en el que vamos arepresentar los dos dominios de parámetros. En consecuencia, tenemos que escribir θ y Cen función de β y K, de manera que así representamos los valores de los inversos de lasdiferencias divididas en el eje x y, en el eje y, el producto de δ por la constante de LipschitzK para la diferencia dividida. Procedemos entonces como se detalla a continuación.

Por una parte, como

‖I − A−10 F ′(x0)‖ ≤ ‖A−1

0 ‖‖A0 − F ′(x0)‖ ≤ β‖A0 − [x0, x0;F ]‖ ≤ Kβ‖F (x0)‖ = Kβδ,

se sigue, por el lema de Banach (lema 1.22), que si Kβδ < 1, existe [F ′(x0)]−1 y es tal que

‖[F ′(x0)]−1‖ ≤ β

1−Kβδ .

Así, θ = β

1−Kβδ .Por otra parte, como

‖F ′(x)− F ′(y)‖ = ‖[x, x;F ]− [y, y;F ]‖ ≤ 2K‖x− y‖,

se sigue que C = 2K.

Page 137: Estrategia metodos iterativos

5.1. MÉTODO CORRECTOR: EL MÉTODO DE STEFFENSEN 123

En consecuencia, para que se cumplan las dos condiciones dadas en (4.4), teorema 4.1, setienen que cumplir las siguientes tres condiciones

Kβδ < 1, 2Kβδ1−Kβδ ≤ 2 y 2Kβδ

(1− β(2Kδ − 1)

(1−Kβδ)2

)≤ 1

2 ,

que se reducen a

2Kβδ ≤ 1 y 4(Kβδ)2 − 4Kβδ(2 + β(1− 2Kδ)) + 1 ≥ 0.

Y, por tanto, ya estamos en condiciones de poder comparar los dominios de parámetrosasociados al corolario 5.3 cuando L = 0 y al teorema 4.1.

En la figura 5.1 vemos claramente que el dominio de parámetros asociado al corolario 5.3cuando L = 0 es mayor que el asociado al teorema 4.1. Notamos que las regiones estánsuperpuestas. Por lo tanto, utilizando la técnica de demostración de la convergencia semilocaldesarrollada en este capítulo, mejoramos el dominio de parámetros que se obtiene mediantela técnica clásica del principio de la mayorante de Kantorovich desarrollada en el capítuloanterior.

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

Figura 5.1: Dominios de parámetros del método de Steffensen asociados al corolario 5.3cuando L = 0 (anaranjado) y al teorema 4.1 (gris).

Caso no diferenciable

Si ahora consideramos el corolario 5.3 con L 6= 0, al fijarnos en las condiciones (5.12),(5.13), (5.15), vemos que el valor de L está libre. Al visualizar entonces en la figura 5.2 eldominio de parámetros asociado a dicho corolario, con L 6= 0, podemos decir que el dominiode parámetros es mayor cuanto menor es el valor de L, obteniéndose como situación óptimael caso diferenciable (L = 0). Notamos que las regiones están superpuestas.

Page 138: Estrategia metodos iterativos

124 CAPÍTULO 5. SITUACIÓN (NO)-DIFERENCIABLE

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

Figura 5.2: Dominios de parámetros del método de Steffensen asociados al corolario 5.3cuando L = 1

2 ,13 ,

15 ,

110 (verde, rojo, amarillo y azul, respectivamente).

5.1.3. AplicaciónA continuación ilustramos el estudio realizado anteriormente con dos sistemas de ecuacio-

nes no lineales, uno diferenciable y otro no diferenciable, que surgen de la discretización deecuaciones integrales de Hammerstein de la forma (1.41), presentadas en la sección 1.6.1. Parael sistema diferenciable, veremos que podemos garantizar la convergencia semilocal del méto-do de Steffensen mediante el teorema 5.2 de este capítulo, pero no mediante el terorema 4.1del capítulo anterior. Para el sistema no diferenciable, veremos que podemos garantizar laconvergencia semilocal del método de Steffensen mediante el teorema 5.2.

Así, consideramos (1.41) con

H(t, x(t)) = δx(t)2 + µ|x(t)|, δ, µ ∈ R,

y la trasformamos, mediante un proceso de discretización, tal y como se hace en la sec-ción 1.6.1, en el siguiente sistema de ecuaciones no lineales:

F (x) ≡ x− f− A (δ x + µ x) = 0, F : R8 −→ R8, (5.16)

donde x = (x21, x

22, . . . , x

28)T , x = (|x1|, |x2|, . . . , |x8|)T y δ, µ ∈ R. Además,

[u,v;F ] = I − A (δdiagz+ µdiagw),

donde z = (z1, z2, . . . , z8)T con zi = ui + vi, para todo i = 1, 2, . . . , 8, y w = (w1, w2, . . . , w8)Tcon wi = |ui|−|vi|

ui−vi, para todo i = 1, 2, . . . , 8, de manera que L = 2|µ|‖A‖ y K = |δ|‖A‖.

Sistema de ecuaciones no lineales diferenciable

Si f = 2 = (2, 2, . . . , 2)T , δ = 34 y µ = 0, entonces el sistema (5.16) se reduce a

F (x) ≡ x− 2− 34A x = 0, F : R8 −→ R8. (5.17)

Page 139: Estrategia metodos iterativos

5.1. MÉTODO CORRECTOR: EL MÉTODO DE STEFFENSEN 125

En este caso, [u,v;F ] = I− 34A diagz y el sistema de ecuaciones no lineales es diferenciable

(µ = 0).Eligiendo x0 =

(75 ,

75 , . . . ,

75

)Tcomo punto de salida y la norma del máximo, obtenemos

δ = 0.7816 . . ., θ = 1.3335 . . . y C = 0.1853 . . . Ahora, vemos que la segunda condición de (4.4)del teorema 4.1 no se cumple porque `δb2 = 0.5295 . . . > 1

2 . En consecuencia, no podemosgarantizar la convergencia del método de Steffensen mediante la teoría de Kantorovich conel terorema 4.1 del capítulo anterior.

Sin embargo, sí que la podemos garantizar mediante el teorema 5.2 de este capítulo, puestoque la ecuación (5.5), que se reduce a

(0.2272 . . .)(t− 2.5669 . . .)(t− 1.6860 . . .)(0.2272 . . .)t− (0.7135 . . .) = 0,

tiene dos raíces reales positivas y la más pequeña, R = 1.6860 . . ., cumple la condicióon (5.6),ya que

M + βω(R,R + δ) = 0.6695 . . . < 1,

donde M = 0.1976 . . . y ω(s, t) = K(s+ t) con K = 0.0926 . . .En la situación anterior, utilizando el método de Steffensen, después de cinco iteraciones

y usando el criterio de parada ‖xn − xn−1‖ < 10−16, obtenemos la aproximación numéricax∗ = (x∗1, x∗2, . . . , x∗8)T de una solución de (5.17) que se puede ver en la tabla 5.1. En latabla 5.2 mostramos los errores ‖xn − x∗‖ obtenidos usando el mismo criterio de parada.Notemos que el vector dado en la tabla 5.1 es una buena aproximación de la solución delsistema (5.17), puesto que ‖F (x∗)‖ ≤ constante × 10−16. Mostramos la sucesión ‖F (xn)‖en la tabla 5.2.

Además, por el teorema 5.2, la existencia y unicidad de la solución está garantizada en labola B(x0, 1.6860 . . .).

i x∗i i x∗i i x∗i i x∗i1 2.042845 . . . 3 2.422455 . . . 5 2.576941 . . . 7 2.206427 . . .2 2.206427 . . . 4 2.576941 . . . 6 2.422455 . . . 8 2.042845 . . .

Tabla 5.1: Aproximación de la solución x∗ de (5.17)

n ‖xn − x∗‖ ‖F (xn)‖0 1.1769 . . . 7.8163 . . .× 10−1

1 2.2469 . . .× 10−1 1.3937 . . .× 10−1

2 8.8921 . . .× 10−3 5.4331 . . .× 10−3

3 1.4371 . . .× 10−5 8.7842 . . .× 10−6

4 3.7504 . . .× 10−11 2.29284 . . .× 10−11

Tabla 5.2: Errores absolutos y ‖F (xn)‖ para (5.17)

Page 140: Estrategia metodos iterativos

126 CAPÍTULO 5. SITUACIÓN (NO)-DIFERENCIABLE

Sistema de ecuaciones no lineales no diferenciable

Si f = 2 = (2, 2, . . . , 2)T y δ = µ = 12 , entonces el sistema (5.16) se reduce a

F (x) ≡ x− 2− 12A(x + x) = 0, F : R8 −→ R8. (5.18)

En este caso, [u,v;F ] = I − 12A(diagz + diagw) y el sistema de ecuaciones no lineales

es no diferenciable (µ 6= 0).Si elegimos x0 =

(125 ,

125 , . . . ,

125

)Tcomo punto de salida y la norma del máximo, obtenemos

δ = 0.3594 . . ., β = 1.5115 . . . y la ecuación (5.5), que se reduce a

(0.1867 . . .)(t− 2.2255 . . .)(t− 1.1385 . . .)(0.1867 . . .)t− (0.5085 . . .) = 0,

tiene dos raíces reales positivas y la más pequeña, R = 1.1385 . . ., cumple la condición (5.6),ya que

M + βω(R,R + δ) = 0.7040 . . . < 1,

donde M = 0.2710 . . . y ω(s, t) = L+K(s+ t) con L = 0.1235 . . . y K = 0.0617 . . .A continuación, utilizando el método de Steffensen, después de cuatro iteraciones y

usando el criterio de parada ‖xn − xn−1‖ < 10−16, obtenemos la aproximación numéricax∗ = (x∗1, x∗2, . . . , x∗8)T de una solución de (5.18) que se puede ver en la tabla 5.3. En latabla 5.4 mostramos los errores ‖xn − x∗‖ obtenidos usando el mismo criterio de parada.Notemos que el vector dado en la tabla 5.3 es una buena aproximación de la solución delsistema (5.18), puesto que ‖F (x∗)‖ ≤ constante × 10−16. Mostramos la sucesión ‖F (xn)‖en la tabla 5.4.

Además, por el teorema 5.2, la existencia y unicidad de la solución está garantizada en labola B(x0, 1.1385 . . .).

i x∗i i x∗i i x∗i i x∗i1 2.039360 . . . 3 2.383586 . . . 5 2.521279 . . . 7 2.188708 . . .2 2.188708 . . . 4 2.521279 . . . 6 2.383586 . . . 8 2.039360 . . .

Tabla 5.3: Aproximación de la solución x∗ de (5.18)

n ‖xn − x∗‖ ‖F (xn)‖0 3.6063 . . .× 10−1 3.5949 . . .× 10−1

1 2.3907 . . .× 10−3 1.6324 . . .× 10−3

2 6.7249 . . .× 10−7 4.6622 . . .× 10−7

3 5.0981 . . .× 10−14 3.5423 . . .× 10−14

Tabla 5.4: Errores absolutos y ‖F (xn)‖ para (5.18)

Page 141: Estrategia metodos iterativos

5.2. MÉTODO PREDICTOR: EL MÉTODO SIMPLIFICADO DE STEFFENSEN 127

5.2. Método predictor: el método simplificado de Stef-fensen

A la hora de mejorar la accesibilidad del método de Steffensen, proponemos, en estecapítulo, un método iterativo híbrido (predictor-corrector) que no utiliza derivadas en sualgoritmo. Teniendo en cuenta que el resultado de convergencia semilocal que acabamos deestablecer para el método de Steffensen, teorema 5.2, es aplicable a operadores no diferen-ciables, consideramos, como método predictor para el método híbrido, un método iterativoque no utilice derivadas. En concreto, utilizaremos el método simplificado de Steffensen (5.4),que, como veremos, tiene mayor dominio de parámetros que el método de Steffensen.

5.2.1. Convergencia semilocalComenzamos estudiando la convergencia semilocal del método simplificado de Steffensen

(5.4) bajo las mismas hipótesis generales que para el método de Steffensen, aunque, en estecaso, como el objetivo de la sección es comparar los dominios de parámetros de los métodossimplificado de Steffensen (5.4) y de Steffensen, tanto en situaciones diferenciables como nodiferenciables, exigimos directamente la condición (H3) en vez de (C3). Así, suponemos quese cumplen:

(H1) ‖F (z0)‖ ≤ δ0,(H2) existe [z0, z0 + F (z0);F ]−1 = B−1

0 ∈ L(X,X), para z0 ∈ Ω, y es tal que‖B−1

0 ‖ ≤ β0,(H3) ‖[x, y;F ]− [u, v;F ]‖ ≤ L+K(‖x−u‖+‖y−v‖);L,K ≥ 0;x, y, u, v ∈ Ω;x 6=

y;u 6= v.

Ahora, damos el siguiente lema técnico que utilizamos después.

Lema 5.4. Sea zn la sucesión dada por el método simplificado de Steffensen (5.4). Sizm−1 6= zm con zm−1, zm ∈ Ω, entonces

F (zm) = ([zm, zm−1;F ]−B0) (zm − zm−1).

Demostración. A partir de la definición de zn, se sigue

F (zm−1) +B0(zm − zm−1) = 0,

de manera que

F (zm) = F (zm)− F (zm−1)−B0(zm − zm−1)= [zm, zm−1;F ](zm − zm−1)−B0(zm − zm−1)= ([zm, zm−1;F ]−B0) (zm − zm−1).

A continuación presentamos un resultado de convergencia semilocal para el método sim-plificado de Steffensen (5.4).

Page 142: Estrategia metodos iterativos

128 CAPÍTULO 5. SITUACIÓN (NO)-DIFERENCIABLE

Teorema 5.5. Sean X un espacio de Banach y F : Ω ⊂ X → X un operador no lineal defi-nido en un dominio abierto convexo no vacío Ω. Suponemos que se cumplen las condiciones(H1)–(H3). Si la ecuación

t =(

1 +N − β0(L+K(2t+ δ0))1− β0(L+K(2t+ δ0))

)β0δ0, (5.19)

donde N = β0(L+Kδ0(1 + β0)), tiene al menos una raíz real positiva, y denotamos por r laraíz positiva más pequeña de (5.19),

Q = β0(L+K(2r + δ0)) < 1 (5.20)

y B(z0, r) ⊂ Ω, entonces el método simplificado de Steffensen (5.4), empezando en z0, es-tá bien definido y converge a una solución z∗ de F (x) = 0. Además, la solución z∗ y lasiteraciones zn pertenecen a B(x0, r) y z∗ es única en B(x0, r) ∩ Ω.

Demostración. Comenzamos probando que la sucesión zn está bien definida, es decir,zn ∈ B(z0, r) ⊂ Ω, para todo n ∈ N. Notemos que la raíz real positiva más pequeña r de laecuación (5.19) es:

r =(

1 + N

1−Q

)β0δ0. (5.21)

A partir de (H1)–(H2) y como consecuencia de (5.21), se sigue que z1 está bien definida y

‖z1 − z0‖ ≤ ‖B−10 ‖‖F (z0)‖ ≤ β0δ0 < r.

Luego, z1 ∈ B(z0, r).A continuación, podemos definir z2 = z1 −B−1

0 F (z1) y

‖z2 − z1‖ ≤ ‖B−10 ‖‖F (z1)‖

≤ ‖B−10 ‖‖[z1, z0;F ]−B0‖‖z1 − z0‖

≤ β0 (L+K(‖z1 − z0‖+ ‖F (z0)‖)) ‖z1 − z0‖≤ β0(L+Kδ0(1 + β0))‖z1 − z0‖= N‖z1 − z0‖.

Además, por (5.21), también se tiene que

‖z2 − z0‖ ≤ ‖z2 − z1‖+ ‖z1 − z0‖ ≤ (1 +N)‖z1 − z0‖ ≤ (1 +N)β0δ0 < r

y, por tanto, z2 ∈ B(z0, r).Suponemos ahora, para i = 1, 2, . . . , n, que

‖zi − zi−1‖ < N Qi−2‖z1 − z0‖,

‖zi − z0‖ <

(1 +N

1−Qi−1

1−Q

)‖z1 − z0‖ < r,

donde Q < 1 por (5.20).

Page 143: Estrategia metodos iterativos

5.2. MÉTODO PREDICTOR: EL MÉTODO SIMPLIFICADO DE STEFFENSEN 129

Entonces, zn+1 = zn −B−10 F (zn) está bien definido y

‖zn+1 − zn‖ ≤ ‖B−10 ‖‖F (zn)‖

≤ ‖B−10 ‖‖[zn, zn−1;F ]−B0‖‖zn − zn−1‖

≤ β0 (L+K(‖zn − z0‖+ ‖zn−1 − z0‖+ ‖F (z0)‖)) ‖zn − zn−1‖< β0(L+K(2r + δ0))‖zn − zn−1‖= Q‖zn − zn−1‖< N Qn−1‖z1 − z0‖.

Notemos que las diferencias divididas de primer orden [zn, zn−1;F ] existen ya que si zn = zn−1,zn−1 es una solución de F (x) = 0, la sucesión zn sería convergente y el resultado quedaríaprobado.

Además, por (5.20), también tenemos

‖zn+1 − z0‖ ≤ ‖zn+1 − zn‖+ ‖zn − z0‖< (N(Qn−1 + · · ·+Q+ 1) + 1) ‖z1 − z0‖

=(

1 +N1−Qn

1−Q

)‖z1 − z0‖

<

(1 + N

1−Q

)‖z1 − z0‖

≤(

1 + N

1−Q

)β0δ0

= r.

Luego, zn+1 ∈ B(z0, r), para todo n ∈ N.Veamos ahora que la sucesión zn es de Cauchy. Como

‖zn+j − zn‖ ≤ ‖zn+j − zn+j−1‖+ ‖zn+j−1 − zn+j−2‖+ · · ·+ ‖zn+1 − zn‖< (Qj−1 +Qj−2 + · · ·+Q+ 1)‖zn+1 − zn‖

= 1−Qj

1−Q ‖zn+1 − zn‖

<1−Qj

1−Q N Qn−1‖z1 − z0‖

< NQn−1

1−Q‖z1 − z0‖,

para j ≥ 1 y Q < 1, se sigue que zn es una sucesión de Cauchy. Por tanto, zn esconvergente. Ahora, si lım

nzn = z∗ ∈ B(z0, r), vemos que z∗ es una solución de F (x) = 0.

Como‖F (zn)‖ < (L+K(2r + δ0))‖zn − zn−1‖

y ‖zn − zn−1‖ → 0, cuando n → ∞, se sigue fácilmente, por la continuidad del operador F ,que F (z∗) = 0.

Page 144: Estrategia metodos iterativos

130 CAPÍTULO 5. SITUACIÓN (NO)-DIFERENCIABLE

Terminamos probando la unicidad de la solución z∗ en B(z0, r). Suponemos entonces queexiste otra solución y∗ ∈ B(z0, r), con y∗ 6= z∗, de la ecuación F (x) = 0. Sea J = [y∗, z∗;F ].Si J es inversible, tenemos z∗ = y∗, puesto que J(y∗ − z∗) = F (y∗) − F (z∗). Para ver queJ es inversible, basta, por el lema de Banach (lema 1.22), con ver que ‖I − B−1

0 J‖ < 1. Enefecto, por hipótesis,

‖I −B−10 J‖ ≤ ‖B−1

0 ‖‖B0 − J‖ ≤ ‖B−10 ‖‖[z0, z0 + F (z0);F ]− [y∗, z∗;F ]‖

≤ β0(L+K(‖y∗ − z0‖+ ‖z∗ − z0 − F (z0)‖))≤ β0(L+K(‖y∗ − z0‖+ ‖z∗ − z0‖+ ‖F (z0)‖))≤ β0(L+K(2r + δ0))< 1.

Luego, el operador J−1 existe.

5.2.2. AccesibilidadUna vez probada la convergencia semilocal del método simplificado de Steffensen (5.4),

nuestro siguiente objetivo es ver cuál es el dominio de parámetros de este método paracompararlo con el de Steffensen. Para ello, transformamos la ecuación (5.19) en la siguienteecuación cuadrática:

2Kβ0t2 + (β0(L+Kδ0(1− 2β0))− 1) t+ δ0β0(1 +Kδ0β

20) = 0. (5.22)

Como el término independiente de la ecuación anterior es siempre positivo, para que dichaecuación tenga al menos una raíz real positiva, las dos raíces tienen que ser positivas. Vemosentonces cuándo tiene dos raíces reales positivas, lo que ocurre si

β0(L+Kδ0(1− 2β0))− 1 < 0 (5.23)

y∆ = (β0(L+Kδ0(1− 2β0))− 1)2 − 8Kδ0β

20(1 +Kδ0β

20)

=(β0(L+Kδ0(1− 2β0))− 1 +

√8Kδ0β2

0(1 +Kδ0β20))

×(β0(L+Kδ0(1− 2β0))− 1−

√8Kδ0β2

0(1 +Kδ0β20))> 0.

Observamos que los dos factores de ∆ son < 0 si

β0(L+Kδ0(1− 2β0)) +√

8Kδ0β20(1 +Kδ0β2

0) < 1. (5.24)

Luego, ∆ > 0 si se cumple (5.24). También, como consecuencia de (5.24), se cumple (5.23).En este caso, la raíz positiva más pequeña de (5.22) es

r = 14Kβ0

(1− β0(L+Kδ0(1− 2β0))−

√∆). (5.25)

A continuación, vemos cuándo se cumple la condición (5.20) del teorema 5.5. Para ello,sustituimos el valor de r en (5.20) y obtenemos

1− β0(L+Kδ0(1 + 2β0) +√

∆ > 0. (5.26)

Page 145: Estrategia metodos iterativos

5.3. MÉTODO ITERATIVO HÍBRIDO (PREDICTOR-CORRECTOR) 131

Notemos que también podemos considerar que la ecuación (5.22) tenga una raíz realpositiva doble sin más que tener en cuenta la desigualdad no estricta en (5.24).

En consecuencia, las condiciones de convergencia que se imponen a los parámetros δ0,β0, L y K, como son que la ecuación (5.19) tenga al menos una raíz real positiva y que laraíz real positiva más pequeña de (5.19), denotada por r, cumpla (5.20), se van a cumplirsiempre que se cumplan (5.24) y (5.26). Así, enunciamos entonces el siguiente resultado, cuyademostración se sigue fácilmente sin más que satisfacer las hipótesis del teorema 5.5.

Corolario 5.6. Sean X un espacio de Banach y F : Ω ⊂ X → X un operador no linealdefinido en un dominio abierto convexo no vacío Ω. Supongamos que se cumplen las condicio-nes (H1)–(H3). Además, si se cumplen (5.24), (5.26) y B(z0, r) ⊂ Ω, donde r está definidoen (5.25), entonces el método simplificado de Steffensen (5.4), empezando en z0, está biendefinido y converge a una solución z∗ de F (x) = 0. Además, la solución z∗ y las iteracioneszn pertenecen a B(z0, r) y z∗ es única en B(z0, r) ∩ Ω.

A continuación, representamos gráficamente el dominio de parámetros asociado al coro-lario 5.6. Para ello, seguimos el mismo criterio que para el corolario 5.3 y distinguimos doscasos: el caso diferenciable (L = 0) y el no diferenciable (L 6= 0). Notemos que las condicionesiniciales (H1) y (H2), exigidas al punto de salida z0, definen los parámetros δ0 y β0, mientrasque la condición (H3), exigida al operador F , define los parámetros fijos L y K. Igual queantes, consideramos x = β0 (eje de abscisas), y = Kδ0 (eje de ordenadas) y coloreamos enel plano xy los valores de los parámetros que verifican las condiciones (5.24) y (5.26) delcorolario 5.6. Observamos entonces que los ejes de los dominios de parámetros asociados alos corolarios 5.3 y 5.6 representan los mismos valores. A la vista de las figuras 5.3 y 5.4, po-demos decir que el dominio de parámetros es mayor cuanto menor es el valor de L. Notamosque las regiones están superpuestas.

Si ahora comparamos los dominios de parámetros de los métodos de Steffensen y simplifi-cado de Steffensen (5.4), figuras 5.5 y 5.6, vemos en ambos casos que el dominio de parámetrosdel método simplificado de Steffensen (5.4) es mayor que el del método de Steffensen. Notamosque las regiones están superpuestas.

5.3. Método iterativo híbrido (predictor-corrector)A la vista de todas las figuras anteriores acerca de los dominios de parámetros de los

métodos de Steffensen y simplificado de Steffensen (5.4), observamos que tenemos más po-sibilidades de localizar puntos de salida para obtener convergencia semilocal del métodosimplificado de Steffense (5.4)n que para el método de Steffensen. Por tanto, las condicionesque garantizan la convergencia semilocal del método de Steffensen son más restrictivas quelas que garantizan la del método simplificado de Steffensen (5.4). Así, construimos un métodoiterativo híbrido (predictor-corrector), donde el método predictor es el método simplificado deSteffensen (5.4) y el método corrector es el método de Steffensen, que mejora la aplicabilidaddel método de Steffensen.

5.3.1. Construcción del métodoNuestro objetivo inmediato consiste en asegurar que para un par (δ0, β0) que satisfaga

las condiciones del corolario 5.6, es decir, que (δ0, β0) esté dentro del dominio de parámetros

Page 146: Estrategia metodos iterativos

132 CAPÍTULO 5. SITUACIÓN (NO)-DIFERENCIABLE

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

Figura 5.3: Dominio de parámetros del mé-todo simplificado de Steffensen asociado alcorolario 5.6 cuando L = 0.

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

Figura 5.4: Dominios de parámetros del mé-todo simplificado de Steffensen asociados alcorolario 5.6 cuando L = 1

2 ,13 ,

15 ,

110 (rosa,

morado, magenta y cyan, respectivamente).

del método simplificado de Steffensen (5.4), obtengamos un par (δN0 , βN0) que satisfaga lascondiciones del corolario 5.3, después de realizar un cierto número N0 de iteraciones conel método simplificado de Steffensen (5.4), y asegurar así la convergencia del método deSteffensen al empezar este método en la iteración N0 obtenida previamente mediante elmétodo simplificado de Steffensen (5.4). Cuando esto ocurra, podemos considerar el par(δN0 , βN0) como par inicial (δ, β) para el método de Steffensen.

Para ello, construimos una sencilla modificación del método de Steffensen que sea con-vergente cuando se tomen como puntos de salida los mismos que, a partir de los cuales,garantizan la convergencia del método simplificado de Steffensen (5.4). Así, consideramos elsiguiente método iterativo híbrido (predictor-corrector):

dado z0 en Ω,zj+1 = zj − [z0, z0 + F (z0);F ]−1F (zj), j = 0, 1, . . . , N0 − 1,x0 = zN0 ∈ Ω,xn+1 = xn − [xn, xn + F (xn);F ]−1F (xn), n ≥ 0,

(5.27)

donde z0 satisface las condiciones del corolario 5.6 y x0 las del corolario 5.3.Para que (5.27) sea convergente, nos planteamos entonces dos cuestiones:1. Localizar un punto de salida z0, a partir del cual el método predictor, el método sim-

plificado de Steffensen (5.4), converja.

2. A partir de la convergencia del método predictor, garantizar la existencia de un valorN0 ∈ N tal que zN0 se pueda tomar como punto de salida para el método corrector, elmétodo de Steffensen, y asegurar así después la convergencia de este método al empezaren x0 = zN0 .

Page 147: Estrategia metodos iterativos

5.3. MÉTODO ITERATIVO HÍBRIDO (PREDICTOR-CORRECTOR) 133

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

Figura 5.5: Dominios de parámetros delos métodos de Steffensen (anaranjado) ysimplificado de Steffensen (marrón) cuandoL = 0 (caso diferenciable).

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

Figura 5.6: Dominios de parámetros de losmétodos de Steffensen (verde) y simplifica-do de Steffensen (rosa) cuando L = 1

2 (casono diferenciable).

Entonces, utilizamos el método simplificado de Steffensen (5.4) durante un número finitode pasos N0 hasta que zN0 = x0 cumpla las condiciones exigidas para que el método deSteffensen sea convergente y, después, aplicamos el método de Steffensen en vez del méto-do simplificado de Steffensen (5.4). La clave del problema reside entonces en garantizar laexistencia de N0.

5.3.2. Convergencia semilocal del método

A continuación, estudiamos la convergencia semilocal del método híbrido (5.27). A partirdel método predictor, el método simplificado de Steffensen (5.4), consideramos la siguientesituación. Dada la aproximación inicial z0, consideramos la sucesión zn definida por elmétodo simplificado de Steffensen (5.4) junto con

‖F (z0)‖ ≤ δ0, ‖[z0, z0 + F (z0);F ]−1‖ ≤ β0.

Para que el método simplificado de Steffensen (5.4) sea convergente, se tienen que cumplir lascondiciones del corolario 5.6. Después, iterando, se van definiendo los pares (δn, βn) asociadosa cada zn.

En primer lugar, observamos que la definición del par inicial (δ0, β0) para el método deSteffensen es inmediata porque los parámetros δ0 y β0 representan lo mismo en los métodosde Steffensen y simplificado de Steffensen (5.4). A continuación, procedemos de la siguienteforma.

Primer paso del método predictor: definición del par (δ1, β1).

Page 148: Estrategia metodos iterativos

134 CAPÍTULO 5. SITUACIÓN (NO)-DIFERENCIABLE

Notemos‖F (z1)‖ ≤ ‖[z1, z0;F ]−B0‖‖z1 − z0‖

≤ (L+K(‖z1 − z0‖+ ‖F (z0)‖)) ‖z1 − z0‖≤ (L+K(β0δ0 + δ0)) β0δ0

< (L+K(2r + δ0)) β0δ0

= Qδ0

= δ1,

‖I −B−10 A1‖ ≤ ‖B−1

0 ‖‖B0 − A1‖≤ β0 (L+K(‖z1 − z0‖+ ‖z1 − z0‖+ ‖F (z1)‖+ ‖F (z0)‖))≤ β0 (L+K(2r + δ1 + δ0))= β0 (L+K(2r + (1 +Q)δ0))= T,

‖A−11 ‖ = ‖[z1, z1 + F (z1);F ]−1‖ ≤ β0

1− T = β1,

siempre que T < 1, que puede escribirse como

T = (1 +Kδ0β0)Q < 1. (5.28)

Además, δ1 = Qδ0 < δ0, puesto que Q < 1 si se cumple (5.28).

Segundo paso del método predictor: definición del par (δ2, β2).Notemos

‖F (z2)‖ ≤ ‖[z2, z1;F ]−B0‖‖z2 − z1‖≤ (L+K(‖z2 − z0‖+ ‖z1 − z0 − F (z0)‖)) ‖z2 − z1‖≤ (L+K(‖z2 − z0‖+ ‖z1 − z0‖+ ‖F (z0)‖)) ‖B−1

0 ‖‖F (z1)‖≤ (L+K(2r + δ0)) β0δ1

= Qδ1

= δ2,

‖I −B−10 A2‖ ≤ ‖B−1

0 ‖‖B0 − A2‖≤ β0 (L+K(‖z2 − z0‖+ ‖z2 − z0‖+ ‖F (z2)‖+ ‖F (z0)‖))≤ β0 (L+K(2‖z2 − z0‖+ δ2 + δ0))= β0 (L+K(2r + (1 +Q2)δ0))< β0 (L+K(2r + (1 +Q)δ0))= T,

‖A−12 ‖ = ‖[z2, z2 + F (z2);F ]−1‖ ≤ β0

1− T = β2,

siempre que T < 1. Además, δ2 = Q2δ0 < δ0, puesto que Q < 1 si se cumple (5.28).

Page 149: Estrategia metodos iterativos

5.3. MÉTODO ITERATIVO HÍBRIDO (PREDICTOR-CORRECTOR) 135

n-ésimo paso del método predictor: definición del par (δn, βn).Notemos

‖F (zn)‖ ≤ ‖[zn, zn−1;F ]−B0‖‖zn − zn−1‖≤ (L+K(‖zn−1 − z0‖+ ‖zn−1 − z0 − F (z0)‖)) ‖zn − zn−1‖≤ (L+K(‖zn − z0‖+ ‖zn−1 − z0‖+ ‖F (z0)‖)) ‖B−1

0 ‖‖F (zn−1)‖≤ (L+K(2r + δ0)) β0δn−1

= Qδn−1

= δn,

‖I −B−10 An‖ ≤ ‖B−1

0 ‖‖B0 − An‖≤ β0 (L+K(‖zn − z0‖+ ‖zn − z0‖+ ‖F (zn)‖+ ‖F (z0)‖))≤ β0 (L+K(2r + δn + δ0))= β0 (L+K(2r + (1 +Qn)δ0))< β0 (L+K(2r + (1 +Q)δ0))= T,

‖A−1n ‖ = ‖[zn, zn + F (zn);F ]−1‖ ≤ β0

1− T = βn,

siempre que T < 1. Además, δn = Qnδ0 < δ0, puesto que Q < 1 si se cumple (5.28).

Una vez construido el par (δn, βn), a partir de las sucesiones δn y βn, tenemos queasegurar la existencia de un N0 ∈ N tal que el par (δN0 , βN0) satisfaga las condiciones de con-vergencia exigidas al método de Steffensen en el corolario 5.3. Si observamos las condiciones(5.12), (5.13) y (5.15) del corolario 5.3 y tenemos en cuenta δn < δn−1 y que βn = β0

1−T esconstante, para todo n ∈ N, por ser Q < 1 y T < 1, podemos asegurar entonces las siguientestres afirmaciones.

Primero, siempre queLβ <

1 + L

1 + 2L, (5.29)

donde β = β01−T , existirá N1 ∈ N para el que se cumpla la condición (5.12) del corolario 5.3;

es decir,δN1

(M2

N1 + (LβN1 +KδN1βN1 − 1) (MN1 + βN1))< 0,

donde MN1 = βN1(L+KδN1(1 + βN1)).Segundo, siempre que

Lβ <12 , (5.30)

donde β = β01−T , existirá N2 ∈ N para el que se cumpla la condición (5.13) del corolario 5.3;

es decir,

MN2(1− 2KδN2βN2) + βN2(L+KδN2(1− 2βN2))

+√−8KδN2βN2

(M2

N2 + (LβN2 +KδN2βN2 − 1) (MN2 + βN2))< 1.

Page 150: Estrategia metodos iterativos

136 CAPÍTULO 5. SITUACIÓN (NO)-DIFERENCIABLE

donde MN2 = βN2(L+KδN2(1 + βN2)).Tercero, siempre que se cumpla (5.30), existirá N3 ∈ N para el que se cumpla la condición

(5.15) del corolario 5.3; es decir,

1− LβN3 − (1 + 2KδN3βN3)MN3 −KδN3βN3(1 + 2βN3) +√

∆N3 > 0.

donde MN3 = βN3(L+KδN3(1 + βN3)) y

∆N3 = (MN3(1− 2KδN3βN3) + βN3(L+KδN3(1− 2βN3))− 1)2

+8KδN3βN3

(M2

N3 + (LβN3 +KδN3βN3 − 1) (MN3 + βN3)).

Obsérvese que (5.29) se cumple siempre que se cumple (5.30). En consecuencia, siempreque se cumpla (5.30), podemos tomar N0 = maxN1, N2, N3, elegir x0 = zN0 y aplicar elmétodo de Steffensen a partir de la aproximación x0 = zN0 , dada por el método simplificadode Steffensen (5.4), para garantizar la convergencia del método híbrido (5.27).

Para terminar, resumimos todo lo anterior en el siguiente resultado.

Teorema 5.7. Sean X un espacio de Banach y F : Ω ⊂ X → X un operador no lineal defi-nido en un dominio abierto convexo no vacío Ω. Supongamos que se cumplen las condiciones(H1)–(H3), (5.28), (5.30) y B(z0, r) ⊂ Ω, donde r está dado en (5.25). Entonces, existe unN0 ∈ N tal que, para x0 = zN0, la sucesión xn dada por el método híbrido (5.27) está biendefinida y converge a una solución de F (x) = 0.

5.4. AplicaciónIlustramos el estudio realizado anteriormente con dos aplicaciones a sistemas no lineales,

siendo uno diferenciable y otro no diferenciable. Ambos sistemas surgen de las discretizacionesde los problemas conservativos definidos en la sección 1.6.2 del capítulo 1.

5.4.1. Sistema de ecuaciones no lineales diferenciableLa distribución constante de la temperatura se conoce en una varilla homogénea de longi-

tud 1 en la que, como consecuencia de una reacción química o algún proceso de calor, el calorse genera a una velocidad φ(x(t)) por unidad de tiempo y por unidad de longitud, siendoφ(x(t)) una función dada por el exceso de temperatura x de la varilla sobre la temperaturacirculante. Consideramos el problema en el que al final de la varilla, t = 0 y t = 1, se man-tienen esas temperaturas, discretizamos el correspondiente problema de contorno dado por(1.49)–(1.50) y aproximamos una solución del sistema no lineal (1.52) que surge del procesode discretización.

Por ejemplo, si elegimos la ley exponencial, φ(u) = exp(u), para la generación del calor ym = 8, entonces el vector vx del correspondiente sistema (1.52) está dado por

vx = (v1, v2, . . . , v8)t, vi = exp(xi), i = 1, 2, . . . , 8. (5.31)

A continuación, observamos que una solución x∗ del correspondiente sistema (1.52) con(5.31) satisface

‖x∗‖ ≤ h2‖A−1‖ ‖vx∗‖ ⇒ ‖x∗‖ − h2‖A−1‖ exp(‖x∗‖) ≤ 0,

Page 151: Estrategia metodos iterativos

5.4. APLICACIÓN 137

donde ‖A−1‖ = 10 y h = 19 , de forma que ‖x∗‖ ∈ [0, %1] ∪ [%2,+∞], siendo %1 = 0.142342 . . .

y %2 = 3.279579 . . . las dos raíces reales positivas de la ecuación escalar 81t− 10 exp(t) = 0.Por tanto, podemos considerar F : Ω ⊂ R8 → R8 con

Ω = x ∈ R8; ‖x‖ < 3,

puesto que %1 < 3 < %2.Además, la primera derivada de la función F definida en (1.52) está dada por

F ′(x) = A+ h2diagvx.

En consecuencia,F ′(x)− F ′(y) = h2diagz,

donde y = (y1, y2, . . . , y8)t y z = (exp(x1)−exp(y1), exp(x2)−exp(y2), . . . , exp(x8)−exp(y8))t,y

‖F ′(x)− F ′(y)‖ ≤ h2 max1≤i≤8

|exp(ci)| ‖x− y‖,

con c = (c1, c2, . . . , c8)t ∈ Ω y h = 19 , de modo que

‖F ′(x)− F ′(y)‖ ≤ e3h2‖x− y‖. (5.32)

Considerando la diferencia dividida ([37])

[x,y;F ] =∫ 1

0F ′ (τx + (1− τ)y) dτ

y teniendo en cuenta∫ 1

0‖τ(x− u) + (1− τ)(y− v)‖dτ ≤ 1

2 (‖x− u‖+ ‖y− v‖) ,

y (5.32), tenemos

‖[x,y;F ]− [u,v;F ]‖ ≤∫ 1

0‖F ′ (τx + (1− τ)y)− F ′ (τu + (1− τ)v) ‖ dτ

≤ e3h2∫ 1

0(τ‖x− u‖+ (1− τ)‖y− v‖) dτ

= e3

2 h2 (‖x− u‖+ ‖y− v‖) .

Luego, ω(s, t) = e3

2 h2(s+ t) = e3

162(s+ t).Eligiendo el punto de salida x0 = (0, 0, . . . , 0)t y la norma del máximo, se obtiene δ = 1

81y β = 11.177516 . . ., de manera que la ecuación (5.5) del teorema 5.2, que se reduce a

(2.771684 . . .)t2 − (1.164148 . . .)t+ (0.137625 . . .)(2.771684 . . .)t− (0.774543 . . .) = 0,

no tiene raíces reales. Así que no podemos garantizar la convergencia del método de Steffensena una solución de (1.52) con φ(u) = exp(u).

Page 152: Estrategia metodos iterativos

138 CAPÍTULO 5. SITUACIÓN (NO)-DIFERENCIABLE

En cambio, si que podemos aplicar el método simplificado de Steffensen (5.4) empezandoen z0 = (0, 0, . . . , 0)t. Como δ0 = 1

81 , β0 = 11.177516 . . ., la ecuación (5.19) del teorema 5.5,que se reduce a

(2.771684 . . .)(t− 0.283165 . . .)(t− 0.209447 . . .)(2.771684 . . .)t− (0.982890 . . .) = 0,

tiene dos raíces reales positivas y la más pequeña, r = 0.209447 . . ., cumple la condición(5.20), puesto que

Q = β0(L+K(2r + δ0)) = 0.597631 . . . < 1,y es tal que B(z0, r) ⊂ Ω = B(0, 3). Por tanto, el método simplificado de Steffensen (5.4) con-verge a una solución de (1.52) con φ(u) = exp(u), la dada por el vector x∗ = (x∗1, x∗2, . . . , x∗8)tque aparece en la tabla 5.5, después de ocho iteraciones con una tolerancia de 10−16. Observa-mos que ‖x∗‖ = 0.138937 . . . < 3 y x∗ es única en la bola B(z0, 0.209447 . . .). En la tabla 5.6se muestran los errores ‖zn−x∗‖ utilizando el criterio de parada ‖zn− zn−1‖ < 10−16. Note-mos que el vector dado en la tabla 5.5 es una buena aproximación de la solución del sistema(1.52) con φ(u) = exp(u), puesto que ‖F (x∗)‖ ≤ constante × 10−16. Mostramos la sucesión‖F (zn)‖ en la tabla 5.6.

i x∗i n x∗i i x∗i n x∗i1 0.05481058 . . . 3 0.12475178 . . . 5 0.13893761 . . . 7 0.09657993 . . .2 0.09657993 . . . 4 0.13893761 . . . 6 0.12475178 . . . 8 0.05481058 . . .

Tabla 5.5: Aproximación de la solución x∗ de (1.52) con φ(u) = exp(u)

n ‖zn − x∗‖ ‖F (zn)‖0 1.3893 . . .× 10−1 1.2345 . . .× 10−2

1 9.4358 . . .× 10−4 1.1258 . . .× 10−4

2 1.3380 . . .× 10−5 1.6342 . . .× 10−6

3 1.9003 . . .× 10−7 2.3261 . . .× 10−8

4 2.6986 . . .× 10−9 3.3039 . . .× 10−10

5 3.8321 . . .× 10−11 4.6918 . . .× 10−12

6 5.4417 . . .× 10−13 6.6625 . . .× 10−14

7 7.7259 . . .× 10−15 9.4609 . . .× 10−16

Tabla 5.6: Errores absolutos obtenidos con el método simplificado de Steffensen y ‖F (zn)‖

Por otra parte, es fácil ver que se puede aplicar el método híbrido (5.27) porque se cumplenlas condiciones (5.28) y (5.30) del teorema 5.7, ya que

T = β0 (L+K(2r + (1 +Q)δ0)) = 0.926161 . . . < 1 y Lβ = 0 < 12

respectivamente, de manera que está garantizada la convergencia semilocal del método híbrido(5.27) para un cierto N0 ∈ N. Así, la primera aproximación dada por el método simplificado

Page 153: Estrategia metodos iterativos

5.4. APLICACIÓN 139

de Steffensen (N0 = 1) ya cumple las hipótesis del teorema 5.2, puesto que la raíz real positivamás pequeña de la ecuación (5.5), que ahora se reduce a

(2.812541 . . .)(t− 0.354796 . . .)(t− 0.001279 . . .)(2.812541 . . .)t− (0.997887 . . .) = 0,

es R = 0.001279 . . . y cumple (5.6):

M + βω(R,R + δ) = 0.005711 . . . < 1.

Por tanto, después de una aproximación del método simplificado de Steffensen (5.4), po-demos aplicar el método de Steffensen para aproximar la solución x∗ dada en la tabla 5.5, quese obtiene después de dos aproximaciones más con el método de Steffensen y una toleranciade 10−16. En la tabla 5.7 se muestran los errores ‖xn−x∗‖ y la sucesión ‖F (xn)‖ utilizandoel mismo criterio de parada que antes.

n ‖xn − x∗‖ ‖F (xn)‖0 1.3893 . . .× 10−1 1.2345 . . .× 10−2

1 9.4358 . . .× 10−4 1.1258 . . .× 10−4

2 4.4714 . . .× 10−8 5.5579 . . .× 10−9

Tabla 5.7: Errores absolutos obtenidos con el método híbrido (5.27) y ‖F (xn)‖

5.4.2. Sistema de ecuaciones no lineales no diferenciableRecordemos primero que si consideramos un sistema de ecuaciones del tipo (1.52), donde

la función φ(u) es no derivable, entonces la función F es no diferenciable.Consideramos entonces φ(u) = u2

3 + |u|+ 1, de manera que el correspondiente sistema deecuaciones no lineales dado por (1.52) con m = 8 y

vx = (v1, v2, . . . , v8)t, vi = x2i

3 + |xi|+ 1, i = 1, 2, . . . , 8, (5.33)

es no diferenciable.Como en R8 podemos considerar diferencias divididas de primer orden que no necesitan

que la función sea diferenciable, consideramos la diferencia dividida de primer orden dadapor [u,v;F ] = ([u,v;F ]ij)8

i,j=1 ∈ L(R8,R8), donde [u,v;F ]ij está definido en (1.46) si m = 8.Luego,

[u,v;F ] = A+ h2 diagz,

donde zi = ui+vi

3 + |ui|−|vi|ui−vi

, para i = 1, 2, . . . , 8, y h = 19 . Así,

‖[x,y;F ]− [u,v;F ]‖ ≤ max1≤i≤8

∣∣∣∣∣xi − ui3 + yi − vi3 + |xi| − |yi|

xi − yi− |ui| − |vi|

ui − vi

∣∣∣∣∣≤ h2

(13 max

1≤i≤8|xi − ui + yi − vi|+ max

1≤i≤8

∣∣∣∣∣ |xi| − |yi|xi − yi− |ui| − |vi|

ui − vi

∣∣∣∣∣)

≤ h2

3 (‖x− u‖+ ‖y− v‖) + 2h2,

Page 154: Estrategia metodos iterativos

140 CAPÍTULO 5. SITUACIÓN (NO)-DIFERENCIABLE

de manera que ω(s, t) = 2h2 + h2

3 (s+ t) = 281 + 1

243(s+ t).Si elegimos el punto de salida x0 =

(110 ,

110 , . . . ,

110

)Ty la norma del máximo, obtenemos

δ = 0.086378 . . . y β = 11.260889 . . ., de manera que la ecuación (5.5) del teorema 5.2, quese reduce a

(0.092682 . . .)t2 − (0.483595 . . .)t+ 0.709393 . . .(0.092682 . . .)t− (0.390824 . . .) = 0,

no tiene raíces reales. Por lo tanto, no podemos garantizar la convergencia del método deSteffensen a una solución de (1.52) con (5.33).

En cambio, si que podemos aplicar el método simplificado de Steffensen (5.4) empezandoen z0 =

(110 ,

110 , . . . ,

110

)T. Como δ0 = δ y β0 = β, la ecuación (5.19) del teorema 5.5, que se

reduce a(0.092682 . . .)(t− 7.194574 . . .)(t− 1.524492 . . .)

(0.092682 . . .)t− (0.717950 . . .) = 0,

tiene dos raíces reales positivas y la más pequeña, r = 1.524492 . . ., cumple la condición(5.20), puesto que

Q = β0(L+K(2r + δ0)) = 0.423342 . . . < 1.Por tanto, el método simplificado de Steffensen (5.4) converge a una solución de (1.52) con(5.33), la dada por el vector x∗ = (x∗1, x∗2, . . . , x∗8)t en la tabla 5.8, después de cinco iteracionescon una tolerancia de 10−16. Observamos que x∗ es única en la bola B(z0, 1.524492 . . .). En latabla 5.9 mostramos los errores ‖zn−x∗‖ utilizando el criterio de parada ‖zn−zn−1‖ < 10−16.Notemos que el vector dado en la tabla 5.8 es una buena aproximación de la solución delsistema (1.52) con vx definido en (5.33), ya que ‖F (x∗)‖ ≤ constante× 10−16. Mostramos lasucesión ‖F (zn)‖ en la tabla 5.9.

i x∗i n x∗i i x∗i n x∗i1 0.05468713 . . . 3 0.12442184 . . . 5 0.13855711 . . . 7 0.09634112 . . .2 0.09634112 . . . 4 0.13855711 . . . 6 0.12442184 . . . 8 0.05468713 . . .

Tabla 5.8: Aproximación de la solución x∗ de (1.52) y (5.33)

n ‖zn − x∗‖ ‖F (zn)‖0 4.5312 . . .× 10−2 8.6378 . . .× 10−2

1 1.3059 . . .× 10−5 7.6576 . . .× 10−6

2 1.8877 . . .× 10−8 3.4066 . . .× 10−9

3 2.7309 . . .× 10−11 4.9253 . . .× 10−11

4 3.9579 . . .× 10−14 7.1254 . . .× 10−15

Tabla 5.9: Errores absolutos obtenidos con el método simplificado de Steffensen y ‖F (zn)‖

Por otra parte, es fácil ver que se puede aplicar el método híbrido (5.27) porque se cumplenlas condiciones (5.28) y (5.30) del teorema 5.7, ya que

T = β0 (L+K(2r + (1 +Q)δ0)) = 0.425037 . . . < 1 y Lβ = 0.483590 . . . < 12

Page 155: Estrategia metodos iterativos

5.4. APLICACIÓN 141

respectivamente, de manera que está garantizada la convergencia semilocal del método híbrido(5.27) para un cierto N0 ∈ N. Así, la primera aproximación dada por el método simplificadode Steffensen (N0 = 1) ya cumple las hipótesis del teorema 5.2, puesto que la raíz real positivamás pequeña de la ecuación (5.5), que ahora se reduce a

(0.069768 . . .)(t− 5.570018 . . .)(t− 3.459413 . . .)(0.069768 . . .)t− (0.508965 . . .) = 0,

es R = 0.000142 . . . y cumple (5.6):

M + βω(R,R + δ) = 0.556922 . . . < 1.

Por tanto, después de una aproximación del método simplificado de Steffensen (5.4), po-demos aplicar el método de Steffensen para aproximar la solución x∗ dada en la tabla 5.5,que se obtiene después de dos aproximaciones más con el método de Steffensen y una tole-rancia de 10−16. En la tabla 5.10 se muestran los errores ‖xn − x∗‖ y la sucesión ‖F (xn)‖utilizando el mismo criterio de parada que antes.

n ‖xn − x∗‖ ‖F (xn)‖0 4.5312 . . .× 10−2 8.6378 . . .× 10−2

1 1.3059 . . .× 10−5 7.6576 . . .× 10−6

2 3.2146 . . .× 10−12 4.8940 . . .× 10−13

Tabla 5.10: Errores absolutos obtenidos con el método híbrido (5.27) y ‖F (xn)‖

Page 156: Estrategia metodos iterativos
Page 157: Estrategia metodos iterativos

Bibliografía

[1] Amat, S., y Busquier, S., Convergence and numerical analysis of a family of two-step Steffensen’s methods, Comput. Math. Appl., 49,2: 13–22, 2005.

[2] Amat, S., y Busquier, S., A two-step Steffensen’s method under modified convergenceconditions, J. Math. Anal. Appl., 324,2: 1084–1092, 2006.

[3] Andronow, A. A., y Chaikin, C. E., Theory of oscillations, Princenton UniversityPress, New Jersey, 1949.

[4] Argyros, I. K., On the Secant Method, Publ. Math. Debrecen, 43: 223–238, 1993.

[5] Argyros, I. K., A new convergence theorem for Steffensen’s method on Banach spacesand applications, Southwest J. Pure Appl. Math., 1: 23–29, 1997.

[6] Atkinson, K. E., The numerical solution of a nonlinear boundary integral equationon smooth surfaces, IMA J. of Numer. Anal., 14: 461–483, 1994.

[7] Balazs, M., y Goldner, G., On existence of divided differences in linear spaces,Rev. Anal. Number. Theorie Approximation, 2: 5–9, 1973.

[8] Banach, S., Théorie des opérations linéaires, Chelsea, 2a edición, New York, 1963.

[9] Banás, J., Rocha Martin, C. J., y Sadarangani, K., On solutions of a quadraticintegral equation of Hammerstein type, Math. Comput. Modelling, 43: 97–104, 2006.

[10] Beauzamy, B., Introduction to Banach spaces and their geometry, North Holland,1985.

[11] Berberian, S. K., Lectures in functional analysis and operator theory, Springer Ver-lag, 1974.

[12] Bruns, D. D., y Bailey, J. E., Nonlinear feedback control for operating a nonisot-hermal CSTR near an unstable steady state, Chem. Eng. Sci., 32: 257–264, 1977.

[13] Cartan, H., Calcul diffeérentiel, Hermann, 1971.

[14] Corduneanu, C., Integral Equations and Applications, Cambridge University Press,Cambridge, 1991.

[15] Curtain, R. F., y Pritchard, A. J., Functional analysis in modern applied mat-hematics, Academic Press, 1977.

143

Page 158: Estrategia metodos iterativos

144 Bibliografía

[16] Day, M. M., Normed linear spaces, Springer Verlag, 1958.

[17] Deimling, K., Nonlinear functional analysis. Springer Verlag, Berlin, 1985.

[18] Dennis, J. E., Jr., Toward a Unified Convergence Theory for Newton-Like Methods.Article in Nonlinear funcional analysis and aplications. Edited by L. B. Rall, AcademicPress, New York, 43: 425–472, 1970.

[19] Dunford, N., y Schwartz, J. T., Linear operators. Part I: General theory, Inters-cience Publishers Inc., 1958.

[20] Ezquerro, J. A., Gutiérrez, J. M., Hernández, M. A., Romero, N., y Rubio,M. J., El método de Newton: de Newton a Kantorovich, La Gaceta de la RSME, 13,1:53–76, 2010.

[21] Faraci, F., y Moroz, V., Solutions of Hammerstein integral equations via a varia-tional principle, J. Integral Equations. Anal., 15,4: 385–402, 2003.

[22] Ganesh, M., y Joshi, M. C., Numerical solvability of Hammerstein integral equationsof mixed type, IMA J. Numer. Anal., 11: 21–31, 1991.

[23] Hernández, M. A., y Rubio, M. J., A uniparametric family of iterative processesfor solving nondifferentiable equations, J. Math. Anal. Appl., 275: 821–834, 2002.

[24] Hernández, M. A., Rubio, M. J., y Ezquerro, J. A., Secant-like methods forsolving nonlinear integral equations of the Hammerstein type, J. Comput. Appl. Math.,115: 245–254, 2000.

[25] Hu, S., Khavanin, M., y Zhuang, W., Integral equations arising in the kinetictheory of gases, Appl. Anal., 34: 261–266, 1989.

[26] Kantorovich, L. V., The majorant principle and Newton’s method (en ruso), Dokl.Akad. Nauk. SSSR, 76: 17–20, 1951.

[27] Kantorovich, L. V., y Akilov, G. P., Functional analysis, Pergamon Press, NewYork, 1982.

[28] Kincaid, D., y Cheney, W., Análisis numérico: las mátemáticas del cálculo cientí-ficio, Addison-Wesley Iberoamericana, Wilmington, 1994.

[29] Kreyszig, E., Introductory functional analysis with applications, John Wiley & Sons,New York, 1978.

[30] Laarsonen, P., Ein abergradratisch konvergenter intertiver algorithmus, Ann. Acad.Sci. fenn. Ser. A I, 405: 1–10, 1969.

[31] Lindenstruss, J., y Tzafriri, L., Classical Banach spaces I, Springer Verlag, 1977.

[32] Lindenstruss, J., y Tzafriri, L., Classical Banach spaces II, Springer Verlag, 1979.

[33] Lund, J., y Vogel, C., A Fully-Galerkin method for the solution of an inverse pro-blem in a parabolic partial differential equation, numerical solution of an inverse, InverseProblems, 6: 205–217, 1990.

Page 159: Estrategia metodos iterativos

Bibliografía 145

[34] Ortega, J. M., y Rheinboldt, W. C., Iterative solution of nonlinear equations inseveral variables, Academic Press, 1970.

[35] Ostrowski, A. M., Solution of equations and systems of equations, Academic Press,New York, 1966.

[36] Potra, F. A., On a modified secant method, Anal. Number. Theor. Approx., 8,2:203–214, 1979.

[37] Potra, F. A., y Pták, V., Nondiscrete induction and iterative processes, Pitman,New York, 1984.

[38] Rall, L. B., Computational solution of nonlinear operator equations, Robert E. Krie-ger Publishing Company, Michigan, 1979.

[39] Rashidinia, J., y Zarebnia, M., New approach for numerical solution of Hammers-tein integral equations, Appl. Math. Comput., 185: 147–154, 2007.

[40] Rudin, W., Functional Analysis, Alhambra, Madrid, 1979.

[41] Schmidt, J. W., Eine übertragung der regula falsi auf gleichungen in Banachraum. I,II. Z. Angew. Math. Mech., 43,1-8: 97–100, 1963.

[42] Schröder, J., Nichtlineare majoranten beim verfahrem der schrittweissen näherung.Arch. Math. (Basel), 7: 471–484, 1956.

[43] Sergeev, A., On the method of chords. Sibirsk. Mat. Z., 2: 282–289, 1961.

[44] Stoker, J. J., Nonlinear vibrations, Interscience-Wiley, New York, 1950.

[45] Traub, J. F., Iterative methods for the solution of equations, Prentice-Hall, EnglewoodCliffs, New Jersey, 1964.

[46] Ulm, S., On the generalized divided differences. I, II, Izv. Akad. Nauk Eston. SSR,Ser. Fitz. Mat., 16: 146–156, 1967.

[47] Varona, J. L., Graphic and numerical comparison between iterative methods, Math.Intelligencer, 24: 37–46, 2002.

[48] Wojtaszczyk, P., Banach spaces for analysis, Cambridge University Press, 1991.

[49] Wolfram, S., The Mathematica book, 5th ed., Wolfram Media / Cambridge UniversityPress, 2003.

Page 160: Estrategia metodos iterativos
Page 161: Estrategia metodos iterativos
Page 162: Estrategia metodos iterativos

Servicio de Publicaciones

Biblioteca Universitaria

C/ Piscinas, s/n

26006 Logroño (La Rioja)

Teléfono: 941 299 187

http://publicaciones.unirioja.es

www.unirioja.es