30
Revista Latinoamericana de Psicología 2006, volumen 38, N o 2, 215-243 MODELOS MATEM`TICOS DEL CONDICIONAMIENTO CL`SICO: EVOLUCIÓN Y DESAF˝OS ACTUALES EDGAR H. VOGEL 1 , FABIÁN A. SOTO Universidad de Talca, Chile MARÍA E. CASTRO Y PAOLA A. SOLAR Universidad del Mar, Chile ABSTRACT From the beginning of the study of classical conditioning, the formulation of mathematical theories has been a major goal of theoreticians. After more than a century of research, the amount of empirical data accumulated is impressive and the theories have become progressively more complex and sophisticated. Nowadays, there is such a diversity of models, each addressing only certain categories of phenomena and using somewhat different formalisms, that a critical analysis seems opportune. This article attempts to provide such an analysis for the Spanish speaking audience. Key words: Associative learning, Pavlovian conditioning, classical conditioning, neural networks, connectionism. RESUMEN Desde los inicios del estudio del condicionamiento clásico, la formulación de modelos matemáticos ha sido uno de los principales objetivos de los autores. Después de más de un siglo de investigación, la cantidad de información empírica acumulada es impresionante y los modelos teóricos han llegado a ser progresivamente más complejos y sofisticados. Hoy en día, 1 Correspondencia: EDGAR H. VOGEL, Universidad de Talca, Escuela de Psicología, Casilla N° 747, Talca, Chile. E-mail: [email protected] continúa Agradecimientos: Esta investigación fue financiada por el Proyecto Regular Fondecyt N° 1040109.

MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

Embed Size (px)

Citation preview

Page 1: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

Revista Latinoamericana de Psicología2006, volumen 38, No 2, 215-243

MODELOS MATEMÁTICOS DEL CONDICIONAMIENTOCLÁSICO: EVOLUCIÓN Y DESAFÍOS ACTUALES

EDGAR H. VOGEL1, FABIÁN A. SOTO

Universidad de Talca, Chile

MARÍA E. CASTRO Y PAOLA A. SOLAR

Universidad del Mar, Chile

ABSTRACT

From the beginning of the study of classical conditioning, the formulation of mathematicaltheories has been a major goal of theoreticians. After more than a century of research, theamount of empirical data accumulated is impressive and the theories have become progressivelymore complex and sophisticated. Nowadays, there is such a diversity of models, eachaddressing only certain categories of phenomena and using somewhat different formalisms,that a critical analysis seems opportune. This article attempts to provide such an analysis forthe Spanish speaking audience.

Key words: Associative learning, Pavlovian conditioning, classical conditioning, neuralnetworks, connectionism.

RESUMEN

Desde los inicios del estudio del condicionamiento clásico, la formulación de modelosmatemáticos ha sido uno de los principales objetivos de los autores. Después de más de un siglode investigación, la cantidad de información empírica acumulada es impresionante y losmodelos teóricos han llegado a ser progresivamente más complejos y sofisticados. Hoy en día,

1 Correspondencia: EDGAR H. VOGEL, Universidad de Talca, Escuela de Psicología, Casilla N° 747, Talca, Chile. E-mail:[email protected]

continúa

Agradecimientos: Esta investigación fue financiada por el Proyecto Regular Fondecyt N° 1040109.

Page 2: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

216 VOGEL, SOTO, CASTRO Y SOLAR

es tal la diversidad de modelos, cada uno implementado con distintos formalismos y destinadoa explicar diferentes grupos de fenómenos, que una evaluación crítica nos parece oportuna.Este artículo pretende entregar este análisis al público de habla hispana.

Palabras clave: aprendizaje asociativo, condicionamiento Pavloviano, condicionamientoclásico, redes neuronales, conexionismo.

INTRODUCCIÓN

A principios del siglo pasado, se difundieroninternacionalmente las observaciones experi-mentales realizadas en el laboratorio de IvánPavlov, acerca de un tipo de aprendizaje asocia-tivo en el cual los animales cambian su patrón derespuesta a un estímulo, llamado condicionado,en virtud de su asociación con otro estímulo,llamado incondicionado (Pavlov, 1927). Estetipo de aprendizaje, conocido comocondicionamiento clásico o pavloviano, fue ini-cialmente estudiado en el reflejo salivatorio deperros, pero rápidamente se desarrollaron otrosprocedimientos que incluían los sistemas derespuesta de una variedad de especies, talescomo moluscos, insectos, peces, aves, roedo-res, conejos, simios y humanos.

Con el fin de dar cuenta de los innumerableshallazgos experimentales obtenidos con elcondicionamiento pavloviano, los investigado-res comenzaron a elaborar teorías que rápida-mente evolucionaron hacia modelos matemáticos.Esta temprana inclinación por la cuantificaciónobedeció a la necesidad de examinar hipótesis noambiguas, lo cual era una de las grandes dificul-tades de la Psicología en el comienzo del siglopasado. Desde entonces, los modelos decondicionamiento han crecido en complejidad ypoder explicativo, siguiendo los avances de otrasdisciplinas afines tales como la inteligencia artifi-cial y la neurociencia.

Además, la década de los ochenta fue testigodel perfeccionamiento de varios procedimientosexperimentales mixtos, tales como el retiro delsifón en la aplysia, el condicionamiento de te-

mor en ratas, y el condicionamiento palpebral enconejos, los cuales permitieron abordar en for-ma simultánea los aspectos conductuales yneurobiológicos del aprendizaje. Hoy en día, loscircuitos neuronales que subyacen a algunasformas de condicionamiento se han descrito concierto detalle (McCormick & Thompson, 1983)y sus mecanismos celulares están comenzando aser identificados (Medina et al., 2000). Estoshallazgos significan nuevos desafíos para lasteorías, las cuales, además de explicar los fenó-menos conductuales, deben cumplir con crite-rios de plausibilidad biológica.

En los últimos años, con la proliferación deluso de computadores personales que favorecenla realización de gran cantidad de cálculos enpoco tiempo, se observa un explosivo creci-miento en el número de modelos cuantitativosde condicionamiento clásico. La mayoría deestos son presentados en la forma de redesneuronales conexionistas, donde los estímulosse representan por nódulos que se influyen unosa otros a través de conexiones plásticas. En elpresente artículo, más que revisar un gran núme-ro de modelos, hemos optado por clasificarlosen unas pocas categorías, describiendo uno odos de los modelos más representativos de cadacategoría y los fenómenos para los cuales fueroncreados.

PRIMERA GENERACIÓN: MODELOS DEENSAYO DISCRETO

El fenómeno de condicionamiento clásico sedescribe usualmente como el resultado de lapresentación conjunta del estímulo condiciona-do (inicialmente neutral) y el estímulo incondi-

Page 3: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

217MODELOS DEL CONDICIONAMIENTO CLÁSICO

cionado. Cada una de estas presentaciones o“pareamientos” se denomina ensayo, y se asu-me que el grado de aprendizaje es una funcióndirecta del número de éstos. Aquellos modelosque se han preocupado por describir cómo ocu-rre el aprendizaje a través de los ensayos, sedenominan modelos de ensayo discreto,enfatizando con ello que el ensayo es la unidadmínima de aprendizaje, y que, por lo tanto, elaprendizaje se describe exclusivamente en fun-ción de la ausencia o presencia de los estímulosen el ensayo como un todo.

En la Figura 1 se presenta una red neuronal quese puede utilizar para describir la mayoría de losmodelos de ensayo discreto. Se asume que loseventos del ambiente (estímulos condicionados oEC y estímulo incondicionado o EI), activan susrespectivas unidades sensoriales de procesamien-

to representadas por círculos. El nivel de activaciónde las unidades, x

i (para el EC) y z (para el EI), es

binario, es decir asume el valor de 1 cuando elestímulo está presente y de 0 cuando no lo está. Launidad adaptativa es la encargada de la generaciónde la respuesta. Las unidades sensoriales influyena la unidad adaptativa por medio de sus conexio-nes, las cuales se representan gráficamente comolíneas que las conectan. Los valores de v

i represen-

tan la fuerza asociativa de cada estímulo condicio-nado (EC), es decir la capacidad de éstos paraprovocar la respuesta, mientras que el valor de lrepresenta la fuerza de la asociación entre el estí-mulo incondicionado (EI) y la respuesta. Se asumeque el EI tiene una conexión “máxima” o perfectacon la unidad adaptativa, y que la fuerza asociativade cada EC, v

i, es una expresión de la asociación

entre el EC y el EI. Esta figura nos servirá comopunto de partida para describir las distintas catego-rías de modelos de condicionamiento pavloviano.

Figura 1. Una red neural prototípica para el condicionamiento Pavloviano. Los círculosrepresentan unidades de procesamiento y las líneas continuas y discontinuas representan conexio-nes modificables (v

i) e inmodificables (l) entre las unidades, respectivamente. Las letras x

i, z e Y,

representan la actividad de las unidades sensoriales y la unidad adaptativa.

UNIDADADAPTATIVA

UNIDADESSENSORIALES

Respuesta

Y

X1X2

X3Z

v1v2

v3

EC1 EC2 EC3 EI

l

Page 4: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

218 VOGEL, SOTO, CASTRO Y SOLAR

El operador lineal

La tradición cuantitativa en teoría del aprendi-zaje se inició simultáneamente bajo la influenciade 2 enfoques teóricos diferentes: Lasformulaciones de Clark Hull y Keneth Spence(Hull, 1943; Spence, 1960), y la “teoría estadísti-ca del aprendizaje” o “teoría del muestreo deestímulos” (Bush & Mosteller, 1955; Estes, 1950).Pese a que la contribución de ambos enfoques esvasta, en este artículo incluimos solamente unmínimo de detalles, considerados necesarios paracomprender los desarrollos teóricos posteriores.

Dejando de lado importantes diferenciasentre ambos enfoques, se puede decir que am-bos postulan virtualmente el mismo algoritmopara describir cómo se produce el aprendizajea lo largo de los ensayos. La idea básica,conocida como “operador lineal”, señala quelas variaciones en la fuerza del hábito (en elcaso de las formulaciones de Hull y Spence) o dela probabilidad de la respuesta (en el caso de losmodelos estocásticos) son una función de la discre-pancia entre un valor máximo o asintótico y elvalor asociativo actual del EC. La siguiente ecua-ción general describe el operador lineal usando laterminología de la red neuronal de la Figura 1:

∆vi =θ(zλ-x

iv

i) (1)

Donde vi es la fuerza asociativa del EC

i, λ la

fuerza asociativa máxima proporcionada por elEI, y θ un parámetro que dicta la tasa de apren-dizaje. Este algoritmo de aprendizaje asume queel aprendizaje es un proceso gradual de correc-ción de errores. Es decir, en cada ensayo elanimal aprende una fracción de lo que le quedapor aprender, reduciendo progresivamente elerror hasta llegar a una asíntota. Este fenómenose ha observado prácticamente en todas lassituaciones de aprendizaje y se describe como laforma negativamente acelerada de la funciónque relaciona el nivel de respuesta (intensidad ofrecuencia) con el número de ensayos.

Otro aspecto distintivo de la Ecuación 1 es quetodos los ECs que se presenten simultáneamente

pareados con EI, aumentarán en su fuerzaasociativa, independientemente del valor asocia-tivo de los otros estímulos presentes en el ensayo.Esto es un ejemplo de lo que se ha denominado“hipótesis de la continuidad” (Spence, 1945), lacual sostiene que la asociación entre el EC y el EIdepende exclusivamente de parámetros relacio-nados con estos dos estímulos.

La hipótesis de la continuidad fue seriamentedesafiada a fines de los años 60 por una serie deexperimentos, que sugerían que el nivel de apren-dizaje alcanzado por un determinado estímulo,X, depende no sólo de sus propiedades (porejemplo la intensidad de X), sino también delvalor asociativo que tuvieran todos los otrosestímulos presentes en el ensayo. Por ejemplo,Kamin (1968) descubrió un fenómeno llamadobloqueo, en el cual un EC que ha desarrolladouna asociación con el EI, “bloquea” el aprendi-zaje de cualquier otro potencial EC en una faseposterior en la que se presentan ambos estímulosjuntos y seguidos por el EI. Las demostracionesbásicas de bloqueo implican un experimento de3 fases. En la primera fase, un estímulo A (porejemplo un tono), es presentado en conjunto conel EI (por ejemplo un choque eléctrico), hastaque desarrolla la habilidad para generar la res-puesta condicionada. En la segunda fase, elestímulo A es presentado en conjunto con otroestímulo, B (por ejemplo, una luz) y ambos sonseguidos por el EI. En la tercera fase, se evalúala respuesta condicionada emitida por el animalen presencia de A y B separadamente. El resul-tado es que el estímulo B desarrolla muy poca oninguna capacidad para producir RC, es decir,es bloqueado por A.

El bloqueo y otros fenómenos similares,tales como la validez relativa (Wagner, Logan,Haberlandt & Price, 1968) y el ensombrecimien-to (Pavlov, 1927) fueron interpretados comoevidencia de que el condicionamiento clásico es“competitivo”, ya que los ECs parecen “compe-tir” por la asociación con el EI. Esto no puedeser explicado por el operador lineal, el cualasume que la contigüidad entre el EC y el EI esel único requisito para el aprendizaje.

Page 5: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

219MODELOS DEL CONDICIONAMIENTO CLÁSICO

El modelo de Rescorla y Wagner (1972)

Los hallazgos de competencia entre estímu-los motivaron la formulación de teorías compe-titivas del aprendizaje. El principal objetivo deestas teorías era describir cómo un animal asociaun EC y con un EI, en función del grado en el queel EC tiene un valor predictivo o informacionalacerca de la ocurrencia del EI. Uno de losprimeros y más exitosos modelos competitivosfue propuesto por Rescorla y Wagner (1972),quienes sostenían que los organismos aprendenque un evento predice o es “causa” de unaconsecuencia dependiendo de cuán predeciblees dicha consecuencia por otros eventos. For-malmente, el modelo señala que el cambio en lafuerza de la asociación entre un EC

i y el EI está

dado por:

∆vi= αβ(zλ-Σx

iv

i) (2)

donde ∆vi es el cambio en la fuerza asociativa

del estímulo i en el ensayo, α y β representan laintensidad del EC y el EI, respectivamente, λ esel valor máximo o asintótico de aprendizaje yΣx

iv

i es la suma de la fuerzas asociativas de

todos los ECs que están presentes en el ensayo.

La aplicación del modelo presentado en laFigura 1 a la teoría de Rescorla y Wagner,implica asumir que el aprendizaje se producecuando la unidad adaptativa, que en un comien-zo sólo era activada por el estímulo incondicio-nado con valor de lambda igual a 1, comienzaprogresivamente a aumentar su probabilidad deactivación por el estímulo condicionado debidoa que la conexión entre ambos, v

i, crece a

medida que se repiten las presentaciones con-juntas del EC y el EI. El monto en que cambiaráel valor de v

i depende de la diferencia entre el

valor total de todas las conexiones activas y elvalor del estímulo incondicionado, es decir, zλ-xΣv.

Descrito de esta manera, el modelo deRescorla y Wagner puede ser considerado uncaso especial de aprendizaje supervisado, en elcual el EI es la “entrada maestra” que dicta

cuánto es lo que tienen que aprender los “apren-dices” o ECs. Cuando la suma total del aprendi-zaje de los ECs es igual al valor de la entradamaestra, el error es cero y el aprendizaje sedetiene.

Para ver cómo opera el modelo, examinemosel fenómeno de bloqueo en el cual un grupoexperimental recibe una primera fase con lacontingencia A+ (EC A seguido por el EI) y unasegunda fase con AB+ (estímulos A y B presen-tados en conjunto y seguidos por el EI). Segúnel modelo, en la fase 1 el estímulo A aumentaprogresivamente su fuerza asociativa hasta quealcanza la asíntota (es decir, v

A =λ). En la segun-

da fase, cuando los dos estímulos se presentanjuntos, el valor de Σx

iv

i =λ (gracias a la contribu-

ción de A) con lo cual el error es cero y no seproduce aprendizaje. Esto significa que al termi-nar la segunda fase, tanto A como B permanecencon su valor asociativo inicial (V

A =λ y V

B =0).

Es decir, B ha sido bloqueado por A.

El modelo de Rescorla y Wagner es la teoríamás influyente y exitosa en el ámbito del apren-dizaje asociativo. Da cuenta de todos los fenó-menos de aprendizaje asociativo simple,incluyendo los efectos de competición de estí-mulos y anticipa los resultados de otros estudiosque fueron diseñados para desafiarlo. Natural-mente, el modelo tiene varias limitaciones, lascuales han estimulado la investigación en estaárea durante más de 3 décadas. Más aún, lahistoria de las teorías matemáticas del aprendi-zaje después de 1972 puede ser descrita, en granmedida, como los intentos de los científicos parasolucionar las fallas de este modelo. Las siguien-tes secciones describen dos categorías de mode-los que fueron formulados con estos fines.

El modelo atencional de Mackintosh (1975)

El modelo de Rescorla y Wagner sostieneque los fenómenos de competición de estímulos,tales como el bloqueo, se deben a una disminu-ción en las propiedades reforzantes del EI. Estosignifica que un EI completamente predicho porlos ECs pierde todo su poder reforzador. Una

Page 6: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

220 VOGEL, SOTO, CASTRO Y SOLAR

explicación alternativa, conocida como “enfo-que atencional”, sugiere que el fracaso asociati-vo que se da en la competición de estímulos noocurre porque el EI pierde efectividad, sinoporque el animal “ignora” un EC que se presentaen conjunto con otro EC que tiene mayor rele-vancia, debido a que éste último fue asociadopreviamente con el EI.

El ímpetu por la formulación de modelosatencionales proviene de una serie de fenóme-nos en los cuales el EC pierde su capacidad paraasociarse con el EI sin que haya mediado algúncambio en la predictibilidad del EI. El másconocido de estos fenómenos es la inhibiciónlatente, en la cual la preexposición de un estímu-lo por sí solo, resulta en una disminución de sucapacidad posterior para asociarse con el EI(Lubow, 1973). El modelo de Rescorla y Wagnerno puede dar cuenta de este fenómeno porquepredice que en la fase de preexposición, cuandono está presente el EI, ningún tipo de aprendizajedebería ocurrir.

Mackintosh (1975) formuló el primer y másinfluyente modelo atencional de condicionamientoclásico. Según este modelo, cuando hay un con-junto de potenciales estímulos condicionados, lasaliencia (alfa) de un estímulo en particular va aaumentar si este estímulo es un mejor predictordel EI que todos los otros estímulos juntos, y va adisminuir si este estímulo es un peor predictor delEI que todos los demás juntos. Según este mode-lo, aunque el procesamiento del EI tiene un rol enel aprendizaje, su función se limita solamente adeterminar cuál es la asíntota que cada estímulopuede alcanzar. Los fenómenos de competiciónde estímulos se explican completamente en fun-ción de una competencia entre los ECs por teneracceso a un nivel de procesamiento que les permi-ta aprovechar el reforzamiento disponible.

El modelo de Mackintosh (1975) explica lainhibición latente asumiendo que durante lapreexposición no reforzada de un EC, éste dis-minuye su valor de alfa debido a que no es unmejor predictor del EI que todos los otros estí-mulos que se encuentran presentes durante esta

fase (es decir, los estímulos llamados“contextuales”). Luego, cuando el EC se presen-ta pareado con el EI, su valor de alfa es inferiora lo normal y, por lo tanto su aprendizaje es máslento.

Otro rasgo interesante del modelo deMackintosh es cómo concibe la relación entre elaprendizaje excitatorio y el inhibitorio. El mode-lo asume que la presentación de un EI inespera-do produce un aumento en la fuerza asociativaexcitatoria hacia una asíntota (por ejemplo, +1),mientras que la omisión de un EI esperadoresulta en el incremento de la fuerza asociativainhibitoria hacia una asíntota de valor contrario(por ejemplo, -1). La fuerza asociativa neta de unEC es una función de la suma de sus tendenciasexcitatorias e inhibitorias. Esta concepción de lainhibición, soslaya uno de los problemas másgraves del modelo de Rescorla y Wagner, el cuales la predicción incorrecta de que las presenta-ciones no reforzadas de un estímulo inhibitoriodeberían llevarlo a perder su valor inhibitorio (esdecir, su valor negativo se extingue hasta llegara 0). Esto ocurre porque, según el modelo deRescorla y Wagner, la ausencia del EI causa quetanto inhibidores como excitadores se extinganhacia una asíntota de 0. Por su parte, el modelode Mackintosh predice que no debería producir-se tal extinción de la inhibición, ya que enausencia del EI, la asíntota es –1. La no existen-cia de extinción de la inhibición ha sido confir-mada experimentalmente por Zimmer-Hart yRescorla (1974).

El modelo mixto de Pearce y Hall (1980)

Pearce y Hall (1980) creían que un mecanis-mo atencional era necesario para explicar losfenómenos de preexposición. Sin embargo, noestaban satisfechos con la idea de Mackintosh deque la preexposición no reforzada del EC era laúnica manera de obtener inhibición latente. Porejemplo, Hall y Pearce (1979) encontraron queera posible retardar la asociación entre un EC yun EI, si el EC se presenta previamente pareadocon el mismo EI pero de menor intensidad. Elmodelo de Mackintosh (1975) no puede expli-

Page 7: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

221MODELOS DEL CONDICIONAMIENTO CLÁSICO

car este hallazgo, ya que predice que durante laprimera fase el EC debería ganar más que perderasociabilidad, debido a que éste es el mejorpredictor del EI del momento, aunque sea demenor intensidad.

Frente a este dilema, Pearce y Hall (1980)propusieron que la asociabilidad de un determi-nado EC

i (

i) disminuye a medida que éste se

transforma en un buen predictor del EI y aumentacuando no se presenta un EI que se esperaba. Seasume entonces que los animales tienen unacapacidad limitada para procesar simultáneamentevarios estímulos y que solamente aquellos estí-mulos que anteceden a eventos “inesperados”ganan acceso al procesador. Usando la redneuronal de la Figura 1, la idea de Pearce y Hallpuede describirse señalando que la asociabilidaddel EC

i es proporcional al valor absoluto de la

discrepancia entre la activación de la unidadadaptativa generada por el EI y la activación dedicha unidad generada por todos los estímuloscondicionados. Es decir, el error de predicción seusa para ajustar los valores de α.

Otra innovación con respecto al modelo deRescorla y Wagner, es que Pearce y Hall (1980),sugirieron que el aprendizaje excitatorio y elinhibitorio ocurren separadamente, ocupan dis-tintas reglas y nunca se extinguen. En rigor, lared neuronal de la Figura 1 debería modificarsede tal forma que cada EC tenga 2 tipos deconexiones con la unidad adaptativa: excitatoriase inhibitorias. La fuerza asociativa neta queadquiere un determinado EC, se obtiene sustra-yendo la fuerza asociativa inhibitoria de la fuer-za asociativa excitatoria.

El modelo configuracional de Pearce(1987, 2002)

Los modelos propuestos por Rescorla yWagner (1972), Mackintosh (1975) y Pearce yHall (1980) son modelos elementísticos (o ele-mentales). Esto significa que la representaciónde un conjunto de estímulos que se presentanjuntos es equivalente a la suma de las represen-taciones de cada estímulo por separado. Esta

postura elementalista ha sido cuestionada porJohn Pearce (1994, 2002), quien propuso unmodelo que asume que las configuraciones sonlas unidades funcionales básicas en una situa-ción de condicionamiento. Según este enfoque,cada estímulo compuesto es una configuraciónúnica que desarrolla una asociación unitaria conel EI. Sin embargo, además de la fuerza asociativaque adquiere directamente la configuración, E

i,

se asume la existencia de otra fuerza asociativa,e

i, que la configuración obtiene indirectamente

gracias a la generalización desde otras configu-raciones que contienen algunos de sus compo-nentes. Por ejemplo, se asume que un estímulocompuesto AB tendrá un fuerza asociativa totalV

AB equivalente a la suma de E

AB+

je

AB+….+

ne

AB,

donde los últimos sumandos representan lasfuerzas asociativas que se generalizan a la con-figuración AB, provenientes de las configura-ciones j,…,n, que incluyen a los estímulos A o B.El valor de

je

AB está dado por la fuerza asociativa

de la configuración J, ponderada por la semejan-za que ésta tiene con AB. La semejanza entre dosconfiguraciones, Sij, está a su vez dada por lacantidad de elementos que comparten. En resu-men v

i = E

i + ΣS

ije

i.

Más allá de estas diferencias en la forma enque el modelo de Pearce concibe la representa-ción de los estímulos, éste utiliza la misma reglapara calcular el cambio asociativo en los ensa-yos de entrenamiento que el modelo de Rescorlay Wagner. Específicamente, el modelo de Pearce(1987, 1994) sostiene que el cambio en la fuerzaasociativa directamente condicionada a la confi-guración AB, está dada por β[λ - (E

AB +

je

AB +….+

ne

AB)].

Aunque las posturas elementalista yconfiguracional se han descrito como posturascontrapuestas, es importante apreciar que ambasreconocen tanto procesos configuracionalescomo elementalistas. Brandon, Vogel y Wagner(2000) enfatizaron que la principal diferenciaentre estos dos enfoques se puede apreciar en laoperación que el modelo realiza cuando se for-ma un compuesto con estímulos que se habíanpresentado por separado (o composición de

Page 8: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

222 VOGEL, SOTO, CASTRO Y SOLAR

estímulos). La visión elementalista siempreasume una sumatoria de la fuerza asociativa delos componentes al formar un compuesto, mien-tras que el modelo configuracional siempre asu-me una sustracción de la fuerza asociativa decada elemento cuando éstos se presentan juntos.

Se han realizado numerosos experimentosacerca de la composición de estímulos. Porejemplo, el enfoque elementalista predicesumatoria de la respuesta a dos estímulos entre-nados separadamente y probados en compuesto(entrenamiento con A+ y B+ y prueba con AB),mientras que el enfoque configuracional prediceun fenómeno de “promediación”. La prediccióndel modelo elementalista radica en su carácteraditivo, donde cada elemento aporta la totalidadde su fuerza asociativa al formar un compuestocon otro estímulo. Por el contrario, según elmodelo configuracional sustractivo, cada estí-mulo aporta sólo la mitad de su fuerza asociativaal formar el compuesto, ya que cada uno de ellosse parece sólo en un 50% al estímulo AB.

Con respecto a la sumatoria, la literatura encondicionamiento clásico muestra resultadoscontradictorios. Por ejemplo, numerosos estu-dios realizados con ratas y conejos, los cualesgeneralmente utilizan estímulos condicionadosde distintas modalidades sensoriales (auditiva,visual y táctil), han encontrado evidencia desumatoria, lo cual apoya la perspectivaelementística (Rescorla, 1997). Por el contrario,se ha observado ausencia de sumatoria en estu-dios que utilizan el procedimiento deautomoldeamiento en palomas y estímulos vi-suales (Aydin & Pearce, 1995). Además de estosexperimentos con sumatoria simple, se han rea-lizado algunas pruebas más complejas de losprincipios aditivo y sustractivo que distinguen aambos enfoques, encontrándose el mismo nivelde ambigüedad en los resultados. A pesar deciertos esfuerzos por explicar estas discrepan-cias (Myers, et al., 2001; Pearce, 2002), estetema está aún sin solución.

La idea predominante en la actualidad es quela controversia puede ser resuelta asumiendo

que ambos tipos de enfoques son parcialmentecorrectos, que la codificación de estímulosinvolucra tanto aspectos configuracionales comoelementalistas y que el predominio de una u otraestrategia de codificación depende de ciertasvariables relacionadas con los estímulos, la tareay los individuos. Consecuentemente, los inves-tigadores se han interesado por determinar lascondiciones precisas que determinan uno u otrotipo de procesamiento y han comenzado adesarrollar modelos flexibles que permitan estaalternancia de procesamiento (Wagner, 2003).

SEGUNDA GENERACIÓN: MODELOSBÁSICOS DE TIEMPO REAL

Los modelos de ensayo discreto de la sec-ción anterior describen los cambios asociativosque ocurren entre los ensayos pero no al interiorde éstos. Es decir, el ensayo es consideradocomo un todo asociativo discreto, en el cual elaprendizaje ocurre o no ocurre. Con esta estra-tegia, los investigadores han podido dar cuentade la mayoría de los fenómenos de adquisición,extinción, discriminación, generalización y com-petición de estímulos.

Sin embargo, existe un cúmulo de evidenciaque indica que el aprendizaje depende de larelación temporal entre el EC y el EI. Por ejem-plo, se ha encontrado que a mayor intervalo detiempo entre la iniciación del EC y la iniciacióndel EI, mayor es la latencia de iniciación y picode la respuesta condicionada (Gallistel & Gibbon,2000). También se ha visto que el intervalo entreestímulos determina la rapidez y asíntota con laque se adquiere la respuesta condicionada, en loque se ha denominado “función del intervaloentre estímulos”. Esta función tiene una formade U invertida, es decir existe un intervalo deduración intermedia, que es óptimo para el apren-dizaje (Smith, Coleman & Gormezano, 1969).

El descubrimiento de estos “fenómenos tem-porales” condujo a la evolución hacia un nuevotipo de modelos, los modelos de tiempo real, loscuales describen el proceso asociativo momentoa momento, en lugar de ensayo tras ensayo,

Page 9: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

223MODELOS DEL CONDICIONAMIENTO CLÁSICO

como lo hacían sus predecesores. El rasgomedular de esta categoría de modelos, es lanoción de “trazo” o “huella”, la cual se refiere acómo cambia la representación interna del estí-mulo a través del tiempo. Por ejemplo, Hull(1943) avanzó que la representación del estímu-lo condicionado no es la misma a lo largo de todasu duración y que el aprendizaje será óptimocuando la presentación del EI coincida con elmomento en el cual la representación del EC esmáxima. Con este simple supuesto, es posibledar cuenta de los fenómenos temporales másbásicos, tales como el hecho de que el nivel deaprendizaje óptimo es para intervalos de dura-ción intermedia.

La mayoría de los modelos de tiempo realpueden ser descritos a partir de la red neuronalde la Figura 1. La única modificación que tieneque hacerse con respecto a los modelos deensayo discreto es asumir que el nivel de activa-ción de cada unidad de procesamiento, x

i (EC) y

zi (EI), es una función continua en lugar de

binaria. Dicho de otro modo, ya no se habla deestímulo presente (con valor de x

i =1) y estímulo

ausente (con valor xi =0) sino que se habla de

niveles de activación (por ejemplo, 0 < xi < 1). El

patrón no lineal de activación de un estímulodurante un ensayo es lo que se denomina huelladel estímulo. Nótese que la huella de un estímuloes sinónimo de su representación interna, y porlo tanto no necesariamente tiene que coincidircon la presentación física real de éste, es decir, lahuella puede iniciarse en cualquier momentodespués de la presentación del estímulo y conti-nuar aún después de que éste ha cesado.

En los últimos años la creación de modelosde tiempo real ha experimentado un auge. Sinduda, esta diversidad es reflejo de los diversosorígenes teóricos de cada modelo. De hecho,cada uno de los modelos de ensayo discreto quese describieron en la sección anterior inspiró laformulación de uno o varios modelos de tiemporeal. Por ejemplo, el primer modelo de tiemporeal, publicado por Moore y Stickney (1980) esuna extensión del modelo atencional deMackintosh (1975). Más o menos al mismo

tiempo, Wagner (1981) presentó su versión entiempo real del modelo de Rescorla y Wagner, ySchmajuk y Moore (1985) hicieron lo mismocon el modelo de Pearce y Hall (1980). En esamisma década, Sutton y Barto (1981) inventaronuna regla de aprendizaje completamente nueva,la regla de la derivada del tiempo.

Por supuesto, no todos estos modelos tuvie-ron el mismo éxito. Esta sección describirá tresmodelos representativos de esta segunda gene-ración de modelos de condicionamiento clásico,que hemos denominado “modelos básicos detiempo real”. Usamos el término “básico” por-que estos modelos tienen el diseño estructuralmás elemental que se requiere para transformarun modelo de ensayo discreto en un modelo detiempo real, agregando una representación tem-poralmente variable de los estímulos.

Una versión de tiempo real del modelo deRescorla y Wagner

Schmajuk (1997) propuso que inmediata-mente después de la presentación del EC, surepresentación interna, x

i, aumenta en forma

negativamente acelerada hasta llegar a un máxi-mo, donde se estabiliza hasta comenzar a decaeruna vez que el estímulo termina. Por simplici-dad, Schmajuk asume que la representación delEI es binaria. El aprendizaje consiste en aplicarla regla de Rescorla y Wagner (1972) paraevaluar el cambio en la fuerza asociativa del ECmomento a momento de acuerdo a la intensidadde la representación interna del EC y a la presen-cia o ausencia del EI. Estas nociones se formali-zan de la siguiente manera:

∆vi= α

j[z

(t)λ

(t)-Σx

i(t)v

i(t)]x

i(t)(3)

Usando la nomenclatura de la Figura 1, laEcuación 3 plantea que el monto de aprendizajeobtenido por el EC en cada instante de tiempo,depende de la discrepancia momentánea entre laactivación de la unidad adaptativa por todos losECs y la activación por el EI [z

(t)λ

(t)-Σx

i(t)v

i(t)], y

de la fuerza de la representación interna del ECen ese momento, [x

i(t)]. La forma en que opera

Page 10: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

224 VOGEL, SOTO, CASTRO Y SOLAR

este modelo se puede ilustrar con un ejemplo deadquisición con un EC y un EI, donde el EC estápresente durante 10 momentos y el EI tiene unaaparición de un momento de duración durante elmomento número 10. En el primer ensayo, nohay aprendizaje desde el momento 1 al 9, ya quela unidad adaptativa no es activada ni por el ECni por el EI (ya que z

(t)λ

(t)-Σx

i(t)v

i(t)=0). En el

momento 10, la unidad adaptativa es activadapor el EI proveyendo de reforzamiento para elEC, cuyo monto es proporcional a la activaciónde la unidad adaptativa por el EI (z

(t)λ

(t)) y a la

fuerza de la huella del EC (xi(t)

), es decir el ECdesarrolla fuerza asociativa excitatoria. En elsegundo ensayo, las porciones iniciales del ECactivan la unidad adaptativa en proporción a lafuerza de la huella en esos momentos (x

i(t)) y a la

fuerza asociativa excitatoria adquirida por el ECen el ensayo anterior (v

i). Sin embargo, ya que

en esos momentos iniciales no hay activación dela unidad adaptativa por el EI, se produce apren-dizaje inhibitorio (ya que z

(t)λ

(t) <Σx

i(t)v

i(t)), lo

que causa que el EC pierda parte de la fuerzaasociativa que ganó durante el ensayo anterior.Al llegar al momento 10 del segundo ensayo, elEC nuevamente gana fuerza asociativa. Esteproceso continua ensayo tras ensayo, resultandoen que la fuerza asociativa neta adquirida encada uno va estar dada por la interacción entreexcitación e inhibición que se adquiere momen-to a momento. Naturalmente, mientras más largoes el intervalo entre el EC y el EI, mayor oportu-nidad para que las porciones tempranas del ECdesarrollen inhibición.

A través de esta simple modificación delmodelo de Rescorla y Wagner, es posible darcuenta de la forma de U invertida de la funcióndel intervalo entre EC y EI. Específicamente, elmodelo predice que intervalos largos generanbajos niveles de aprendizaje excitatorio debidoa la mayor cantidad de momentos en los cualesse produce aprendizaje inhibitorio. Por otra par-te, intervalos cortos generan menos aprendizajeporque la huella del EC no ha alcanzado sumáximo en el momento de la presentación delEI. Los intervalos de duración intermedia resul-tan óptimos para el aprendizaje puesto que el EC

coincide con el EI durante el máximo de suhuella.

El modelo de la derivada del tiempo de Suttony Barto

Sutton y Barto (1981) propusieron un mode-lo en el cual la unidad adaptativa no requiere deuna entrada especial o supervisor para producircambios en la fuerza asociativa de los estímuloscondicionados. Concretamente, se asume que elreforzamiento proviene tanto de los ECs comodel EI, y que su magnitud depende de la diferen-cia entre la activación de la unidad adaptativa endos momentos de tiempo. De ahí la denomina-ción modelo de la derivada del tiempo, ya que elreforzamiento es una función de la derivada dela activación de la unidad adaptativa en elmomento t y el momento inmediatamente ante-rior, t-1.

Una de las ventajas del modelo de la deriva-da del tiempo es su capacidad para explicar unfenómeno conocido como “condicionamientode segundo orden” (Rescorla, 1980a), en el cualun EC

i adquiere fuerza asociativa en virtud de su

pareamiento con un ECj, el cual había sido

pareado previamente con el EI. Ya que segúneste modelo los ECs también otorganreforzamiento, la predicción del fenómeno esobvia.

Para implementar el modelo, Sutton y Barto(1981) asumen que la representación interna delEC incluye 2 tipos de huellas. La primera,denominada “huella de estimulación”, x

i(t), es

una función binaria que asume el valor de 1cuando el estímulo está presente y 0 cuando nolo está. Esta huella está a cargo de la generaciónde la RC. La segunda huella, llamada “huella deelegibilidad”, e

i(t), sigue un patrón de activación

variable durante la presentación del estímulo ycontrola el grado de adquisición de fuerzaasociativa del estímulo en función del tiempo.

Con respecto a la regla de aprendizaje, elmodelo de la derivada del tiempo asume quehabrá reforzamiento disponible para cambiar las

Page 11: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

225MODELOS DEL CONDICIONAMIENTO CLÁSICO

asociaciones del EC con la unidad adaptativa,siempre que haya una diferencia en la actividadde la unidad adaptativa en dos momentos deltiempo. Dicho de otro modo, el aprendizaje queocurre en cualquier momento está dado por ladiscrepancia entre la actividad actual de la uni-dad adaptativa y su actividad en el momentoinmediatamente anterior. Así, el reforzamientoes una función de la diferencia (derivada deltiempo) entre la respuesta en el momento t, Y(t),y la respuesta en el momento t-1, Y(t-l). Siguien-do la nomenclatura de la Figura 1, esta regla sepuede expresar del siguiente modo:

∆Vi= α[{ Σx

i(t)v

i(t)+z

(t)λ

(t)}-

{ Σxi(t-1)

vi(t-1)

+z(t-1)

λ(t-1)

]ei(t)

El modelo de la derivada del tiempo tienebastante éxito explicando una gran parte de losfenómenos de ensayo discreto. Por ejemplo,explica el bloqueo (A+ /AB+), asumiendo queuna vez que el estimulo A ha adquirido lacapacidad para activar a la unidad adaptativa enla primera fase, anulará el efecto reforzador delEI en la segunda fase. Esta cancelación delreforzamiento afecta a B, puesto que A y B sepresentan en el momento t-1 y el EI en elmomento t, con lo cual no hay diferencia entre laactivación en t-1 y en t. Con esto el estímulo B sequeda sin reforzamiento y no desarrolla asocia-ción con el EI.

Aunque el modelo fue desarrollado princi-palmente para dar cuenta de los fenómenostemporales, presenta una serie de problemas eneste dominio. Por ejemplo, ya que la huella deelegibilidad sigue un curso temporal indepen-diente de la duración del estímulo condicionado,el modelo predice que el nivel de aprendizaje nodepende de la duración del EC, lo cual es contra-dicho por la evidencia empírica que señala que,después de alcanzar una duración óptima, amedida que aumenta el largo del EC, el aprendi-zaje se empobrece. Otro problema de este mode-lo es que predice el desarrollo de aprendizajeinhibitorio cada vez que se termina el EI. Esto

ocurre porque, según la Ecuación 4, el EC desa-rrolla fuerza asociativa negativa cada vez que laactivación de la unidad adaptativa en un momen-to dado es menor que la activación en el momentoanterior. Esto significaría, por ejemplo, que si sepresentan el EC y EI simultáneamente, el EC nodebería desarrollar fuerza asociativa alguna yaque la excitación del inicio del EI se cancelaríacon la inhibición de su término. Aunque hayevidencia de aprendizaje inhibitorio con el proce-dimiento de condicionamiento retrospectivo(Siegel & Domjan, 1971), la mayoría de losestudios han mostrado que la presentación simul-tánea del EC y el EI produce aprendizaje excitatorio(Rescorla, 1980b).

El modelo SOP de Wagner

El modelo SOP intenta explicar varios fenó-menos que no fueron considerados por la mayo-ría de los modelos descritos anteriormente, talescomo los fenómenos de primacía y las diferen-cias cualitativas que a menudo se observan entrela RC y la RI. La primacía se refiere a unasituación en la que los eventos que ocurren fueradel ensayo afectan la formación de asociacionesde los estímulos que ocurren dentro de los ensa-yos (Wagner, Rudy & Whitlow, 1973). Porejemplo, Donegan y Wagner (1987) demostra-ron que hay una reducción de la amplitud de larespuesta incondicionada cuando el EI es prece-dido por un EC bien entrenado. Wagner (1981)conjeturó que la respuesta generada en el mo-mento de la presentación del EI está determinadapor el grado de activación de su representacióninterna, y que un EC puede activar esa represen-tación justo antes de la ocurrencia de la respuestaincondicionada, con lo cual “gasta” los recursosantes que aparezca el EI.

Una forma obvia en la que un EI “pre-procesado” (es decir, cuya representación in-terna ya ha sido activada) puede afectar el nivelde la respuesta incondicionada, es el conocidoparadigma de habituación de corto plazo, elque se refiere a una disminución en la amplitudde respuesta al segundo de un par de estímulosincondicionados. Esto ocurre siempre y cuan-

(4)

Page 12: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

226 VOGEL, SOTO, CASTRO Y SOLAR

do haya cercanía temporal entre los dos estímu-los (Whitlow, 1975).

El modelo de Rescorla y Wagner (1972) fuela primera implementación cuantitativa de lanoción de que un EI esperado es menos efectivocomo reforzador. Sin embargo, este modelo noda cuenta de la sensibilidad temporal con la queestos fenómenos ocurren. Por otra parte, se haobservado también que la “predictibilidad” nosólo afecta el pre-procesamiento del EI, si notambién al pre-procesamiento del EC, comopuede darse en el caso de la inhibición latente, locual también está fuera del alcance del modelode Rescorla y Wagner. En rigor, puede decirseque SOP fue diseñado para proveer una versióncomputacional de la noción de “primacía”.

Después de su formulación original (Wagner,1981), el modelo SOP se ha descrito de variasmaneras, cada una reflejando distintas posibili-dades de implementación de sus supuestos bási-

cos. El panel A de la Figura 2 contiene losprincipales elementos de SOP de acuerdo a unade sus últimas rendiciones (Brandon et al., 2002).Se asume que todos los estímulos (ECs y EIs)están representados por un par de unidades deprocesamiento, una unidad primaria, A1 y unaunidad secundaria, A2. Las unidades primariasy secundarias están compuestas por un númerogrande pero finito de elementos, los cuales pue-den estar activos o inactivos. La presentación deun estímulo causa la activación de una propor-ción de sus elementos en la unidad A1 (deacuerdo al parámetro p1), a lo cual sigue laactivación de una proporción de elementos de launidad secundaria, A2 (de acuerdo al parámetropd1). A su vez, los elementos de A2 que seactivan ejercen un efecto inhibitorio sobre loselementos de A1 que se encuentran inactivos, esdecir, estos no pueden ser activados. Eventual-mente, los elementos de A2 decaen (según elparámetro pd2) y liberan a los elementos de A1de su estado refractario.

continúa

(A) Respuestasecundaria

Respuestaprimaria

A2EI A1EI

v1 v2

A21A11 A22

A12

� �

Pd1EI

Pd11

Pd1

P11

P12

EC1 EC

2 EI

Page 13: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

227MODELOS DEL CONDICIONAMIENTO CLÁSICO

Según esta concepción, el curso temporal dela activación de cada estímulo es representadopor 2 tipos de huellas: la huella de la actividad dela unidad primaria y la huella de la unidadsecundaria. El valor instantáneo de cada huellaestá dado por la proporción de elementos queestán activos en ese momento. Las formas de lashuellas describen un período de reclutamientode elementos, un pico, una estabilización y undecaimiento después de la terminación del estí-

mulo. Estas huellas cumplen un rol específico enel proceso asociativo y en la generación de larespuesta. En breve, SOP asume que la respuestaincondicionada es bifásica, donde su primercomponente es una función del nivel de activi-dad A1 y el segundo de A2. Adicionalmente, seasume que el condicionamiento dota al EC de lacapacidad para activar directamente los elemen-tos del estado A2 del EI, sin pasar por A1. Estanoción es consistente con numerosas observa-

Figura 2. Representación de dos modelos de tiempo real en el lenguaje de las redes neuronales.Los círculos representan unidades de procesamiento y las líneas continuas y discontinuas

representan conexiones inmodificables y modificables, respectivamente. El Panel A describe laarquitectura del modelo SOP para dos ECs, el cual asume que los estímulos activan sus respecti-vas unidades primarias de acuerdo a los valores p1

i y éstas activan a las unidades secundarias de

acuerdo a los valores pd1i. Las unidades secundarias inhiben a las primarias a través de

inhibición recurrente (-). La unidad primaria del EI es responsable de la generación de la RIprimaria, mientras la unidad secundaria genera tanto la RI secundaria como la RC provocada porlos ECs a través de sus conexiones v

i. El Panel B describe la arquitectura del modelo TD para un

estímulo condicionado, representado por una línea de demora con tres unidades asociadas con suencendido (x

111, x

112 y x

113) y tres unidades asociadas con su apagado (x

121, x

122 y x

123). Cada

unidad, xijk

, se conecta a la unidad adaptativa por medio de conexiones asociativas, vijk

.

(B) Respuesta

Y

V111

V112

V113

V121 V122

V123

X111 X112X113 X121

X122 X123 Z

EIEC1

l

Page 14: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

228 VOGEL, SOTO, CASTRO Y SOLAR

ciones, donde la respuesta condicionada no esuna réplica de la RI, sino que más bien seasemeja a su parte final, la cual muchas veces esopuesta a la parte inicial. Este fenómeno esparticularmente notorio cuando se usan EIsfarmacológicos ante los cuales los animalesmuestran patrones de respuesta complejos. Yaque no siempre la RI es opuesta a la RC, Wagner(1981) ideó el acrónimo “SOP”, que significa“procesos algunas veces oponentes” (sometimesopponent processes).

En términos de la conectividad mostrada enel panel A de la Figura 2 y siendo consistentescon la terminología usada para otros modelos,puede decirse que la unidad secundaria del EI,A2

EI equivale a la unidad adaptativa de la Figura

1. Si bien existe otra unidad que también produ-ce una respuesta (la unidad A1

EI), ésta no está

disponible para plasticidad. El EC desarrolla sucapacidad para provocar respuesta por interme-dio de la fuerza de su asociación con la unidadsecundaria del EI. En suma, la RC es una funcióndel grado de actividad primaria del EC, A1

EC y de

la fuerza de la conexión entre esta unidad y A2EI.

Según SOP el aprendizaje excitatorio e inhi-bitorio se desarrollan por separado. Se asumeque en todo momento el cambio en las conexio-nes excitatorias, ∆v

i+, es proporcional al pro-

ducto entre el número de elementos primariosdel EC y del EI que están activos en ese momen-to. Análogamente, el aprendizaje inhibitorio,∆v

i -, es proporcional al producto del número de

elementos primarios del EC y el número deelementos secundarios del EI que se encuentranactivos en un momento dado. En resumen, elaprendizaje excitatorio depende del procesa-miento simultáneo de las unidades A1

EC y A1

EI,

y el aprendizaje inhibitorio de A1EC

y A2EI. El

curso temporal de las huellas primarias y secun-darias es fundamental para las predicciones delmodelo. Por lo general se asume que en losensayos típicos de adquisición, en el cual el ECprecede al EI, la actividad primaria del EC (A1

EC)

coincide principalmente con la actividad prima-ria del EI (A1

EI) y muy poco con la actividad

secundaria de éste (A2EI

), lo que da lugar al

fortalecimiento de las conexiones excitatoriasentre el EC y el EI.

Según SOP, la asociación entre el EC y el EIno sólo afecta la probabilidad y tipo de respues-ta, sino que también afecta el procesamiento delestímulo incondicionado. Esta propiedad es laque permite a SOP dar cuenta de los fenómenosde primacía. Por ejemplo, es posible explicar elfenómeno llamado “disminución condicionadade la RI” (Donegan, 1981; Marcos, 1997; Mar-cos & Redondo, 2002), el cual se trata de unareducción en la amplitud de la RI cuando el EI esprecedido por un EC con fuerza asociativa,asumiendo que el EC causa que cierta propor-ción de elementos del EI se movilicen al estadosecundario de actividad e inhiban a sus respec-tivos elementos primarios, los cuales, entonces,no se activarán cuando se presenta el EI.

SOP logra mantener el valor explicativo desu predecesor, el modelo de Rescorla y Wagner(1972), resolviendo además varias de sus princi-pales falencias. Por ejemplo, SOP no cae en lapredicción incorrecta de extinción de la inhibi-ción condicionada, ya que asume que las pre-sentaciones no reforzadas de un EC inhibitoriono tienen efectos en la actividad de las unidadesrepresentacionales del EI, y por lo tanto, nopuede ocurrir ningún tipo de aprendizaje.

TERCERA GENERACIÓN: MODELOSCOMPLEJOS

Todos los modelos que hemos llamado deprimera y segunda generación se basan en lossupuestos más simples que se requieren paraexplicar los fenómenos básicos de aprendizaje.Por ejemplo, como se aprecia en la Figura 1, lared neuronal incluye sólo dos capas, una capasensorial o de entrada y una capa motora o desalida. Además, cada estímulo es representadopor una única unidad de procesamiento queactúa como un todo influyendo a la unidadadaptativa. Esta arquitectura ha sido seriamentecriticada, tanto por su poca plausibilidad bioló-gica como por su fracaso en explicar ciertosfenómenos conductuales que se han ido descu-

Page 15: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

229MODELOS DEL CONDICIONAMIENTO CLÁSICO

briendo con el correr de los años. Los modelosque se describen en esta sección representandistintas estrategias que se han implementadopara hacer modelos más sofisticados y explica-tivos.

Modelos componenciales

Se ha descubierto que a medida que progresael aprendizaje, no sólo se producen cambios enla frecuencia y amplitud de la respuesta condi-cionada, sino que también se modifican suscaracterísticas temporales, tales como el tiempoque demora en iniciarse y en alcanzar el máxi-mo. Ya que la mayoría de las medidas de la RCestán correlacionadas, éstas pueden considerar-se como diferentes manifestaciones delconstructo “fuerza de la asociación entre el EC yel EI”. Esta noción de huella molar, presente enlos modelos de la sección anterior, sostiene queuna repuesta débilmente aprendida tendrá me-nos frecuencia, menor amplitud y demorará másen iniciarse y en alcanzar su máximo que unarespuesta bien aprendida.

Existen ciertas situaciones experimentalesen las cuales se ha demostrado que ciertas carac-terísticas temporales de la RC no se correlacionan.Por ejemplo, se ha observado que si se comienzael entrenamiento con un determinado intervalo yluego se modifica a otro más largo o más corto,se produce también un cambio en la latencia deiniciación y pico de la RC hacia valores máslargos o cortos, según sea la dirección del cam-bio (Coleman & Gormezano, 1971). Nótese queel cambio en la temporalidad de la RC no se dacomo un desplazamiento gradual de la respuestahacia su nueva ubicación, sino más bien consisteen la desaparición de la respuesta en su ubica-ción original y su aparición en la ubicaciónnueva. La noción de la huella molar prediceincorrectamente que el cambio debería ser gra-dual ya que reflejaría simplemente la ganancia ola pérdida de fuerza asociativa producto delcambio en el intervalo de tiempo.

Otra observación que resulta problemáticapara la noción de huella molar es que si se realiza

el entrenamiento desde un principio con dosintervalos entre EC y EI, digamos algunos ensa-yos con uno corto y otros ensayos con uno largo,el resultado es que la RC desarrolla dos picos,uno en la localización del EI para el intervalocorto y otro para su ubicación en el intervalolargo. Es decir, el animal aprende dos respuestastopográficamente distintas y apropiadas paracada intervalo (Millenson, Kehoe & Gormezano,1977). La noción de huella molar incorrecta-mente predice una respuesta con una localiza-ción intermedia, entre los dos intervalos, ya quesegún esta noción la ubicación temporal de larespuesta es una función de la fuerza asociativaneta que se obtiene como producto de los dostipos de ensayos de aprendizaje.

Estas dificultades se han resuelto creandouna representación más compleja del EC, cono-cida como representación molecular ocomponencial. Esta noción asume que la huelladel estímulo se forma a partir de la actividad deun gran número de componentes o elementos,los cuales se activan en distintos momentos a lolargo de la duración del estímulo y tienen suspropias conexiones con el EI. Es decir, la con-cepción molecular asume que cada elementopor separado y no el EC como un todo, sonquienes establecen la asociación con el EI. Porello, la forma de la RC está dada por la fuerzaasociativa de los elementos que se encuentranactivos en cada momento de la duración del EC.De este modo, se espera que los elementos quese encuentran activos al momento de la presen-tación del EI obtengan el máximo de fuerzaasociativa, lo cual explica que el pico de la RCsea aproximadamente en la localización tempo-ral donde se espera el EI. Del mismo modo, si unanimal está entrenado con 2 intervalos entreestímulos, se esperaría que dos constelacionesde elementos, una en cada localización, desarro-llen la fuerza asociativa que corresponde a cadaintervalo.

Otra ventaja de la representación componenciales su plausibilidad biológica. Más aún, se hacomenzado a acumular evidencia de que lasprincipales características temporales del

Page 16: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

230 VOGEL, SOTO, CASTRO Y SOLAR

condicionamiento podrían emerger de la activi-dad de constelaciones de neuronas que se activana partir de un sólo EC y que exhiben plasticidada nivel de sus sinapsis. Por ejemplo, el modelo delcondicionamiento de parpadeo en conejos pro-puesto por Medina y col. (2000) asume que lascaracterísticas temporales de la RC dependen delpatrón de activación de millares de células Golgiy su influencia en la generación de la respuesta através de las sinapsis con las células Purkinje y suefecto regulador sobre el núcleo interpósito delcerebelo.

Se han propuesto varias estrategias para cons-truir representaciones componenciales del EC.Por ejemplo, Desmond y Moore (1988) propusie-ron un tipo de representación llamada “línea dedemora” en la cual el comienzo del EC genera unaactivación secuencial de elementos a lo largo deltiempo. Grossberg y Schmajuk (1989) sugirieronque el EC genera una población de señales conforma de campana, las cuales varían en una seriede parámetros generando señales “lentas” y “rá-pidas”. Vogel y col. (2003), propusieron unarepresentación dual del EC, en la cual algunoselementos tienen patrones de actividad localiza-dos en el tiempo mientras que otros no codificaninformación temporal sino que se activan al azaren cualquier momento durante al presentacióndel estímulo. Por último, McLaren y Mackintosh(2000) propusieron un modelo que asume quecualquier estímulo (condicionado o incondicio-nado) está representado por un conjunto elemen-tos que se encuentran recíprocamente conectadospor lazos asociativos que se fortalecen cada vezque se activan simultáneamente. Los elementospueden ser activados “externamente” por lo estí-mulos que representan o bien internamente através de su asociación con otros elementos, quea su vez son activados externamente por otrosestímulos.

Además de los modelos mencionados en elpárrafo anterior, se han propuesto otros tantosmodelos componenciales. Con el fin de ilustrar laforma en que opera esta estrategia, hemos elegidodescribir con cierto detalle uno de estos modelos:el modelo de la diferencia temporal (TD) pro-

puesto por Sutton y Barto (1990). Este modelo esuna variación del modelo de la derivada temporalque busca resolver algunos de los problemas deeste último.

Específicamente, TD asume que el EC estárepresentado por una “línea de demora”, en lacual la presentación del EC desencadena unacascada de activación de elementos los cualesestán ordenados secuencialmente en una “líneade demora”. Cada elemento, además de pasar laactivación al elemento siguiente de la línea, estáconectado con la unidad adaptativa. Por último,se asume que la presentación y terminación de unestímulo dan lugar a cascadas de activación inde-pendientes: los elementos de encendido y loselementos de apagado. El panel B de la Figura 2muestra un ejemplo del modelo TD para un ECcon sus líneas de demora para el encendido y elapagado del estímulo. La actividad de cada ele-mento se denota como x

ijk, para indicar (1) el EC

que la activa (subíndice “i”), (2) si el elemento esactivado por el inicio o por el término del estímulo(subíndice “j”), y (3) su orden en la secuencia deactivación (subíndice “k”). Los elementos pue-den estar activos (x

ijk=1) o inactivos (x

ijk=O). Por

último, se asume que cada elemento está repre-sentado por una huella de estimulación (quecontrola la generación de la respuesta) y unahuella de elegibilidad (que controla el nivel deaprendizaje). La huella de estimulación es el valorbinario de activación x

ijk=1, mientras que la hue-

lla de elegibilidad sigue una función exponencialsimilar a la descrita para el modelo de la derivadadel tiempo.

En cuanto a la regla de aprendizaje, el modeloTD difiere del modelo de la derivada del tiempoal considerar separadamente la contribución delEC y el EI al reforzamiento. Formalmente, elmodelo TD enuncia que el cambio en la fuerzaasociativa de cada elemento en la línea de demo-ra, v

ijk, está dado por la siguiente ecuación:

Av¡jk

= αβ(z(t)

λ(t)

+γΣxijk(t)

vi(t)

- Σxijk(t-1)

vijk(t-1)

] (5)

Donde, γ es llamado “parámetro de descuen-to” el cual permite que un EC con cierta fuerza

Page 17: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

231MODELOS DEL CONDICIONAMIENTO CLÁSICO

asociativa genere reforzamiento en todos losmomentos en los que está presente y no sólo alcomienzo. Al comparar la ecuación 5 (TD) con laecuación 4 (derivada del tiempo) se pueden apre-ciar dos grandes diferencias. La primera se refierea que mientras que en el modelo de la derivadatemporal el EI, a través zλ, contribuye al términode reforzamiento tanto en el momento t como enel momento t-1, en el modelo TD el valor de zλ seaplica solamente en el momento t. Esto significaque en el modelo TD es la presencia del EI másque los cambios en su presencia aquello quedetermina el reforzamiento, lo cual es esencial-mente lo mismo que plantea el modelo de Rescorlay Wagner.

La segunda diferencia se refiere a la contribu-ción de los ECs al cómputo del reforzamiento.Como se ve en la ecuación 5, la contribución de losECs en el momento t es ponderada o “descontada”por el parámetro γ, lo que permite que los ECscontribuyan al reforzamiento incluso cuando elvalor agregado de sus fuerzas asociativas no cam-bie entre los momentos t y t-1. Con estas dosdiferencias, es posible concluir que el modelo TDestá a mitad de camino entre el modelo de laderivada del tiempo y el modelo de Rescorla yWagner. Con esta estructura, TD da cuenta de lagran mayoría de los fenómenos temporales, exclu-yendo solamente los fenómenos de primacía en loscuales ha mostrado su fortaleza el modelo SOP.

Modelos con unidades escondidas

Una de las principales motivaciones para cons-truir modelos con unidades escondidas fue eldescubrimiento de un fenómeno conocido como“patrón negativo”, el cual se refiere a una situa-ción experimental en la que dos ECs se pareancon el EI cada vez que se presentan por separado(A+/B+) pero no cuando se presentan en conjunto(AB-). El resultado es que la repuesta a cualquierade los dos estímulos, A o B, es mayor que larespuesta al compuesto AB. Este fenómeno, tam-bién conocido como “problema del ó exclusivo”,sugiere que la representación interna de un estí-mulo compuesto debería ser diferente de la mera

suma de sus componentes. En efecto, si el animal“sumara” las fuerzas asociativas de A y B cuandose presentan juntos, éste debería responder más alcompuesto que a los componentes.

Las dos primeras generaciones de modelosdescritas en este artículo resolvieron este proble-ma agregando un elemento adicional en la capasensorial, llamado “elemento configuracional”(Pearce 1987; Wagner & Rescorla, 1972), el cualrepresenta la conjunción de dos o más estímulosy establece asociaciones con la unidad adaptativacomo cualquier otro elemento sensorial. Natural-mente, se requieren tantos elementos configura-cionales como combinaciones posibles deelementos, lo cual ha sido consideradoantieconómico por sus detractores (Schmajuk,1997). Una alternativa a este enfoque es asumirque las configuraciones no son preexistentes nipertenecen a la capa sensorial, sino que se formanpara resolver un determinado problema y residenen una capa intermedia, llamada “capa de lasunidades ocultas”.

En el ámbito del condicionamiento Pavlovianose han propuesto varios modelos con unidadesocultas, los cuales difieren principalmente en elnúmero de capas y el patrón de interconexiones.El panel A de la Figura 3 muestra un ejemploprototípico de este tipo de redes neuronales, basa-do en una de las propuestas más exitosas, elmodelo SD de Schmajuk y DiCarlo (1992). Laprimera capa, llamada “capa sensorial” contieneunidades que se activan directamente por losestímulos externos (condicionados e incondi-cionados). La segunda capa contiene las unida-des ocultas, la cuales se activan exclusivamentepor las unidades sensoriales, es decir, no recibeninfluencia directa del mundo exterior. En la figu-ra, cada unidad oculta tiene conexiones disponi-bles con todas las unidades sensoriales, lo que leotorga la posibilidad de representar cualquierconfiguración posible. Por último, la tercera capa,denominada “capa de salida”, contiene la unidadadaptativa, la cual tiene conexiones con todas lasunidades de las dos capas anteriores y es laencargada de generar la respuesta.

Page 18: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

232 VOGEL, SOTO, CASTRO Y SOLAR

Figura 3. Representación de dos modelos con unidades escondidas en el lenguaje de las redesneuronales. Los círculos representan unidades de procesamiento y las líneas continuas y

discontinuas representan conexiones inmodificables y modificables entre unidades,respectivamente. El Panel A describe la arquitectura del modelo SD, en el cual las unidades máspequeñas en la capa de unidades sensoriales son activadas directamente por estímulos ambienta-les. Las unidades de tamaño mediano en la capa de unidades escondidas, son activadas por lasunidades sensoriales a través de las conexiones C

ij. La unidad grande en la capa de unidades de

salida es activada por el EI a través de su conexión, l y también por las unidades sensoriales yescondidas a través de las conexiones VS

i y VH

i, respectivamente. La actividad de la unidad de

salida, Y(t), es responsable de la generación de la respuesta. El Panel B describe la arquitecturadel modelo APECS, el cual difiere del modelo SD en que carece de conexiones directas entre losECs y la unidad adaptativa y en la presencia de unidades de sesgo que influyen a las unidades

escondidas a través de las conexiones VBi.

(A)

(B)

CAPA DEUNIDADES DE

SALIDA

CAPA DEUNIDADESOCULTAS

CAPA DEUNIDADES

SENSORIALES

l

Y

VS1

VH1 VS2

VH2

VS3

W 1 W 2

C11

C12

C21 C22

C31

C32

X1 X2

X3 Z

EC1 EC2EC3 EI

CAPA DEUNIDADES DE

SALIDA

CAPA DEUNIDADESOCULTAS

CAPA DEUNIDADES

SENSORIALES

Respuesta

Respuesta

lY

VB1

VH1

W 1W 2 W 3

VB2 VB3

C11

C12

C23C21

C22 C23

1 1 1

X1X2 Z

EC1

EC2

EI

VH2

VH3

Page 19: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

233MODELOS DEL CONDICIONAMIENTO CLÁSICO

Un aspecto central de los modelos con uni-dades ocultas es que las conexiones entre lasunidades sensoriales y las unidades ocultas sepueden modificar con la experiencia. Esto signi-fica que la red tiene 3 tipos de conexionesplásticas: 1) conexiones entre unidades senso-riales y unidades ocultas (C

ij), 2) conexiones

entre unidades sensoriales y la unidad adaptativa(VS

i) y 3) conexiones entre unidades ocultas y la

unidad adaptativa (VHj). Así, la actividad de la

unidad adaptativa (Y(t)

), depende del EI conactividad z

(t), y conexión l, de los ECs con

actividad xi(t) y conexiones VS

i y de las unida-

des ocultas con actividad wi(t)

y conexiones VHj.

Similarmente, se asume que la actividad de launidad escondida W

j está regulada por la suma

de sus conexiones con las unidades de entradaponderadas por sus respectivos niveles de acti-vación, es decir, W

j(t)= Σx

i(t)C

ij.

El cambio en las conexiones de las unidadessensoriales y las unidades ocultas con la unidadadaptativa está gobernado por la regla de apren-dizaje de Rescorla y Wagner. Es decir, variacio-nes en la conexión entre cualquier unidadsensorial u oculta con la unidad adaptativa, esuna función de la diferencia entre la activaciónmomentánea de la unidad adaptativa ocasiona-da por el EI y la activación ocasionada por todaslas unidades sensoriales y ocultas que se en-cuentran activas en el momento. Formalmente,se tiene que:

∆VSi= θ

1x

i[z

(t)λ

(t)-(Σx

i(t)VS

i(t)+ Σw

j(t)VH

j(t))]1-VS

i (6)

∆VHJ= θ

2W

i[z

(t)λ

(t)-(Σx

i(t)VS

i(t)+ Σw

j(t)VH

j(t))]1-VH

i (7)

En las ecuaciones 6 y 7, los factores 1-VSi

y 1-VHi se usan para mantener los valores

asociativos entre –1 y +1, y θ1 y θ

2 son parámetros

que determinan las tasas de aprendizaje. Laexpresión [z

(t)λ

(t)-(Σx

i(t)VS

i(t)+ Σw

j(t)VH

j(t))] tam-

bién puede ser descrita como el error de lapredicción o error de output (EO). Más allá deestas diferencias, puede apreciarse que en estaparte, la red aprende según la regla de Rescorlay Wagner que señala que el aprendizaje quetiene lugar en una determinada unidad de proce-

samiento es directamente proporcional a la dis-crepancia entre la actividad “real” y la actividad“predicha” en dicha unidad.

Por otra parte, la asociación entre las unidadessensoriales y la unidad adaptativa cambia de acuer-do a una regla conocida como retropropagación(Rumelhart, et al., 1986). Esta regla consiste encalcular un error especial para estas conexiones,conocido como EH (la H proviene de “Hidden”, esdecir, oculto), el cual se obtiene ponderando odescontando del error de salida o EO los valoresasociativos que se obtuvieron una vez que se hizoel ajuste en las conexiones entre las unidadessensoriales y la unidad de salida. Dicho de otromodo, el EH es el error que “sobra” una vez quese ajustan los pesos de las conexiones entre lasunidades de entrada y la unidad de salida, esdecir, el error se propaga “hacia atrás” en la redde neuronal.

Schmajuk y DiCarlo (1992) implementaronla noción de retropropagación asumiendo queEH

ij es una función del grado de activación de la

unidad adaptativa causado por las unidades ocul-tas (W

i(t)VH

i(t)) y del error de salida (EO). Ya

que la actividad de las unidades ocultas es unafunción de la actividad de las unidades sensoria-les EH se puede decir que EH

ij = f(EOVH

i

Σxi(t)C

ij(t)). Formalmente, las conexiones entre

las unidades sensoriales y las unidades ocultascambian de acuerdo a la siguiente ecuación:

∆Cij=θ

3X

iEH(1-C

ij) (8)

El parámetro de tasa de aprendizaje θ3 de la

ecuación 8 es mayor que sus equivalentes de lasecuaciones 9 y 10, confiriéndole mayor rapidezal aprendizaje de C

ij que de VS

i y VH

i. Nótese

que es necesario asignar ciertos valores inicialesdiferentes de cero a C

ij, de otro modo nunca

ocurrirían cambios en estas conexiones.

Conceptualmente, puede decirse que el su-puesto central del modelo SD es que si el error depredicción del EI no se puede reducir modifican-do las conexiones entre las unidades sensorialesy la unidad adaptativa, entonces la red desarrolla

Page 20: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

234 VOGEL, SOTO, CASTRO Y SOLAR

conexiones entre las unidades sensoriales y lasunidades ocultas. Es decir, la red genera confi-guraciones sólo cuando estas son necesariaspara resolver un problema determinado. Porejemplo, considérese el caso en el cual dosestímulos condicionados son entrenados sepa-radamente hasta niveles asintóticos (A+, B+). Alcomienzo, se fortalecen las conexiones VSA yVSB de acuerdo a las ecuaciones 6 y 7. Además,ya que A y B tienen un valor inicial muy bajo deC

lA y C

lB , la presentación de cualquiera de ellos

no alcanza para activar la unidad escondida (porlo tanto, los valores de w

j también son bajos), lo

cual a su vez determina que la unidad oculta nodesarrolle fuerza asociativa significativa con launidad de salida. Ya que las conexiones de lasunidades sensoriales A y B con la unidad ocultadependen de la actividad de la unidad oculta, C

Aj

y CBj

permanecen bajos. En resumen, no seforman conexiones con la unidad oculta porqueno se necesitan.

A diferencia del ejemplo anterior, para resol-ver el problema del patrón negativo (A+, B+,AB-), sí se necesitan conexiones entre las unida-des escondidas y la unidad adaptativa. En estecaso, la red también desarrolla conexiones VS

A

y VSB fuertes. Sin embargo, cuando los dos

estímulos se presentan juntos activan moderada-mente a la unidad escondida, con lo cual éstaqueda disponible para modificar su conexióncon la unidad adaptativa. Sin embargo, durantelos ensayos compuestos, la unidad oculta recibeun valor de EO fuertemente negativo, debido aque A y B activan la unidad adaptativa sin que sepresente el EI (es decir, error negativo). El resul-tado es que VH adquiere un valor inhibitorio. Yaque durante los ensayos compuestos, VH y EOson negativos, el valor de EH se torna positivo(ver ecuación 8), con lo cual C

Aj y C

Bj se tornan

positivos. En resumen, cada vez que los estímu-los se presentan por separado, activan sólo launidad adaptativa, generando la respuesta con-dicionada, mientras que cada vez que se presen-tan juntos, si bien tienden a activar la unidadadaptativa a través de sus conexiones directascon ésta, también la inhiben indirectamente, através de su acción mancomunada sobre la uni-

dad oculta, la cual, a su vez, inhibe a la unidadadaptativa.

El modelo SD es capaz de dar cuenta de ungran número de fenómenos de condicionamientoPavloviano, incluyendo algunos de los más pro-blemáticos, tales como el “señalamiento de laocasión” (occassion setting), donde algunosestímulos más que desarrollar la capacidad pargenerar la RC, aparentemente desarrollan ciertahabilidad para modular la respuesta de otrosestímulos condicionados (Ross & Holland, 198l).El modelo SD explica estos fenómenos asu-miendo que un estímulo puede actuar como unsimple EC a través de sus conexiones directascon la unidad adaptativa y como un señalador dela ocasión a través de sus conexiones con lasunidades ocultas (Schmajuk, Lamoureux &Holland, 1998).

Modelos con estímulos incondicionadosmoduladores

La mayor parte de los modelos descritosanteriormente tienen en común que asumen larepresentación más simple posible del EI. Enrigor, todo lo que se asume es que los animalesdeben procesar el EI con el fin de generar laentrada “maestra” a partir de la cual se calcula elerror para ajustar las conexiones de los ECs conla unidad adaptativa. En esta sección se discuteuna categoría de modelos en los cuales el EIcumple una función moduladora además de sutradicional rol de reforzamiento.

Grossberg (1975) propuso uno de los prime-ros modelos modulatorios de aprendizaje, elcual asume que el EC forma asociaciones tantosensoriales como motivacionales con el EI.Específicamente, se asume que al parear un ECcon un EI, se produce un cambio en la asocia-ción entre la representación sensorial del EC y larepresentación del EI, de manera tal que el EC setransforma en un reforzador secundario y ad-quiere la capacidad de producir la repuesta. Ensegundo lugar, se establece una asociación entrela representación del EI y una representaciónsecundaria del EC, de tal manera que el EI

Page 21: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

235MODELOS DEL CONDICIONAMIENTO CLÁSICO

adquiere la capacidad de modular el grado deactividad del EC o atención que se pone a éste.El primer tipo de asociación se denomina “apren-dizaje por reforzamiento” para designar el he-cho de que el EC adquiere la capacidad parafuncionar como si fuera el EI. El segundo tipo deasociación, se denomina “aprendizaje de incen-tivo-motivación” para designar el hecho de queel EC se transforma en un estímulo relevante alcual el animal aprende a prestar atención. Enresumen, un EC bien entrenado adquiere laspropiedades motivacionales del EI, monopolizala atención del animal, sirve como reforzadorpara otros EC potenciales y genera la RC.

De forma similar, Wagner y Brandon (1989)propusieron una extensión del modelo SOP,llamada AESOP, la cual asume que el EC formaasociaciones tanto con aspectos sensoriales comoemotivos del EI. La asociación del EC con elaspecto sensorial es responsable de la genera-ción de respuestas condicionadas discretas, cla-ramente distinguibles, mientras que la asociacióncon el aspecto emotivo es responsable de lageneración de respuestas emocionales difusaslas cuales actúan modulando a las respuestasdiscretas. Además, se asume que algunos ECspodrían ser más proclives a un tipo de asociaciónque a otro, y que ello puede depender del arreglotemporal de los estímulos. La incorporación deun mecanismo emotivo/modulador al modeloSOP fue inspirada principalmente por un fenó-meno conocido como “divergencia de las medi-das de respuestas” (Schneiderman, 1972), elcual se refiere a que algunas veces no haycorrelación entre las distintas formas en las quese mide la respuesta condicionada. Por ejemplo,Tait y Saladin (1986) demostraron quepareamientos retrospectivos de un choque eléc-trico en la mejilla con un EC auditivo en conejosproducían condicionamiento inhibitorio si seevaluaba a través de la respuesta de parpadeo ycondicionamiento excitatorio si se evaluaba através de la respuesta emocional de supresión dela conducta de beber. Una interpretación posiblepara este hallazgo y otros similares (Brandon &Wagner, 1989), es que la respuesta condiciona-da discreta (el parpadeo) y la respuesta emocio-

nal condicionada (la supresión del beber) po-drían estar controladas por distintos aspectos delEI y que la naturaleza de la asociación (excitatoriao inhibitoria) puede depender de requerimientostemporales propios para cada tipo de asociación.

Wagner, Brandon, y sus colegas (Brandon &Wagner, 1991; Brandon, Bombace, Falls &Wagner; 1991) realizaron una serie de experi-mentos para determinar cuáles son las condicio-nes bajo las cuales los ECs se asocian con los 2aspectos del EI. La conclusión que obtuvieron esque las respuestas emocionales condicionadastienden a desarrollarse con mayor facilidad conECs extendidos o contextuales, mientras que lasrespuestas condicionadas discretas tienden adesarrollarse mejor con ECs cortos. Además,Gewirtz, Brandon y Wagner (1998) sugirieronque las respuestas emocionales condicionadasno sólo modulan la expresión de las respuestascondicionadas discretas, sino que también influ-yen en su adquisición.

La modificación que se hizo a SOP paraexplicar estos fenómenos, consistió en asumirque el EI controla 2 unidades representacionalesindependientes, una para el aspecto sensorial yla otra para el aspecto emocional. La asociacióndel EC con el aspecto sensorial es la responsablede la generación de la RC discreta, mientras quela conexión del EC con la unidad emotiva esresponsable de la generación de la respuestaemocional condicionada. AESOP usa las mis-mas reglas que SOP para la formación de asocia-ciones y las diferencias entre RC discretas yemocionales se obtienen por diferencias deparámetros. Esta diferencia de parámetros buscareflejar el hecho de que la representación emotivadura más que la representación sensorial, ha-ciéndola más efectiva con intervalos más bienlargos.

Tanto la teoría de Grossberg como el modeloAESOP son descripciones muy sofisticadas y com-pletas de los fenómenos del condicionamiento,abarcando áreas tan diversas como los fenómenostemporales y la competencia de estímulos. Pese aesta sofisticación, y quizás precisamente a causa

Page 22: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

236 VOGEL, SOTO, CASTRO Y SOLAR

de ésta, estos modelos no han promovido muchainvestigación empírica.

CUARTA GENERACIÓN: APRENDIZAJECAUSAL EN HUMANOS

En un estudio típico de aprendizaje causalhumano se presenta a los sujetos informaciónacerca de una serie de eventos (como comerdeterminados alimentos) que son seguidos o nopor una consecuencia (como desarrollar unaalergia), para luego preguntarles hasta qué nivelestiman que los eventos predicen tal consecuen-cia o se relacionan con ella (cuáles alimentosproducen la alergia y cuáles no). Resulta fácilver cómo este procedimiento puede considerar-se análogo al utilizado en estudios decondicionamiento pavloviano, si se asume quelos eventos predictores (por ejemplo, los alimen-tos) juegan el rol de los ECs, que el evento apredecir (por ejemplo, la alergia) el del EI y quela predicción es análoga a la RC.

Varios autores (Dickinson, Shanks &Evenden, 1984; Allan, 1993) han sugerido quela analogía entre el aprendizaje causal humano yel condicionamiento clásico podría darse tam-bién al nivel de los mecanismos que subyacen aambos. La idea básica es que los eventos yconsecuencias de una tarea de juicios causalespueden ser representados por los sujetos me-diante unidades sensoriales similares a las de laFigura 1 y la efectividad con que se juzga que unevento puede producir un resultado es reflejo dela fuerza asociativa de la conexión entre ambos,que se modifica según reglas de aprendizajesimilares a la de Rescorla y Wagner. Esta inter-pretación se ha visto fortalecida por hallazgosque indican que los fenómenos típicos delcondicionamiento clásico se producen tambiénen el aprendizaje causal (Allan, 1993).

Recientemente, sin embargo, se ha descu-bierto un nuevo fenómeno, conocido como“reevaluación retrospectiva”, en el cual los suje-tos parecen reevaluar aquello que han aprendidoacerca de algunos estímulos en función de suexperiencia con otros estímulos diferentes. En

un experimento de “bloqueo retrospectivo”, porejemplo, se presenta un compuesto de dos estí-mulos A y B (por ejemplo, huevo y tomate)seguidos por una reacción alérgica, con el resul-tado de que el sujeto juzga que ambos estímulosson “buenos predictores” de la reacción alérgica.En una segunda fase, se presenta solamente elestímulo A (por ejemplo, huevo) seguido por lareacción alérgica. En una fase de prueba poste-rior, los sujetos juzgan que el estímulo B (toma-te) es un mal predictor de la reacción alérgica. Lainterpretación común es que en la fase 2 el sujeto“reevalúa retrospectivamente” el valor causal opredictivo del estímulo B, extinguiendo el valorasociativo de B, aunque este estímulo no seencuentra presente (Chapman, 1991).

Además del bloqueo retrospectivo, se hademostrado la existencia de otros fenómenossimilares, tales como el desensombrecimiento(Larkin, Aitken & Dickinson, 1998) y la inhibi-ción condicionada retrospectiva (Chapman,1991). El principal problema de los modelosasociacionistas tradicionales para dar cuenta deestos fenómenos, es que asumen que los anima-les solamente pueden aprender a partir de lasclaves físicamente presentes durante la situaciónde refuerzo. Por ejemplo, en el bloqueo retros-pectivo la presentación de A durante la segundafase de entrenamiento no debería afectar la fuer-za asociativa de la clave ausente B.

El descubrimiento de la reevaluación retros-pectiva ha sido tomado como una de las princi-pales evidencias en contra de la adecuación deuna explicación asociativa para el aprendizajecausal humano. Sin embargo, en los últimosaños se aprecian esfuerzos por explicar estosfenómenos dentro de la perspectiva asocia-cionista. En las siguientes secciones presenta-mos 3 modelos asociativos que se han formuladocon estos fines.

El modelo de Rescorla y Wagner modificado(Van Hamme & Wasserman, 1994)

El modelo de Rescorla-Wagner no entregasignificación psicológica a los ECs ausentes

Page 23: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

237MODELOS DEL CONDICIONAMIENTO CLÁSICO

durante un ensayo de aprendizaje, asignándolesun valor de α igual a cero. Con el fin de explicarla reevaluación retrospectiva, Van Hamme yWasserman (1994) propusieron que el parámetroα asuma un valor negativo en aquellos ensayosen los que el EC no está pero existen expectati-vas respecto a su aparición. Dichas expectativaspodrían depender de la presencia de un estímulopreviamente asociado con el EC ausente o deinstrucciones verbales. El modelo asume, ade-más, que durante presentaciones de ECs com-puestos se producen asociaciones entre suselementos, con lo cual la presentación de uno deellos activa automáticamente la representacióndel otro.

Según este modelo, en la primera fase delbloqueo retrospectivo (AB+), los ECs A y B seasocian entre sí y con el EI. En la segunda fase(A+), el estímulo A continúa ganando fuerzaasociativa y el estímulo B, que no está presentepero es “esperado” debido a su asociación conA, presenta un valor α

B negativo, con lo cual

pierde fuerza asociativa. Nótese que un ECausente también puede ganar fuerza asociativacuando el valor negativo de α interactúa con unvalor negativo del término de error (l - SV). Elprincipio general es que los estímulos ausentes,pero esperados, cambian su fuerza asociativa endirección opuesta a los estímulos presentes.

En concordancia con la explicación que en-tregan Van Hamme y Wasserman, varias inves-tigaciones han comprobado que las asociacionesintracompuesto (Chapman, 1991; Larkin, Aitken& Dickinson, 1998) y la información verbalacerca de una clave ausente (Wasserman &Castro, 2005) pueden ser determinantes en laobservación de reevaluación retrospectiva. Sinembargo, se ha criticado a este modelo que noexplica satisfactoriamente cómo una asociaciónintracompuesto lleva a que el valor de α seanegativo para una clave ausente, y por qué elmismo proceso no afecta a la representaciónasociativamente activada del EI. El modelo quedescribimos en la sección siguiente fue formula-do para resolver este problema.

El modelo SOP modificado (Dickinson &Burke, 1996)

En el modelo SOP original (Wagner, 1981),el aprendizaje de un EC sólo ocurre cuando surepresentación se encuentra en un estado prima-rio de actividad A1, que se produce sólo despuésde la presentación física del estímulo. Ya que laactividad secundaria del EC no produce apren-dizaje alguno, Dickinson y Burke (1996) propu-sieron que otorgarle dicha propiedad podría serla forma para dotar a SOP de un mecanismo deaprendizaje para EC ausentes. Para implementaresta idea, los autores suponen que dos estímulosA y B que se presentan juntos terminan porasociarse, y la presencia física de uno adquierela capacidad de generar actividad secundaria enel otro. Además se extienden las reglas de apren-dizaje del modelo, planteando que el aprendiza-je excitatorio entre dos estímulos es proporcionalal grado en que coinciden en el mismo tipo deactividad (A1

AA1

B o A2

AA2

B) y el aprendizaje

inhibitorio es proporcional al grado en que con-curren distintos tipos de actividad (A1

AA2

B o

A2AA1

B).

Según el modelo, durante la primera fase delprocedimiento de bloqueo retrospectivo se for-man asociaciones intracompuesto entre los ele-mentos del compuesto AB, las que determinan laactivación en A2 de los elementos del estímuloB cuando se presenta el estímulo A aisladamen-te, y viceversa. El bloqueo retrospectivo no seríauna consecuencia necesaria de la contingenciaAB+ A+, porque las presentaciones de A durantela segunda fase activarían una proporción de loselementos del EI al estado A2, mientras otraproporción es activada al estado A1 a través dela presencia del EI mismo. De este modo, aúncuando los elementos del estímulo B se venpromovidos al estado A2 durante estos ensayos,esto fortalece tanto las conexiones excitatorias(por medio de A2

BA2

EI) como inhibitorias (por

medio de A2BA1

EI) con el EI. La ocurrencia del

bloqueo retrospectivo dependerá de cuál de losdos procesos tiene una mayor fuerza. Esta ambi-güedad no es necesariamente incorrecta, ya que

Page 24: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

238 VOGEL, SOTO, CASTRO Y SOLAR

el fenómeno de bloqueo retrospectivo no siem-pre se obtiene (Larkin, Aitken & Dickinson,1998).

El modelo SOP modificado también prediceque, bajo ciertas condiciones, es posible que seproduzca aprendizaje completamente nuevo apartir de estímulos ausentes. Por ejemplo, laactivación simultánea de la representación dedos estímulos ausentes debería llevar a un forta-lecimiento de las conexiones excitatorias entreambos, dado que se ha producido una actividaddel tipo A2-A2. Si bien esta predicción ha resul-tado correcta en investigaciones delcondicionamiento clásico animal (Dwyer,Mackintosh & Boakes, 1998), Le Pelley yMcLaren (2001) han sido incapaces de encon-trar nuevo aprendizaje a partir de estímulosausentes con humanos. Esto les ha llevado aplantear una alternativa, que se discute a conti-nuación.

El modelo APECS de Le Pelley y McLaren(2001)

La dificultad que tuvieron Le Pelley yMcLaren (2001) para encontrar nuevo aprendi-zaje a partir de estímulos ausentes, a pesar de quesí les fue posible modificar asociacionespreexistentes, los ha llevado a plantear que lareevaluación retrospectiva no se debe a un pro-ceso de nuevo aprendizaje mediado por asocia-ciones intracompuesto, sino a cambios en lacapacidad para recuperar una representaciónpreviamente guardada en la memoria.

El modelo APECS originalmente fue diseña-do para proteger ciertas asociaciones deldesaprendizaje una vez que cambian las contin-gencias que les dieron origen (por ejemplo, en laextinción), simplemente dificultando su activa-ción y no eliminando el aprendizaje original. Elmodelo posee una arquitectura con unidadesescondidas, pero asume un procesamiento com-pletamente configuracional de estímulos que noincluye conexiones directas entre las unidadessensoriales y las unidades de salida, sino quetanto estímulos aislados como compuestos son

representados por una unidad configuracionalescondida independiente, la que a su vez esta-blece conexiones directas con las unidades desalida. Las unidades escondidas son, en estecontexto, unidades configuracionales que re-presentan un patrón particular de estimulación.El panel B de la Figura 3 muestra un ejemplo dela arquitectura de APECS para dos ECs y un EI.

En términos generales, las conexiones entrelas unidades configuracionales escondidas y launidad de salida (VH

k), y las conexiones entre

unidades sensoriales y configuracionales (Cij) se

modifican de acuerdo con reglas de aprendizajepor retropropagación como las propuestas porRumelhart y col. (1986). Lo más interesante deeste modelo es su proceso de memoria, en el cualuna representación configuracional se hace re-fractaria, protegiendo a sus asociaciones contrael desaprendizaje. Esta característica se obtienemediante dos mecanismos. Primero, la actividadde cada unidad configuracional se encuentramodulada por una unidad de sesgo (las unidadespequeñas adyacentes a cada unidadconfiguracional en la Figura 3 B), que se mantie-ne con un nivel de activación constante de 1, ycuya conexión con la unidad configuracional(VB

j) se modifica de la misma manera que la

conexión entre unidades sensoriales yconfiguracionales (C

ij). De este modo, la unidad

de error tiene una influencia continua sobre launidad configuracional, pero el monto de talinfluencia puede verse modificado. La influen-cia de esta unidad de error sobre una representa-ción configuracional es la que puede hacer quetal representación sea más fácil o más difícil deactivar a partir del patrón de estímulos físicosque le dio origen, lo que depende de la naturale-za (excitatoria o inhibitoria) y magnitud de laconexión entre la unidad de error y la unidadescondida.

El segundo mecanismo especial del modeloAPECS consiste en el congelamiento de algunasconexiones en la red cuando el valor del error depredicción es negativo, lo que permite mantenertales conexiones intactas aún bajo un cambio enlas contingencias que les dieron origen. De este

Page 25: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

239MODELOS DEL CONDICIONAMIENTO CLÁSICO

modo, una vez que se han desarrollado lasasociaciones para poder predecir un refuerzo apartir de una cierta configuración de estímulos,si posteriormente tal configuración lleva a unapredicción errónea acerca de la presentación delrefuerzo, se reducen automáticamente losparámetros de aprendizaje hasta un valor cerca-no a cero para todas las conexiones previamenteestablecidas. Aún así, la red logra adaptarse a lasnuevas contingencias debido a que las conexio-nes de la unidad de error no sufren del mismoproceso de congelamiento, y pueden modificarsepara dificultar la activación de la unidad escon-dida cuando se presenta el patrón de estímuloscorrespondiente.

La explicación para los fenómenos dereevaluación retrospectiva se funda en el carác-ter configuracional del modelo APECS. Por ejem-plo, durante la primera fase del bloqueoretrospectivo (AB+) se formaría una representa-ción configuracional de AB que puede luegoactivarse por la presentación de cualquiera desus componentes. De este modo, los ensayoscon A durante la segunda fase de entrenamientoactivan la representación configuracional de AB,la que se ve sometida tanto a cambios poraprendizaje (i.e., en su conexión con la unidadde salida) como debidos a la interferencia retro-activa (i.e., cambios en el valor de la conexióndesde la unidad de error). Por último, todarespuesta frente a B en una fase de prueba esresultado de la activación de la unidadconfiguracional AB y, por lo tanto, depende delos procesos de aprendizaje y memoria que hanafectado a esta unidad durante la segunda fase.

Las predicciones del modelo APECS conrespecto a los fenómenos de reevaluación re-trospectiva son similares a las del modelo SOPmodificado, pero el primero predice que no esposible obtener nuevo aprendizaje a partir declaves ausentes, mientras el segundo prediceque tal aprendizaje sí ocurrirá bajo ciertas condi-ciones. En este aspecto, la evidencia experimen-tal no es concluyente aún (Dwyer, Mackintosh& Boakes, 1998; Le Pelley & McLaren 2001).Otro aspecto específico al modelo APECS es que

no apela a la necesidad de asociacionesintracompuesto para explicar la reevaluaciónretrospectiva. Aún así, el modelo es capaz deexplicar algunos de los experimentos que hancomprobado que tal relación sí existiría(Dickinson & Burke, 1996), pero no todos ellos(Chapman, 1991). Su principal aporte es que, sinsalir de la tradición de modelos cuantitativosasociacionistas, logra entregar una explicación ala reevaluación retrospectiva completamentedistinta a la entregada por su competencia, basa-da en un cambio en la facilidad para recuperaruna representación de la memoria.

Ninguno de los modelos revisados en estasección ha logrado situarse sobre el resto en laexplicación del aprendizaje a partir de clavesausentes. Suelen entregar predicciones muy si-milares que no permiten diferenciar claramenteentre ellos. Además todos presentan dificultadesen la predicción de ciertos hallazgos tales comola “reevaluación retrospectiva de orden supe-rior” (De Houwer & Beckers, 2002) y otrosfenómenos, como el precondicionamiento sen-sorial y el condicionamiento mediado, en loscuales se comprueba nuevo aprendizaje paraestímulos ausentes en la misma dirección quepara los estímulos presentes, justo el resultadocontrario a lo observado en fenómenos dereevaluación retrospectiva.

La explicación de estos resultados contradic-torios requiere un mayor conocimiento acercade las condiciones que llevan a uno u otroresultado, las cuales han comenzado a serestudiadas e incluidas en modelos matemáticosrecién en los últimos años. Algunos de estosmodelos explican gran parte de estos fenómenosa través de mecanismos que incidirían en laejecución de la respuesta más que en el aprendi-zaje (Stout & Miller, 2005).

COMENTARIOS FINALES

En este artículo hemos intentado destacaralgunos de los hitos del devenir de la tradicióncuantitativa en las teorías del condicionamientoPavloviano. Con el fin de acotar la gran diversi-

Page 26: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

240 VOGEL, SOTO, CASTRO Y SOLAR

dad de alternativas teóricas que se han propues-to, hemos agrupado los modelos en 4 categoríaso generaciones. Si bien cada nueva generaciónrepresenta un aumento en la complejidad de losmodelos, ello no significa necesariamente quelas últimas generaciones remplacen completa-mente los niveles de análisis de las generacionesanteriores.

En cada generación de modelos aún hayabundante debate teórico y trabajo empírico porhacer. Por ejemplo, en el ámbito de los modelosde ensayo discreto quizá el tema más candentehoy en día se refiera a si los estímulos compues-tos deben representarse como configuraciones ocomo elementos separados. Los trabajos recien-tes en los laboratorios de Allan Wagner y JohnPearce, muestran que este tema aún no se haresuelto.

Por otra parte, la sensibilidad temporal con laque se ha comenzado a analizar la topografía dela respuesta en los nuevos paradigmas experi-mentales, ha mostrado que la RC no es una merareplica de la RI, sino que es altamente sensible aun número de parámetros relacionadas con losEIs y ECs. En este ámbito, los investigadores sehan visto en la necesidad de aceptar que laasociación no ocurre entre un EC y un EI sinoentre componentes de los estímulos. Este análi-

sis más bien molecular, ha resultado ser altamen-te conveniente para describir e investigar acercade los mecanismos neurobiológicos del aprendi-zaje.

Finalmente, el descubrimiento de similitu-des empíricas entre el condicionamientoPavloviano y el aprendizaje de relaciones decausalidad en humanos, reactivó el interés porel condicionamiento en ámbitos de investiga-ción que generalmente miraban con desdeñolos procedimientos de investigación animal ysu potencial capacidad para aplicarla a losfenómenos humanos “cognitivos”. Sin embar-go, la teorización en este ámbito es aún insipientey enfrenta grandes dificultades, tales como elfenómeno de la reevaluación retrospectiva, queha sido visto por algunos como una prueba dela inconveniencia de esta extrapolación. Otroshan comenzado a formular ciertas solucionesteóricas basadas en los modelos conexionistastradicionales.

Sin duda, el debate continuará en los próxi-mos años, enriqueciendo aún más nuestro cono-cimiento de uno de los fenómenos más largamenteestudiados en Psicología experimental. A travésde esta revisión, esperamos haber mostrado queel condicionamiento Pavloviano es un fenómenoplenamente vigente en la actualidad.

REFERENCIAS

Allan, L. G. (1993). Human contingency judgements: Rule based or associative? Psychological Bulletin, 114, 436-448.

Aydin, A. & Pearce, J.M. (1995). Summation in autoshaping with short and long-duration stimuli. Quarterly Journal of ExperimentalPsychology, 48B, 215-234.

Brandon, S. E., Bombace, J. C., Falls, W., & Wagner, A. R. (1991). Modulation of unconditioned defensive reflexes via an emotivePavlovian conditioned stimulus. Journal of Experimental Psychology: Animal Behavior Processes, 17, 312-322.

Brandon, S. E., Vogel, E. H., & Wagner, A. R. (2000). A componential view of configural cues in generalization and discriminationin Pavlovian conditioning. Behavioural Brain Research, 110, 67-72.

Brandon, S.E., Vogel, E.H., & Wagner, A.R. (2003). Stimulus representation in SOP: I. Theoretical rationalization and someimplications. Behavioural Processes, 62, 2-26.

Brandon, S. E., & Wagner, A. R. (1991). Modulation of a discrete Pavlovian conditioning reflex by a putative emotive Pavlovianconditioned stimulus. Journal of Experimental Psychology: Animal Behavior Processes, 17, 299-311.

Bush, R. R., & Mosteller, F. (1955). Stochastic models for learning. Nueva York: Wiley.

Chapman, G. B. (1991). Trial order affects cue interaction in contingency judgements. Journal of Experimental Psychology: Learning,Memory and Cognition, 17, 837-854.

Coleman, S. R., & Gormezano, I. (1971). Classical conditioning of the rabbit’s (Orictolagus cuniculus) nictitating membrane responseunder symmetrical CS-US intervals shifts. Journal of Comparative and Physiological Psychology, 77, 447-455.

Page 27: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

241MODELOS DEL CONDICIONAMIENTO CLÁSICO

De Houwer, J., & Beckers, T. (2002). Higher-order retrospective revaluation in human causal learning. Quarterly Journal ofExperimental Psychology, 55B, 137-151.

Desmond, J. E., & Moore, J. W. (1988). Adaptive timing in neural networks: The conditioned response. Biological Cybernetics, 58,405-415.

Dickinson, A., & Burke, J. (1996). Within-compound associations mediate the retrospective revaluation of causality judgements.Quarterly Journal of Experimental Psychology, 49B, 60-80.

Dickinson, A., Shanks, D., & Evenden, J. (1984). Judgement of act-outcome contingency: The role of selective attribution. QuarterlyJournal of Experimental Psychology, 36A, 29-50.

Donegan, N. H. (1981). Priming-produced facilitation or diminution of responding to a Pavlovian unconditioned stimulus. Journalof Experimental Psychology: Animal Behavior Processes, 7, 295-312.

Donegan, N. H., & Wagner, A. R. (1987). Conditioned diminution and facilitation of the UR: A sometimes opponent-processinterpretation. En I. Gormezano, W. F. Prokasy, & R. F. Thompson (Eds.), Classical Conditioning. Hillsdale, NJ: Erlbaum.

Dwyer, D. M., Mackintosh, N. J., & Boakes, R. A. (1998). Simultaneous activation of the representation of absent cues results in theformation of an excitatory association between them. Journal of Experimental Psychology: Animal Behavior Processes, 24, 163-171.

Estes, W. K. (1950). Toward a statistical theory of learning. Psychological Review, 57, 94-104.

Gallistel, R., & Gibbon, J. (2000). Time, rate and conditioning. Psychological Review, 107, 289-344.

Gewirtz, J. C., Brandon, S. E., & Wagner, A. R. (1998). Modulation of the acquisition of the rabbit eyeblink conditioned responseby conditioned contextual stimuli. Journal of Experimental Psychology: Animal Behavior Processes, 24, 106-117.

Grossberg, S. (1975). A neural model of attention, reinforcement and discrimination learning. International Review of Neurobiology,18, 263-327.

Grossberg, S., & Schmajuk, N. A. (1989). Neural dynamics of adaptive timing and temporal discrimination during associative learning.Neural Networks, 2, 79-102.

Hall, G., & Pearce, J. M. (1979). Latent inhibition of a CS during CS-US pairings. Journal of Experimental Psychology: AnimalBehavior Processes, 5, 31-42.

Hull, C. L. (1943). Principles of behavior: An introduction to behavior theory. Nueva York: Appleton-Century-Crofts.

Kamin, L. J. (1968). “Attention-like” processes in classical conditioning. En M. R. Jones (Ed.), Miami Symposium on the Predictionof Behavior: Aversive stimulation (pp. 9-33). Miami: University of Miami Press.

Larkin, M. W., Aitken, M. R., & Dickinson, A. (1998). Retrospective revaluation of causal judgements under positive and negativecontingencies. Journal of Experimental Psychology: Learning, Memory and Cognition, 24, 1331-1352.

Le Pelley, M. E., & McLaren, I. P. L. (2001). Retrospective revaluation in humans: Learning or memory? Quarterly Journal ofExperimental Psychology, 54B, 311-352.

Lubow, R.E. (1973). Latent inhibition. Psychological Bulletin, 79, 398-407.

Mackintosh, N. J. (1975). A theory of attention: Variations in the associability of stimuli with reinforcement. Psychological Review,82, 276-298.

Marcos, J. L. (1997). Modulación condicionada de la respuesta incondicionada en el condicionamiento clásico humano. Psicothema,9, 155-165.

Marcos, J. L., & Redondo, J. (2002). Efectos diferenciales de los mecanismos asociativos y de expectación sobre la disminución dela respuesta incondicionada en el condicionamiento clásico electrodérmico. Psicothema, 14, 375-381.

McCormick, D. A., & Thompson, R. F. (1983). Cerebellum: Essential involvement in the classically conditioned eyelid response.Science, 223, 296-299.

McLaren, I. P. L., & Mackintosh, N. J. (2000). An elemental model of associative learning: I. Latent inhibition and perceptual learning.Animal learning and Behavior, 28, 211-246.

Medina, J. F., Garcia, K. S., Nores, W. L., Taylor, N. M., & Mauk, M. D. (2000). Timing mechanisms in the cerebellum: Testingpredictions of a large-scale computer simulation. The Journal of Neuroscience, 20, 5516-5525.

Millenson, J. R., Kehoe, E. J., & Gormezano, I. (1977). Classical conditioning of the rabbit’s nictitating membrane response underfixed and mixed CS-US intervals. Learning and Motivation, 8, 351-366.

Moore, J. W., & Stickney, K. J. (1980). Formation of attentional-associative networks in real time: Role of the hippocampus andimplications for conditioning. Physiological Psychology, 8, 207-217.

Myers, K. M., Vogel, E. H., Shin, J., & Wagner, A. R. (2001). A comparison of the Rescorla-Wagner and Pearce models in a negativepatterning and a summation problem. Animal Learning and Behavior, 29, 36-45.

Page 28: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

242 VOGEL, SOTO, CASTRO Y SOLAR

Pavlov, I. P. (1927). Conditioned reflexes. Londres: Oxford University Press.

Pearce, J. M. (1987). A model for stimulus generalization in Pavlovian conditioning. Psychological Review, 94, 61-73.

Pearce J. M. (2002). Evaluation and development of a connectionist theory of configural learning. Animal Learning and Behavior,30, 73-95.

Pearce, J. M., & Hall, G. (1980). A model for Pavlovian learning: Variations in the effectiveness of conditioned but not unconditionedstimuli. Psychological Review, 87, 532-552.

Rescorla, R. A. (1980a). Pavlovian second-order conditioning: Studies in associative learning. Hillsdale, NJ: Erlbaum.

Rescorla, R. A. (1980b). Simultaneous and successive associations in sensory preconditioning. Journal of Experimental Psychology:Animal Behavior Processes, 6, 207-216.

Rescorla, R.A. (1997). Summation: Assessment of a configural theory. Animal Learning and Behavior, 25, 200-209.

Rescorla, R. A., & Wagner, A. R. (1972). A theory of Pavlovian conditioning: Variations in the effectiveness of reinforcement andnon reinforcement. En A. H. Black, & W.F. Prokasy (Eds.), Classical Conditioning II: Current Theory and Research. NuevaYork: Appleton-Century-Crofts.

Ross, R. T., & Holland, P. C. (1981). Conditioning of simultaneous and serial feature-positive discriminations. Animal Learning andBehavior, 9, 292-303.

Rumelhart, D. E., Hinton, G. E., & Williams, G. E. (1986). Learning internal representations by error propagation. En D. E. Rummelhart& J. L. Mclelland (Eds.) , Parallel Distributed Processing: Explorations in the Microstructure of Cognition: Vol. 1, Foundations.Cambridge, MA: Bradford MIT Press.

Schmajuk, N. A. (1997). Animal learning and cognition: A neural network approach. Cambridge: Cambridge University Press.

Schmajuk, N. A., & Dicarlo, J. J. (1992). Stimulus configuration, classical conditioning, and hippocampal function. PsychologicalReview, 99, 268-305.

Schmajuk, N. A., & Moore, J. W. (1985). Real-time attentional models for classical-conditioning and the hippocampus. PhysiologicalPsychology, 13, 278-290.

Schmajuk, N. A., Lamoureux, J. A., & Holland, P. C. (1998). Occasion setting: A neural network approach. Psychological Review,105, 3-32.

Schneiderman, N. (1972). Response system divergences in aversive classical conditioning. En A. H. Black, & W. F. Prokasy (Eds),Classical conditioning II: Current theory and research. Nueva York: Appleton-Century-Crofts.

Siegel, S., & Domjan, M. (1971). Backward conditioning as an inhibitory procedure. Learning and Motivation, 2, 1-11.

Smith, M. C., Coleman, S. R., & Gormezano, I. (1969). Classical conditioning of the rabbit’s nictitating membrane response at backward,simultaneous, and forward CS-US intervals. Journal of Comparative and Physiological Psychology, 69, 226-231.

Spence, K. (1945). An experimental test of continuity and non-continuity theories of discrimination learning. Journal of ExperimentalPsychology, 35, 253-266.

Spence, K. W. (1960). Behavior theory and learning. Englewood Cliffs, NJ: Prentice-Hall.

Stout, S. C., & Miller, R. R. (2005). Sometimes competing retrieval: A formalization of the comparator hypothesis. Manuscrito enviadopara su publicación.

Sutton, R. S., & Barto, A. G. (1981). Toward a modern theory of adaptive networks: Expectation and prediction. Psychological Review,88, 135-170.

Sutton, R. S., & Barto, A. G. (1990). Time-derivative models of Pavlovian reinforcement. En M. Gabriel, & J. W. Moore (Eds.),Learning and computational neuroscience: Foundations of adaptive networks (pp. 497-534). Cambridge, MA: The MIT Press.

Tait, R. W., & Saladin, M. E. (1986). Concurrent development of excitatory and inhibitory associations during backward conditioning.Animal Learning and Behavior, 14, 133-137.

Van Hamme, L. J., & Wasserman, E. A. (1994). Cue competition in causality judgements: The role of nonpresentation of compoundstimulus elements. Learning and Motivation, 25, 127-151.

Vogel, E. H., Brandon, S. E., & Wagner, A. R. (2003). Stimulus Representation in SOP: II. An application to inhibition of delay.Behavioural Processes, 62, 27-48.

Wagner, A. R. (1981). SOP: A model of automatic memory processing in animal behavior. En N. E. Spear, & R. R. Miller (Eds.),Information Processing in Animals: Memory mechanisms. Hillsdale, NJ: Erlbaum.

Wagner, A. R. (2003). Context-sensitive elemental theory. The Quarterly Journal of Experimental Psychology, 56B, 7-29.

Wagner, A. R., & Brandon, S. E. (1989). Evolution of a structured connectionist model of Pavlovian conditioning (AESOP). En S.B. Klein, & R. R. Mowrer (Eds.), Contemporary learning theories: Pavlovian Conditioning and the Status of Traditional LearningTheory. Hillsdale, NJ: Erlbaum.

Page 29: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me

243MODELOS DEL CONDICIONAMIENTO CLÁSICO

Wagner, A. R., Logan, F. A., Haberlandt, K., & Price, T. (1968). Stimulus selection in animal discrimination learning. Journal ofExperimental Psychology, 76, 171-180.

Wagner, A. R. & Rescorla, R. A. (1972). Inhibition in Pavlovian conditioning: Application of a theory. En M. S. Halliday & R. A.Boakes (Eds.), Inhibition and learning. San Diego, CA: Academic Press.

Wagner, A. R., Rudy, J. W., & Whitlow, J.W. (1973). Rehearsal in animal conditioning. Journal of Experimental Psychology, 97,407-426.

Whitlow, J. W. (1975). Short-term memory in habituation and dishabituation. Journal of Experimental Psychology: Animal BehaviorProcesses, 1, 189-206.

Wasserman, E. A., & Castro, L. (2005). Surprise and change: Variations in the strength of present and absent cues in causal learning.Learning and Behavior, 33, 141-146.

Zimmer-Hart C. L., & Rescorla R. A. (1974). Extinction of pavlovian conditioned inhibition. Journal of Comparative and PhysiologicalPsychology, 86, 837-845.

Recepción: mayo de 2005

Aceptación final: junio de 2006

Page 30: MODELOS MATEM`TICOS DEL CONDICIONAMIENTO … · MODELOS DEL CONDICIONAMIENTO CLÁSICO 217 cionado. Cada una de estas presentaciones o “pareamientos” se denomina ensayo, y se asu-me